научная статья по теме ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ ПРИ ОГРАНИЧЕННЫХ ФАЗОВЫХ КООРДИНАТАХ Автоматика. Вычислительная техника

Текст научной статьи на тему «ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ ПРИ ОГРАНИЧЕННЫХ ФАЗОВЫХ КООРДИНАТАХ»

Автоматика и телемеханика, Л- 2, 2007

PACS 02.30.Yy

© 2007 г. Д. Ю. КАРАМЗИН, канд. физ.-мат. наук (Вычислительный центр им. A.A. Дородницына РАН, Москва)

ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ ПРИ ОГРАНИЧЕННЫХ ФАЗОВЫХ КООРДИНАТАХ1

Изучается автономная задача оптимального управления с фазовыми ограничениями. Для нее получены необходимые условия оптимальности в форме принципа максимума Поптрягипа. Важными свойствами полученного результата являются полпота условий принципа максимума, а также их невырожденность.

1. Введение

Настоящая работа посвящена исследованию принципа максимума (ПМ) в задаче оптимального управления при ограниченных фазовых координатах (1). Такие задачи еще принято называть задачами с фазовыми ограничениями. Задачи управления с фазовыми ограничениями являются очень важным классом задач управления. Они часто встречаются в робототехнике, теории упругих колебаний, теории управления движением и во множестве других физических приложений [1 5]. Исследованию фазовых ограничений посвящено много работ разных авторов [1.6 10]. и этот список является далеко не полным.

Цель настоящей работы получение необходимых условий оптимальности в форме (ПМ), которые по возможности обладают свойством полноты и невырожденности. Ниже получены два варианта невырождающегося ПМ (теоремы 1, 2), причем условия, полученные в теореме 1, являются также и полными. «Невырождающнйся ПМ» означает, что его условия информативны и не могут быть удовлетворены тривиальным набором множителей Лагранжа. Подробнее о проблеме невырожденности ПМ можно прочитать в [6]. «Полнота» условий ПМ означает, что в общем случае (случае общего положения) количество неизвестных равно количеству уравнений.

Впервые ПМ для задач с фазовыми ограничениями был получен в [8] в 1959 г. (см. также в [5]). Немного позже, в [9] был получен еще один вариант такого ПМ. Две теоремы из [8 и 9] сложно сравнивать: они доказаны при разных предположениях н имеют разные условия. Заметим только, что если ПМ из [8] невырождающнйся, то в теореме из [9] может вырождаться (см. [6], пример 4.1 на с. 111). В [11] был доказан соответствующий невырождающнйся аналог этой теоремы. В настоящей работе предлагается некоторый новый подход к проблеме. Условия теоремы 1 (и, тем более, теоремы 2) отличаются от условий упомянутых выше теорем других авторов. В частности, сопряженная переменная в теореме 1 удовлетворяет такому же уравнению, как и в ПМ из [8], однако условия максимума и нетривиалыгости, а также понятие регулярности траектории другие. Наконец, важно отметить, что в

1 Работа выполнена ири финансовой поддержке Российского фонда фундаментальных исследований, проекты .N-" 04-01-00619, .N-" 05-01-00275 и Фонда содействия отечественной науке.

предложенных ниже условиях повышенной гладкости по управлению го теоремы 2 вытекает теорема 25 го [5. с. 345].

2. Постановка задачи и определения

Будем изучать следующую автономную задачу оптимального управления:

ч

3 (х.и) = Ко(р) + ! ¡о(х,и)&

—> шт.

(!)

«0

х = /(х. и). Ь € Т = [¿0. Ь].

К(р) < 0. К2(р) =0. р = (Х0.Х1). хо = х(Ьо). Х1 = х(г1). С(х) < 0. и(Ь) € и = {и € И™ : р(и) < 0} п.в. Ь € Т.

Здесь Т = [i0.i1] _ фиксированный отрезок времени, запись «п.в. Ь>> означает для почти всех £ в смысле меры Лебега. Вектор р = (х0.х1) называется концевым, а ограничения К1(р) < 0 К2(р) = 0 - концевыми. Ограничение О(х) < 0 называется фазовым, а р(и) < 0 - геометрическим. Измеримая существенно ограниченная вектор-функция и(-) называется управлением.

Функции в задаче (1) действуют в следующих пространствах: К^ : И2" ^ И' 3 = 0.1. 2, к0 = 1, С : И" ^ И.кз, р : И™ ^ И^, /./0 : И" х И™ ^ И". И1. Предполагается, что все функции непрерывно дифференцируемы по совокупности

С

считать, что функции / и р имеют достаточно высокую степень гладкости по и.2

Относительно множества и предположим следующее. Положим I = {1..... к4}, I(и) = {г € I : рг(и) = 0}. Будем считать, что:

1) векторы др~(и), г € I(и) линейно независимы Vи € И™:

ди

2) множество и ограничено, т.е. это компакт в И™.

йх(Ь)

Если —-— = /(х(Ь).и(Ь)) п.в., то пара {х(-).и(-)} называется процессом управ-аЬ

ления в задаче (1). Процесс управления {х(-).и(-)} называется допустимым, если вектор р = (х0.х1) удовлетворяет концевым ограничениям, функция х(-) удовлетворяет фазовому, а управление и(-) - геометрическому ограничениям. Задача состоит в отыскании минимума функционала 3 на множестве допустимых процессов. Напомним, что допустимый процесс {Х(-).Х(-)} называется сильным (локальным) минимумом, если существует е > 0 такое, что для любого допустимого процесса {х(-).и(-)} такого, что \х(Ь) — х(Ь)\ ^ XVЬ € Т, выполняется 3(х.и) ^ 3(х.и).

Рассмотрим допустимый процесс {Х(-).Х(-)}, являющийся сильным минимумом. Положим р = (Х0. Х1), где Х0 = Х^), Х1 = х(Ь 1). В дальнейшем, опуская неактивные индексы г: К\(р) < 0, будем считать, что К1(р) = 0. Введем ряд обозначений и определений, которые будем использовать ниже.

(х. и)

означает, что вместо опущенных аргументов в нее подставляются оптимальные значения х(-). и(-). Например: /(Ь) = /(х(Ь). и(Ь)). (То же обозначение используется для частных производных функций по х.и).

- Эта степень гладкости определяется возможностью применения теоремы Морса-Сарда [1'2], которая используется при доказательстве. Бесконечной дифференцируемости по и при каждом фиксированном х заведомо достаточно.

Введем в рассмотрение вектор-функцию R: R" х Rm ^ Rfc3, R(x,u) dG

— (x)f(x,u)■

Положим Tj

[t e T : Gj(t) = 0}, j e J = {1,..., k3}, J(t) = {j e J: t e Tj}.

Обозначим через P(u) матрицу ортогонального проектирования Rm на ортого-

( d^i 1

нальное дополнение к подпространству Lin < ^— (u), i e I(u) >. При этом по определению, если I(u) = 0 (это значит, что u e int то P(u) = ^^e E - единичная матрица. Будем обозначать через \M| количество элементов множества M.

Определение 1. Концевые ограничения называются регулярными, если век-dRi

торы -—2 (р), i = 1,. ..,k2 линейно независимы и существу ет вектор z e R2" dp

dR / dRi \

такой, что —— (p)z = 0, ( —— (p), z) > О V i = 1,...,ki. dp \ dp /

Определение 2. Фазовые ограничения называются регулярными, если для

(dGj \

——(t), z(t)\ > О

V j e J(t).

Определение 3. Концевые ограничения называются согласованными с фазовыми в точке р, если найдется е > 0 такое, что

{p e R2" : Ri(p) < 0, R2(p) =0, \p - p\ < е} С С {p =(xo,x1) : G(xk) < 0, k = 0,1}.

Будем говорить, что концевые ограничения строго согласованы с фазовыми, если найдется е > 0 такое, что

{p e R2" : Ri(p) < 0, R2(p) = 0, \p -XK е} С c{p = (xo,x1) : G(xk) +e\xk - xk\-l < 0, k = 0,1} ,

где 1 = (1,..., 1) — вектор из k3 единиц. Согласованность ограничений, очевидно, слабее их строгой согласованности. Примером задачи со строго согласованными ограничениями может служить задача с фиксированными концами p = (xo, xi).

Определение 4. Процесс управления {£(•),«(•)} будем называть слабо регу-

dR л

лярным, если для п.в. t e T у матрицы -^-(t)P(t) существует отличный от нуля минор порядка \ J(t) \, стоящий в строках с номерами j e J(t).

Определение 5. Процесс управления {£(•), u^)} будем называть регулярным, если существует е0 > 0 такое, что для всех t e T и п.в. s e T: \s — t\ < е0 у мат-

dR л

рицы —— (s)P(s) существует минор порядка \ J(t)\, стоящий в строках с номерами du

j e J(t), модуль которого не меньше е0.

Определение 5 было введено в [7] и использовалось там для исследования задачи с фазовыми ограничениями. Отметим, что оно является обобщением понятия регулярности траектории из [8] на случай измеримых управлений.

3. Две теоремы о принципе максимума

Рассмотрим функцию Понтрягина Н и малый лагранжиан I:

Н(х, и, ф, Х0) = а(х, и), ф) - \ofoix, и), 2

1(р,А)=^ Кг(р),\г) , А =(Ао,\и\2).

г=0

Через дМ будем обозначать границу множества М; через I - меру Лебега на прямой, а через ф(г+), ф(г-) — правый и левый пределы функции в точке г соответственно. Положим

V = и дТ, И+ = {у е И : уУ > 0,г = 1,..., ¿}

П(г) = с1 (|и е и : Ез(и, г) < о Уз е J(г)}) .

Теорема 1. Пусть слабо регулярный процесс {Х(-),Х(-)} является сильным локальным минимумом в задаче (1). Предположим, что концевые и фазовые ограничения регулярны, концевые ограничения строго согласованы с фшзовыми, а .множество V\{t0,tl} состоит из конечного числа N) точе к тУ, г = 1,..., N ту < тУ+1 Уг < N. Тогда существуют число А0 > 0, векторы А^ е И.+1, А2 е Ик2, ау е И+3, г = 1,...^, кусочно (абсолютно) непрерывная функция ф, претерпевающая разрывы в точках ту, а также измеримые функции п е Ькз(Т) и £ е Ь^4 (Т), принимающие значения в И+3 и И+4 соответственно, такие что

(2)

Ао + £({г е Т : \ф(г)\ > о}) > о,

(3)

(г)

дН

Ф = - дх (г, Ф, Ао) +

дI

Ф(гк) = (-1)кт— (р, А), к = о, 1,

дЕ

дх

п(г), г е Т,

дхк

Ф(ту+) = Ф(т-) +

да )

ау, г = 1

(4) О)

тах Н(и,г,ф(г),А0) = Н(г,ф(г),А0) = со^ п.в. г е Т,

пеп(г)

дН

ди

(г,Ф(г),А0

дЕ ди

(г)

п(г)

£(г) п.в

(6)

г,(г),а(г)) + Ш,ф(г)) =о п. в., и,а(п)) = о у г < N.

!

!

!

Теорема 1 дает полную систему условий для нахождения оптимальной траектории. Действительно, рассмотрим для простоты задачу с закрепленными концами Х0, Х\ и кз = 1. И пусть из каких-то дополнительных соображений (скажем, по предположению) известно, что оптимальная траектория имеет N точек стыка. Используя регулярность траектории и разрешая (5) относительно п, выразим их через ф. Таким образом, неизвестными имеем управляемый процесс {х(-),и(-)}и вектор в = (ф0,а\,..., аN, т\,...,тN )■ Условие максимума (4) и решение гамильтоновой

системы дает возможность и(Ь) выразить через в: и(Ь) = и(Ь; в). Соответственно х(Ь) = х(Ь; в), х(Ь0; в) = х0. Таким образом, остались ф0,аг,тг - всего п + 2М неизвестных. Найдем такое же количество уравнений. Первые п уравнений получаются из условия х(Ь1; в) = х^ Соотношение 0(х(тг; в)) = 0 дает еще N уравнений. Наконец последние N уравнений та точки стыка тг получаются из формулы (4), в силу которой скачок гамильтониана в точке тг равен нулю.

Доказательство теоремы 1. Пусть процесс {£(•),и(•)} - сильный локальный минимум в задаче (1). Не ограничи

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком