научная статья по теме НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ Математика

Текст научной статьи на тему «НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2007, том 47, < 7, с. 1123-1150

УДК 519.626.2

НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА В ЗАДАЧЕ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ1-*

© 2007 г. Д. Ю. Карамзин

(119991 Москва, ул. Вавилова, 40, ВЦ РАН) e-mail: dmitry_karamzin@mail.ru Поступила в редакцию 11.10.2005 г.

Исследуется задача оптимального управления с фазовыми ограничениями. Предлагается альтернатива уже имеющимся подходам к изучению этой задачи. Доказаны принцип максимума и необходимые условия второго порядка. Библ. 17.

Ключевые слова: задача оптимального управления, принцип максимума, фазовые ограничения.

1. ВВЕДЕНИЕ И ПОСТАНОВКА ЗАДАЧИ Будем изучать следующую задачу оптимального управления:

$(x, u) = Ko(p) + Jf о(x, u, t)dt

min,

(1)

х = /(х, и, t), t е Т = [¿0,11 ], К1 (р)< 0, К2(р) = 0, р = (Хо, хх), Хо = х(¿0), хх = х(t! ),

О(х, t) < 0, и(t) е и( t) = {и е К™ : ф(и, t)< 0 } п.в. t е Т.

Здесь t е Т- время, запись п.в. t означает для почти всех t в смысле меры Лебега. Векторр = (х0, хх) называется концевым, а ограничения К1(р) < 0, К2(р) = 0 концевыми. Ограничение О(х, t) < 0 называется фазовым, а ф(и, 0 < 0 - геометрическим. Измеримая существенно ограниченная вектор-функция и() называется управлением. Все конечномерные векторы считаются вектор-столбцами.

Функции в задаче (1) действуют в следующих пространствах:

К : К2" — ^, ] = 1, 2, ф : К™ х К1 — к"4 , О : Г х К1 — К"3, /: К" х К™ х К1 — К".

Функции К0: К2" —► К1 и К = (К1, К2) предполагаются дважды непрерывно дифференцируемыми по совокупности аргументов. Функции/,/0, ф дважды непрерывно дифференцируемы по (х, и) для п.в. t, они сами и все их частные производные до второго порядка включительно измеримы по t при каждых (х, и), ограничены на каждом ограниченном множестве и непрерывны по (х, и) равномерно по t. Функция О предполагается трижды непрерывно дифференцируемой.

Кроме того, относительно функции ф и отображения и предположим следующее. Положим I = {1, 2, ..., "4}, 1(и, ^ = {/ е I : фг(и, 0 = 0}. Будем считать, что выполняется следующее:

1) векторы д-ф- (и, I е 1(и, 0 линейно независимы У и е К™ для п.в. t е Т; ди

2) существует константа c > 0: |u| < c Vu e U(t) п.в. t.

1) Работа выполнена при финансовой поддержке РФФИ (коды проектов 07-01-00416, 05-01-00193, 06-01-90841, 05-01-00275),

Фонда содействия отечественной науке и грантов Президента РФ (проекты МК-5591.2006.1, НШ-5344.2006.1).

Если dtt = f(x(t), u(t), t) п.в. t e T, то пара {x(), u()} называется процессом управления в задаче (1). Процесс управления {x(), u()} называется допустимым, если векторp = (x0, xx) удовлетворяет концевым ограничениям, функция x() удовлетворяет фазовому, а управление u() - геометрическому ограничениям. Задача состоит в отыскании минимума функционала 3 на множестве допустимых процессов.

Определение 1. Допустимый процесс {X (•), U (•)} называется сильным (локальным) минимумом, если существует е > 0 такое, что для любого допустимого процесса {x(-), u()} такого, что |x(t) - X (t)| < е Vt e T, выполняется 3(X, U) < 3(x, u).

Настоящая работа посвящена исследованию принципа максимума (ПМ) и необходимых условий второго порядка в задаче оптимального управления с фазовыми ограничениями (1). В разд. 2 статьи доказаны два варианта ПМ (теоремы 1 и 2), в разд. 3 получен ПМ вместе с необходимыми условиями второго порядка (теорема 3) и, наконец, в заключительной части обсуждаются полученные результаты, разбирается пример.

Задачи с фазовыми ограничениями относятся к классу вырожденных задач оптимального управления. Заметим, что в задаче (1) функция G не зависит от управления: dG/du = 0. Поэтому фазовое ограничение не получается переписать в виде: u(t) e U(x(t), t) п.в., где U(x, t) - некоторое непрерывное по (x, t) в окрестности сильного минимума многозначное отображение. Более того, такого отображения не может быть как только 3t: G( x (t), t) = 0, а x (t) принадлежит границе множества {x : G(x, t) < 0} (следствие теоремы существования решения для дифференциальных включений из [1]). Этим они отличаются от регулярных смешанных ограничений, для которых указанная форма записи возможна. Фазовые ограничения более схожи с концевыми или промежуточными ограничениями, но они рассматриваются в каждый момент времени и, таким образом, мы имеем континуум промежуточных ограничений G(x(t), t) < 0, t e T. За этим прячется главная трудность, которая встречается на пути исследования задач с фазовыми ограничениями, а именно: ПМ для таких задач может вырождаться, и возникает проблема доказательства невы-рождающегося ПМ. Говорят, что ПМ вырождается, если его условия могут быть удовлетворены тривиальным набором множителей Лагранжа с = 0 и y(t) = 0 п.в. Действительно, сопряженная переменная в ПМ для задачи с фазовыми ограничениями есть функция разрывная, имеющая, возможно, разрывы в концевых точках. Поэтому, например, условие нетривиальности вида + + sup t )| = 1 можно, очевидно, удовлетворить указанным выше тривиальным набором множи-

t e T

телей и ПМ с таким условием нетривиальности будет вырождаться на некоторых задачах. Подробнее о фазовых ограничениях и проблеме вырождающегося ПМ см. [2].

Впервые ПМ для задач с фазовыми ограничениями был получен Р.В. Гамкрелидзе в [3], [4] в 1959 г. В 1963 г. был получен еще один вариант такого ПМ (см. [5]). Однако две теоремы из [3] и [5] сложно сравнивать: они доказаны при разных предположениях и имеют разные условия. Заметим только, что если ПМ из [3] невырождающийся, то теорема из [5] может вырождаться (см. [2], пример 4.1, с. 111). В [6] был доказан соответствующий невырождающийся аналог этой теоремы. В настоящей работе предлагается иной подход к проблеме. Теорема 1 мало связана с упомянутыми выше ПМ других авторов. В частности, сопряженная переменная в ней удовлетворяет такому же уравнению как и в [3], однако условие максимума и понятие регулярности траектории другие (подробнее см. разд. 4).

Необходимые условия второго порядка в задачах с фазовыми ограничениями изучались в работах [7], [8] (см. также библиографию в [7]). Другие условия можно обнаружить в [9], [10]. Предлагаемый ниже подход к изучению условий второго порядка во многом основывается на работе [7].

2. ПРИНЦИП МАКСИМУМА

В этом разделе для задачи (1) докажем два варианта невырождающегося ПМ (теоремы 1 и 2). Введем ряд обозначений и определений, которые будем использовать ниже. Рассмотрим допустимый процесс {x (•), u (•)}, являющийся сильным минимумом. Положим p = (xo, xi), где xo =

= x (t0), xi = x (tx). В дальнейшем, опуская неактивные индексы i: K\ (p) < 0, будем считать, что *х( Р) = 0.

Если над некоторой функцией, зависящей от (х, и), ставится крышка, то это означает, что вместо опущенных аргументов в нее подставляются оптимальные значения х (•), и (•), например

У (О =У х (О, и (0, 0. (То же обозначение используется для частных производных функций по х, и.)

д к2

Определение 2. Концевые ограничения называются регулярными, если векторы -г-— (р), / =

др

= 1, 2, ..., к2, линейно независимы и существует вектор г е К2" такой, что

Щ2(р)г = 0, ^<г) > 0 = 1' 2, •••> к,.

Определение 3. Будем говорить, что концевые ограничения строго согласованы с фазовыми в точке р, если найдется ё > 0 такое, что

{р е К2" : К1 (р) < О, К2(р) = 0, \р - р\ < ё} с {р = (хо, х1) : О(хь гк) + ё|х^ - хД • 1 < 0, к = 0, 1}.

Здесь 1 = (1, ..., 1) - вектор из к3 единиц. Примером задачи со строго согласованными ограничениями является задача с фиксированными концами р = (х0, х1).

Введем в рассмотрение вектор-функцию Я: К г х Г х К1 — К 3:

дО дО

Я(х, и, t) = — (х, t)/(х, и, t) + "ду (х, t).

Положим Т} = {у е Т: О (У) = 0},у е J = {1, 2, ..., к3}, /(У) = {/ е J: у е 7}},-/(и, у) ={/ е /(У) : Я (и, у) = 0}. Обозначим через Р(и, У) матрицу ортогонального проектирования К™ на ортогональное до-

полнение к подпространству Lin] (u, t), i e I(u, t ) l. При этом по определению, если I(u, t) = 0

I д u I

(это значит, что u e int U(t)), то P(u, t) = E, где E - единичная матрица. Будем обозначать через |M| количество элементов множества M.

Определение 4. Траекторию x (t) будем называть регулярной относительно фазовых ограничений, если выполнено следующее:

а) для любого t e T существует ненулевой вектор z(t) такой, что

^(t), z(t)j> 0 V/ e J(t); д R

б) для п.в. t e T и для всех u e U(t) у матрицы (u, t)P(u, t) существует отличный от нуля ми-

д u

нор порядка |J(u, t)|, стоящий в строках с номерами/ e J(u, t). Рассмотрим функцию Понтрягина H и малый лагранжиан l

H(x, u, t, y, Ào) = <f(x, u, t), y> - Xofo(x, u, t),

2

l ( = (^ ),À>, À = (А,оЛЛ2 ).

i = 0

Через dM будем обозначать границу множества M; через ^ - меру Лебега на прямой, а через y(t+), y(t-) - соответственно, правый и левый пределы функции в точке t.

Положим

Э = иЭТ/, [R+ = {y e Rd : y > 0, i = 1, 2,..., d},

/ e J

Q(t) = {u e U(t) : R(u, t)< 0 V/ e J(t)}.

Теорема 1. Пусть процесс {X (•), и (•)} является сильным локальным минимумом в задаче (1). Предположим, что концевые ограничения регулярны и строго согласованы с фазовыми, траектория X (•) регулярна относительно фазовых ограничений, а множество Э\{0, t1} состоит из конечного числа N точек т,, , = 1, 2, ..., N т, < т, + 1 V, < N. Тогда существуют число Х0 > 0,

k

векторы X е 1К+1, Х2 е

, / = 1, 2, ..., N, кусочно абсолютно непрерывная функция у,

чг е ^ , а, е

претерпевающая разрывы в точках т,, а также измеримые функции п е L23 (Т) и ^ е L24 (Т), принимающие, соответственно, значения в 1К+ и 1К+4 такие, что

Хо + £({ t е Т : |у( t )|> 0 })> 0, (2)

У = --=£ ( )

I (t)

п(t), t е Т,

Э/

tk) = (-1ГэЭх-(Р, k = о, 1,

(3)

у(тг+) = у(т -) +

э О, ■ ЭЭО)

/ = 1, 2,..., N,

тах Н(и, t, t), Х0) = Н( t, t), Х0) п.в. t е Т,

и е )

Э-р( t )Д 0 ) =

Э и

ЭЭи (t)

(4)

п(t) + (t)]*£(t) п.в., (5)

<П(t), О(t)> + <£(t),ф(t)> = 0 п.в., <аг, О(т,)> = 0 V/ < N. (6)

Замечание 1. Точки т в терминах книги [4] называются точками стыка и являются точками выхода (или схода) оптимальной траектории на границу (с границы) фазоограничения. Отметим, что, по определению, все N точек стыка являю

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком