ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 10, с. 1670-1680
УДК 519.626
ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОДНОГО КЛАССА НЕВЫПУКЛЫХ ЗАДАЧ УПРАВЛЕНИЯ1)
© 2015 г. Е. В. Аксенюшкина*, В. А. Срочко**
(*664015 Иркутск, ул. Ленина, 11, БГУЭП;
**664003 Иркутск, ул. К. Маркса, 1, ИГУ) e-mail: srochko@math.isu.ru Поступила в редакцию 15.12.2014 г.
Рассматривается задача оптимизации билинейно-квадратичного функционала относительно линейной фазовой системы с модульным ограничением на управление. На основе специальных представлений для целевого функционала получены достаточные условия оптимальности некоторых классов экстремальных управлений в форме неравенств знакопостоянства для функций одной и двух переменных. Реализация предлагаемых условий носит вполне элементарный вычислительный характер, сопоставимый с проверкой управлений на экстремальность. Библ. 9.
Ключевые слова: линейная фазовая система, невыпуклая задача оптимизации, экстремальные управления, достаточные условия оптимальности.
DOI: 10.7868/S004446691510004X
1. ВВЕДЕНИЕ
Рассматривается задача оптимизации билинейно-квадратичного функционала на траекториях линейной фазовой системы с модульным ограничением на управление. Экстремальные управления данной задачи являются, вообще говоря, кусочно-постоянными функциями времени со значениями ± 1. Исследуется проблема оптимальности простейших реализаций такого типа: управления без переключений, с одной точкой переключения и т.д. Построены явные представления для целевого функционала относительно управления, не содержащие фазовых и сопряженных переменных. В результате простых заключений получаются достаточные условия оптимальности избранных управлений в форме знакоопределенности для функций одной и двух переменных. В типичной задаче на максимум нормы конечного состояния достаточные условия связаны с согласованным изменением набора функций времени: знакопостоянство либо совпадающие точки смены знака.
Необходимо отметить, что реализация представленных условий носит вполне элементарный вычислительный характер: это проверка некоторых функций на неотрицательность в пределах отрезка времени. Если эти функции допускают явные аналитические выражения через параметры задачи (начальное состояние, конечное время, коэффициенты фазовой системы), то полученные условия в определенной мере решают проблему параметрического синтеза, т.е. описывают множество параметров, для которых заданное управление является оптимальным в соответствующей задаче. В этом контексте приведены иллюстрирующие примеры. Установлена связь предлагаемых условий с принципом максимума, которая характеризуется следующим взаимодействием: неотрицательность подынтегральной функции (достаточное условие) ~ неотрицательность интеграла (необходимое условие).
Укажем достаточные условия оптимальности общего характера, связанные с функцией Понтрягина (условие вогнутости гамильтониана по фазовым переменным, экстремальное свойство фазовой траектории, сильно экстремальные управления (см. [1]—[5])). В рамках рассматриваемой задачи их применение представляется весьма проблематичным. Для задачи на максимум евклидовой нормы конечного состояния хорошо известно необходимое и достаточное условие
1) Работа выполнена при финансовой поддержке РФФИ (код проекта 14-01-00564).
1670
оптимальности в форме неположительности функции многих переменных (опорная функция множества достижимости) на сфере (поверхность уровня целевой функции) (см. [6]). Разработаны различные схемы реализации этого критерия (см. [7], [8]), однако эвристические элементы в соответствующих итерационных алгоритмах пока сохраняются. Предлагаемые в данной статье условия оптимальности являются только достаточными, но обладают свойством эффективной безытерационной реализации, вполне аналогичной процедуре проверки принципа максимума для некоторого управления.
2. ПОСТАНОВКА ЗАДАЧИ И НЕОБХОДИМЫЕ СООТНОШЕНИЯ
Введем переменные: t е T = [t0, tj — время, u(t) е R — управление, x(t) е R" — фазовое состояние, и определим основные элементы рассматриваемой задачи:
1) линейная система
x = A(t)x + b(t)u, x(t0) = x0 (1)
с непрерывными функциями A(t) е Rnxn, b(t) е Rn, t e T ;
2) множество допустимых управлений
V = {u e PC(T) : \u(t) « 1, t e T}
с кусочно-непрерывными функциями u(t), t e T, и модульным ограничением;
3) целевой функционал
Ф(и) = ±( x(ty), Cx(ty)) + Д( a(t), x(t)) u(t) + Ux(t ), D(t)x(t)) ) dt
h
с условиями симметричности матриц C, D(t) и непрерывности функций a(t), D(t), te T. Сформулируем задачу оптимального управления
Ф(и) ^ max, u g V, (P)
т.е. это невыпуклая задача на максимум билинейно-квадратичного функционала, в которой принцип максимума не является достаточным условием оптимальности.
Для вывода таких условий в задаче (P) определим необходимые соотношения и получим явное представление для функционала относительно управления.
Рассмотрим фазовую систему (1). Введем фундаментальную матрицу F(t,T), t, т e T, которая определяется альтернативными уравнениями
Ft (t, т) = A(t)F(t,T), F(t,t) = E,
Fx(t,i) = -F (t,T)A(T), F (t, t) = E,
где E — единичная матрица. Отметим полезное тождество
F(t,T)F(%,ï) = F(t,Z) t, t, 2, e T,
и представим формулу Коши для решения x(t, и) фазовой системы, соответствующего управлению и e V :
t
x(t, и) = F (t, t0)x(t0) + J F(t, x)b(x)u(x)d т. (2)
h
В частности, для и = 0 имеем
x(t, 0) = F(t, to)x(to), t e T. (3)
В рамках задачи (P) образуем функцию Понтрягина
Н(у, x, и, t) = (у, A(t)x + b(t)u) + (a(t), x)u +1 ( x, D(t)x)
с производной
Hu(y, x, t) = {a(t), x) + (b(t), y) (4)
и сопряженной системой для вектор-функции ? е Т:
у = -Ат(0у - Щ)х - аЦ)и, у(^) = Сх(^). (5)
Определим вторую сопряженную систему для матричной функции ¥(?), ? е Т:
Ф = -Ат(0¥ - ¥А(0 - Щ\ = С.
Соответствующее выражение через фундаментальную матрицу имеет вид
Г н
Y(0 = F т(?1, t)
C + ¡FT (т, tl)D(x)F(x, ti)dx
F (t1, t).
Пусть y(t, 0), t e T, — решение сопряженной системы (5) для u = 0, т.е.
\j/(t, 0) = -AT(t)¥(t, 0) - D(t)x(t, 0), ¥(tb0) = Cx(tb 0). Укажем связь между решениями x(t, 0), y(t, 0):
y(t, 0) = ¥(t)x(t, 0), t G T, (6)
которая проверяется непосредственно.
Перейдем на уровень функционала Ф(и). Будем использовать точную формулу его приращения (без остаточных членов) для пары управлений и, v е V (см. [9]):
h
Ф(^ - Ф(и) = ¡Hu(p(t, и, v), x(t, v), t)(v(t) - u(t))dt,
t0
p(t, u, v) = y(t, u) + ¥(t)(x(t, v) - x(t, u)).
С учетом выражения (4) для производной Hu возьмем за основу вариант этой формулы для v = u, u = 0:
t1
Ф(и) = Ф(0) + ¡((a(t), x(t, u)) + {bit), v(t, 0) + Y(t) (x(t, u) - x(t, 0))) u(t)dt.
t0
Принимая во внимание соотношение (6), получаем промежуточное представление
t1
Ф(u) = Ф(0) + ¡( a(t) + ^(t)b(t), x(t, u) u(t)dt.
t0
Введем в рассмотрение вектор-функцию
p(t) = a(t) + W(t)b(t), t g T,
и применим формулу Коши (2) в совокупности с (3). В результате приходим к явной формуле для функционала
Ф^) = Ф(0) + ¡/ p(t), x(t, 0) + ¡F (t, x)b(x)u(x)d x\ u(t)dt. (7)
k\ t0 I
Это представление открывает возможность получения достаточных условий оптимальности, по крайней мере для простейших управлений, связанных с принципом максимума в задаче (P).
3. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
Согласно принципу максимума экстремальные управления в задаче (P) определяются условием
u(t) = signHu (у(t, u), x(t, u), t), t e T,
т.е. в регулярном случае принимают значения ± 1. С помощью формулы (7) найдем условия, обеспечивающие оптимальность постоянных управлений u(t) = 1, u(t) = -1, t е T, в задаче (P).
Введем в рассмотрение функции
s(t,x) = (p(t), F(t,x)b(x)), so(t) = {p(t), x(t, 0)), t e T, те [tQ, t]. Тогда с учетом формулы (7) получаем представление
фи) = ф0) + ФМ + Ф 2(u), (8)
где
h h ( t ^ ф1(и) = Js0(t)u(t)dt, Ф2(u) = J Js(t,x)u(x)dt u(t)dt.
t0 10 V t0 J
Теорема 1. Если
s(t,x) > 0, So(t) > 0, t e T, те [to, t], (9)
то управление u(t) = 1 является оптимальным в задаче (P).
Доказательство. Пусть выполнены условия (9). Тогда управление u = 1 является решением задачи
Ф^ц) ^ max, u e V. Далее оценим Ф2(ы) по модулю для u e V :
t1 t
Ф2(u)\ « J Js(t,X)u(x)dT
\u(t)\ dt « J Js(t, t) |u(t)| dTdt « JJs(t,t)dTdt
= ф*.
t1 t t1 t
„и TJT. - ф*
t0 t0 t0 t0
Поскольку Ф2(1) = Ф*, то управление и = 1 максимизирует функционал Ф2(и) на V. Теорема доказана. Сформулируем альтернативный результат. Теорема 2. Если
s(t,x) ^ 0, S0(t) ^ 0, t е T, те [t{), t], (10)
то управление u(t) = -1 является оптимальным в задаче (P).
Для доказательства достаточно отметить, что Ф 2(-1) = Ф*, т.е. управление и = -1 в условиях теоремы максимизирует функционалы Ф^и), Ф2(и) на множестве V.
Установим связь достаточного условия (9) с принципом максимума для управления и = 1, который выражается неравенством
Hu(w(t, 1),x(t, 1), t) = (a(t),x(t, 1)) + (b(t), W(t, 1)) > 0, t e T. (11)
Проверим вспомогательное соотношение
t
y(t, 1) = *¥(t)x(t, 1) + j>т (т, t)p(x)dx, t e T. (12)
t
Будем использовать матричное уравнение
dFт (т, t) = -A \t)F \x, t) dt
с условием Fт (t, t) = E. Проведем дифференцирование в (12) с учетом соответствующих уравнений и выражения для p(t). После очевидных преобразований получаем
ti
y(t, 1) = -Aт (t)*¥(t)x(t, 1) - D(t)x(t, 1) - a(t) - Aт (t) j>т (x, t)p(x)dx =
t
= -A \t)y(t, 1) - D(t)x(t, 1) - a(t), т.е. сопряженную систему для y(t, 1). Остается отметить, что в силу (12)
y(tb1) = Cx(t1,1).
В итоге заключаем, что представление (12) справедливо.
Вернемся к неравенству (11) с учетом формулы
(
х((, 1) = х((, 0) + | ¥ ((, т)Ь(т)ё т.
к
Тогда имеем
<a(t), x(t, 1)> = <a(t), x(t, 0)) + J( a(t), F (t,x)b(x)) d т,
(Ь((), Ч((, 1)) = {*¥(( )Ь((), х((, 0)) + ¥(( )Ь((), ¥ ((, х)Ь(х)) ^ т + р(х), ¥ (х, ()Ь(( )) ^ т.
(о (
В результате приходим к выражению для производной
( (1
Ни(у((, 1), х((, 1), () = $о(() + р((, х)йх + |*(х, ()й X. (13)
(о (
Отметим, что неравенства
¡((,х) ^ 0, ( е Т, те [(о, (] 5(Х, () ^ 0, те [(, (11 ( е Т,
эквивалентны. Таким образом, связь достаточного условия оптимальности (9) с принципом максимума (11)
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.