научная статья по теме ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОДНОГО КЛАССА НЕВЫПУКЛЫХ ЗАДАЧ УПРАВЛЕНИЯ Математика

Текст научной статьи на тему «ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОДНОГО КЛАССА НЕВЫПУКЛЫХ ЗАДАЧ УПРАВЛЕНИЯ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 10, с. 1670-1680

УДК 519.626

ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОДНОГО КЛАССА НЕВЫПУКЛЫХ ЗАДАЧ УПРАВЛЕНИЯ1)

© 2015 г. Е. В. Аксенюшкина*, В. А. Срочко**

(*664015 Иркутск, ул. Ленина, 11, БГУЭП;

**664003 Иркутск, ул. К. Маркса, 1, ИГУ) e-mail: srochko@math.isu.ru Поступила в редакцию 15.12.2014 г.

Рассматривается задача оптимизации билинейно-квадратичного функционала относительно линейной фазовой системы с модульным ограничением на управление. На основе специальных представлений для целевого функционала получены достаточные условия оптимальности некоторых классов экстремальных управлений в форме неравенств знакопостоянства для функций одной и двух переменных. Реализация предлагаемых условий носит вполне элементарный вычислительный характер, сопоставимый с проверкой управлений на экстремальность. Библ. 9.

Ключевые слова: линейная фазовая система, невыпуклая задача оптимизации, экстремальные управления, достаточные условия оптимальности.

DOI: 10.7868/S004446691510004X

1. ВВЕДЕНИЕ

Рассматривается задача оптимизации билинейно-квадратичного функционала на траекториях линейной фазовой системы с модульным ограничением на управление. Экстремальные управления данной задачи являются, вообще говоря, кусочно-постоянными функциями времени со значениями ± 1. Исследуется проблема оптимальности простейших реализаций такого типа: управления без переключений, с одной точкой переключения и т.д. Построены явные представления для целевого функционала относительно управления, не содержащие фазовых и сопряженных переменных. В результате простых заключений получаются достаточные условия оптимальности избранных управлений в форме знакоопределенности для функций одной и двух переменных. В типичной задаче на максимум нормы конечного состояния достаточные условия связаны с согласованным изменением набора функций времени: знакопостоянство либо совпадающие точки смены знака.

Необходимо отметить, что реализация представленных условий носит вполне элементарный вычислительный характер: это проверка некоторых функций на неотрицательность в пределах отрезка времени. Если эти функции допускают явные аналитические выражения через параметры задачи (начальное состояние, конечное время, коэффициенты фазовой системы), то полученные условия в определенной мере решают проблему параметрического синтеза, т.е. описывают множество параметров, для которых заданное управление является оптимальным в соответствующей задаче. В этом контексте приведены иллюстрирующие примеры. Установлена связь предлагаемых условий с принципом максимума, которая характеризуется следующим взаимодействием: неотрицательность подынтегральной функции (достаточное условие) ~ неотрицательность интеграла (необходимое условие).

Укажем достаточные условия оптимальности общего характера, связанные с функцией Понтрягина (условие вогнутости гамильтониана по фазовым переменным, экстремальное свойство фазовой траектории, сильно экстремальные управления (см. [1]—[5])). В рамках рассматриваемой задачи их применение представляется весьма проблематичным. Для задачи на максимум евклидовой нормы конечного состояния хорошо известно необходимое и достаточное условие

1) Работа выполнена при финансовой поддержке РФФИ (код проекта 14-01-00564).

1670

оптимальности в форме неположительности функции многих переменных (опорная функция множества достижимости) на сфере (поверхность уровня целевой функции) (см. [6]). Разработаны различные схемы реализации этого критерия (см. [7], [8]), однако эвристические элементы в соответствующих итерационных алгоритмах пока сохраняются. Предлагаемые в данной статье условия оптимальности являются только достаточными, но обладают свойством эффективной безытерационной реализации, вполне аналогичной процедуре проверки принципа максимума для некоторого управления.

2. ПОСТАНОВКА ЗАДАЧИ И НЕОБХОДИМЫЕ СООТНОШЕНИЯ

Введем переменные: t е T = [t0, tj — время, u(t) е R — управление, x(t) е R" — фазовое состояние, и определим основные элементы рассматриваемой задачи:

1) линейная система

x = A(t)x + b(t)u, x(t0) = x0 (1)

с непрерывными функциями A(t) е Rnxn, b(t) е Rn, t e T ;

2) множество допустимых управлений

V = {u e PC(T) : \u(t) « 1, t e T}

с кусочно-непрерывными функциями u(t), t e T, и модульным ограничением;

3) целевой функционал

Ф(и) = ±( x(ty), Cx(ty)) + Д( a(t), x(t)) u(t) + Ux(t ), D(t)x(t)) ) dt

h

с условиями симметричности матриц C, D(t) и непрерывности функций a(t), D(t), te T. Сформулируем задачу оптимального управления

Ф(и) ^ max, u g V, (P)

т.е. это невыпуклая задача на максимум билинейно-квадратичного функционала, в которой принцип максимума не является достаточным условием оптимальности.

Для вывода таких условий в задаче (P) определим необходимые соотношения и получим явное представление для функционала относительно управления.

Рассмотрим фазовую систему (1). Введем фундаментальную матрицу F(t,T), t, т e T, которая определяется альтернативными уравнениями

Ft (t, т) = A(t)F(t,T), F(t,t) = E,

Fx(t,i) = -F (t,T)A(T), F (t, t) = E,

где E — единичная матрица. Отметим полезное тождество

F(t,T)F(%,ï) = F(t,Z) t, t, 2, e T,

и представим формулу Коши для решения x(t, и) фазовой системы, соответствующего управлению и e V :

t

x(t, и) = F (t, t0)x(t0) + J F(t, x)b(x)u(x)d т. (2)

h

В частности, для и = 0 имеем

x(t, 0) = F(t, to)x(to), t e T. (3)

В рамках задачи (P) образуем функцию Понтрягина

Н(у, x, и, t) = (у, A(t)x + b(t)u) + (a(t), x)u +1 ( x, D(t)x)

с производной

Hu(y, x, t) = {a(t), x) + (b(t), y) (4)

и сопряженной системой для вектор-функции ? е Т:

у = -Ат(0у - Щ)х - аЦ)и, у(^) = Сх(^). (5)

Определим вторую сопряженную систему для матричной функции ¥(?), ? е Т:

Ф = -Ат(0¥ - ¥А(0 - Щ\ = С.

Соответствующее выражение через фундаментальную матрицу имеет вид

Г н

Y(0 = F т(?1, t)

C + ¡FT (т, tl)D(x)F(x, ti)dx

F (t1, t).

Пусть y(t, 0), t e T, — решение сопряженной системы (5) для u = 0, т.е.

\j/(t, 0) = -AT(t)¥(t, 0) - D(t)x(t, 0), ¥(tb0) = Cx(tb 0). Укажем связь между решениями x(t, 0), y(t, 0):

y(t, 0) = ¥(t)x(t, 0), t G T, (6)

которая проверяется непосредственно.

Перейдем на уровень функционала Ф(и). Будем использовать точную формулу его приращения (без остаточных членов) для пары управлений и, v е V (см. [9]):

h

Ф(^ - Ф(и) = ¡Hu(p(t, и, v), x(t, v), t)(v(t) - u(t))dt,

t0

p(t, u, v) = y(t, u) + ¥(t)(x(t, v) - x(t, u)).

С учетом выражения (4) для производной Hu возьмем за основу вариант этой формулы для v = u, u = 0:

t1

Ф(и) = Ф(0) + ¡((a(t), x(t, u)) + {bit), v(t, 0) + Y(t) (x(t, u) - x(t, 0))) u(t)dt.

t0

Принимая во внимание соотношение (6), получаем промежуточное представление

t1

Ф(u) = Ф(0) + ¡( a(t) + ^(t)b(t), x(t, u) u(t)dt.

t0

Введем в рассмотрение вектор-функцию

p(t) = a(t) + W(t)b(t), t g T,

и применим формулу Коши (2) в совокупности с (3). В результате приходим к явной формуле для функционала

Ф^) = Ф(0) + ¡/ p(t), x(t, 0) + ¡F (t, x)b(x)u(x)d x\ u(t)dt. (7)

k\ t0 I

Это представление открывает возможность получения достаточных условий оптимальности, по крайней мере для простейших управлений, связанных с принципом максимума в задаче (P).

3. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

Согласно принципу максимума экстремальные управления в задаче (P) определяются условием

u(t) = signHu (у(t, u), x(t, u), t), t e T,

т.е. в регулярном случае принимают значения ± 1. С помощью формулы (7) найдем условия, обеспечивающие оптимальность постоянных управлений u(t) = 1, u(t) = -1, t е T, в задаче (P).

Введем в рассмотрение функции

s(t,x) = (p(t), F(t,x)b(x)), so(t) = {p(t), x(t, 0)), t e T, те [tQ, t]. Тогда с учетом формулы (7) получаем представление

фи) = ф0) + ФМ + Ф 2(u), (8)

где

h h ( t ^ ф1(и) = Js0(t)u(t)dt, Ф2(u) = J Js(t,x)u(x)dt u(t)dt.

t0 10 V t0 J

Теорема 1. Если

s(t,x) > 0, So(t) > 0, t e T, те [to, t], (9)

то управление u(t) = 1 является оптимальным в задаче (P).

Доказательство. Пусть выполнены условия (9). Тогда управление u = 1 является решением задачи

Ф^ц) ^ max, u e V. Далее оценим Ф2(ы) по модулю для u e V :

t1 t

Ф2(u)\ « J Js(t,X)u(x)dT

\u(t)\ dt « J Js(t, t) |u(t)| dTdt « JJs(t,t)dTdt

= ф*.

t1 t t1 t

„и TJT. - ф*

t0 t0 t0 t0

Поскольку Ф2(1) = Ф*, то управление и = 1 максимизирует функционал Ф2(и) на V. Теорема доказана. Сформулируем альтернативный результат. Теорема 2. Если

s(t,x) ^ 0, S0(t) ^ 0, t е T, те [t{), t], (10)

то управление u(t) = -1 является оптимальным в задаче (P).

Для доказательства достаточно отметить, что Ф 2(-1) = Ф*, т.е. управление и = -1 в условиях теоремы максимизирует функционалы Ф^и), Ф2(и) на множестве V.

Установим связь достаточного условия (9) с принципом максимума для управления и = 1, который выражается неравенством

Hu(w(t, 1),x(t, 1), t) = (a(t),x(t, 1)) + (b(t), W(t, 1)) > 0, t e T. (11)

Проверим вспомогательное соотношение

t

y(t, 1) = *¥(t)x(t, 1) + j>т (т, t)p(x)dx, t e T. (12)

t

Будем использовать матричное уравнение

dFт (т, t) = -A \t)F \x, t) dt

с условием Fт (t, t) = E. Проведем дифференцирование в (12) с учетом соответствующих уравнений и выражения для p(t). После очевидных преобразований получаем

ti

y(t, 1) = -Aт (t)*¥(t)x(t, 1) - D(t)x(t, 1) - a(t) - Aт (t) j>т (x, t)p(x)dx =

t

= -A \t)y(t, 1) - D(t)x(t, 1) - a(t), т.е. сопряженную систему для y(t, 1). Остается отметить, что в силу (12)

y(tb1) = Cx(t1,1).

В итоге заключаем, что представление (12) справедливо.

Вернемся к неравенству (11) с учетом формулы

(

х((, 1) = х((, 0) + | ¥ ((, т)Ь(т)ё т.

к

Тогда имеем

<a(t), x(t, 1)> = <a(t), x(t, 0)) + J( a(t), F (t,x)b(x)) d т,

(Ь((), Ч((, 1)) = {*¥(( )Ь((), х((, 0)) + ¥(( )Ь((), ¥ ((, х)Ь(х)) ^ т + р(х), ¥ (х, ()Ь(( )) ^ т.

(о (

В результате приходим к выражению для производной

( (1

Ни(у((, 1), х((, 1), () = $о(() + р((, х)йх + |*(х, ()й X. (13)

(о (

Отметим, что неравенства

¡((,х) ^ 0, ( е Т, те [(о, (] 5(Х, () ^ 0, те [(, (11 ( е Т,

эквивалентны. Таким образом, связь достаточного условия оптимальности (9) с принципом максимума (11)

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком