научная статья по теме ВАРИАЦИОННЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ С ПОЗИЦИОННЫМИ УПРАВЛЕНИЯМИ СПУСКА В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Математика

Текст научной статьи на тему «ВАРИАЦИОННЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ С ПОЗИЦИОННЫМИ УПРАВЛЕНИЯМИ СПУСКА В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ»

ДОКЛАДЫ АКАДЕМИИ НАУК, 2015, том 462, № 6, с. 653-656

ТЕОРИЯ УПРАВЛЕНИЯ

УДК 517.977.5

ВАРИАЦИОННЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ С ПОЗИЦИОННЫМИ УПРАВЛЕНИЯМИ СПУСКА В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ © 2015 г. В. ^ Дыхта

Представлено академиком РАН А.Б. Куржанским 15.10.2014 г. Поступило 06.11.2014 г.

БО1: 10.7868/80869565215180048

1. В сообщении анонсированы нелокальные необходимые условия оптимальности, существенно усиливающие классический [1] и негладкий [2] принципы максимума для важных классов задач без ограничений на траекторию. Основные результаты формулируются в рамках конструкций принципа максимума (ПМ) и носят вариационный характер, так как идентифицируют неоптимальные процессы через вспомогательные вариационные задачи нетрадиционного типа. Предлагаемые условия объединены одним названием — позиционный принцип минимума.

Идейная основа доказательств этих условий восходит к методу Н.Н. Красовского оценки качества позиционных управлений с помощью решений неравенства Гамильтона—Якоби для так называемых слабо убывающих (и-стабильных) функций [3]; см. также [4] и дальнейшее развитие этого подхода в [5—7]. Однако это развитие не привело к появлению необходимых условий оптимальности без оперирования априорно известной функций Беллмана. В [8, 9] обсуждаемый подход был адаптирован к выводу необходимых условий оптимальности, что позволило получить первый вариант позиционного принципа минимума для гладких задач. В [10] он был обобщен и распространен на некоторые негладкие задачи; в данном сообщении класс охватываемых задач существенно расширен, но содержание ограничено формулировками позиционного принципа минимума без детализации метода доказательств.

В качестве базовой рассматривается следую -щая негладкая задача оптимального управления (задача (P)):

Институт динамики систем и теории управления Сибирского отделения Российской Академии наук, Иркутск

E-mail: dykhta@gmail.com

x = f( t, x, u), x (t0) = Xo, (1)

u(t) e U, t e T = [ t0, t1 ], J[x, u] = l(x(t1)) ^ min.

Считаем, что выполнены основные предположения:

(H1) множество Uс Rm компактно;

(H2) вектор-функция f(t, x, и) непрерывна и локально липшицева по x на T х Rn х U;

(H3) выполняется условие сублинейного роста

f(t, x, u)|< с(1 + |x|) на Tх Rn х U (с > 0);

(H4) функция l(x) непрерывна.

Задача (P) рассматривается на множестве допустимых пар функций а = (x, и) с абсолютно непрерывными траекториями и измеримыми, ограниченными управлениями. Через а = (x, u) обозначается допустимая пара (процесс), исследуемая на оптимальность.

Под позиционным управлением понимается любая однозначная функция v: T х [n ^ U. Через ^(v) обозначается пучок всех решений системы (1) с таким управлением, который является объединением решений Каратеодори и конструктивных движений Красовского—Субботина [3, 5] (иначе — кривых Эйлера [6, 7]).

2. Введем функцию Понтрягина H(t, x, у, и) = = у ■ f(t, x, и) и сопряженное дифференциальное включение

-у(t) e dxH(t, ~x(t),y(t), u(t)), (2)

где символ dxH означает частный обобщенный градиент Кларка по x [2].

Рассмотрим последовательно три класса негладких задач типа (P) в порядке возрастающей общности.

Задача (P1) с негладкой динамикой, но с дополнительным предположением гладкости целевой функции: l(x) e C2([n).

654

ДЫХТА

Обозначим через а) множество всех решений включения (2) с граничным условием у(?0 = = 1Х(х (?{)) и для любого у е ¥( а) определим вектор-функцию

РЧ(?, х) = у(?) + 1х(х) - 1х(х(?)) и многозначное отображение

(3)

UJ t, x) = Arg minpv (t, x) • f( t, x, u).

(4)

Пусть Tv — множество селекторов отображения Uy(t, x), интерпретируемых как позиционные управления.

Теорема 1. Пусть ä = (X, U) — оптимальный процесс в задаче (P1). Тогда:

а) для любого у е ¥( ä) выполняется неравен -ство

l(X(t1 ))< minJ l(x(h))| x е ^ Ж( v) 1;

l v e T¥ J

б) существует такое у е ¥( ä), что траектория x оптимальна в следующей задаче:

l(x(t1 min, x е Ж( v). (5)

V e T¥

Это необходимое условие оптимальности, как и все следующие теоремы, назовем позиционным принципом минимума. Он отличается от известных вариантов негладкого ПМ оперированием всем множеством котраекторий ¥(ä) и вариационным характером присоединенной задачи (5), в которой оптимальная траектория исходной задачи необходимо должна быть оптимальной. Непосредственно с ПМ задачи (P1) связано только утверждение б) теоремы 1: в действительности экстремальность процесса ä (в смысле выполнения для него ПМ)

равносильна только допустимости траектории x в присоединенной задаче (5) хотя бы при одной у е ¥(ä). Однако и утверждение а) является важным и эффективным: котраектории у е ¥( ä), с которыми ä не удовлетворяет условиям ПМ, могут порождать (по правилу (3), (4)) позиционные управления спуска по функционалу и тем самым не только браковать процесс ä, но и конструктивно задавать процедуру приближения к минимуму.

Пример 1. xx = и1[1 — (u2 — t)2], x2 = + u3, x1(0) = x2(0) = 0, u1 е [-1, 1], u2 е [0, 1], u3 е {-1, 0}, J = — x2(1) ^ min.

В [11] управляемая система данного примера использовалась для иллюстрации критерия гра-ничности траекторий, но мы рассматриваем в ней задачи оптимизации.

Для а = (х, и) = 0 котраектория у (?) = (0, —1) е е ¥(а) и с ней а удовлетворяет негладкому ПМ, т.е. является экстремалью. Однако позиционный принцип минимума бракует а, причем утверждение а) теоремы 1 нарушается при другой котраек-тории у (?) = (1 — ?, —1) е ¥(а) с одноточечным экстремальным отображением = {и* = (1, ?, 0)}. Оно

задает процесс а*, для которого /[а*] = — 1 < 0 =

= /[а ]. Легко показать, что этот процесс оптимален.

В качестве следствия из теоремы 1 получается усиление классического ПМ для гладкой задачи (Р) с непрерывной производной/х(?, х, и). В этой задаче множество ¥(а) состоит из единственной котраектории, так что условие а) можно опустить.

Задача (Р2), в которой целевая функция 1(х) предполагается полувогнутой [12], т.е. существует число С > 0 (константа полувогнутости), такое, что функция х ^ 1(х) — СХ|2 вогнута на Я". Тогда I локально липшицева, и сопряженное включение (2) должно рассматриваться с граничным условием у(?1) е д1( х (?1)), где символ "д" означает градиент Кларка. Известно [13], что вектор ж е д1(х (?1)) в том и только том случае, если выполняется неравенство

1(х) - 1(х(?!)) < 5(х - х(?!)) + с|х - х(?!)|2

для всех х е Я". Отсюда следует, что квадратичная функция ^ ж(х), определенная правой частью этого неравенства, является функцией сравнения

для Iв точке х (?1) на Я" [8—10]; это означает, что из оптимальности а в задаче (Р2) следует оптимальность а в задаче сравнения (СР^) с функционалом ^£ж(х(?1)) вместо /(х(?1)). Но каждая из задач сравнения семейства

{( CPXS )| s ед l (x (ti))}

(6)

относится к классу (Р1); поэтому из теоремы 1 следует

Теорема 2. Если процесс а оптимален в задаче (Р2), то он удовлетворяет позиционному принципу минимума в каждой из задач семейства (6).

Задача (Р3) с целевой функцией I, предста-вимой в виде разности 1(х) = /1(х) — /2(х), где /1 — дважды гладкая, а 12 — конечная выпуклая функция на Я". При выпуклой /1 этот случай охватывает важный класс .ОС-функций, равных разности двух выпуклых [14].

ВАРИАЦИОННЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

655

Легко убедиться, что в задаче (Р3) при любом

q е д12(х (?1)) дважды гладкая функция Ь'1(х) = /1(х) — — q ■ х является функцией сравнения для I в точке

х(?1) на Я" и, следовательно, определяет задачу сравнения (СР,). По аналогии с заключением по задаче (Р2) получаем следующий результат.

Те о р е м а 3. Если процесс а оптимален в задаче (Р3), то он удовлетворяет позиционному принципу минимума каждой из задач семейства

{(СРЬ„)|д едX(г 1))}.

П р и м е р 2 получается из примера 1 заменой функционала на J = а х2 (1) — Х2(1)1 с функцией 1(х) = ах1 — Х2| и параметром а > 0.

Процесс а = (х, и) = 0 удовлетворяет негладкому ПМ при любом а > 0 — достаточно взять у = = (0, —1) е ¥(а). Для применения теоремы 3 имеем семейство функций сравнения х) = а х2 — qx2, q е [—1, 1] (ибо д/2(0) = [—1, 1]). Если взять д = 1,

то в соответствующей задаче сравнения у е ¥( а), но не порождает управлений спуска. Однако ко-траектория у = (1 — —1) обеспечивает этот

1"

спуск, по крайней мере, при a е

' 2

с управле-

нием

u*(0 = Х[0, т] - Х(т, 1 ],

u*

= t, u* = 0,

где Ха — характеристическая функция множества

A с T, а т =

1

2 a + 1

. Следовательно, при a е

0,

процесс а не оптимален, а решение задачи может быть продолжено тестированием управления спуска и*.

Таким образом, в негладких задачах полученные необходимые условия оптимальности в общем случае характеризуют оптимальный процесс через бесконечную серию присоединенных вариационных задач с гладкими целевыми функциями. Эти условия оптимальности сильнее негладкого ПМ, который следует из позиционного принципа минимума для хотя бы одной из присоединенных задач указанных семейств.

3. В заключение отметим, что позиционный принцип минимума допускает обобщение на скользящие режимы, т.е. на допустимые процессы овыпукленной задачи (Р) с управлениями-мерами, а также на выбор в качестве эталонного более современных, но сложных вариантов негладкого ПМ [15]. Для гладких задач он задает

конструктивную итерационную схему спуска, особенно эффективную в комбинации с двойственным позиционным принципом [8, 9] для невыпуклых задач линейных и квадратичных по состоянию.

Представляет безусловный интерес обобщение позиционного принципа минимума на задачи с ограничениями на траекторию, а также на задачи оптимального синтеза, поставленные непосредственно в классе позиционных управлений.

Работа выполнена при частичной финансовой поддержке РФФИ (проект 14—01—00699), Совета по грантам Президента Российской Федерации для государственной поддержки ведущих научных школ (проект НШ-5007.2014.9) и Программы фундаментальных исследований Президиума РАН (проект № 17.1).

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961. 388 с.

2. Кларк Ф. Оптимизация и негладкий анализ. М.:

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком