научная статья по теме НЕСТАНДАРТНАЯ ДВОЙСТВЕННОСТЬ И НЕЛОКАЛЬНЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В НЕВЫПУКЛЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [ Автоматика. Вычислительная техника

Текст научной статьи на тему «НЕСТАНДАРТНАЯ ДВОЙСТВЕННОСТЬ И НЕЛОКАЛЬНЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В НЕВЫПУКЛЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [»

Автоматика и телемеханика, № 11, 2014

© 2014 г. В.А. ДЫХТА, д-р физ.-мат. наук (dykhta@gmail.com) (Институт динамики систем и теории управления СО РАН, Иркутск)

НЕСТАНДАРТНАЯ ДВОЙСТВЕННОСТЬ И НЕЛОКАЛЬНЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В НЕВЫПУКЛЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ1

Для частичной реализации идеи рассмотрения нелинейных задач оптимального управления непосредственно на множестве экстремалей Понт-рягина (или на квазиэкстремалях, если оптимального решения не существует) вводятся в рассмотрение вспомогательные функции канонических переменных, названные бипозиционными, и соответствующий модифицированный лагранжиан задачи. Лагранжиан подлежит минимизации на траекториях канонической системы из принципа максимума. Этот общий подход конкретизирован для невыпуклых задач, линейных по состоянию, и привел к нестандартно двойственной задаче оптимального управления на траекториях сопряженной системы. Применение к исходной и двойственной задачам позиционного принципа минимума позволило получить пару необходимых условий оптимальности, существенно усиливающих принцип максимума и допускающих конструктивную реализацию в форме итерационной процедуры решения задач. Общий подход, признаки оптимальности и итерационная процедура решения иллюстрированы на серии примеров.

1. Введение и постановка задачи

Известно, что решение любой задачи оптимального управления (если оно существует) необходимо искать среди экстремалей, т.е. управлений, удовлетворяющих принципу максимума Понтрягина [1]. Поэтому заманчива идея рассмотрения задачи непосредственно на множестве экстремалей. Она во многом перекликается с методом характеристик для уравнения Гамильтона -Якоби - Беллмана и характеризуется общеизвестными трудностями. В статье предлагается частичное воплощение идеи, которое основано на введении модифицированного лагранжиана задачи, определенного на траекториях канонической системы из принципа максимума. Модифицированный лагранжиан формируется по классическому [2] или кротовскому образцу [3, 4], но с использованием некоторой функции 5(Ь, х, ф) канонических переменных. Такие функции условимся называть бипозиционными. Решение рассматриваемой задачи или вывод условий оптимальности предлагается получать из своеобразной задачи сравнения - минимизации лагранжиана на траекториях канонической системы при подходящем выборе функции 5. Этот путь

1 Работа выполнена при частичной финансовой поддержке Российского фонда фундаментальных исследований (грант № 14-01-00699-а), федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» (соглашение № 8211 от 06.08.2012) и Совета по грантам Президента Российской Федерации для государственной поддержки ведущих научных школ (НШ-5007.2014.9).

напоминает метод Кротова, но обладает большей гибкостью, поскольку варьирование сопряженных траекторий ф(Ь) в задаче сравнения можно интерпретировать как поиск разрешающей функции Кротова ^(Ь, х) = Б(Ь, х, ф(Ь)).

После формального описания общего подхода и примеров он конкретизируется для важного класса невыпуклых задач, линейных по состоянию, в том числе билинейных. В этом случае подход приводит к нестандартно двойственной, эквивалентной задаче оптимального управления на траекториях сопряженной системы. При этом возникает возможность применения к двойственной задаче (да и к исходной) позиционного принципа минимума из [5, 6] - нелокального необходимого условия оптимальности с использованием позиционных управлений спуска по функционалу, - существенно усиливающего принцип максимума. (Для замкнутости изложения он формулируется в разделе 2 в достаточной общности.) Таким образом, для линейных по состоянию задач получается пара независимых необходимых условий оптимальности, которые естественным образом комбинируются между собой, образуя конструктивную схему решения задачи (а не просто пару проверочных тестов). Технология применения признаков оптимальности вместе с итерационной схемой решения задач подробно описана на примерах.

Начнем со следующей задачи оптимального управления (назовем ее задачей (Р)):

(1) х = /(г,х,п), х(г0) = хо,

(2) и(Ь) е и, Ь е Т =[1о,Ьг],

(3) 3[х,п] = ¡(х(Ь{)) ^ М.

Задача (Р) будет рассматриваться на множестве Б пар функций а = (х,и), в которых траектории х(-) абсолютно непрерывны, а управления и(-) измеримы и ограничены на отрезке Т. Через а = (х, й) обозначается допустимый процесс, исследуемый на оптимальность (для простоты анализируется этот случай).

Будем предполагать, что множество и С Ят компактно, а функции /, I обладают свойствами непрерывности и гладкости, характерными для теории классического принципа максимума Понтрягина (кратко - ПМ). Лишь в следующем разделе потребуются дополнительные предположения, которые будут оговорены.

Введем обозначения: а ■ Ь - скалярное произведение векторов а и Ь; в матричных операциях штрихом обозначается транспонирование;

Н(Ь, х,ф,и) = ф ■ /(Ь, х, и)

- функция Понтрягина;

(4) ф = -Нх(г, х, ф, и), ф(и) = ¡х(х(Ь\))

- сопряженная система для котраекторий ф( ) в задаче (Р); граничное условие в (4) соответствует ПМ, в котором вдоль экстремального процесса в действительности выполняется условие .минимума Н по управлению и е и.

2. Позиционный принцип минимума

Анонсируем необходимый здесь результат из [5, 6] при следующих дополнительных предположениях на задачу (Р): (Н1) вектор-функция f (Ь,х,и) обеспечивает глобальное существование и

равномерную ограниченность всех траекторий системы (1), (2); (Н2) функция 1(х) дважды непрерывно дифференцируема. Под позиционным управлением будем понимать любую функцию у(Ь,х), однозначно определенную на Т х Кп со значениями в и .В качестве траекторий системы

Х = /(¿,х,у(Ь,х)), х(Ь0) = х0

с таким управлением (которая не обладает свойством единственности решения из-за возможных разрывов управления у) будут использоваться два типа решений:

а) решения х() типа Каратеодори, если только суперпозиция у(Ь,х(Ь)) измерима на отрезке Т и, следовательно, порождает допустимое программное управление;

б) конструктивные движения Красовского - Субботина [7, 8] (иначе -кривые Эйлера [9]) - равномерные пределы соответствующих ломаных Эйлера.

Множество решений первого типа обозначим через X0(у), второго - через Xк(у), а их объединение - через X(у). Все эти решения определены на отрезке Т.

Для замкнутости изложения напомним определение конструктивных движений Красовского - Субботина, соответствующих позиционному управлению у(Ь, х).

Возьмем любое разбиение А = {Ь0 = в0 < ... = ¿1} отрезка Т и по-

строим рекурсивно непрерывную ломаную Эйлера хд(-) как решение системы

Х = ¡(г,х,у(вг,хА(вг))), ге[вг,вг+1), ¿ = мг,

с кусочно-постоянным программным управлением ид(Ь) = у (вг ,хд(в^)), Ь € [вг, вг+1), и начальным условием х(Ьо) = хо. Рассматривая всевозможные разбиения А, получим пучок ломаных Эйлера (А-траекторий) Хд(у). соответствующих данному позиционному управлению у. Пусть |А| = = тах(вг+1 — вг) - диаметр разбиения А. Любой равномерный предел после-

г

довательности ломаных Эйлера при | А| —^ 0 называется конструктивным движением (предельной траекторией) или кривой Эйлера. Пучок этих конструктивных движений обозначен выше через Xк(у).

Пусть - решение сопряженной системы (4), соответствующее процессу а. Определим вектор-функцию

р{г,х) =ф{1)+1х{х)-1х{х{1))

и многозначное отображение

(5) и-т{1, х) = Argmmp(t, х) ■ /(£, х, и).

пеи

Пусть V-ф - множество всех его селекторов, т.е. функций v(t, х) со значениями в и~ф{1,х), рассматриваемых в качестве позиционных управлений.

Теорема 1. Если процесс а = (х,и) оптимален, то при любом выборе селектора v(t, х) £ V^ выполняется неравенство

l(x(h)) < l(x(t 1)) Var(-) £ X(v).

Более того, траектория х доставляет минимум функционалу в вариационной задаче

(6) l{x{ti)) — min, x(-) е (J X(v).

veVj

Необходимое условие оптимальности теоремы 1 включает в себя ПМ; его подробное обсуждение содержится в [6]. Заметим, что в силу (6) позиционный принцип минимума носит вариационный характер - он формулируется через бесконечномерную экстремальную задачу, в то время как в ПМ такая задача конечномерна.

3. Модифицированный лагранжиан и задача сравнения в канонической системе

Управляемую систему (1), (2), (4) будем называть канонической и обозначать через Г множество всех троек функций 7 = (х,ф,и), связанных на отрезке Т этой системой.

Обозначим через Т множество локально липшицевых бипозиционных функций Б(Ь,х,ф) с непрерывными частными производными по х, ф и производной St, удовлетворяющей условиям Каратеодори (т.е. - в данном случае -измеримой по t для всех фиксированных х, ф).

Для любой фиксированной бипозиционной функции Sх,ф) еТ определим .модифицированный лагранжиан задачи (Р), положив

(7) ^[7] = 1(х(г1)) - S(г,х(г),ф(г))\1 + ^в^х^ф^)^^))м.

т

Здесь в^, х, ф, и) - полная производная функции в^, х, ф) в силу канонической системы.

Задачей сравнения с бипозиционной функцией в будем называть следующую задачу оптимального управления в канонической системе:

(8) KsЬ] ^ , 7 е Г.

Поскольку множество О естественным образом вкладывается в Г и при этом вложении . [ст] = Ks [7] V в е Т, то имеет место равенство

(9) Ы.[о] = М Ks[7] V в еТ.

Далее, введем многозначное отображение (ср. с (5))

(10) UH(t, x, ф) = Arg min H(t, x, ф, u)

neu

и обозначим через Г(Р) множество троек y g Г, удовлетворяющих условию минимума функции H по управлению:

(11) u(t) G Uh(t,x(t)^(t)) Vt G T.

Очевидно, что Г(Р) С Г и состоит из всех биэкстремалей задачи (Р), первые две компоненты которых - (x,u) G D - являются экстремалью задачи (Р), а ф - коэкстремалью. (Следуем терминологии [10, 11]; между тем часто, например, в [12, 13] тройки функций y G Г(Р) называют экстремалями задачи, а в [2] - каноническими экстремалями.)

Если предположить, что в задаче (Р) нижняя грань функционала J на множестве D достигается (т.е. оптимальный процесс в D существует), то в силу принципа максимума имеет место равенство

min J [а] = min{l(x(ti))\ (x^,u) G Г(Р )}.

aeD

Отсюда и из равенства (9) следует, что если задачу сравнения (8) рассматривать при дополн

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком