научная статья по теме ДИНАМИЧЕСКИЙ МЕТОД МНОЖИТЕЛЕЙ В ТЕРМИНАЛЬНОМ УПРАВЛЕНИИ Математика

Текст научной статьи на тему «ДИНАМИЧЕСКИЙ МЕТОД МНОЖИТЕЛЕЙ В ТЕРМИНАЛЬНОМ УПРАВЛЕНИИ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 5, с. 776-797

удк 519.626

ДИНАМИЧЕСКИЙ МЕТОД МНОЖИТЕЛЕЙ В ТЕРМИНАЛЬНОМ УПРАВЛЕНИИ1

© 2015 г. А. С. Антипин, О. О. Васильева

(119333 Москва, ул. Вавилова, 40, ВЦ РАН;

Республика Колумбия, 760032 Кали, 100-00 Калье, 13, Университет Дель Валье) e-mail: olga.vasilieva@correounivalle.edu.co; antipin@ccas.ru Поступила в редакцию 11.11.2014 г.

Предлагается метод решения задачи терминального управления с фиксированным интервалом времени и фиксированными начальными условиями. На правом конце временного интервала задана краевая задача, решение которой определяет терминальные условия. Краевая задача представляет собой конечномерную задачу выпуклого программирования. Динамика задачи терминального управления описывается линейной управляемой системой дифференциальных уравнений. Эта система трактуется как система обычных линейных ограничений типа равенств. Тогда задача терминального управления может рассматриваться как динамическая задача выпуклого программирования, сформулированная в бесконечномерном функциональном гильбертовом пространстве. Функциональная задача трактуется не как задача оптимизации, а как седловая задача. Соответственно, для решения задачи предлагается сед-ловой подход, основанный на решении задачи максимизации двойственной функции, которая порождается модифицированной функцией Лагранжа задачи выпуклого программирования, сформулированной в функциональном пространстве. Сходимость методов также доказывается в функциональном пространстве. Эта сходимость обладает дополнительным свойством монотонности по норме пространства относительно управлений, фазовых траекторий, сопряженных функций, а также относительно конечномерных терминальных переменных. Библ. 23.

Ключевые слова: линейная задача терминального управления, функция Лагранжа, модифицированная функция Лагранжа, седловой метод, сходимость.

Б01: 10.7868/80044466915050051

1. ПОСТАНОВКА ЗАДАЧИ

Рассматривается задача терминального управления линейной дифференциальной системой на фиксированном интервале времени [?0, ?1] с заданным начальным условием v(t0) = V, и подвижным правым концом. Терминальное условие на правом конце определяется как решение задачи выпуклого программирования. Если функции ы(1) е и пробегают все множество управлений, то правые концы траекторий v(í1) = v1 описывают множество достижимости v1 е К(^) с К". На К" определена выпуклая терминальная функция ф1( v1) и задан выпуклый многогранник.

Задача терминального управления с краевой задачей оптимизации на правом конце может быть сформулирована следующим образом: найти такое оптимальное управление и*(0, чтобы

отвечающая ему траектория v*(t) порождала правый конец = V* , который минимизировал бы терминальную выпуклую функцию ф^^) на пересечении множества достижимости К(^) и многогранника.

Формальная постановка задачи в гильбертовом пространстве имеет вид

I v(0 = Б(0 v(0 + В(0и(0, v(/„) = V,, е К",

1) Работа выполнена при финансовой поддержке РФФИ (код проекта 15-01-06045) и Программы поддержки ведущих научных школ (код проекта НШ-4640.2014.1).

и =

и(• )е И2 [г,]| [|и(012л < я2

, г0 < г< г,,

V* е Argmin{ф1 ( V!)|А, V, < а,, V, е V}, V* = V*(г!), где множество достижимости можно представить в форме У1 е {V! е = v(t1) = v1( г) |г = }. В дальнейшем эту систему будем записывать в виде

V* е А^тт( V,) |А, V, < а,,

(1)

йг

v(г) = Б(г) v(г) + в(г)и(г), v(г0) = и(•) е и!

(2)

и =

и(•) е ь"2[го, г,]| ||и(г)|2йг<

V*( г,) = V* е V.

(3)

Из условия = V* е У1 с К" можно видеть, что минимум задачи (1) ищется на пересечении многогранника и множества достижимости динамики (2).

Здесь Б(1), Б(0 есть (п х п), (п х г)-матричные функции, непрерывно зависящие от времени, А1 — фиксированная матрица размера (т х п), где т > п (число строк больше числа переменных; здесь предполагается, что условия v1 > 0 включены в общую систему). Управления принадлежат

выпуклому, замкнутому, ограниченному по норме пространства Ьг2 [?0, t1] множеству «(•) е и. Это множество представляет собой интегральное неравенство (3). Такая форма задания множества управлений отличается от традиционной "геометрической", где все значения функций-управлений принадлежат выпуклому компакту в [№". Естественно, что все "геометрические" управления вкладываются в множество управлений, заданных в интегральной форме. Но последнее множество, будучи ограниченным, существенно богаче, так как содержит функции поточечно неограниченные, которые могут принимать значения на всей вещественной оси. Последнее означает, что если управление пробегает все множество (3), то соответствующее множество достижимости совпадает либо с пространством либо с его подпространством.

В качестве решения дифференциального уравнения (2), (3) может быть любая функция v(•) е е Ьп2 [?0, t1], которая удовлетворяет этой системе для почти всех t е [0, ?1]. В частности, такой функцией может быть "канторова лестница" (см. [14, с. 361]), которая не является абсолютно непрерывной функцией. Эта функция дифференцируема почти всюду, но ее нельзя восстановить по ее производной, при этом она является решением простейшего дифференциального уравнения типа (2). Поэтому систему (1)—(3) будем рассматривать не на всем пространстве траекторий

v(t) е Ьп2 [?0, ?1], а на его подмножестве абсолютно непрерывных функций (см. [1]). Любая функция из этого подмножества удовлетворяет тождеству

v(г) = v(г0) + |(Б(т) v(т) + В(т)и(т))-т, г0 < г < г,.

(4)

В [2, т. 1, с. 443] показано, что любому управлению «(•) е и с Ьг2 [ t0, для линейной дифференциальной системы (2), (3) отвечает единственная траектория Полученная пара в совокупности удовлетворяет тождеству (4). Траектория в этой ситуации является абсолютно непрерывной функцией. Класс абсолютно непрерывных функций представляет собой линейное многооб-

разие, всюду плотное в Ь2 [?0, ?1]. В дальнейшем это линейное многообразие будем обозначать через

ЛС[{0, ?1] с Ь" [?0, ?1], а его замыкание — через АС" [?0, ?1] = Ь"п [?0, ?1]. Для любой пары функций «(•) е АС t1] х и выполняются формулы Ньютона—Лейбница и, соответственно, формулы интегрирования по частям.

В приложениях управление «(•) часто является кусочно-непрерывной функцией. При этом наличие точек разрыва на управлении «(•) никак не сказывается на значениях траектории х(-). Более того, траектория останется без изменения даже в том случае, если изменить значения функции «(•) на множестве меры нуль.

Скалярные произведения и нормы во введенных пространствах определяются соответственно в виде

< х( •), У (• )> = | < X (г), У (г)> йг, х (• )|2 = | X (012йг,

где

<Х( г), у (г )> = £х( г)у(г), |х(г)| = £х2 (г),

х(г) = (Х1(г), ..., X"(г))т, у(г) = (у1 (г), ..., уп(г))т.

Линейная управляемая система (2), (3) представляет собой линейное ограничение, которое выделяет линейное многообразие функций (процессов) «(•), определенных на отрезке [?0, ?1]. Как уже было сказано, правые концы траекторий порождают множество достижимости К(^) с К". В К" определена целевая функция ф^и некоторый многогранник. Целевая функция выделяет на множестве достижимости (с учетом допустимых решений многогранника) точку минимума или выпуклое замкнутое множество таких точек. Любую точку минимума этой функции будем трактовать как конечное (терминальное) условие для динамики (2). Теперь задача выглядит следующим образом: требуется выбрать такое управление ы*(1) е и, чтобы правый конец траектории у*(?1), отвечающий этому управлению, совпал с точкой минимума функции ф^^) на пересечении множества У1 и многогранника, где У1 — множество достижимости динамической системы (2).

Задачи типа (1)—(3) и их обобщения расматривались также в [3]—[8].

"

"

2. КЛАССИЧЕСКАЯ ФУНКЦИЯ ЛАГРАНЖА

Сформулированная задача трактуется как задача выпуклого программирования, определенная в бесконечномерном функциональном пространстве. В [2] показано, что такая задача всегда имеет решение, а в случае регулярности ограничений (типа условия Слейтера) функция Лагран-жа задачи имеет седловую точку относительно своих прямых v(t), ы(1) и двойственных у(0, р1 переменных. Причем первая компонента является решением прямой задачи (1)—(3), а вторая — ее двойственной.

Учитывая сказанное, введем функцию Лагранжа для задачи (1)—(3):

Ь(ръ VI, у(•), v(•), и(•)) = ф1( VI) + <Р1, А1 VI - Й1> +

г й (5)

+ |<у( г), Б (г) V (г) + в (г) и (г) - й v( г)> йг,

>0

для всех р1 е К'; , v1 е К", у(-) е ^2 [ t0, t1], (v(•), «(•)) е ЛС[^, t1] х и, где AC[t0, t1] х и с Ь2 [t0, t1] х х Ь2 [to, tl], а е [to, Ь] с (Ь" [to, tl])т, v(to) = vo.

Здесь К+ — положительный ортант из К™, а [t0, t1] — линейное многообразие абсолютно не-

'^2 ['0,

прерывных функций. Это множество всюду плотное в Ь"2 t1], т.е. замыкание многообразия

['о. по норме Ьп2 ['0, совпадает с Ьп2 ['0, Каждый элемент у(-) трактуется как нормаль линейного функционала <у(0, D(t)v(t) + В(')и(') — — v(t)) из сопряженного пространства линейных

&

функционалов, определенных на Ьп2 ['0, Напомним, что сопряженное пространство к Ьп2 ['0,

есть оно само. Акцентируем еще раз, что двойственная переменная у(-) е ^ ['0, изменяется на линейном многообразии абсолютно непрерывных функций.

Седловая точка (р* , у*(0), (V* , у*(-), «*(•)) функции Лагранжа, образованная прямыми и двойственными решениями задачи (1)—(3), по определению удовлетворяет системе неравенств

'1

й

Ф1 (V*) + {ръ АV* - А1) + |<у('), Б(') V*(') + В(0и*(') - ('))

<

'1

<

0

Ф1( V*) + <р*, АV* - А1) + |<у *('), Б(') V*(') + В(')и*(') - |V*('))< (6)

<Ф1 ( V!) + <р*, - А1) + |<у * ('), Б(') v(') + В(')И(') - й v(')>й'

0

для всехр1 е К+ , у(-) е ^2 ['0, '1], v1 е К", (у(-) х «(•)) е Ж^0, '1] х и, v(í0) =

Левое неравенство этой системы представляет собой задачу максимизации линейной функции по переменным (р1, у(-)) е К^ х ^ ['0, '1]. Из неравенства имеем

<р1 -р*, А V* - А1) + |<у(') - V*('), Б(') V*(') + В(')и*(') - ('))< 0, (7)

гдер1 е К^ , у(-) е ^2 ['0, '1], ^('о) = V). В силу принадлежности элементов (р1, у(0) е К^ х ^ ['0, '1], неравенство (7) выполняется тогда и только тогда,

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком