научная статья по теме ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ КРАЕВЫМИ МОДЕЛЯМИ Математика

Текст научной статьи на тему «ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ КРАЕВЫМИ МОДЕЛЯМИ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2014, том 54, № 2, с. 257-285

УДК 519.626

ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ КРАЕВЫМИ МОДЕЛЯМИ1

© 2014 г. А. С. Антипин

(119333 Москва, ул. Вавилова, 40, ВЦ РАН) e-mail: asantip@yandex.ru Поступила в редакцию 10.09.2013 г.

Переработанный вариант 06.10.2013 г.

Формулируется терминальная задача оптимального управления краевыми конечномерными статическими моделями. Конечномерные модели определяют начальные и терминальные состояния объекта управления. Выбор оптимального управления переводит объект из одного состояния в другое. Предлагается седловой метод решения этой задачи. Доказывается сходимость метода в гильбертовом пространстве. Библ. 24.

Ключевые слова: терминальное управление, краевые задачи, прямые и сопряженные функции Лагранжа, седловые методы, сходимость.

DOI: 10.7868/S0044466914020021

1. ПОСТАНОВКА ПРОБЛЕМЫ

Задача терминального оптимального управления состоит в переводе объекта управления из одного состояния (начального) в другое (терминальное) за конечное время. Эта одна из самых общих задач теории управления. В качестве объектов могут фигурировать любые системы и явления из различных областей науки и практики, включая технологии, экономику, экологию, биологию, политику и другие области. Предполагается, что все объекты погружены в некоторую среду и подвергаются воздействию различных факторов постоянно меняющейся среды. Среда описывается управляемой динамикой. В этой ситуации необходимо выбрать управление, т.е. ресурсы, чтобы перевести объект из одного состояния в другое. Будем предполагать, что управляемая динамика описывается системами линейных дифференциальных уравнений.

В качестве математических моделей объектов могут выступать различные конечномерные (статические) модели, такие как задачи выпуклого и равновесного программирования [1], седловые задачи [2], игры n-лиц с равновесием по Нэшу [3], многокритериальные равновесные задачи [4], седловые игры [5], модели экономического равновесия, вариационные неравенства [6]. Наиболее общая и универсальная конструкция, которая включает в себя все перечисленные выше модели, представляет собой задачу вычисления неподвижной точки экстремального отображения. Формально, это означает — найти неподвижную точку v* е W, удовлетворяющую экстремальному включению

v* е Argmin{ Ф( v*, w) + ф(w)|w е Wс Rn}; (1)

здесь (v, w) е W x Wс Rn x Rn, W — выпуклое замкнутое ограниченное множество. Функция Ф^, w) + 9(w) выпуклая по w при любом v е W. В дальнейшем функцию Ф^, w), зависящую от переменных одинаковой размерности, будем называть бифункцией. В регулярном случае экстремальное отображение (1) всегда имеет неподвижную точку (см. [7]). Ниже покажем, что все перечисленные выше конечномерные задачи вложены в (1).

Имея сказанное ввиду, рассмотрим управляемую динамику, которая описывается системой линейных дифференциальных уравнений. Начальные и терминальные условия этой системы заданы неявно, а именно, как решения конечномерных перечисленных выше краевых задач.

1) Работа выполнена при финансовой поддержке РФФИ (код проекта 12-01-00783) и Программы государственной поддержки ведущих научных школ НШ-5264.2012.1.

6

257

Сформулируем задачу терминального управления, где в качестве краевой проблемы выступает задача вычисления неподвижной точки экстремального отображения

V* е Л^шт{Фо(V*, V,) + фо(V)| V е Щ с Я"}, (2)

V* е Лrgшin{Ф:( V*, V!) + ф!( V!)| V! е Щ с Я", (3)

- V(г) = Б(г) V(г) + в(г) и (г), го < г < гъ

йг (4)

V(го) = V*, V; г!) = V*, и (г) е и},

где и — выпуклое, замкнутое множество, ограниченное по норме функционального пространства. Ниже это множество будет конкретизировано. Здесь неподвижные точки экстремальных включений (2), (3) являются начальными и терминальными условиями динамической системы (4).

В общем случае, выбирая управление и(1) е и и начальное условие у(10) = решаем дифференциальную систему (4) и находим единственную траекторию Эта траектория имеет два конца: левых у(10) и правый Затем проверяем, являются ли эти концы решениями краевых задач (2) и (3). Если да, то решение найдено, если нет, то выбирается другая пара. В случае найденного оптимального управления и*(1) е и с Ь2 траектория v*(í) как решение дифференциальной системы (4) переводит объект из начального состояния (2) в терминальное состояние (3). В предлагаемой работе сформулирован седловой подход к решению задачи и доказана его сходимость.

2. ДИНАМИЧЕСКИЕ ЗАДАЧИ

Уточним постановку динамической задачи (2)—(4) и рассмотрим ее в случае, когда конечномерные множества ' = 0, 1, заданы в виде функциональных ограничений типа неравенств, т.е.

V* е Л^шт{Фо(V*, V,) + ф,( V,)< а,}, (5)

V* е Л^шт{Ф!( V*, V!) + ф:( V!) < ах, (6)

- V (г) = Б (г) V (г) + в (г) и (г), го < г < гх,

йг (7)

^ го) = V*, ^ гх) = V*, и (г) е и},

где и = {и(-) е Ь2 [ 10, и(• )|| , < С}. Здесь Б(1), В(1) суть п х п, п х г-матричные функции, непре-

Ь2

рывно зависящие от времени, А0, А1 — фиксированные матрицы, а0, а1 — заданные векторы. В случае если Ф0( V* , V,) = 0, Ф1( V* , v1) = 0, то (5), (6) переходят в задачи выпуклого программирования.

Будем рассматривать динамическую систему (5)—(7) в гильбертовом пространстве. Последнее означает, что с точностью до множества меры нуль все значения функции-управления и(:) принадлежат множеству и с Ь2 [10, 11]. В случае когда управления пробегают все множество и(:) е и, дифференциальная система (7) порождает траектории 1 е [10, 11], левые ^0) = v0 и правые = v1 концы которых описывают множество начальных и терминальных условий. Для линейных управляемых систем множества достижимости могут лежать в пространствах размерности, меньшей п.

В качестве решения дифференциальной системы (7) будем понимать любую пару (у(-), и(:)) е е Ь" [10, 11] х и, удовлетворяющую тождественно условию

г

v(г) = v(г0) + |(Б(х) V (т) + в (т) и(т)) йт, го < г < г!. (8)

Тождество определяет обобщенное решение динамики (7). В ([8, Кн. 1, с. 443]) показано, что любому управлению и() е и в линейной дифференциальной системе отвечает единственная траек-

тория V/), и эта пара удовлетворяет тождеству (8). В приложениях управление «(•) часто является кусочно-непрерывной функцией. При этом наличие точек разрыва на управлении «(•) никак не сказывается на значениях траектории у(-). Более того, траектория останется без изменения даже в том случае, если изменить значения функции «(•) на множестве меры нуль. Траектория у(-) в ситуации (7) является абсолютно непрерывной функцией (см. [9]). Класс абсолютно непрерывных функций представляет собой линейное многообразие, всюду полное в Ь" [?0, В дальнейшем этот класс будем обозначать какЛС"[{0, с Ь" [?0, где замыкание ЛС" = Ь" [?0, Для любой пары функций (V/), «(•)) е е ЛС"[10, х и выполняются формулы Ньютона-Лейбница и, соответственно, формулы интегрирования по частям. В ([8, Кн. 2, с. 651]) показано, что решения задачи (5)—(7) в форме V* е Ж0, V* е Ж1, (у*(0, «*(•)) е Ь" [ ?0, ?1] х и всегда существует.

Выделим класс конечномерных задач, каждая из которых представляет собой задачу вычисления неподвижной точки экстремального отображения (1). Будем предполагать, что экстремальное отображение этого класса удовлетворяет следующим двум условиям.

1. Функция Ф^, м) + ф(^) выпукла по м> е Ж для любого V е Ж:

Ф( V, а^ + (1 - а)^2) + ф(а^ + (1 - а)^) < (9)

< а(Ф( V, ) + ф()) + (1 - а)(Ф( V, ^2) + ф(^2)), ^2 е Ж.

2. Бифункция Ф( V, м) удовлетворяют условию положительной полуопределенности (см. [10])

Ф(w, ъ) - Ф(w, V) - Ф( V, ъ) + Ф( V, V) > 0, ( V, ъ) е Жх Ж. (10)

В частности, если бифункция билинейная, т.е. Ф(V, м) = (ФV, м>), где Ф есть п х п-матрица, то неравенство (10) принимает вид (Ф^ — м), V — м) > 0, (V, м) е Жх Ж, которое представляет собой хорошо известное определение положительной полуопределенности матрицы. Соответственно, (10) является обобщением этого понятия на нелинейные бифункции. В линейной алгебре условие положительной полуопределенности для квадратичных функций гарантирует выпуклость этих функций. Близкую роль условие (10) играет и в равновесных задачах. В частности, если Ф^, V) = 0, то условие (10) включает в себя условие антисимметричности Ф(^, V) = —Ф(V, м), а антисимметрия порождает седловые задачи. Условие симметрии Ф(^, V) = Ф( V, м) сводит задачи равновесия (5), (6) к задачам оптимизации (см. [11]). Условия симметрии и антисимметрии — это аналоги симметричных и антисимметричных матриц. В общем случае (при сделанных предположениях) фазовый портрет окрестности неподвижной точки V* е Ж (точнее, пары (V*, V*) е Ж х Ж) имеет либо седловую структуру, либо структуру экстремальной точки (см. [12]).

В случае дифференцируемости функции Ф( V, м) по переменной м> е Ж рассмотрим частную производную при условии м> = V; тогда придем к условию монотонности полученного оператора от одной переменной. Действительно, применяя последовательно неравенства выпуклости

(УД*), у -х) </(у) -/(х) < (У/(у), у -х), х, у е X, (11)

к неравенству (10), получаем

(У2Ф(ъ, ъ) - У2Ф( V, V), ъ - V) > 0, ъ, V е Жх Ж, (12)

т.е. градиент-сужение У2Ф^, = ^ = У2Ф( V, V) положительно полуопределенной, выпуклой по м> для любого V функции Ф( V, м) есть монотонный оператор. Экстремальные отображения, подчиненные условиям 1 и 2, в дальнейшем будем называть монотонными экстремальными отображениями.

Сужение матрицы смешанных производных второго дифференциала функции Ф( V, м) на диа-

2

гональ квадрата д Ф ( ^ ъ ) характеризует свойства бифункции. Действительно в [13] уста-

дъдV „=V

новлено, что если бифункция является симметричной, или антисимметричной, или положительной полуопределенной, то аналогичными свойствами обладает сужение матрицы смешанных производных на диагональ квадрата.

В [13] также показано, что если бифункция Ф^, м) дважды непрерывно дифференцируема и сужение ее смешанной производной на диагональ квадрата — положительно определенная матрица, т.е.

2

д Ф ( V, ъ )

д ъ д V

= У^Ф( V, и0|„ = V = (Д V, v)h, Н)> 0, Н е Я", (13)

то выполняется неравенство положительной полуопределенности (10). Это условие обобщает

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком