научная статья по теме ЗАДАЧА ОПТИМАЛЬНОГО ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ И СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ: СЛУЧАЙ ВЕКТОРНОЙ МЕРЫ Автоматика. Вычислительная техника

Текст научной статьи на тему «ЗАДАЧА ОПТИМАЛЬНОГО ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ И СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ: СЛУЧАЙ ВЕКТОРНОЙ МЕРЫ»

Автоматика и телемеханика, № 3, 2015

Нелинейные системы

© 2015 г. Е.В. ГОНЧАРОВА, канд. физ.-мат. наук (goncha@icc.ru),

М.В. СТАРИЦЫН (starmax@icc.ru) (Институт динамики систем и теории управления СО РАН, Иркутск)

ЗАДАЧА ОПТИМАЛЬНОГО ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ И СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ: СЛУЧАЙ ВЕКТОРНОЙ МЕРЫ1

Рассматривается нелинейная задача оптимального импульсного управления с траекториями ограниченной вариации. В качестве управлений выступают векторные меры Лебега-Стилтьеса. Изучаются фазовые и смешанные ограничения в обычном и быстром времени, а также совместные условия на траекторию и импульсное управление. На основе разрывной замены времени развивается метод преобразования к классической задаче оптимального управления. Установлена эквивалентность исходной и полученной редуцированной задач.

1. Введение

Задачи импульсного управления возникают при расширении вырожденных задач оптимального управления и дают удобную математическую идеализацию реальных процессов, сопровождающихся скачкообразными изменениями состояния [1—5]. В пионерских работах В.И. Гурмана получены результаты по расширениям класса для вырожденных задач с линейно входящим управлением. Если в таких задачах управления ограничены в совокупности по норме Ьх, подобное расширение приводит к задачам импульсного управления с траекториями ограниченной вариации (ВУ-расширение) [3-5]. При этом в качестве управлений выступают меры Лебега-Стилтьеса. Модели с траекториями ограниченной вариации возникают также в ряде приложений, где критерий качества включает совокупную (интегральную) величину управляющего воздействия за весь период управления.

Статья является продолжением работ [6, 7] и посвящена исследованию общей задачи оптимального управления объектом, динамика которого описывается нелинейным дифференциальным уравнением с мерами. Система подчинена ограничениям фазового и смешанного типов. Наряду со стандартными смешанными ограничениями, связывающими состояния системы и обычные ограниченные управления, рассматриваются совместные условия на траекторию и импульсное управление. В отличие от [6], фазовые и стандартные смешанные ограничения накладываются на управляемые процессы как в естественной, так и в "быстрой" временной шкале (т.е. в фазе импульса). Импульсы порождаются уже не скалярной, а векторной управляющей мерой со

1 Работа выполнена при частичной поддержке Российского фонда фундаментальных исследований (проекты №№ 13-08-00441, 14-01-31254, 14-08-606).

значениями в заданном конусе. Кроме того, сингулярная составляющая динамической системы зависит от управления. Этим обусловлено привлечение более общей концепции импульсного управления [8] и соответствующего, отличного от используемого в [7], понятия решения дифференциального уравнения с мерами.

В работе предложена специальная реализация метода разрывной замены времени [3, 9-11], позволяющая преобразовать задачу импульсного управления к эквивалентной классической задаче оптимального управления. Эквивалентность задач составляет основной результат статьи.

2. Постановка задачи оптимального импульсного управления

2.1. Формальное описание модели На отрезке времени [0, Т] рассмотрим управляемую систему

(1) Сх = /(х,и) сМ + С(х,п) $(сМ) (С + И)-п.в.,

(2) Е(х(0-), х(Т)) = 0, Ь(х(0-),х(Т)) ^ 0, Ф(х(0-)) ^ 0,

(3) Ф(х(*)) ^ 0,

(4) Q-(x(t—)) = 0, Q+(x(t)) = 0 Н-п.в.,

(5) Ф(хф) ^ 0 |^|-п.в.,

(6) W (х^),п^)) = 0 (С + Ис)-п.в.,

(7) Я(х^),п({)) < 0 (С + Ис)-п.в.,

(8) О ей, #(•) еК,

(9) |^|([0,Т]) < М.

Здесь С(-), С(^) := М, — мера Лебега на числовой оси; п(-) — "обычные", а $(•) — импульсные управления; |$| — скалярная неотрицательная мера, условно называемая "полной вариацией" импульсного управления, и |$|е -непрерывная компонента разложения Лебега этой меры. Положительная величина М определяет ограничение на "полный импульс" управляющего воздействия. Аббревиатура "п.в." означает "почти всюду" относительно указанной меры.

Уравнение (1) представляет собой условную запись, смысл которой поясним после того, как опишем классы обычных и импульсных управлений и приведем адекватное понятие решения дифференциального уравнения с мерами.

2.2. Пространство К импульсных управлений

Используемое понятие импульсного управления, фактически, заимствовано из [8]. Введем следующие обозначения: БУ+([0, Т], Мга) — пространство п-мерных функций ограниченной вариации, определенных на [0, Т] и непрерывных справа на (0, Т]; БУ+о([0, Т], Мга) — подмножество функций ^(■) е е БУ+([0,Т],Мга), таких что ^(0-) =0 е Мга

Импульсное управление $ есть по определению набор (/, /х, {ит, ет}) следующих объектов.

• Главная составляющая импульсного управления есть векторная мера Лебега-Стилтьеса /(■), порожденная на [0, Т] функцией € € ВУ+о([0, Т], Мт) и принимающая значения в заданном непустом замкнутом выпуклом конусе К С Мт.

• Вторая компонента импульсного управления Д(-) — скалярная неотрицательная мера Лебега-Стилтьеса, порожденная на [0, Т] неубывающей функцией € ВУ+о([0,Т], М) и такая, что #(•) € V(/).

При заданной /(■) множество V(/) определяется как совокупность скалярных неотрицательных мер V(■), для которых найдется последовательность {/(■)} векторных мер (■) со значениям в К, таких что {(/(■), I/-7|(-))} сходится к (/(■), V(■)) в слабой-* топологии пространства С*([0, Т], Мт+1). Здесь, |/х|(-) := ~~ полная вариация векторной меры Ва-

риация \^г\(А) компоненты /Хг(-), г = 1 ,т, определяется на борелевских множествах А С [0, Т] как вир ^а |/ДАа)|, где супремум берется по всевозможным разбиениям иаАа множества А на попарно не пересекающиеся борелевские подмножества Аа.

Очевидно, V(/) = 0, поскольку |/|(-) € V(/), и V(А) ^ |/(А)| для любой меры V(■) € V(/) и любого борелевского множества А С [0, Т]. Мера Д(-) € V(/), мажорирующая полную вариацию |/|(-) меры /(■), называется "полной вариацией импульсного управления и обозначается через |$|(-).

• Пусть меры /(■) и Д(-) заданы. В роли еще одной компоненты импульсного управления выступает семейство {ит(-),ет(■)} вспомогательных управлений, параметризованное моментами т € ) приложения импульса. Здесь := {т € [0,£]| х({т}) = 0}. При каждом т управления ет(■), ит(■) представляют собой борелевские функции, определенные на интервале [0,Тт], Тт := Х({т}), и удовлетворяющие ограничениям

(10) и,т(0) € и, ет(0) € Е := {е € К| |е| = 1} £-п.в. на [0,Тт],

тт

(11) У ет(0)^0 = /({т}).

о

Через | ■ | здесь (и далее в сходном контексте) обозначается конечномерная норма вида |ж| = ^

2.3. Класс и обычных управлений

Элементы и(-) пространства и обычных управлений суть классы эквивалентности функций, определенных на отрезке [0, Т] почти всюду с точки зрения меры Лебега-Стилтьеса (£ + |$|с)('), измеримых по Борелю и принимающих (£ + |$|с)-п.в. значения в заданном компактном множестве и С Мг.

Отметим, что множество и х К управлений (и, $), удовлетворяющих ограничениям (8)-(11), наделяется естественной структурой полного метрического пространства (см. [8, 12]).

2-4- Понятие решения дифференциального уравнения с мерами

Будем предполагать, что

• вектор-функции / : Мга х Мг — Мга и С : Мга х Мг — Мгахт являются липши-цевыми по ж, измеримыми по Борелю по переменной и и удовлетворяют условиям линейного роста по ж;

• вектор-функции Е : Мга х Мга — Ма™(е), Ь : Мга х Мга — МШт(ь), Ф : Мга — — ма1т(Ф), Q± : Мп — ма1т(д±), ф : Мп — ма;т(Ф), w : Мп х мг — )

и К : Мга х Мг — Ма™(д) непрерывны;

• Q± неотрицательны.

Следуя [8], под решением дифференциального уравнения с мерами (1) при управлении (и, будем понимать функцию ж(-) € ВУ+([0,Т], Мга), удовлетворяющую всюду на [0, Т] интегральному соотношению

Второй интеграл здесь понимается как интеграл Лебега по непрерывной компоненте ^с(') меры или, что эквивалентно, как интеграл Лебега-

Стилтьеса по функции распределения (■) меры ^е(-). Скачки Дж(т) функции ж(-) в точках т € ^д(Т) определяются соотношением

Дж(т) = Кт(Тт) - ж(т-),

где функции кт(■) удовлетворяют на интервалах [0, Тт] "быстрого времени" вспомогательной предельной системе [1]

(13) К = С(к, ит)ет £-п.в. на [0,Тт], к(0) = ж(т—),

при некоторых управлениях ит(■), ет(■), удовлетворяющих (10), (11).

Предельная система показывает, как эволюционирует фазовое состояние ж(£) на "протяжении" акта импульсного воздействия.

Семейство X(■) = {кт(-)}т(т) назовем пополнением графика функции ж(-), отвечающим управлению (и(-), $(•)).

2.5. Ограничения в "быстром времени"

Наряду с (2)-(9) потребуем выполнения дополнительных ограничений на процессы {кт,ит, ет} предельной системы:

(14) Ф(кт(в)) < 0, в € [0,Тт],

(15) W(кт(в),ит(в)) = 0 £-п.в. на [0,Тт],

(16) К(кт(в),ит(в)) < 0 £-п.в. на [0,Тт]

при всех т € ).

Соотношение (14), называемое фазовым ограничением в быстром времени, определяет дополнительное условие на путь, который проходит состояние системы в фазе импульсного воздействия. Подобные условия возникают, например, в гибридных системах с односторонними ограничениями [3, 13], а также

в механических системах с ударами и сухим трением [14, 15]. Типичный случай здесь Ф = — Ф, где Ф — функция, определяющая фазовое ограничение в обычном времени.

Условия (6), (7), (15), (16) представляют собой смешанные ограничения типа [8]. Отметим, что учет смешанных ограничений в быстром времени важен, например, в некоторых импульсных моделях космической навигации [4, 8].

2.6. Постановка задачи оптимального управления

Рассмотрим задачу оптимального управления (Р):

I = Р(х(Т)) — т£ при ограничениях (2)-(16).

Здесь функция Р : Мп — М предполагается непрерывной.

Набор а = (ж(-),Х(-),и(-), $(■)), удовлетворяющий всем условиям (2)-(16), назовем допустимым процессом задачи (Р). Совокупность всех допустимых процессов обозначим через Х(Р) и будем предполагать, что £(Р) = 0.

В модели присутствует наиболее полный набор ограничений, встречающихся в задачах импульсного управления с траекториями ограниченной вариации. Наряду с концевыми (2), фазовыми (3) и классическими смешанными ограничениями (6), (7) типа равенств и неравенств импульсные процессы подчинены условиям (15), (16) на предельную дин

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком