научная статья по теме СИНТЕЗ РОБАСТНОГО К ВНЕШНЕМУ ВОЗМУЩЕНИЮ ОПТИМАЛЬНОГО РЕГУЛЯТОРА ПО СОСТОЯНИЮ ДЛЯ ОДНОГО КЛАССА НЕСТАЦИОНАРНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ Автоматика. Вычислительная техника

Текст научной статьи на тему «СИНТЕЗ РОБАСТНОГО К ВНЕШНЕМУ ВОЗМУЩЕНИЮ ОПТИМАЛЬНОГО РЕГУЛЯТОРА ПО СОСТОЯНИЮ ДЛЯ ОДНОГО КЛАССА НЕСТАЦИОНАРНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ»

Автоматика и телемеханика, № 7, 2015

© 2015 г. М.Е. ШАЙКИН, канд. техн. наук (shaikin@ipu.ru) (Институт проблем управления им. В.А. Трапезникова РАН, Москва)

СИНТЕЗ РОБАСТНОГО К ВНЕШНЕМУ ВОЗМУЩЕНИЮ ОПТИМАЛЬНОГО РЕГУЛЯТОРА ПО СОСТОЯНИЮ ДЛЯ ОДНОГО КЛАССА НЕСТАЦИОНАРНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ1

Рассматривается задача оптимального управления стохастической динамической системой при воздействии на нее неконтролируемых возмущений стохастической природы. Система задана на конечном интервале времени, ее коэффициент диффузии зависит линейно от вектора состояния, сигнала управления и внешнего возмущения. Регулятор в цепи обратной связи предполагается статическим, нестационарным, линейным по вектору состояния. Получен закон робастного к внешнему возмущению оптимального управления.

1. Введение

Динамические системы, рассматриваемые в этой работе, описываются стохастическими дифференциальными уравнениями Ито, в которых коэффициент сноса и коэффициент диффузии линейно зависят от векторов состояния, управления и внешнего возмущения. Общепринятое наименование для таких систем - системы, мультипликативные по состоянию, управлению и внешнему возмущению или, короче, системы с мультипликативным шумом. В работе решается задача синтеза оптимального регулятора по состоянию для наименее благоприятного внешнего возмущения, при этом понятия оптимальности и наименьшего благоприятствования определены относительно квадратичных функционалов при ограничениях, заданных уравнением Ито. Примером оптимизационных задач такого рода являются задачи Н2/Нте-оптимизации систем с мультипликативным шумом: стационарных и нестационарных, детерминированных и стохастических, заданных на конечных или бесконечных интервалах времени. Действительно, И2/И^-управление является одним из наиболее важных робастных методов управления, и регуляторы для этого класса задач называются робастными к внешней помехе. Помеха удовлетворяет условию конечности ¿2-нормы задающего ее детерминированного или случайного процесса. Оптимальность регулятора обеспечивается решением задачи минимизации функционала потерь .]2 (см. ниже) при наименее благоприятном внешнем ¿2-возмущении, находимом путем максимизации другого функционала - 3\.

Задачи оптимизации детерминированных и стохастических систем не сильно различаются, если коэффициент диффузии стохастической системы не зависит от управления [1, 2]. В этой работе коэффициент диффузии зависит от управления (и одновременно от состояния и внешнего возмуще-

1 Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № 13-08-00744).

ния), и вследствие этого детерминированная и стохастическая теории оптимизации существенно расходятся. Остановимся подробнее на причине этого. Коэффициент диффузии определяет интенсивность внутреннего шума системы. Если коэффициент диффузии зависит от управления, то, изменяясь, сигнал управления изменяет интенсивность шума, т.е. увеличивает неопределенность в системе. Поэтому при выработке сигнала управления регулятор должен тщательно балансировать между уровнем собственной активности и вызываемой ею внутренней неопределенностью системы. В аспекте математического анализа это сказывается на усложнении матричного уравнения, решением которого определяется коэффициент обратной связи регулятора. На месте обычного уравнения Риккати, квадратичного по искомой переменной, появляется Риккати-подобное уравнение с более сложной для этой переменной нелинейностью.

Особенностью постановки задачи в этой работе, как и в предыдущей работе автора [3], является отказ от гипотезы, что скалярные винеровские процессы независимы. Статистическая зависимость компонент задается 3 х 3-матрицей qt, определенной формулой qt (И = уат(йт^), где dwt - столбец с компонентами Матрица интенсивностей qt предполагается произвольной неотрицательно определенной. Процессы '1(1) потому удобно не предполагать независимыми, что получаемые результаты оказываются применимыми и в таком важном случае, когда, например, dwi = dw для всех г; см., например, [4]. Статистическая зависимость процессов Wi(Ь) предполагалась уже в [3], но общую оптимизационную задачу управления удалось тогда решить лишь для частного случая единичной матрицы qt = /3. В настоящей работе задача управления решена полностью для случая произвольной матрицы qt как неособенной (в разделе 3), так и вырожденной (см. примеры в разделе 7).

При решении оптимизационной задачи в этой работе, как и прежде [3], используется нестандартная пока новая методология, внешне похожая на методологию принципа максимума Понтрягина в части введения в теорию нового уравнения, аналогичного сопряженному с уравнением состояния, но из никакого общего принципа не выводимого [5, 6]. Новое уравнение для новой переменной ф(Ь) является обратным стохастическим дифференциальным уравнением со случайным условием на правом конце интервала наблюдения (см. ниже раздел 5).

В отличие от [3] задача синтеза регулятора, оптимального в классе робаст-ных регуляторов, формулируется здесь как теоретико-игровая задача. Минимизирующим игроком в ней является конструктор регулятора, а максимизирующим - неконтролируемое конструктором внешнее возмущение. Решением задачи синтеза является равновесная по Нэшу пара (п*,ь*), где и* - оптимальное управление, V* - наименее благоприятное возмущение. Теоретико-игровая постановка задачи И2/Н^-управления достаточно хорошо известна [7-10]. Чтобы гарантировать существование пары (и*^*) в рассматриваемой здесь задаче синтеза линейного регулятора, обоим игрокам, как и в [7, 9], достаточно использовать только линейные безынерционные нестационарные обратные связи щ(х) = К2(Ь)х, Vt(x) = К\(Ь)х. Ниже в начале раздела 4 будет повод еще раз вернуться к этому вопросу.

2. Постановка задачи

Оптимизируемая система задается уравнениями

( ^ = + ЗДМ + ЗДН +

(1) < + Ао(Ь)ж^Ш1(Ь) + Вю(Ь)Мш2(Ь) + В2о(Ь)Мшз(Ь),

и = адк + £>П(ЬМ + £>12(*Ь, жо € Еп, Ь € [0,Т].

Обозначения в (1) стандартные: [0,Т], Т < то - интервал наблюдения, ж^ -вектор состояния, - внешнее возмущение, щ - управляющий сигнал, XI -управляемый выход, жо - начальное состояние. Скалярные винеровские процессы шДЬ), г = 1,2,3 не предполагаются независимыми. Пусть д(£) - их матрица интенсивности, определяемая соотношением уаг (Тш) = ш =

= (-—ь ш2, ш3). Матрица д(Ь) предполагается здесь неособенной (особенные д(£) рассматриваются в примерах, раздел 7). Для упрощения, но фактически без потери общности считаются выполненными также условия регулярности = 0, ^'12(£)С!(£) = 0, ^'12(£).012(£) = I. Процесс г = (г^) имеет по условию конечную энергию ||г||2 = Е /0Т |г^|2^^ < то. Энергия ||и||2 процесса и = (%), Ь € [0, Т] также считается конечной, тогда [11] существует единственное решение ж^ = ж(Ь, и, г,ж0) уравнения (1) и при этом ||ж||2 = = Е ^ |ж^< то. Внешнее возмущение предполагается неконтролируемым, т.е. исключающим возможность его измерения. Напротив, состояние системы является процессом измеряемым, причем без ошибок. Вектор состояния ж(Ь), Ь € [0, Т] поступает на вход регулятора в цепи обратной связи, а его выходом является сигнал управления и(Ь). Оптимальным считается управление в виде обратной связи и* = и* (ж), Ь € [0, Т], минимизирующее для случая наименее благоприятного внешнего возмущения V = V* функционал потерь

т

(2) 72(и, г) = Е J(ж'tQtЖt + и'^и^М + Е(жТFжт),

о

где Qt ^ 0, Е > 0, ^ ^ 0. Функционал 72(и, г) явно от г не зависит, но зависит неявно, поскольку жt в (2) есть решение уравнения (1), зависящее от г. Наименее благоприятным считается (см., например, [4]) внешнее возмущение г*, минимизирующее по г функционал

т

(3) 71 (и, г) = ЕI(72г'(Ь)г(Ь) - х'(Ь)хс(Ь))^Ь

о

при ограничении (1). Функционал (3) неявно зависит от и, поскольку хс - выходной сигнал замкнутой регулятором щ = К(Ь)ж/; системы. Теоретико-игровая задача решена, если найдена пара (и*, г*) такая, что 71(и*, г*) ^ 71(и*, г), 72(и*,г*) ^ 72(и, г*) и, более того, если найдены матрицы К1(Ь),К2(Ь) такие, что г*(ж) = К1(Ь)ж, и*(ж) = К2(Ь)ж. Цель работы - нахождение матричных коэффициентов К1(Ь), К2(Ь), линейно выражаемых через решение (Р1(Ь), Р2(Ь))

5 Автоматика и телемеханика, № 7

129

некоторой системы связанных матричных дифференциальных уравнений типа Риккати.

Необходимо сделать несколько замечаний о принятых обозначениях. Все матрицы в уравнениях состояния и функционалах качества зависят (и притом непрерывно) от параметра Ь € [0,^, что в написании явно не всегда отмечается. Все случайные векторы - одинаковой размерности п. Случайные процессы х, V, и предполагаются неупреждающими, т.е. измеримыми относительно потока ^-алгебр, порожденных винеровским процессом w = = Скалярное произведение векторов а,Ъ € Кп обозначается и как а'Ь, и как (а, Ъ) в зависимости от удобства. Остальные обозначения поясняются по ходу изложения.

Остается изложить содержание оставшихся разделов работы. В разделе 3 излагается синтез статического регулятора по состоянию при наихудшем входном возмущении. Здесь выписывается обратное уравнение для векторной функции ф(Ь). Интегрирование обратного уравнения откладывается до следующего раздела 4. Структура наименее благоприятного внешнего возмущения определена в разделе 5. Раздел 6 содержит основной результат статьи. Примеры и заключение приведены в разделах 7, 8.

Так как наименее благоприятным является возмущение V* вида ^^(х) = = К\(Ь)х с некоторой матричной функцией К\(Ь), то, подставив в уравнение состояния (1) К\(Ь)х вместо vt, получим систему с управлением

(dxt = (Axt + + Б2Щ)М + AoХtdwl(t) + BlоKlХtdw2(t)+

+В20Щ(1тз(г),

Пусть и* - оптимальное управление. Оптимальная траектория х* вектора состояния системы удовлетворяет уравнению

Оптимальное управление и* должно доставлять минимум функционалу ^(и) (так для краткости обозначаем функционал ,12(и, К\х)), поэтому для любого допустимого управления и должно быть ^(и) — и*) ^ 0. В связи с этим рассматривается разность

3. Синтез статического регулятора по состоянию при наихудшем возмущении

Ъ = С^ + БиК^г + БиЩ, Ь € [0,Т], хо € Кп.

(5)

(х* = (Ах* + В\К\х* + В2и**)(Ь + Aоx*d

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком