научная статья по теме ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДЛЯ ОДНОГО КЛАССА СИСТЕМ, ПОДВЕРЖЕННЫХ ВОЗМУЩЕНИЯМ Математика

Текст научной статьи на тему «ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДЛЯ ОДНОГО КЛАССА СИСТЕМ, ПОДВЕРЖЕННЫХ ВОЗМУЩЕНИЯМ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 68. Вып. 4, 2004

УДК 62-50

© 2004 г. Ф. Л. Черноусько

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДЛЯ ОДНОГО КЛАССА СИСТЕМ, ПОДВЕРЖЕННЫХ ВОЗМУЩЕНИЯМ

Рассматривается специальный класс линейных динамических систем, на которые действуют управления и ограниченные возмущения. Предполагается, что возмущения обусловлены погрешностью реализации управляющего воздействия: при нулевом управлении возмущения отсутствуют, а с увеличением интенсивности управления возможная величина возмущений возрастает. Ставится задача о построении управления, доставляющего ми-нимакс заданному критерию оптимальности при произвольной допустимой реализации возмущений. Решение поставленной минимаксной задачи сводится к решению трансцендентных уравнений. При определенных условиях решение получено в явном виде. Рассмотрен пример, в котором оптимальное управление построено как в форме программы, так и в форме синтеза.

1. Постановка задачи. Многие управляемые динамические системы описываются системой дифференциальных уравнений

Здесь х(0 - я-мерный вектор фазовых координат, ? - время, ыф - т-мерный вектор управляющих воздействий, и(0 - ^-мерный вектор возмущений, / - заданная функция своих аргументов. Системы вида (1.1) являются предметом изучения в теории дифференциальных игр [1]. Возмущение и(0 может интерпретироваться как активное воздействие противника (второго игрока), как неконтролируемое внешнее возмущение, а также как ошибка реализации управления ыф. Последний случай имеет место, если заданное управляющее воздействие (например, сила тяги двигателя) отрабатывается неточно. В этом случае интенсивность возможного возмущения и(0 зависит от величины управляющего воздействия ыф и возрастает с ростом этой величины.

Задача, рассматриваемая в данной работе, моделирует описанную выше ситуацию, в которой величина возможного неконтролируемого возмущения обусловлена погрешностью реализации управления и растет с ростом величины управления. Накладываемые ограничения и критерий оптимальности выбраны таким образом, что поставленная задача допускает решение.

Перейдем к формальной постановке задачи.

Рассматривается линейная управляемая система вида

на заданном интервале времени t е [t0, T]. Здесь x, u, и имеют тот же смысл, что и в системе (1.1), A(t), B(t) и C(t) - заданные матричные функции времени размерности n х n, n х m и n х k соответственно, g(t) - заданная n-мерная вектор-функция времени. На возмущение u(t) наложено ограничение вида

X = f (x, u, и, t)

(1.1)

X = A (t) x + B( t )u + C (t )v + g (t)

(1.2)

(G(t)u(t), u(t)))<||u(t)||4

(1.3)

Здесь G(t) - заданная симметрическая положительно-определенная матричная функция времени размерности k х k, скобки (., .) обозначают скалярное произведение векторов, символом || ■ || обозначена евклидова норма вектора. В частности, если G(t) -единичная матрица, то условие (1.3) означает, что интенсивность возможного возмущения пропорциональна квадрату величины управления.

В начальный момент t = t0 задано начальное условие

X ( t0 ) = x (1.4)

где x0 - заданный n-мерный вектор.

Критерий оптимальности управления зададим в виде

T

J = J[(a(t), x(t)) + b(t)||u||2]dt + F(x(T)) (1.5)

>0

Здесь a(t) - заданная я-мерная вектор-функция времени, b(t) - заданная положительная скалярная функция, F(x) - заданная скалярная гладкая функция векторного аргумента. Критерий оптимальности J включает линейное по x интегральное слагаемое, пропорциональное проекции фазового вектора на заданное направление, квадратичное по управлению u слагаемое, а также нелинейное терминальное слагаемое, которое может служить мерой отклонения терминального состояния x(T) от заданной точки. Введение этого нелинейного слагаемого является существенным обобщением постановки задачи, рассмотренной в [2]. Все заданные функции времени, фигурирующие в соотношениях (1.2), (1.3), (1.5), предполагаются кусочно-непрерывными на интервале t е [t0, T].

Поставим задачу найти управление, доставляющее следующий минимакс функционалу J из (1.5)

J * = minmax J (1.6)

u и

при выполнении соотношений (1.2)-(1.4). Здесь максимум берется по всем возмущениям u(t), удовлетворяющим ограничению (1.3), причем при выборе возмущений управление u(t) считается известным на всем интервале t е [t0, T]. Минимум в (1.6) берется по всем управлениям u(t). При этом будет построено как программное управление u(t), рассчитанное на "наихудший" случай реализации возмущения u(t), так и управление в форме синтеза (по принципу обратной связи) как функция u = u* (x, t) от времени и текущего фазового состояния, рассчитанное на наихудшую будущую реализацию возмущения. Поставленная задача может трактоваться как задача гарантированного (в смысле критерия оптимальности (1.6)) управления ансамблем траекторий системы (1.2) при всевозможных допустимых ограничениях.

2. Преобразования. Выполним некоторые преобразования, упрощающие поставленную задачу. Обозначим через Ф(0 фундаментальную матрицу системы (1.2). Эта матрица определяется соотношениями

Ф = А (»Ф, Ф( to ) = En (2.1)

где En - единичная (n х я)-матрица. Считая фундаментальную матрицу известной, сделаем в системе (1.2) замену фазового вектора и возмущения

x = Ф( t)y, и = ||u|| 2D ( t) w (2.2)

Квадратную невырожденную матрицу D(t) размерности k х k выберем таким образом, чтобы при всех t е [t0, T] выполнялось тождество

DTGD = Ek (2.3)

Соотношение (2.3) означает, что преобразование возмущения в (2.2) должно приводить квадратичную форму (1.3) к сумме квадратов. В качестве D(t) можно взять, например, матрицу G-1.

После подстановки (2.2) система (1.2) примет вид

y = Bx (t) u + | |u|| 2CX( t) w + gi( t) (2.4)

Здесь введены обозначения

Bi( t) = Ф-1( t)B (t), Ci( t) = Ф-1( t)C( t) D (t)

1 (2.5)

gi( t) = Ф-1( t)g (t)

Ограничение (1.3) при учете равенств (2.2) и (2.3) преобразуется к простому виду

N1 < 1 (2.6)

Начальное условие (1.4) и критерий оптимальности (1.5) в результате замены переменных (2.2) запишутся в виде

y (to) = х0 (2.7)

T

J = J[(fl 1 (t), y(t)) + b(t)||u||2]dt + F1(y(T)) (2.8)

to

Здесь обозначено

fl1( t) = ФТ( t) a (t), F 1( y) = Fm T) y) (2.9)

Таким образом, исходная задача (1.2)-(1.6) сводится к отысканию минимакса J * = minmax J (2.10)

u w

для системы (2.4) с ограничением (2.6) на возмущение w, с начальными условиями (2.7) и с критерием оптимальности (2.8). Пользуясь принципом максимума [3], последовательно определим сначала максимум J по w, а затем минимум по u.

3. Построение решения. Для задачи о максимуме функционала (2.8) по w составим функцию Гамильтона для системы (2.4) с критерием оптимальности (2.8)

H = (p, B1 u) + I lull2 (CTp, w) + (p, g1) + (a1, y) + b\\u\\2 (3.1)

Запишем сопряженную систему и условие трансверсальности для сопряженного вектора p(t)

p = -a1 (t), p (T) = Э F1 (y (T))/dy (3.2)

Решая задачу Коши (3.2), получим

T

f д F1( y (T))

p(t, y(T)) = Ja1 (т)dT + 1 dyV " (3.3)

t

Условие максимума гамильтониана (3.1) по w при ограничении (2.6) дает

T -1 T

w (t) = \\CTlA CTp (3.4)

Подставляя функцию w(t) из (3.4) в систему (2.4), получим

у = В и + ||и|| 2|| С[р\"1с1с[р + ^! (3.5)

Рассмотрим теперь задачу о минимуме функционала (2.8) по и для системы (3.5). Функция Гамильтона для этой задачи оптимального управления имеет вид

Н1 = (Р1, В1и) + |и2\\С\р\_1(Р1, С^р) + (Р1, ) - (ах, у) - Ъ\\и\\2 (3.6)

Здесь р1 - сопряженный вектор для рассматриваемой задачи, удовлетворяющий следующей сопряженной системе и условию трансверсальности

Р1 = а1 (^, Р1 (Т) = -д ^ (у (Т))/ду (3.7)

Сопоставляя соотношения (3.7) и (3.2), находим, что имеет место равенство

Р1 = -Р(и у(Т)), t е[to, Т] (3.8)

Функция p(t, у(Т)) определена равенством (3.3).

Подставляя выражение (3.8) в гамильтониан (3.6), получим после упрощений

Н = - (в\р, и) - ||и||2(||Стр| + Ъ) - (Р, gl) - (а1, у) (3.9)

Максимум гамильтониана Нх из (3.9) по и достигается при

Т

ВР

и (^ = —т-тт— (3.10)

2(| СтР|| + Ъ)

Формулы (3.10) и (3.4) выражают оптимальное программное управление и(0 и "наихудшее" возмущение w(t) через заданные функции времени и сопряженный вектор р, определяемый соотношением (3.3) и зависящий, в свою очередь, от терминального значения у(Т) фазового вектора. Поэтому для нахождения решения в законченном виде требуется еще определить у(Т).

Подставим управление и(0 из (3.10) в систему (3.5) и проинтегрируем ее при начальном условии (2.7). Получим t

у (t) = л° + | Ь (р,т)Лт (3.11)

где введено обозначение

II Т II2 Т Т

\\вТр\\ с сТр в1 вТр

Ь(Р, t) = ,, ' 'Т „ ' ! , Т ,, 1 2--1 | Т 1 + gl (3.12)

41 С[ р|| С[ р| + Ъ )2 2(| С1 р\\ + Ъ)

Зависимость функции Ь(р, t) от второго аргумента обусловлена зависимостью от t заданной функции Ъ(t), а также функций В^), C1(t), g1(t), которые определены соотношениями (2.5). Функция р(^ у(Т)) определена равенством (3.3). Полагая t = Т в (3.11), получим

г

у(Т) = Х0 + |Ь(р(и у(Т)), t)Л (3.13)

Равенство (3.13) представляет собой систему п уравнений для неизвестного п-мер-ного вектора у(Т). Вопрос о существовании и единственности решения этой системы

в общем случае остается открытым. Ниже рассматриваются некоторые частные случаи, в которых существует единственное решение этого уравнения.

Предположим, что единственное решение у(Т) системы (3.13) найдено. Тогда приходим к следующей процедуре решения поставленной минимаксной задачи. Когда вектор у(Т) найден, сопряженный векторр(г, у(Т)) полностью определен равенством (3.3), оптимальное программное управление н(г) и наихудшее возмущение ^(г) задаются равенствами (3.10) и (3.4) соответственно, а фазовый вектор у(г) для данных н(г) и ^(г) определен в виде квадратуры (3.11). Искомый минимакс J* функционала J найдем, подставляя в равенство (2.8) найденные функции н(г) из (3.10), у(г) из (3.11) и вычисляя еще одну квадратуру. Фазовую траекторию х(г) и возмущение и(г) в исходных переменных определим при помощи соотношений (2.2).

Выше описана процедура построения оптимального программного управления н(г) при заданном начальном условии х(г0) = х0 из (1.4). Найденное управление, зависящее от начальных данных, можно представит

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком