научная статья по теме ЭКСТРЕМАЛЬНОЕ ПРИЦЕЛИВАНИЕ В ЗАДАЧАХ С НЕИЗВЕСТНЫМ УРОВНЕМ ДИНАМИЧЕСКОЙ ПОМЕХИ Математика

Текст научной статьи на тему «ЭКСТРЕМАЛЬНОЕ ПРИЦЕЛИВАНИЕ В ЗАДАЧАХ С НЕИЗВЕСТНЫМ УРОВНЕМ ДИНАМИЧЕСКОЙ ПОМЕХИ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 73. Вып. 4, 2009

УДК 62-50

© 2009 г. С. А. Ганебный, С. С. Кумков, В. С. Пацко

ЭКСТРЕМАЛЬНОЕ ПРИЦЕЛИВАНИЕ В ЗАДАЧАХ С НЕИЗВЕСТНЫМ УРОВНЕМ ДИНАМИЧЕСКОЙ ПОМЕХИ

Известный в теории дифференциальных игр метод экстремального прицеливания применен к задачам, в которых заранее не оговорен уровень динамической помехи. Рассматриваются задачи с линейной динамикой, фиксированным моментом окончания и геометрическим ограничением на полезное управление. Цель управления — привести систему на заданное терминальное множество в момент окончания. Предложен способ управления обратной связи, который обеспечивает успешное завершение, если помеха не превышает некоторый критический уровень. При этом "слабая" помеха парируется "слабым" полезным управлением. Сформулирована и доказана теорема о гарантии. Рассмотрен иллюстративный пример.

1. Введение. В теории антагонистических дифференциальных игр [1—5] хорошо разработаны методы решения задач, в которых по постановке оговорены геометрические ограничения управляющих воздействий обоих игроков. Однако во многих практических проблемах геометрическое ограничение налагается только на полезное управление (на управление первого игрока), в то время как наложение такого ограничения на динамическое воздействие помехи (на управление второго игрока) не является естественным. Кроме того, оптимальное управление обратной связи первого игрока, полученное в рамках стандартной формализации антагонистической дифференциальной игры, направлено на парирование наихудшего возмущения. В реальных же ситуациях динамическое возмущение, как правило, не действует наихудшим способом.

Желательно иметь способ управления по принципу обратной связи, который успешно работает в широком диапазоне помех. При этом, чем "слабее" или "менее оптимальна" помеха, тем "слабее" должно быть парирующее ее полезное управление. Цель статьи — предложить такой способ, опирающийся на сложившуюся теорию дифференциальных игр.

Рассматриваемая задача близка к интенсивно изучаемым в настоящее время задачам о подавлении управляемой системой внешнего ограниченного возмущения [6—9]. Главное отличие данной работы, помимо используемого математического аппарата, состоит в том, что в ней процесс управления рассматривается на конечном промежутке времени и полезное управление по постановке задачи стеснено геометрическим ограничением. Среди работ, использующих результаты теории дифференциальных игр и ориентированных на задачи с неизвестным уровнем помехи, отметим [10].

Центральное понятие, используемое в статье, — понятие стабильного моста [3, 5]. Так называется множество в пространстве время х фазовый вектор, в котором первый игрок, используя свое управление и дискриминируя противника, может удержать движение системы вплоть до момента окончания.

Рассмотрим семейство дифференциальных игр, где геометрическое ограничение управления второго игрока зависит от скалярного параметра. С каждым значением параметра свяжем также некоторое ограничение управления первого игрока и некоторый стабильный мост. Предполагаем, что семейство мостов упорядочено по включе-

нию с возрастанием параметра. Первый игрок гарантирует удержание фазового вектора в трубке стабильного моста при помощи своего управления, уровень которого соответствует рассматриваемой трубке, если управление второго игрока также удовлетворяет соответствующему ограничению. Семейство мостов позволяет сконструировать управление обратной связи первого игрока и описать гарантию, обеспечиваемую управлением.

Поясним, как это происходит. Пусть на управляемую систему действует возмущение, не превышающее некоторый уровень. Тогда движение системы будет пересекать мосты сконструированного семейства, пока не достигнет (сверху или снизу) границы моста, соответствующего реализовавшемуся уровню помехи. В дальнейшем движение будет идти в пределах этого моста. Таким образом, произойдет автоматическая подстройка (адаптация) уровня полезного управления под неизвестный заранее уровень помехи.

Изложенная идея задания упорядоченного семейства стабильных мостов является весьма общей. Ее конкретное воплощение связано с возможностью аналитического или численного построения стабильных мостов. В теории дифференциальных игр имеется значительное количество публикаций [11—21], посвященных алгоритмам численного конструирования максимальных стабильных мостов и множеств уровня функции цены. Разработанные методы можно использовать для построения указанного семейства стабильных мостов.

Рассматриваются задачи с линейной динамикой, фиксированным моментом окончания и выпуклым компактным терминальным множеством, на которое первый игрок пытается привести систему. Векторное полезное управление стеснено геометрическим ограничением в виде выпуклого компакта. Перечисленные особенности позволяют сконструировать упорядоченное семейство стабильных мостов и соответствующее адаптивное управление. А именно, в исследуемом случае достаточно построить заранее и хранить в памяти компьютера только два специальных максимальных стабильных моста. На их основе в процессе движения в текущий момент t вычисляется t-сечение подходящего стабильного моста из указанного семейства. Управляющее воздействие первого игрока вырабатывается при помощи экстремального прицеливания [3, 5, 22] на это сечение. Эффективность алгоритма обусловлена тем, что все /-сечения мостов рассматриваемого семейства выпуклые.

Формулируется и доказывается теорема о гарантии, обеспечиваемой первому игроку предлагаемым способом управления.

В настоящее время алгоритм численно реализован [23—25] для случая, когда терминальное множество определяется лишь двумя или тремя компонентами фазового вектора в момент окончания.

Статья завершается примером моделирования линеаризованной задачи о встрече двух слабоманеврирующих объектов. Описание динамики заимствовано из публикаций Шинара с соавт [26, 27].

Исследование примыкает к анализу случая скалярного полезного управления [24]. Имеется краткое изложение способа адаптивного управления при произвольном компактном ограничении полезного управления [28].

2. Постановка задачи. Рассмотрим линейную дифференциальную игру с фиксированным моментом окончания

г = А(^г + В(^и + С(^ и, г е Ят, t е Т, и е Р с Я", и е Я" (2.1)

Здесь и и и — векторные управляющие воздействия первого и второго игроков, Р — выпуклое компактное ограничение управления первого игрока, Т = [ 90,9] — промежуток игры. Условимся, что множество Р содержит нуль пространства Ж Матрич-нозначные функции А и С непрерывны по /. Матричнозначная функция В удовлетво-

ряет условию Липшица на промежутке T. Отсутствует какое-либо конкретное ограничение управления и.

Первый игрок пытается привести n выделенных компонент фазового вектора системы (2.1) в момент 0 на терминальное множество M. Множество M предполагается выпуклым компактом в пространстве указанных n компонент фазового вектора z. Условимся, что множество M содержит некоторую окрестность начала координат этого пространства. Начало координат примем за центр множества M. Перевод n выделенных компонент вектора z как можно ближе к центру множества M соответствует интересам первого игрока.

Требуется предложить способ построения адаптивного управления для системы (2.1).

Перейдем к системе, правая часть которой не содержит фазовый вектор:

x = D(t)u + E(t) и, x e Rn, t e T, u e P с Rp, и e Rq (2.2)

Переход осуществляется (см. [3], с. 160, [5], с. 89—91) при помощи соотношений

x(t) = Zn^(9, t)z(t), D(t) = Zn^(9, t)B(t), E(t) = Z„mm(9, t)C(t)

где Zn m(B,t) — матрица, составленная из n строк фундаментальной матрицы Коши для системы z = A(t) z, соответствующих тем компонентам вектора z, в пространстве которых определено множество M. Первый игрок пытается привести фазовый вектор системы (2.2) на множество M в момент окончания 9.

Дальнейшие выкладки будут сделаны для системы (2.2). Построенное управление U(t, x) применяется к системе (2.1) в виде U(t, Zn m(B, t)z).

3. Система стабильных мостов. В дальнейшем символ S(t) = {x е Rn : (t, x) e S} означает сечение множества S с T x Rn в момент t e T. Пусть O(e) = {x e Rn : |x| < e} — шар радиуса e в пространстве R с центром в нуле.

Стабильные мосты. Рассмотрим на интервале T = [90, 9] антагонистическую дифференциальную игру с терминальным множеством М и геометрическими ограничениями 9Р, Э управлений игроков

x = D(t)u + E(t)u, x e Rn, t e T, М, u e 9, и e Э (3.1)

Здесь матрицы D(t), E(t) те же самые, что и в системе (2.2). Множества М, 9Р, Э предполагаются выпуклыми компактами. Они рассматриваются как параметры игры.

Ниже u(-) и и(•) будут обозначать измеримые функции времени со значениями в множествах 9Р и Э, соответственно. Движение системы (3.1) (и следовательно, системы (2.2)), выходящее из точки x* в момент t* в силу управлений u(-) и и(-), обозначим через x(■; t*, x*, u(■), и(■)).

Следуя Н.Н. Красовскому и А.И. Субботину [3, 5], определим понятия стабильного и максимального стабильного мостов.

Множество W с T х Rn назовем стабильным мостом для системы (3.1) при некоторых фиксированных множествах 9Р, Э и М, если W(9) = М и выполнено следующее свойство стабильности: для любой позиции (t*, x*) е W и любого управления и(•) второго игрока первый игрок может подобрать свое управление u(-) так, что позиция (t, x(t)) = (t, x(t; t*, x^, u(-), u(-))) остается в множестве W в любой момент t е (t*].

Максимальное по включению множество W с T х Rn, W(9) = М, обладающее свойством стабильности, называется максимальным стабильным мостом.

Максимальный стабильный мост является [3, 5] замкнутым множеством. Его t-се-чения выпуклы ([5], с. 87) в силу линейности системы (3.1) и выпуклости множества Ж.

Построение системы стабильных мостов.

1°. Выберем множество Qmax с Rq, трактуемое как "максимальное" ограничение управления второго игрока, которое первый игрок согласен считать "разумным" при приведении системы (2.2) на множество M. Предполагаем, что множество Qmax содержит нуль своего пространства. Такое допущение не обременительно, поскольку при отсутствии возмущения

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком