научная статья по теме ПЕРВИЧНЫЕ СТРАТЕГИИ ПРОСТОГО ПРЕСЛЕДОВАНИЯ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НА ДВУСТОРОННИХ ПЛОСКИХ ФИГУРАХ Математика

Текст научной статьи на тему «ПЕРВИЧНЫЕ СТРАТЕГИИ ПРОСТОГО ПРЕСЛЕДОВАНИЯ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НА ДВУСТОРОННИХ ПЛОСКИХ ФИГУРАХ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 68. Вып. 4, 2004

УДК 62-50

© 2004 г. А. А. Меликян

ПЕРВИЧНЫЕ СТРАТЕГИИ ПРОСТОГО ПРЕСЛЕДОВАНИЯ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НА ДВУСТОРОННИХ ПЛОСКИХ ФИГУРАХ

Рассматриваются дифференциальные игры простого преследования, в которых пространство игры - плоская двусторонняя фигура. Игроки могут переходить с одной стороны на другую через край этой фигуры или вырезы в ней. Примеры таких пространств - круговой диск, прямоугольник, двусторонняя плоскость с круговым вырезом. Исследованы условия существования сингулярных траекторий преследования. Найдено достаточное условие (в терминах геометрических параметров фигуры и отношения скоростей игроков) существования простой стратегии преследования.

В теории дифференциальных игр так называемое простое движение нередко используется для моделирования движения маневрирующих объектов. Простым, согласно принятой терминологии [1], называется движение безынерционной точки, управляемой по скорости, на которую обычно накладываются симметричные (сферические) ограничения. Решение ряда игровых задач с простыми движениями оказывается технически менее сложным, чем в задачах с более сложной динамикой. Сравнительно элементарным, например, является решение задач сближения и преследования с простым движением в евклидовом пространстве. Можно отметить следующие два отличия более сложных дифференциально-игровых моделей от простых игр в евклидовом пространстве. Эти модели описываются более сложными, нелинейными уравнениями движения, либо, при сохранении простых движений, в них пространство игры обладает более сложной геометрией и является (римановым) многообразием, возможно имеющим край или сингулярные точки, где теряется гладкость многообразия. Свойства нелинейности в некоторой степени вбирает в себя метрический тензор многообразия, однако характер динамических уравнений позволяет эффективно использовать геометрические методы.

Решение игровых задач со сложной нелинейной динамикой - достаточно трудная математическая задача. Строгая формализация эффективных задач теории дифференциальных игр, разработка эффективных методов их решения связана в отечественной науке с именем Н.Н. Кра-совского [2-4], представителей созданной им школы по теории управления [5, 6] и других отечественных специалистов [7, 8].

В данной работе рассматриваются дифференциальные игры преследования с простым движением на двумерных многообразиях. Платой в игре является время преследования, радиус поимки полагается равным нулю.

Оптимальное время преследования при простом движении игроков в евклидовой плоскости (пространстве) вычисляется по известной простой формуле как отношение начального расстояния между игроками к разности скоростей [1]. Эта формула верна также для игры на гладких двумерных поверхностях (многообразиях) при достаточно малых значениях начального расстояния. Оптимальные траектории игроков определяются кратчайшей линией (геодезической), соединяющей игроков. При этом оба игрока, и преследующий и убегающий, движутся вдоль этой общей геодезической линии. Подобную стратегию преследующего (убегающего) игрока будем называть первичной стратегией преследования (убегания).

Однако наличие позиций (положений двух точек-игроков), для которых существуют две геодезические линии с равными длинами, может породить особые (сингулярные) траектории преследования, являющиеся огибающими семейства геодезических, а также траектории других типов. Как следует из полученных ранее результатов [9], в игре преследования на конусе

обязательно возникают сингулярные траектории [10, 11]. Если, например, пространство игры -прямой круговой цилиндр, то наличие двух геодезических линий не изменяет оптимальности первичной стратегии, и в этой игре нет сингулярных траекторий.

Цель данной работы - исследование условий возникновения сингулярных траекторий преследования, формулировка достаточных условий, при которых в данном пространстве игры и при данном отношении скоростей игроков оптимальными являются первичные стратегии, обзор и анализ решения ряда игровых задач в разных игровых пространствах-многообразиях. Основной элемент геометрического анализа - построение трехмерного многообразия позиций игроков с двумя равными геодезическими линиями. Другие геометрические методы решения игровых задач эффективно использовались ранее [12, 13].

Достаточное условие глобальности первичной стратегии записывается в виде неравенства в терминах единичных касательных векторов в концах геодезических линий [11]. Построена зависимость отношения скоростей игроков от эксцентриситета эллипса, выделяющая множество эллипсов с оптимальным преследованием по первичным геодезическим.

1. Пространство и динамика игры. Рассматривается дифференциальная игра с участием двух управляемых точек-игроков - преследователя Р и убегающего игрока Е. Точки совершают простое движение, т.е. могут мгновенно менять направление скоростей, ограниченных по величине, соответственно, положительными постоянными 1 и V,

Пространством игры, в котором движутся точки, является двусторонняя плоская фигура М, возможно неограниченная, имеющая выпуклую границу. Точки могут переходить с одной стороны многообразия М на другую в точках границы. Подобное пространство игры - многообразие без края, однако негладкое из-за наличия ребра -границы фигуры. В работе будут рассмотрены также и примеры, в которых многообразие М является гладким, или имеет край. Во всех случаях многообразие М - двумерная поверхность или фигура, рассматриваемая в трехмерном евклидовом пространстве, и длина кривой на М понимается как евклидова длина в объемлющем трехмерном пространстве.

Отметим, что негладкость многообразия не порождает существенных трудностей при анализе задачи. Множество М можно приблизить гладким многообразием: например, эллипс можно рассмотреть как вырожденный эллипсоид с исчезающе малой осью. Специфика задачи заключается в наличии двух и более кратчайших геодезических, соединяющих игроков в некотором подмножестве позиций.

Уравнения движения игроков задаются соотношениями и ограничениями:

х = и, у = и, х, у, и, ие Я2 (1.1)

Здесь х = (х:, х2), у = (у:, у2) - евклидовы (локальные) координаты игроков Р и Е в плоскости, совпадающей с плоскостью фигуры и снабженной прямоугольной декартовой системой координат. В дополнение к соотношениям (1.1) следует указывать на какой стороне фигуры (условно, верхней или нижней) находится точка Р или Е. Кроме того, в точках границы ограничения (1.2) должны быть дополнены условиями, запрещающими выход игроков за пределы фигуры М.

2. Первичное решение. Первичным называется решение, совпадающее по структуре с решением игры на евклидовой плоскости. Время преследования (с нулевым радиусом поимки) при этом равно отношению начального расстояния между игроками к разности их скоростей

0 < V < 1.

2 2 ^ 1 2 2^2 и1 + и2 < 1, Ц»! + и2 <V

2

(1.2)

V(х, у) = Ь(х, у)/(1- V)

(2.1)

Начальное расстояние для случаев, когда игроки находятся на одной и той же стороне (геодезическая линия - отрезок) или на разных сторонах (геодезическая линия

Фиг. 1

представляет собой ломаную линию из двух отрезков) фигуры М, соответственно, задается формулами

где й = (й1, й2) - точка излома геодезической, т.е. точка перехода с одной стороны фигуры М на другую.

Оптимальное поведение игроков в первичной области состоит в их движении вдоль соединяющей их кратчайшей геодезической. Соответствующие первичные стратегии задаются формулами

и(х, у) = -а(х, у)(а(х, у) = дЬ/дх), и(х, у) = VЬ(х, у)(Ь(х, у) = дЬ/ду) (2.3)

где а и Ь - единичные внешние касательные к геодезической линии векторы в точках Р и Е (направленные вдоль соответствующего отрезка), фиг. 1. Непосредственной проверкой можно убедиться, что модуль градиента функции Ь(х, у) по каждой из переменной х и у равен единице. Иными словами, эта функция удовлетворяет двум уравнениям эйконала. Отметим, что при дифференцировании Ь(х, у) производные от вектора й = й(х, у) исчезают, благодаря условиям Вейерштрасса - Эрдмана [14] в угловой точке экстремали (закону "угол падения равен углу отражения" для экстремали). В общем виде выражения для единичных касательных векторов выводятся из формулы первой вариации геодезического функционала [9, 11, 14].

Область с М х М фазового пространства М х М, в которой первичное время преследования (2.1) оптимально, по определению называется первичной. Отметим, что в формуле (2.1) имеется в виду кратчайшая геодезическая, определяемая соотношением

где Б(х, у, а) - семейство возможных локальных минимумов вариационной задачи о геодезической длине, а - параметр семейства, пробегающий некоторое множество А. В рассматриваемых задачах множество А обычно состоит из двух элементов.

Покажем, что время (2.1) является гарантированным для игрока Р во всем фазовом пространстве М х М, т.е. оптимальная поимка происходит либо за время (2.1),

Ь(х, у) = |х - у, Ь(х, у) = |х - й\ + \у - й\

(2.2)

Ь(х, у) = шш Б(х, у, а)

(2.4)

а е А

либо быстрее. При фиксированном а полная производная по времени функции S(x, y, а) в силу системы (1.1) имеет вид

S = <a, u) + <b,v)(a = Sx, b = Sy)

Наибольшая скорость убывания расстояния между игроками, которую может достичь игрок P, равна

minL = minmin S = - 1 + min (b, и) < - 1 + v (2.5)

u u ае A ае A*

Здесь A* - подмножество множества A, на котором достигается минимум (2.4), см. [15], а при получении неравенства использовано ограничение (1.2), налагаемое на вектор и.

Неравенство (2.5) и доказывает требуемую оценку времени.

Аналогичное утверждение о гарантии времени (2.1) для убегающего не удается получить из-за известного свойства максимина - неравенства

maxL = max min S < min maxS

и и ае A* ае A* и

3. Другие типы оптимальных траекторий. Представим фазовое пространство M х M в виде суммы

M х M = D1+ D2

причем по определению оптимальное время преследования в D1 равно величине (2.1), а во вторичной области D2 строго меньше этой величины. В известных примерах задач простого преследования встречаются следующие типы оптимальных траекторий [9, 11, 16-21]. Граница Г12 между областям

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком