научная статья по теме П-СТРАТЕГИЯ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С ЛИНЕЙНЫМИ ОГРАНИЧЕНИЯМИ ПО УПРАВЛЕНИЮ Математика

Текст научной статьи на тему «П-СТРАТЕГИЯ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С ЛИНЕЙНЫМИ ОГРАНИЧЕНИЯМИ ПО УПРАВЛЕНИЮ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 78. Вып. 3, 2014

УДК 62-50

© 2014 г. Б. Т. Саматов

П-СТРАТЕГИЯ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С ЛИНЕЙНЫМИ ОГРАНИЧЕНИЯМИ ПО УПРАВЛЕНИЮ

Вводится понятие линейного ограничения по управлению игроков в дифференциальной игре преследования, которое обобщает в некотором смысле как интегральное, так и геометрическое ограничения. Для соответствующей задачи строится оптимальная стратегия параллельного преследования (П-стратегия).

1. Введение. Как задача управления z = f(z, u), так и более общая дифференциальная игра z = f(z, u, и) обычно рассматриваются при "геометрическом" ограничении, налагаемом на векторы управления, вида

u е P, и е Q (1.1)

где Р и Q — заданные подмножества евклидовых пространств соответствующей размерности, т.е. управляющий субъект должен выбирать способ управления, порождающий измеримую функцию u(t), 0 < t < t* (соответственно u(t), 0 < t < t*), такую, что

u(t) е P п.в. ( u(t) е Q п.в.) (1.2)

Например, если Р — шар |u| < g, то ограничение (1.2) равносильно требованию

IIu(• )||ю = ess sup |u(t)| < Z (1.3)

о < t < t *

С функциональной точки зрения естественный аналог этого условия - "интегральное" ограничение

-t * -ii /р

II u (• )|| p =

J| u (t )| pdt ■"0 -

< z, р> 0, p > 1 (1.4)

Задачи с интегральными ограничениями сложнее задач с геометрическими ограничениями, однако на практике важны оба типа ограничений: если первый тип выражает ограниченность динамических возможностей объекта (например, ограничение по силе тяги), то второй тип ограничений выражают конечность ресурсов (например, топлива).

Ниже предлагается новый тип ограничения по управлению игроков — ограничение "линейного роста". Для вектора управления ы(-) это ограничение имеет вид

t

1........

u(5) ds <ф(t), t е [0, t*]; ф(t) = at + р0 (1.5)

0

где а и р0 — неотрицательные числа. Ясно, что ограничение (1.5) при а = 0, р0 > 0 будет интегральным ограничением типа (1.4) при р = 2. Вместе с тем при а > 0, р0 = 0 огра-

3 Прикладная математика и механика, № 3

ничение (1.5) непосредственно следует из геометрического ограничения типа (1.3), т.е. в этом смысле является менее жестким. Аналогично, на вектор управления ц(-) налагается ограничение линейного роста вида

г

|| u(s)\2ds <у(0, г е [0, г* ]; = рг + ст0 (1.6)

о

где в и ст0 — неотрицательные числа.

2. Игра преследования с ограничениями линейного роста. Рассматривается следующая задача преследования: в пространстве К" управляемый объект X (преследователь), гонится за другим объектом Y (убегающим). Пусть х и у — местоположения преследователя и убегающего, х0 и у0 (х0 Ф у0) — их начальные местоположения. Движения объектов описываются уравнениями

х = и, х(0) = х0; у = и, у(0) = у0; х, у, и, и е К", п > 1 (2.1)

Параметрами управления игроков служат векторы скорости и и и, зависящие от времени ? > 0. Измеримую функцию и(-) (и(')), удовлетворяющую условию (1.5) (условию (1.6)), назовем допустимым управлением преследователя (убегающего) класса У (класса V). Введенная пара классов (У, V) допустимых управлений определяет дифференциальную игру.

В силу уравнений (2.1) каждая пара (х0, и(-)) и (у0, ц(-)) порождает траектории движения

х(г) = х0 + |и(^)ds и у(г) = у0 + |и(s)ds

игроков X и Y. Цель преследователя X — поимка, т.е. осуществление равенства

х( г) = у (г) (2.2)

а убегающий Y стремится уклониться от встречи, т.е. осуществить неравенство х(?) Ф у(() для всех ? > 0, а в противном случае как можно дальше отодвинуть момент встречи (2.2). Такова предварительная постановка рассматриваемой задачи преследования.

Одна из рассмотренных Айзексом [1] игровых задач, известная как игра с "линией жизни" была достаточно полно изучена [2, 3]; при этом был введен специальный способ синтеза управления преследователя "стратегия параллельного преследования" (П-стратегия). В дальнейшем такая стратегия нашла многочисленные применения к решению дифференциальных игр преследования ([3—6] и др.), как правило, с геометрическими ограничениями вида (1.1).

Для приложений представляет интерес изучение дифференциальных игр, в которых на управления игроков налагаются двойные, т.е. одновременно и интегральные, и геометрические ограничения, а также игры с разнотипными ограничениями ([7—9] и др.). Следует отметить, что дифференциальные игры с такими и более общими ограничениями сравнительно мало исследованы.

Для решения рассматриваемой ниже дифференциальной игры преследования с ограничениями линейного роста вида (1.5), (1.6) предлагаются аналоги П-стратегии [2—4]. В зависимости от выбора параметров а, р0, в, ст0 возможны 9 вариантов игры. Например, при а Ф 0, р0 = 0, в Ф 0, ст0 = 0 имеем аналог дифференциальной игры с геометрическими ограничениями [2—6, 10, 11], при а = 0, р0 Ф 0, в = 0, ст0 Ф 0 — только

0

0

с интегральными ограничениями [12, 13], при а = 0, р0 Ф 0, в Ф 0, а0 = 0 — с интегрально-геометрическими ограничениями [13], при а Ф 0, р0 Ф 0, в Ф 0, а0 = 0 — с двойным ограничением для преследователя [8, 13] и т.д.

3. П-стратегия в случае а > р. Для решения задачи преследования объекту X недостаточно располагать только одними допустимыми управлениями «(•) е У. Поэтому пока полагаем, что с течением времени ему становится известной информация о текущих местоположениях: своего х(?) и убегающего у(?), а также о значениях скалярных функций р(?) и ст(?):

р(I) = Ф(I) - ||и(э)|р(0) = Ро (3.1)

о

ст(I) = у(I) - | и(э)|, ст(0) = Сто (3.2)

о

которые назовем остаточными ресурсами объектов X и Y соответственно. Далее, четверку (х(?), у(?), р(?), ст(0) назовем текущим состоянием (У, V)-игры, и в зависимости от этого состояния определим стратегию преследователя.

Пусть в игре (У, V) в некоторый момент времени ? объект X (объект Y) находится в точке х (в точке у) и имеет остаточный ресурс р (остаточный ресурс а), при этом х Ф у. Исходя из классического способа построения П-стратегии [2—4] полагаем, что для постоянного вектора и е К" направление и величину скорости и е К" можно выбрать так, что были выполнены соотношения

Ти = Ти - г, а Т + р - Т\и\2 = в Т + ст - Т| и\2

где z = х — у, Т > 0. Введем обозначения X = г /Т, 5 = р - Ст, % = г/|г и находим

и = и - \и\2 = |и|2 + Х5/|г| + а - р (3.3)

Возводя в квадрат обе стороны первого из этих равенств и учитывая второе, получаем квадратное уравнение относительно А. Его положительный корень имеет вид

Х*(г, 5, и) = /(5/(21г) + < (3.4)

где

f(w) = w + Vм>2 + а - р

и (и, — скалярное произведение векторов и и ^ в К". Заметим, что второй корень квадратного уравнения не при всех и и ^ может быть положительным.

Определяем корень (3.4) при а > в, как разрешающую функцию [5, 6] и приведем некоторые важные ее свойства. Одно из них следующее: если а > в, то функция А*^, 8, и) определена, непрерывна и неотрицательна при всех (I, 8, и) е А* х К", где А* = 8) : zФ 0}.

Теперь, подставляя разрешающую функцию (3.4) вместо А в соотношения (3.3), находим функцию

и* (г, 8, и) = и - X* (г, 5, и(3.5) и ее величину

|и*(г, 8, и)|2 = |и|2 + Х*(г, 8, и)8/|г + а - р (3.6)

Функцию (3.5) определяем как стратегию преследователя с полной информацией.

Пусть убегающий Y движется при помощи произвольного допустимого управления и(-) е V, а преследователь X реализует стратегию (3.5). Тогда из соотношений (2.1) и (3.1), (3.2) следует система уравнений относительно переменных z и 8 вида

г = и*(г, 8, и(0) - и(0, 8 = |и(012 - |и*(г, 8, и(0)12 + а - р и в силу равенств (3.5) и (3.6) получаем задачу Коши

г = -X*(г, 8, и(0)г/|г\, г(0) = г„, 8 = -X*(г, 8, и(0)8/|г\, 8(0) = 8о (3.7)

где z0 = x0 — у0, 80 = р0 — а0. Поскольку точка 80) е А*, то в ее окрестности согласно условиям Каратеодори [14] система (3.7) имеет единственное абсолютно непрерывное решение ^(0, 8(0), исходящее из точки 80), и при этом выполняется включение ^(0, 8(0) е А* для некоторого промежутка времени [0, Для t е [0, * справедливы следующие равенства:

8(0/(2|г(01) = И„ = 8„/(2|г„|)

и*(г(I), 8(0, и(V) = и*(г„, 8„, и(0) (3.8)

|и*(г„, 8„, и(0)|2 = | и(/)|2 + X*(г„, 8„, и(0)8„/|г„| + а - р

Первое из них следует из вида системы (3.7), а второе и третье вытекают из первого.

В силу равенств (3.8) преследователю X для построения функции управления достаточно иметь информацию о текущем значении функции и(0 и о начальных данных z0,

Po, О» а Р.

Определение 1. Пусть а > р. Тогда в (и, V) -игре П*-стратегией преследователя назовем функцию

и*(и) = и - X*(и)^„, и е К" (3.9)

где

Х*( и) = Дц„ + < и,£„», £„ = г„/| г)|

а и*(и(0), t > 0 — ее реализацией для каждого ц(-) е V.

Определение 2. П*-стратегия называется выигрышной для преследователя в промежутке времени [0, 7], если для любого ц(-) е V: а) существует такой момент времени Г* е [0, Т], что выполнено равенство х(Г*) = у^*), б) и*(и(-)) е У в промежутке времени [0, (Т — гарантированное время преследования или поимки.)

Теорема 1. Пусть выполнено хотя бы одно из условий: а) а > Р или б) а = Р и р >

> а + 2л/а |г0|. Тогда в (У, V)-игре П*-стратегия является выигрышной в промежутке времени [0, Т*], где Т* — наименьший положительный корень уравнения

^а Т + р„Т -V р Т + ст„ Т = |г„| (3.10)

Доказательство. Пусть убегающий У движется при произвольном управлении ц(-) е V, а преследователь X реализует П*-стратегию. Тогда из уравнений (2.1) имеем задачу Коши

г = и*(и(0) - и(х), г(0) = гс

Откуда в силу определения (3.9) находим

х

г (х) = Л * (х, и( ■)) го; Л* (х, и( ■)) = 1 - \х *( ф)) &

го -1

о

Аналогично указанному ранее [2—4] и здесь вектор в процессе преследования остается параллельным самому себе. "Функция сближения игроков" Л*(^ ц(-)) при а > в монотонно убывает по t и справедлива оценка

х

Л*(X, и(■)) < 1 - ± ]Д ио - |и(5)|)& (3.11)

о

Поскольку функцияА^) является вогнутой при всех действительных w, то для нее выполнено интегральное неравенство Иенсена в форме

/ - IV(5)йв < - /w(5))X > 0

о о

применяя которое, из неравенства (3.11), с использованием неравенства Коши-Буня-ковского

(* \

|| и(5)|</х || и(5)|

1/2

при ограничении (1.6) получаем

Л*(X, и(■ ))<Л*(X) = 1 - -у(цо-vв + а/x)

Легко проверить, что уравнение Л*(Т) = 0 эквив

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком