научная статья по теме ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ СОБСТВЕННО ЛИНЕЙНЫХ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРЫ Математика

Текст научной статьи на тему «ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ СОБСТВЕННО ЛИНЕЙНЫХ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРЫ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 79. Вып. 1, 2015

УДК 62-50

© 2015 г. В. Л. Пасиков

ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ СОБСТВЕННО ЛИНЕЙНЫХ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРЫ

Рассматриваются игровые ситуации наведения на начало координат для управляемых объектов, эволюция которых описывается собственно линейными интегро-дифференциальными и интегральными системами Вольтер-ры. Предлагается некоторая модификация экстремальных конструкций Н.Н. Красовского при подходящем выборе пространства позиций. Приведен модельный пример.

Обычно подобные задачи рассматривались для обыкновенных дифференциальных систем, в предлагаемой работе динамика движущихся объектов описывается более сложными системами. Решение задач наведения привело к новому определению позиции игры, а это потребовало использование полной памяти по управляющим воздействиям, что значительно усложняет применение методов, развитых ранее [1—5].

1. Состояние управляемой собственно линейной интегро-дифференциальной системы.

Пусть движение конфликтно-управляемого объекта описывается интегро-дифферен-циальной системой

t

x = A(t )x(t ) + J K(t, s)x(s)ds + f (t, u(t ), u(t ) ), x(0) = x 0 (1.1)

0

Здесь x — n--мерный фазовый вектор, u e U и и e V — rx - мерный и r2 — мерный векторы управляющих воздействий (управлений) подчиненные первому и второму игрокам, Uи V — компакты в соответствующих векторных пространствах, матрица A(t) непрерывна на отрезке [0, 0], 6 > 0 — фиксированное время окончание игры, матрица K(t, s) непрерывна при 0 < s < t < 0, f(t, u, и) — n-мерная вектор-функция, непрерывная при каждом t е [0, 0] по совокупности переменных u, и, а при фиксированных u и и функция измерима по t. Все интегралы понимаются в смысле Лебега.

Известно ([6], с. 9),что система (1.1) имеет единственное решение, удовлетворяющее заданному начальному условию. По известному плану доказательства ([7], теорема 27), проинтегрировав систему (1.1) в пределах от 0 до t получаем интегральное уравнение Вольтерры второго рода

t

x( t ) = J Q( t, s) x( s) ds + ф t) (1.2)

Q( t,s) = A( s) + Jk(t, s)d t , ф( t) = ¡f(s, u( s), u( s)) ds + x 0

я) — непрерывное ядро уравнения (1.2), ф(0 — абсолютно непрерывная на [0, 0] функция. Уравнение (1.2) имеет единственное абсолютно непрерывное решение при

0

S

0

фиксированных реализациях управлений u[t] и и[t] [8], а значит, исходная система (1.1) с начальным условием

x(0) = xo (1.3)

имеет единственное абсолютно непрерывное решение.

По известной схеме [7] получим решение системы (1.1) при реализовавшихся измеримых функциях u[t] и и [t], с начальным условием (1.3). Обозначим

k(t) = x(t) - A(t)x(t)

Решение

t

x(t) = X (t, 0)x0 + J X (t,s)k(s)ds (1.4)

o

обыкновенного дифференциального уравнения x = k(t) + A(t)x(t)

записанное по формуле Коши [1], где X(t, s) — матрица Коши однородной системы, подставляем в уравнение (1.1) и меняем порядок интегрирования. Получаем линейное интегральное уравнение Вольтерры второго рода относительно k(t)

t

k(t) = f (t, u(t), u(t)) + Ф(t, 0)x0 + J Ф(t, s)k(s)ds (1.5)

Ф(г, s) = J K (t, t)X (t, s)d т

5

Пусть R(t, s) — резольвента матрицы Ф(^ s), тогда суммируемое решение уравнения (1.5) запишется в виде [8]

t

k(() = f(t,и((),и(()) + Ф((,0)х0 + J R((, s) [f (s, u(s), u(s)) + Ф( 0)x0] ds (1.6)

5

Подставляя выражение (1.6) в равенство (1.4) и меняя порядок интегрирования, запишем решение системы (1.1) в следующей форме:

t t

x(t) = X (t, 0)x0 + Jx(t, s^(s, 0)dsx0 + Jx(t, s)f (s, u(s), u(s))ds (1.7)

0 0

t

x((, s) = X ((, s) + JX ((, t)R(t, s)d т

s

2. Решение игровой задачи наведения. Задача рассматривается на заданном промежутке [0,9] и плата игры определяется равенством

Y = ||х(9)|| (2.1)

(введена евклидова норма). Первый игрок распоряжается выбором управления u е U и стремится минимизировать величину (2.1) на траекториях x[t], t е [0, 9], системы (1.1), реализующихся под воздействием управления u[t], t е [0, 9], в паре с любой допусти-

s

мой реализацией и [?], ? е [0, 9], и е V, второго игрока. Допустимые реализации и[?], и [?], ?е [0, 9], предполагаются измеримыми функциями. Цель второго игрока противоположна и заключается в максимизации величины (2.1).

Считаем теперь что ?0 е [0, 9) — начало процесса управления, а на промежутке [0, ?0] уже реализовались некоторые допустимые управляющие воздействия, удовлетворяющие вложениям и е и и и е V.

Если положить, что и[?] = 0, и [?] = 0, при ? е [?0, 9), то состояние системы (1.1) в момент ? записывается согласно решению (1.7):

и, г

х(9,г) = х0(9) + |х(9,5)/(5, ф],ф])йЗ + |х(9,5)/(5, . (2.2)

0 I,

Определение 1. Пара р ={?, х(9, ?)} называется позицией игры в момент ?, ? е [?0, 9), ?0 е [0, 9); р0 = {?0, х(9, ?0)} — начальная позиция игры.

Отметим, что для вычисления позиции в каждый момент ? е [?0, 9) требуется полная память по управляющим воздействиям [5].

Определение 2. Стратегией первого (второго) игрока называется правило, которое каждой реализовавшейся позиции {?0, х(9, ?0)} ставит в соответствие компакт

Ц^, х(9, д) ^ и(^(?0, х(9, ?0)) с V)

Множества ие(р0) (Ve(p0)) предполагаются полунепрерывными сверху по включению по ? и х, причем по изменению ? справа.

Пусть функцияД?, и, и) удовлетворяет условию седловой точки в "маленькой игре" [2]

тттах//(г, и, и) = тахтт/'/(г, и, и)

и е и и е V и е V и е и

/' — некоторый и-мерный числовой вектор, штрих означает транспонирование. Введем в рассмотрение программный максимин [1]

е

Е0(г 0, х(9, г0)) = шах[/' х(9,г0) + Г ш1пшах{/' Х(9,5)}/(5, и[з], и[5])&] (2.3)

Ц/||=1 иеи ueV

Предполагается, что в правой части наибольшее значение достигается на единственном векторе l, т.е. рассматривается регулярный случай [1,2].

Определение 3. Пусть и-мерный вектор l' в каждый момент t0 е [0, 9) доставляет максимум правой части равенства (2.3). Если позицияp0 такова, что s0(t0, х(9, t0)) > 0, то с этой позицией будем сопоставлять множество Ue(t0, х(9, t0)) (Ve(t0, х(9, t0)) всех векторов ue е U(иe е V), для которых

maxxe(t0)f (t0, ue, u) = min maxxe(t0)f (t0, u, u)

ueV ueJ ueV

(minxe(t0)f (t0, u, ue) = min maxxe(t0)f (t0, u, u)), xe(t0) = l'x(9, t0)

ueJ ueJJ vzV

Такие стратегии Ue(Ve) будем называть экстремальными стратегиями первого (второго) игрока.

Далее определяем пошаговое движение [2, 3] системы (1.1) и пучок движений [2, 3] как совокупность пределов пошаговых движений. Отсюда вытекает, что систему (1.1) можно рассматривать как дифференциальное включение, а ее движение — как измеримый селектор, который существует [3].

2 Прикладная математика и механика, № 1

Теорема 1. В регулярном случае при выборе первым игроком стратегии

Ue = Ue(t, x(9, t)), t e [t0,9), t0 e [0, 9)

описываемой определением 3, ему будет гарантирован результат игры

||x(9)|| < S0(t0, x(9, t0))

при любом допустимом способе управления второго игрока. Доказательство. Вводится в рассмотрение функция

t 0 s(t,х(9, t) = l'x(<d, t0) + [maxxe(s)f(s, ue(s),u(s))ds + \xe(s)f(s, и (s),u(s))ds (2.4)

J ueV J

t0 t

Здесь

B(t0, x(Q, t0)) = ||x(9)||

в случае, когда первый игрок применяет свою экстремальную стратегию, а второй — произвольную допустимую; s(9,x(9,9)) — значение программного максимина (2.3). Дифференцируя равенство (2.4) по t, убеждаемся, что

— = maxxe(t)f(t, ue(t), u(t)) - xe(t)f(t, ue(t), u(t)) > 0

dt ueV

и, таким образом, при замене в равенстве (2.4) произвольной допустимой стратегии второго игрока на экстремальную, значение e((,x(Q,t)) может только увеличиться, т.е.

e(t0, x(9,10)) <s(9,x(9,9))

что и требовалось доказать.

Теорема 2. В регулярном случае при выборе вторым игроком стратегии

Vе = Ve(t, x(9, t)), t e [t0, 9), t0 e [0, 9)

описываемой определением 3.2, ему будет гарантирован результат игры

||x(9)|| > S0(t0, x(9, t0))

при любом допустимом способе управления первого игрока.

Доказательство аналогично доказательству теоремы 1. Непосредственным следствием теорем 1 и 2 является теорема о существовании седловой точки в рассматриваемой игре.

Теорема 3. Если в регулярном случае игры функция f(t, u, и) удовлетворяет условию седловой точки в "маленькой игре", то экстремальные стратегии игроков U®(t, x(9, t)) и V^t, x(9, t)), t e [t0, 9), t0 e [0, 9), доставляют седловую точку в рассматриваемой игре, причем

||x(9)|| = S0(t0, x(9, t0))

3. Модельн^1й пример. Пусть движение объекта описывается системой двух одинаковых скалярных уравнений

t

z(t) = e + Jz(s)ds + u2(t) - и2(t); z = (x, y), z(0, 0) = (1, 1) (3.1)

0

Для каждого уравнения получаем

f (t, u, и) = e + u 2(t) - и2(t), A(t) = 0, K(t, s) = 1

Однородная дифференциальная система имеет вид z = 0. В качестве фундаментальной матрицы выберем Z(t) = 1 и записываем матрицу Коши

Z(t, s) = Z(t)Z _1(s) = 1, Z(t, 0) = 1

Далее вычисляем матрицу t t <S>(t, s) = J K (t, t)Z(t, s)d t = \d t = t - s, <^{t, 0) = t

s s

Ее резольвента определяется формулой ([9], с. 22) R(t, s) = sh(t — s). Отсюда следует, что

t t z(t, s) = Z((, s) + JZ((, t)R(t, s)dт = 1 + Jsh(x - s)dт = ch(t - s)

s s

Функция

y(u, и) = u2—и2, |u| < 1, |u| < 1 имеет седловую точку (0, 0) и

2 2 min u = 0, max(-u ) = 0

u^U ueV

Тогда

2 2 2 2 minmaX[u + (-u )] = maxmin[u + (-u )] = 0

u^U ueV ueV uçU

По формуле (1.8) получаем решение системы (3.1)

zW = -1 + ie,t + 1) + 3cht+J.(t-s)(u![s1-„2Mds) ,3.2,

0

Очевидно, что x(0) = 1, y(0) = 1.

Из решения (3.2) следует, что движение осуществляется по прямой y = x к началу координат от точки (1, 1).

Формулы (3.1) и (3.2) иллюстрируют приведенные теоремы.

Замечание. Аналогичные задачи могут быть решены и для управляемых систем более сложных типов: интегро-дифференциальных

t t x = q(t) + A(t)x(t) + J K (t, s)x(s)ds + J B(t, s)f (s, u(s),u(s))ds 0 0 или интегральных систем типа Вольтерры [10] t t x(t) = ф(t) + jA(t, s)x(s)ds + j"B(t, s)f(s, u(s), и(s))ds 0 0

ЛИТЕРАТУРА

1. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.

2. Красовский Н.Н., Субботин А.И. Позицонные дифференциальные игры. М.: Наука, 1974. 456 с.

3. Субботин А.И., Ченцов А.Г. Оптимизация в задачах управления. М.: Наука, 1981. 287 с.

4. Осипов Ю.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком