научная статья по теме НЕПРЕРЫВНЫЕ ОДНОЗНАЧНЫЕ СТРАТЕГИИ В ЗАДАЧАХ УКЛОНЕНИЯ Математика

Текст научной статьи на тему «НЕПРЕРЫВНЫЕ ОДНОЗНАЧНЫЕ СТРАТЕГИИ В ЗАДАЧАХ УКЛОНЕНИЯ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 68. Вып. 4, 2004

УДК 62-50

© 2004 г. С. А. Брыкалов НЕПРЕРЫВНЫЕ ОДНОЗНАЧНЫЕ СТРАТЕГИИ В ЗАДАЧАХ УКЛОНЕНИЯ

Рассматриваются непрерывные способы управления по обратной связи в задачах уклонения в присутствии помехи. Состояние управляемой системы характеризуется конечномерным вектором. Динамика описывается обыкновенным дифференциальным уравнением, которое линейно по фазовому вектору. Управляющий параметр может нелинейно входить в уравнение, и в том числе в коэффициент при фазовом векторе. Дифференциальное уравнение содержит также неизвестную помеху. Предполагается, что управление и помеха подчинены геометрическим ограничениям. Цель управления состоит в уклонении от выпуклого замкнутого целевого множества, заданного в функциональном пространстве траекторий системы. В частности, такая постановка задачи содержит случай целевого множества в конечномерном пространстве состояний системы на правом конце отрезка. Изучаются способы управления, которые описываются однозначными отображениями, непрерывно зависящими от фазового вектора. Эти способы управления могут использовать отклонение аргумента. При естественных ограничениях, накладываемых на систему, показано, что если некоторый непрерывный способ управления по обратной связи гарантирует уклонение при любой допустимой помехе, то найдется способ управления без обратной связи, также гарантирующий уклонение.

В теории позиционных дифференциальных игр [1-4] стратегия игрока есть функция, описывающая обратную связь в конфликтно управляемой системе. Свойства непрерывных по фазовому вектору стратегий подробно обсуждались ([1], § 55, [2], § 3, [3], с. 232-239, [5-8]). Непрерывные стратегии в дифференциальной игре с линейным по фазовому вектору уравнением рассматривались в предположении, что коэффициент при фазовом векторе не зависит от управления.

Ниже изучается ситуация, когда такая зависимость может присутствовать, и, кроме того, эти результаты распространяются с начальных на некоторые краевые задачи. При этом удалось дать достаточно простое доказательство теоремы о непрерывных стратегиях, основанное на применении теоремы Какутани в пространстве непрерывных функций и леммы о замкнутости графика многозначного отображения. Здесь используются налагаемые ниже упрощающие предположения (выпуклость целевого множества, однозначность стратегий и некоторые другие). Соображения о том, как отбросить или ослабить эти упрощающие предположения за счет усложнения доказательства, можно найти в работах [7, 8], которые основаны на методах алгебраической топологии.

1. Постановка задачи. Будем исследовать управляемую систему, описываемую дифференциальным уравнением

х = А (г, и)х + g(г, и, и)

Независимая переменная г е [г0, Ф] обычно обозначает время, х - конечномерный фазовый вектор, и - управление, и - помеха. Заданы геометрические ограничения и е Р, и е 2. Фиксировано целевое множество М в функциональном пространстве траекто-

рий системы. Требуется воздействовать на систему с помощью управления и е Q так, чтобы гарантировать уклонение *(■) М, какой бы ни была реализация помехи и(0 е Р.

Целевое множество в пространстве траекторий естественно появляется, в частности, как множество уровня нетерминального функционала (например, зависящего от значений решения в нескольких точках или содержащего максимум, интеграл, другие нелокальные операции). Были рассмотрены конкретные примеры дифференциальных игр с нетерминальными функционалами платы [4].

Часто встречается ситуация, в которой целевое множество МФ задается в конечномерном пространстве, и уклоняющийся игрок старается добиться выполнения соотношения х(-д) МФ. Эту ситуацию можно рассматривать как частный случай задачи с целевым множеством М в пространстве траекторий. Достаточно взять в качестве М множество всех непрерывных функций, заканчивающихся на МФ, т.е. удовлетворяющих условию *(-$) е МФ.

Можно формировать требуемое управление и по обратной связи, учитывая замеры фазового вектора, а также использовать более общие стратегии с памятью и = = и(?, *(■)). Было бы естественным попытаться обойтись стратегиями, обладающими свойством непрерывности по фазовому вектору. Однако во многих задачах возможности таких стратегий ограничены.

Ниже при достаточно общих предположениях о системе будет показано следующее. Если можно гарантировать уклонение посредством непрерывной по *(■) стратегии и = и(?, *(■)), то удается обеспечить уклонение с помощью программного управления и = и(?, у()), где у() - подходящая фиксированная функция. Таким образом, если в этих задачах можно уклониться с помощью управления по непрерывной обратной связи, то удается уклониться и без обратной связи, т.е. по программе.

Результат иллюстрируется простым примером дифференциальной игры, в которой требуется уклониться от начала координат в конечный момент времени, причем сначала движение системы определяется только помехой, а затем только уклоняющимся игроком. Это приводит к разрывным коэффициентам в уравнении.

Отметим, что приведенный ниже математический результат доказан для стратегий и = и(?, *(■)), содержащих как запаздывание, так и опережение. Этот результат позволяет также рассмотреть случай не только начальной, но и некоторых краевых задач, что оказывается полезным, если независимая переменная имеет смысл не времени, а координаты. Стратегии с отклонением аргумента и краевые условия, содержащие управляющие параметры, возникают в некоторых задачах о стационарных распределениях температуры на стержне, управление нагреванием которого осуществляется по непрерывной обратной связи, см. [9].

Будем использовать следующие обозначения (п - целое число, п > 1): Rл - пространство п-мерных векторов (столбцов), норма | |п которого фиксирована; Rn х п -пространство (п х п)-матриц с вещественными элементами, норма которого | |п х п согласована с рассматриваемой векторной нормой, т.е. |АЬ|п < |А|п х п|Ь|п для произвольных А е Rn х п, Ь е Rn, С0 - пространство непрерывных функций; Ь1 - пространство измеримых по Лебегу функций с интегрируемым модулем (с интегрируемой нормой |*(0|п или |х(0|п х п для функций х(0 со значениями в пространстве п-мерных векторов или (п х п)-матриц); АС - пространство абсолютно непрерывных функций.

Используются обычные нормы перечисленных функциональных пространств, в частности,

IX (■ )|| АС = II* (■ )11 Со+1 |Х( ■ )|| ¿1

Знак со соответствует выпуклой оболочке, с1 со - выпуклой замкнутой оболочке.

2. Системы с непрерывной обратной связью. Зафиксируем некоторые вещественные числа 10 < Ф и целые числа п, р, q > 1. Если из контекста не вытекает другое, ис-

пользуемые функциональные пространства состоят из функций, определенных на отрезке [t0, Ф] и принимающих значения в Rn. Например, С0 обозначает C°([i0, Ф], Rn), если не оговорено иное. Предполагаем, что множества P с Rp, Q с Rq непусты и замкнуты. Кроме того, множество P ограничено. Функция g : [t0, Ф] х P х Q ^ Rn удовлетворяет условиям Каратеодори. Это означает, что функция g(t, u, и) при почти всяком фиксированном t непрерывна по u, и, а при любых фиксированных u, и измерима по t. Кроме того, пусть найдется функция [t0, Ф] ^ [0, £(■) б L1, такая, что для почти всех t е [t0, Ф] и всех u е P, v е Q верно неравенство

|g(t, u,v)\п t) (2.1)

Матричная функция A : [t0, Ф] х Q ^ Rn х n удовлетворяет условиям Каратеодори. Для некоторой n : [t0, Ф] ^ [0, п( ) е L1, почти всякого t е [t0, Ф] и любого и е Q выполняется оценка

A(t,v)\nхn <n(t) (2.2)

Множество M с С0 выпукло и замкнуто. Пусть и : [t0, Ф] х С0 ^ Q удовлетворяет условиям Каратеодори. Таким образом, u(t, z( )) при почти всяком фиксированном числе t е [t0, Ф] непрерывно зависит от функции z( ) е С0, а при всякой фиксированной функции z() выражение u(t, z()) измеримо по переменной t. Отображения о : С0 ^ [t 0, Ф], h : С0 ^ Rn непрерывны. Найдется число K > 0, такое, что для всякой функции z( ) е С0 верно неравенство

h(z(■ ))|n < к (2.3)

Замечание 1. Фактически достаточно ограниченности h лишь на множестве M. Однако предположение об ограниченности h на всем пространстве С0 позволяет несколько упростить приводимое ниже доказательство теоремы.

Договоримся, что g(t, P, r) - совокупность всех векторов вида g(t, a, r), где число t и вектор r фиксированы, a пробегает множество P. Теорема. Пусть краевая задача

х(t) е A(t, v(t, x(■)))x(t) + cog(t, P, v(t, x(■))) (2.4)

х(о(х( ■))) = h (x (■)) (2.5)

не имеет решений x( ) е M n АС. Тогда найдется функция у(-) е С0 такая, что начальная задача

x(t) е А(t, v(t, y(■)))x(t) + cog(t, P, u(t, y(■))) (2.6)

x(o(y (■))) = h (y (■)) (2.7)

также не имеет решений x( ) е M n АС.

Замечание 2. Подчеркнем, что в теореме идет речь об отсутствии решений, принадлежащих множеству M n АС. При налагаемых на А, и, g, P, о, h требованиях рассматриваемые задачи заведомо имеют решения в АС. Проще всего убедиться в этом следующим образом. Зафиксируем некоторый элемент в е P и заметим, что для любой функции y(-) линейное обыкновенное дифференциальное уравнение

x(t) = А(t,v(t, y(■)))x(t) + g(t, в, u(t, y(■)))

имеет решение, подчиненное начальному условию (2.7). Это решение удовлетворяет также начальной задаче (2.6), (2.7). Теперь разрешимость краевой задачи (2.4), (2.5) следует из сформулированной выше теоремы, если в качестве M взять все пространство С0.

Замечание 3. Поскольку в правых частях дифференциальных включений (2.4), (2.6) овы-пукляются ограниченные замкнутые множества в конечномерном пространстве, выпуклая

оболочка совпадает с выпуклой замкнутой оболочкой. Это следует из теоремы Каратеодори (см., например [10], с. 171, 174).

Замечание 4. Переход к выпуклой оболочке в правых частях включений (2.4), (2.6) становится ненужным, если выполняется следующее требование выпуклости вектограммы: для почти всякого t е [Г0, Ф] и всякого г е Q множество g(t, Р, г) выпукло. Для доказательства теоремы понадобится следующая Лемма о замкнутом графике. Пусть дано многозначное отображение

[Ф] х С0 х С0 Э х(•), г(-)) ^ Р(t, х(•), г(•)) с К"

причем для любых х( ), г( ) е С0 и почти всякого t е [^,Ф] м

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком