научная статья по теме УКЛОНЕНИЕ В КОНФЛИКТНОЙ СРЕДЕ ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ РАЗНОРОДНЫХ НАБЛЮДАТЕЛЕЙ Кибернетика

Текст научной статьи на тему «УКЛОНЕНИЕ В КОНФЛИКТНОЙ СРЕДЕ ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ РАЗНОРОДНЫХ НАБЛЮДАТЕЛЕЙ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2014, № 4, с. 18-27

УКЛОНЕНИЕ В КОНФЛИКТНОЙ СРЕДЕ ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ РАЗНОРОДНЫХ НАБЛЮДАТЕЛЕЙ*

© 2014 г. А. А. Галяев, Е. П. Маслов

Москва, ИПУ РАН Поступила в редакцию 19.11.13 г., после доработки 17.02.14 г.

Решается задача об уклонении на плоскости подвижного объекта от обнаружения системой из двух разнородных неподвижных наблюдателей. Для случая степенной зависимости уровня излучаемого сигнала от скорости движения уклоняющегося объекта найден в явном виде оптимальный закон уклонения. Построены траектории обхода системы наблюдателей и прорыва через систему.

DOI: 10.7868/S0002338814040076

0. Введение. В связи с широким использованием беспилотных аппаратов для целей охраны и предотвращения несанкционированного доступа на охраняемую территорию сформировался новый класс задач поиска — уклонения. В англоязычной литературе этот класс задач получил название "Path Planning in the Threat Environment" [1—7]; в русскоязычной литературе — название задач управления подвижными объектами в конфликтной среде [8]. Под конфликтной средой понимается совокупность объектов (они называются конфликтующими), сближение с которыми для управляемого объекта нежелательно в ходе выполнения им основной задачи. Целью управления объектом при движении его в конфликтной среде является минимизация негативного воздействия конфликтующих объектов на управляемый объект путем выбора маршрута и параметров движения последнего.

К числу негативных воздействий принято относить обнаружение объекта. Задачи об оптимизации закона уклонения подвижного объекта от обнаружения рассматривались в ряде работ. Постановки задач отличаются предположениями о характеристиках информационных полей, в которых происходит обнаружение, классами допустимых законов управления, видом критериев качества, количеством обнаружителей, объемом и характером информации, доступной конфликтующим сторонам (см. [1—7] и библиографию к указанным статьям).

Особенность задач уклонения от обнаружения состоит в том, что во всех случаях текущий уровень сигнала I на входе наблюдателя зависит от текущей дистанции D до уклоняющегося объекта, а для некоторых полей — и от величины текущей скорости v объекта. Для описания указанной зависимости в литературе широко используется степенная модель, в которой уровень сигнала пропорционален отношению:

Величина показателя степени к является характеристикой физического поля, в котором осуществляется обнаружение [9,10]. Величина показателя степени т характеризует зависимость уровня интенсивности излучаемого сигнала от скорости движения объекта. Такая зависимость имеет место для сигналов первичного гидроакустического поля.

Для описания механизмов обнаружения в литературе наиболее часто используются два подхода.

Первый подход состоит в оценке интегрального уровня сигнала, поступившего на вход относительно большой информационно-наблюдательной системы за все время наблюдения. В литературе такую систему принято называть сенсором. Оценка интегрального уровня сигнала на входе сенсора определяется с учетом решения задачи об оптимизации закона управления подвижным объектом, перемещающимся в течение заданного промежутка времени Т из фиксированной

* Работа выполнена при финансовой поддержке РФФИ (грант № 12-08-90018-Бел_а) и Программы № 14 ОЭММПУ РАН.

(0.1)

начальной точки Л(хА, уА) в фиксированную конечную точку В(хв, ув) маршрута и уклоняющимся при этом от обнаружения наблюдателем (группой наблюдателей), расположенным в районе.

В [9] было показано, что для практически важного случая малых отношений сигнал/помеха на входе неподвижного сенсора задача о минимизации вероятности обнаружения сводится к минимизации функционала (риска):

где х(0, у^) — текущие координаты уклоняющегося объекта в декартовой системе координат, начало которой совпадает с позицией наблюдателя; точками сверху обозначены производные по времени; граничные условия задаются соотношениями

Функционал (0.2) имеет следующую физическую интерпретацию. Риск — это величина, пропорциональная интегральному уровню принятого наблюдателем сигнала, излученного подвижным объектом и прошедшего через среду распространения за время движения объекта по маршруту. Исторически задача об оптимизации закона уклонения от обнаружения вначале была решена для случая движения объекта на постоянной скорости [1, 2]. В [10, 11] приведены постановка и решение задачи об уклонении подвижного объекта на переменной скорости с одновременной оптимизацией траектории и закона управления скоростью. В [10, 11] было показано, что движение объекта по оптимальной траектории уклонения с использованием оптимального закона изменения скорости порождает на входе наблюдателя сигнал, мгновенный уровень которого остается постоянным в течение всего времени движения.

Второй подход к описанию механизма обнаружения состоит в том, что наблюдатель отождествляется с точечным объектом, снабженным круговой зоной обнаружения фиксированного радиуса, центр которой совпадает с текущей позицией наблюдателя. В литературе такой наблюдатель принято называть информационным детектором (или просто детектором). Цели, попавшие внутрь круга, обнаруживаются достоверно; цели, не попавшие в круг, — не обнаруживаются. Указанный подход описан, например, в [6, 7].

Развитием постановки (0.2), (0.3) является учет ограничений на траекторию уклонения и/или управление (скорость) уклоняющегося. Ограничения на траекторию имеют место, например, при решении задачи о форсировании канала [12] — физическими ограничениями служат границы канала; в [13] описано решение задачи об оптимизации закона уклонения от обнаружения при наличии прямолинейного координатного ограничения.

Задача об управлении при наличии ограничения на траекторию уклонения решается и в настоящей статье. Систему разнородных наблюдателей образуют сенсор и детектор — в том информационном смысле, который был им придан выше. Так как попадание подвижного объекта в круговую зону обнаружения детектора с неизбежностью приводит к его мгновенному обнаружению, то задача об оптимизации закона уклонения от обнаружения системой разнородных наблюдателей сводится к задаче уклонения от обнаружения сенсором при наличии круговой запретной зоны (кругового ограничения) — зоны обнаружения детектора.

1. Постановка задачи. Вводится полярная система координат, полюс которой совпадает с положением сенсора, а полярная ось проходит через начальную точку маршрута А(ха, уА).

Полярные координаты произвольной точки плоскости обозначаются символами (р, у). Полярное уравнение круговой зоны обнаружения детектора имеет вид [14]

где pd (у) — полярный радиус точки окружности — границы круговой зоны обнаружения детектора (нижний индекс соответствует англ. detector), соответствующий полярному углу у; (l, 0) — полярные координаты детектора — центра зоны обнаружения; r — радиус зоны обнаружения.

Квадратное уравнение (1.1) разрешается относительно полярного радиуса pd (у):

(0.2)

x(0) = xA, y(0) = yA; x(T) = xB, y(T) = yB.

(0.3)

P¿(v) - 2pd(V)lcos(V - 6) + l2 = r2,

(1.1)

(1.2)

Попадание уклоняющегося объекта с полярными координатами (р, у) в пределы круговой зоны обнаружения детектора возможно лишь при выполнении системы неравенств

Pdi(v) > Р(¥) > Pd2(V).

Во введенной полярной системе координат задача об оптимизации закона уклонения от обнаружения системой разнородных наблюдателей сводится к минимизации функционала [10, 11]

T

R = J(р 2 + 2d ^ min, (1.3)

^ р (V.V.P.P)

при наличии граничных условий

р(0) = р у(0) = 0 ; p(T) = рв, V(T) = v в (1.4)

и ограничения

P^ [p d2(v), Pdi(v)]; ye [0, y в ]. (1.5)

2. Решение задачи. При наличии ограничений в виде неравенств на функции координат подвижного объекта оптимальная траектория состоит из участков, часть из которых лежит на границе допустимой области, а остальные — внутри допустимой области. В Приложении доказана лемма, из которой следует, что в случае функционала (0.2) и ограничения вида (1.1) соответствующие отрезки оптимальных траекторий в точках сопряжения сшиваются гладко.

2.1. Решение задачи об оптимизации закона уклонения при движении объекта внутри допустимой области приведено в [10, 11, 13] и определяется следующими соотношениями:

уравнение оптимальной траектории, проходящей через произвольные точки K(pк, ук);

M(р м, ¥ м):

р(¥) = рк exp f V-V K ln te); (2.1)

Wм -V к P к J

оптимальный закон изменения скорости

v(v) = Cp(v); (2.2)

постоянная C определяется из условия прохождения маршрута по оптимальной траектории с использованием оптимального закона изменения скорости за заданное время

V м

T = f ds(y) J v(v)'

V к

где ds(y) — дифференциал дуги в полярных координатах, и вычисляется по формуле

с = 1J(vм -wк)2 + ln2 ^;

TV Рк

значение риска, соответствующее оптимальному закону уклонения,

Я = С2Т = 1 Г(¥м - ¥к)2 + 1п2 М. (2.3)

т У р к )

2.2. Решение задачи (1.3)—(1.5) об оптимизации закона уклонения при наличии ограничения в виде окружности сводится к нахождению оптимального закона управления при движении объекта по дуге окружности (круговой траектории), при произвольном времени движения, нахождению в явном виде условий сопряжения отдельных участков траектории и минимизации суммарного риска.

При движении по фиксированной круговой траектории оптимизация закона уклонения сводится к оптимизации закона изменения скорости. Пусть Б(р в, у в), Н (рн, у н) — точки входа и схода траектории с круговой границы соответственно; Тв, Тн — моменты входа и схода.

Находим явный вид функционала на круговой траектории (при р = рй (у)):

Кпн =

_ г(р +Р УК )

йи

Р

Используя выражение (1.2), вычисляем производную полярного радиуса по времени: 1рл - 9)

р й = +

I

г2 -12 8Ш2(у - 9)

(2.4)

(2.5)

Возводя (2.5) в квадрат, подставляя результат в (2.4) и приводя подобные члены, находим выражение для функционала при движении по круговой траектории:

Кви =

г2 - 128т2(у - 9)

у 2dt.

(2.6)

Функционал вида

Кпи -

I / 2dt,

где символом /(у) обозначена дробь в (2.6), имеет первый интеграл /(У)¥2 - V д-т (/ (У)¥2) = -/(У)¥2

— гамильтониан, который

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком