Автоматика и телемеханика, № 6, 2014
Робастные и адаптивные системы
© 2014 г. А.А. ГАЛЯЕВ, канд. физ.-мат. наук (galaev@ipu.rssi.ru) (Институт проблем управления им. В.А. Трапезникова РАН, Москва)
ЗАДАЧА УКЛОНЕНИЯ ОТ ПОДВИЖНОГО ОДИНОЧНОГО НАБЛЮДАТЕЛЯ НА ПЛОСКОСТИ В КОНФЛИКТНОЙ СРЕДЕ1
Рассматривается задача уклонения подвижного объекта от движущегося наблюдателя в конфликтной среде. Найден закон управления скоростью подвижного объекта. Построена оптимальная траектория движения, проведено сравнение зависимости накопленного сигнала от времени при других законах управления.
1. Введение
Задачи управления движением подвижного объекта в конфликтной среде вызывают повышенный интерес в связи с все более широким применением роботов и различного рода беспилотных и автономных транспортных средств. Планирование траекторий таких объектов происходит в условиях постоянной и переменной внешней среды, формирующей, в свою очередь, постоянную или динамическую карту угроз, зависящую от критерия оптимизации (миссии) подвижного объекта.
В соответствии с условиями внешней среды задачи планирования траекторий разбиваются на две группы. К первой группе относятся задачи управления движением в практически важном для приложений случае - малом отношении сигнал/помеха [1-8]. Постановки задач оптимизации отличаются друг от друга
- уклонением на переменной или постоянной скорости [1, 2];
- количеством неподвижных наблюдателей, формирующих карту угроз [3];
- наличием дополнительных ограничений [4].
Связь вероятностного критерия обнаружения подвижного объекта и алгоритма принятия решения об обнаружении с энергетическим критерием оптимизации, используемым в приведенных выше работах, изложена в [5-7]. Разрешенной областью движения подвижного объекта является все пространство, в котором происходит движение, с учетом ограничений, однако каждый участок траектории вносит свой вклад в критерий оптимизации.
1 Работа выполнена при финансовой поддержке Программы № 14 ОЭММПУ РАН и Российского фонда фундаментальных исследований (проект № 12-08-90018-Бел-я).
Ко второй группе относятся задачи планирования траектории без столкновения с подвижными препятствиями [9, 10]. При таком подходе динамическая карта угроз формируется благодаря геометрическим размерам препятствий и их векторам скоростей. Разрешенная область движения подвижного объекта состоит в таком случае из областей в пространстве, не занятых препятствиями.
Особенность задач уклонения от обнаружения заключается в том, что во всех практических случаях мгновенный уровень сигнала I, пришедшего на вход наблюдателя или сенсора, зависит от текущего расстояния Б до уклоняющегося объекта, а для некоторых полей также зависит от модуля мгновенной скорости V объекта. Для описания подобной зависимости используется степенная модель
Величина показателя степени к характеризует физическое поле, по признакам которого осуществляется обнаружение. Значения к = 1, 2, 3, 4 могут быть интерпретированы в рамках соответствующих физических моделей. Значение к = 1 описывает процесс затухания волн на поверхности жидкости и убывание уровня интенсивности первичного гидроакустического поля в мелком море. Убывание уровня интенсивности первичного гидроакустического поля в глубоком море, соответствующее пассивному режиму обнаружения, а также убывание уровня интенсивности теплового поля и первичного электромагнитного поля при их распространении соответствует значению к = 2. Значение к = 3 описывает убывание уровня напряженности магнитного поля. Значение к = 4 соответствует убыванию уровня интенсивности вторичного электромагнитного и гидроакустического полей (активный режим обнаружения). Показатель степени т, находящийся в числителе дроби, определяет зависимость уровня интенсивности излучаемого сигнала от скорости движения объекта. Подобная зависимость присуща для сигналов первичного гидроакустического поля.
В настоящей работе предлагается использовать энергетический критерий оптимизации для решения задачи построения траектории уклонения и закона изменения скорости подвижного объекта при его уклонении от движущегося по прямой на постоянной скорости наблюдателя.
2. Постановка задачи
Предположим, что на плоскости расположены два объекта - одиночный движущийся по прямой с постоянной скоростью V = (VI; У2) наблюдатель (сенсор) и управляемый подвижный объект, имеющий координаты (х,у) = = (х(Ь),у(Ь)). Координаты объектов, координаты начальной и конечной точек маршрута подвижного объекта заданы в неподвижной декартовой системе координат, начало которой совпадает с начальной позицией наблюдателя. Требуется найти траекторию движения подвижного объекта и закон измене-
ния его скорости, доставляющие минимум функционалу
T т
i i X2 + y2
(2.1) R(x,y,x,y) = / Ldt = / -- '—г- .,, dt —>■ min .
' У J (х-Угty + (y-V2ty (x,y,x,y)
0 0
Точкой обозначена производная по времени. Граничные условия заданы в виде
x(0) = Ха, x(T) = хв, y(0) = УА, y(T)= yA,
где А(ха,Уа), B(xb,Ув) - начальная и конечная точки маршрута. Величина T (время движения по траектории) фиксирована, L является функцией Лагранжа.
В рамках приведенной выше физической интерпретации числитель дроби в (2.1) есть величина, пропорциональная мгновенному уровню излучаемого объектом сигнала в предположении о том, что имеет место квадратичная зависимость этого уровня от модуля текущей скорости объекта; знаменатель дроби есть квадрат относительного расстояния между объектами.
3. Решение задачи
Сначала избавимся от явной зависимости от времени в знаменателе функционала обнаружения. Замена переменных
£ = x - Vit, _ П = У - V2t
приводит функционал к виду
0
Для минимизации функционала действия на траектории движения необходимо выполнение уравнений Эйлера-Лагранжа
/
(3.1)
± / i + Vx) , (i + Vi)2 + ('f] + V2Ï2, =
dt\e+v2) (e+v2)2 * '
d_ (f} + Vy\ {i + Vi)2 + {f} + V2? n =
dt\e+v2J (e+v2)2 л
Раскрыв скобки и приведя подобные слагаемые, перепишем уравнения (3.1) в виде
¿.-1 ш2 - ё2) , - ш + ШУ2 - '2щУ1
(32) 1 ^2 + i?2 ^2 + i?2
^ п , V(£2-V2) ] У~Ч -si'li • -^//Г, „
£2 + n2 £2 + n2
Заменой переменных система (3.2), состоящая из двух дифференциальных уравнений второго порядка, преобразовывается к системе, состоящей из четырех дифференциальных уравнений первого порядка.
(3.3)
{ е = и,
П = v,
e(v2 - и2) V2е - 2nvu + 2v{V> - 2v^Vi
и +
e2 + n2
+
e2+n2
+ rj(u2 - v2) + F2r? - 2£vu + 2t/,r?Fi - 2v£V2
e2+П2
e2 + П2
0, 0.
Далее рассмотрим симметрии системы уравнений (3.3), чтобы иметь возможность проинтегрировать эту систему в квадратурах.
3.1. Симметрии системы уравнений (3.3) и понижение порядка
этой системы
Шаг первый. Система (3.3) автономная, поэтому она допускает групповое преобразование сдвига Gi с соответствующей ему инфинитезимальной образующей "г/ 1.
д
(3.4) G1 : (t) ->• (i + const); = —.
Первым интегралом системы (3.2) является гамильтониан [11]
и Т idL ■91 Н = L- 4—г - г/—,
де дг]
который в явном виде представим выражением
v 2 - (е2+п2)
H
е2+п2
В результате деления каждого уравнения системы (3.3) на первое уравнение из этой системы получаем
v
Щ =
(3.5)
и
£(v2 - и2) - 2r)vu + 2v{V2 - 2vr]Vi
Щ + u((2 + r?2) + u((2 + r?2) ~ '
rj(u2 - v2) v2r] - 2£vu + 2v;r]Vi - 2u(V2 4 + u(C2 + r?2) + u(C2 + r?2) ~
Шаг второй. Системы (3.3) и (3.5) обладают симметрией относительно группы растяжений С2 с инфинитезимальной образующей ""2.
(3.6) С2 : Г?) ^ (А2*, А2£, Л2Г?); = ^ + ^ +
£
Замена переменных «> = — приводит систему (3.5) к виду
П
(3.7)
и,,
(■и2 - V2) + V2 - 2гтт + 2Ущ - 2У2ит
(V — и)(т2 + 1) т(у2 - и2) + У2т - 2ни + 2У2гт1 -(V — и)(т2 + 1)
Без потери общности за счет выбора направлений осей координат полагаем У2 = 0, VI = V. Тогда система (3.7) переписывается в виде
(3.8)
V,,, =
ит —
(и2 - V2) + V2 - 2ипт + 2Уи
(V — и)(т2 + 1) -ш(-и2 — и2) + V2w — — 2Vv (V — и)(т2 + 1)
Система (3.8) может быть представлена в матричной форме
/и2 — V2 + V2 + 2Vu
(3.9)
V,
и'ш
\
V — и -2уи - 2У у
V — и
—2vu
V — и
у2 - и2 + У2
V — и
1
\ I_
ги2 + 1 т
) V ^тт У
Из вида (3.9) следует, что система может быть разрешена относительно независимой переменной т. В каких случаях это возможно, дает ответ следующая
Лемма 1. Пусть и = V и выполнено неравенство и2 + V2 >V2, тогда система вида (3.9) разрешима относительно вектор-столбца
1 \ т
1 т
т2 + 1' т2 + Доказательство леммы 1.
Условие и = V необходимо, чтобы элементы матрицы, стоящей в (3.9), не обращались в бесконечность. Обозначим эту матрицу буквой М и вычислим ее детерминант. Справедлива цепочка равенств
(и — v)2detM = (и2 — V2 + V2 + 2Vu)(v2 — и2 + V2) — 2vu(2vu + 2Vv) = = —(и2 + V2)2 + V4 + 2 — (и2 + V2)) = (V2 — (и2 + v2))((V + и)2 + V2).
Последнее выражение в цепочке представимо в виде произведения двух множителей. Первый множитель не равен нулю в силу условий леммы, второй тоже не равен нулю, так как в этом случае должно быть выполнено V = 0, и = — V, т.е. и2 + V2 = V2, чего не может быть по этому же условию леммы.
По лемме 1 существует локальное решение системы уравнений (3.9). Следующий пример иллюстрирует численное решение оптимизационной задачи (2.1).
V
,
3.2. Пример
Рассмотрим ситуацию, когда параметры задачи принимают следующие значения:
- подвижный объект переходит из точки (1;0) в точку (0; 1,2) за время Т = 1,68;
- скорость наблюдателя равна V = 0,3.
На рис. 1 представлена оптимальная траектория движения подвижного объекта в сравнении с аналитической оптимальной траекторией уклонения
у
1,0
0,8 0,6 0,4 0,2
0
NN
Ч N4
\ ч ч\ \\
\\
\
1
и2 1,5
1,4
1,3
1,2
1,1
1,0
0,9
/
к \ \ / / 1
\ \ \ /
\ \
\ \ \ У у' /
\ / /' / / /
у' у у' ч \ \ / / !
0,2 0,4 0,6 0,8 1,0 0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6
х г
Рис. 1. Траектории движения.
Рис. 2. Квадрат скорости подвижного объекта как функция времени.
Ь 1,4
1,3
1,2
1,1
1,0
0,9
\ \
\ \ \
\ \ \ N
\ \ \
\ Ч \
N \ \
---
Я
1,6
1,4 1,2 1,0 0,8 0,6 0,4 0,2
/ /
/ У /
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.