научная статья по теме ТЕРМИНАЛЬНАЯ ОПТИМИЗАЦИЯ ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ ОДНОПОЗИЦИОННОГО УНИПАРАМЕТРИЧЕСКОГО НАБЛЮДАТЕЛЯ Кибернетика

Текст научной статьи на тему «ТЕРМИНАЛЬНАЯ ОПТИМИЗАЦИЯ ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ ОДНОПОЗИЦИОННОГО УНИПАРАМЕТРИЧЕСКОГО НАБЛЮДАТЕЛЯ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 2, с. 147-154

СИСТЕМЫ УПРАВЛЕНИЯ ДВИЖУЩИМИСЯ ОБЪЕКТАМИ

УДК 629.7

ТЕРМИНАЛЬНАЯ ОПТИМИЗАЦИЯ ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ ОДНОПОЗИЦИОННОГО УНИПАРАМЕТРИЧЕСКОГО НАБЛЮДАТЕЛЯ

© 2015 г. В. В. Хуторцев

Ростов-на-Дону, РНИИРС Поступила в редакцию 24.01.14 г., после доработки 26.08.14 г.

Рассмотрены особенности построения процедуры оптимизации пространственного траек-торного управления наблюдениями для подвижного однопозиционного унипараметрическо-го наблюдателя в условиях декомпозиции модели его перемещения на пространственную и временную составляющие при заданной структуре последней. Приведен пример определения траекторного управления наблюдениями для подвижного пеленгатора. Выявлены характерные черты его оптимальных пространственных траекторий.

Б01: 10.7868/80002338815010060

Введение. Решение задачи определения координат объекта наблюдения (ОН) предполагает выполнение условий наблюдаемости системы, в частности, связанного с согласованностью размерности ю вектора наблюдения и размерности т пространства, которому этот объект принадлежит.

Для однопозиционных унипараметрических наблюдателей (ОУПН), измеряющих параметры только какого-либо одного типа (пеленги, дальность), эти условия обычно не выполняются. Использование таких наблюдателей для оценивания координат местоположения ОН возможно либо за счет привлечения дополнительной априорной информации о кинематике объекта [1], либо за счет перемещения ОУПН в пространстве. В последнем случае качество оценивания существенно зависит от траектории движения наблюдателя. Задача ее определения относится к одной из разновидностей общей задачи управления измерительными процессами [2—4], а именно к классу задач траекторного управления наблюдениями [4, 5].

Их решение, как правило, отличается высоким уровнем сложности, поскольку основано на анализе как закономерностей перемещения объекта наблюдения и наблюдателя, так и закономерностей эволюции во времени точностных характеристик оценивания. При решении оптимизационных задач управления движением в ряде случаев оказывается оправданным рассмотрение лишь частного их аспекта, часто ориентированного на поиск закона управления для объекта, перемещающегося вдоль заданной пространственной кривой [6, 7]. Применительно к задачам траекторного управления наблюдениями такие примеры приведены в [4].

Представляется актуальным рассмотрение особенностей синтеза закона траекторного управления наблюдениями при известной закономерности перемещения ОУПН вдоль траектории. Актуальность обусловлена необходимостью решения ряда практически важных задач, связанных, в частности, с определением координат местоположения источников сигналов (в том числе аварийных) с помощью подвижных наземных наблюдателей или летательных аппаратов, закон перемещения которых вдоль траектории известен, а на состав и структуру поисковых средств наложены ограничения.

1. Постановка задачи. Пусть математическая модель динамики ОН (модель в отклонениях) определяется уравнением

^ = А(г, ()г + В(г,()п,((), (е [(н, (к], г((н) = ¿0, (1.1)

где г, г е Я", г = г (?) — известная векторная функция, характеризующая опорную траекторию перемещения ОН; г — отклонение от опорной траектории; г0 — случайный вектор, у которого

М[г0] = 0, М[г0 ] = К0; "г е Як — формирующий гауссовский шум, для которого М["г(?)] = 0,

147

10*

Щп(г)п\ (г — т)] = 0г8(т); е Як х к - диагональная матрица; А.Я" х Я ^ Яп х п; В:Я" х Я ^ Яп х к;

функции А(г, г), В(г, г) измеримы по совокупности своих аргументов и удовлетворяют условию Липшица; гн, гк — соответственно начальный и конечный моменты времени. Для описания траектории наблюдателя воспользуемся моделью

^ = ф(и), / е [ 1н, 1к], х( 1н) = хо, (1.2)

а/

где х е Ят — вектор, характеризующий траекторию ОУПН в пространстве (т = 3) или на плоскости (т= 2); ит = [ы1...ит] — вектор управлений, элементы которого имеют смысл углового положения касательной к пространственной траектории ОУПН в каждой ее точке по отношению к осям декартовой системы координат, в которой описывается движение наблюдателя; I — текущая длина траектории или натуральный параметр [8—10]; ф. Ят х Ят имеет смысл вектора направляющих косинусов; /н, 1к — соответственно начальное и конечное значения натурального параметра.

Для ф выполняется ограничение [8]

фтф = 1, V/ е [н /к]. (1.3)

Закон движения наблюдателя вдоль траектории будем считать известным: / = у( г), г е[ Хн, Хк ], (1.4)

где у(г) е с1[гн, гк] — строго монотонная функция. Из (1.4) следует, что

/н = у(Хн), /к = У(гк). (1.5)

Уравнение наблюдения ОУПН (уравнение в отклонениях) представим в виде у (г) = Н( г, х) г + п (г), (1.6)

где у е Я®;

H =

1 е Rax", (1.7)

'd s ( z, x )

. dz

ИD (ZD, x)

s: Rn x Rm ^ R® — модель сигнала; n — гауссовский шум наблюдения; M[n(t)\ = 0; M[n(t)nT(t — т) = = Q5(t); Q е R® x ® — диагональная матрица интенсивности шума;

D(Zd, x) = [(Zd -x)T(Zd -x)]1/2 (1.8)

— расстояние между ОН и ОУПН; ZD е Rm — подвектор декартовых координат вектора Z; значения и и к в (1.7) определяются в зависимости от типа (активного или пассивного) наблюдателя и ОН [11\.

Для поиска управления пространственной траекторией рассмотрим терминальный критерий качества вида [4, 9, 12\

J = aTK(tK)a ^ min, (1.9)

u e U

где K(t¥) — корреляционная матрица ошибок оценивания в конце траектории при l = /к; a е Rn — заданный вектор; U — множество управлений.

Поставим задачу рассмотреть особенности процедуры синтеза пространственного траектор-ного управления наблюдениями для ОУПН при известной закономерности (1.4) его перемещения вдоль траектории, описываемой моделью (1.2).

2. Решение задачи оптимизации пространственного траекторного управления наблюдениями. Поиск закона управления будем проводить при условии, что

D(Zd, x)> D, V/ е [ н /к ], Vt е [ tw tK ], (2.1)

где D > 0 — некоторое пороговое расстояние.

Из (2.1) следует, что ОУПН на всем протяжении интервала наблюдения не может догнать ОН. Указанное ограничение является общим для подобного класса задач [4]. Рассмотрим уравнение движения ОУПН (1.2), (1.4). Пусть

= v(t)> 0,

dt тогда

= vi( 0ф( u), x( ^) = xo. (2.2)

t

Математическая модель эволюции во времени точностных характеристик оценивания для (1.1), (1.6) имеет вид [4]

— = AK + KAT + BQ7BT - kH Q- HK,

dt ^ (2.3)

t e[ tн, tK ], K( tн) = Ko.

Проекция гамильтоновой системы, соответствующей (2.3), на пространство R2n определяется уравнениями [4]

iP = - ATp + HJQlHq, ^ = BQ-BTp + Aq, dt dt z (2.4)

t e[ tн, tк ], KoP (tн) = q ( ^), где p, q e Rn.

Для критерия качества (1.9) в терминах (2.4) получим

J = aTq(tK) ^ min, (2.5)

u e U

где полагается, что

P (tк) = a. (2.6)

Совокупность (2.2), (2.4), (2.6) образует двухточечную краевую задачу (ДТКЗ), определяющую математическую модель управляемой системы. Ей соответствует гамильтониан

Ж = VpT[ - ATp + HTQl Hq] + vT [ BQzBTp + Aq ] + ^v, (t)9( u), (2.7)

где yp, yq e Rn, e Rm — множители Лагранжа.

Из (2.7) следует, что оптимальный закон управления иопт определяется соотношением

иопт = argmax(vT ф( u)}. (2.8)

и e U

Отметим, что оптимальное управление непосредственно от закона перемещения ОУПН вдоль пространственной траектории не зависит. Эта зависимость проявляется косвенно через значения

Для модели (1.2) с правой частью

T

ф (u) = [cosu1... cosum] (2.9)

из (2.8) следует, что

фТ ( ^пт) =

■W Vs-I

(2.10)

где

уе

£ У

(2.11)

Очевидно, что результат (2.10) удовлетворяет ограничению (1.3). С учетом условия [4]

Ур = д, Уд = -Р, V е [ ] для ух получим dyx _ дЖ

= -д{дТНТО1 Нд}, * е[1К], Ух(О = 0.

дх дх

(2.12)

(2.13)

Таким образом, для определения оптимального управления необходимо решение ДТКЗ (2.2), (2.4), (2.13) с учетом конечного условия (2.6).

В основе такого решения лежит итерационная процедура, базирующаяся на принципе частичного обновления управления [2—4]. Она включает:

1) задание начального управления и0(?) и определение из (2.2) начальной траектории х0(?);

2) расчет на основании х0(?) в соответствии с (1.7) матрицы Н(т, х0);

3) решение ДТКЗ (2.4), (2.6) и формирование зависимостейр°(0,

4) решение для полученных значений уравнения (2.13) в обратном времени и определение вектора множителей Лагранжа у° (?);

5) определение в соответствии с (2.8), (2.10) вектора

ф (и ) =

■ 0 ух1 0 ' 1_уе

Ух ■ 0

УsJ

и управления

и=

агеео8

0 0

Чу2У

. агеео8

0

'Ут

0

КУе у

(2.14)

(2.15)

где

уЕ = Е (у°-)2;

и = 1

6) расчет закона управления в соответствии с принципом частичного обновления

0-0, ,1 0ч 0/,ч

и (г) = п и (г) + (1 - п )и (г),

(2.16)

где п0 е (0, 1).

Далее п. 1)—6) повторяются с соответствующей заменой индекса.

Значения П,] = 0, 1, 2, ..., выбираются из условия сходимости итерационной процедуры [4] .

Особенностью рассмотренной процедуры по сравнению с оптимизационной процедурой тра-екторного управления общего вида [4] является наличие аналитических взаимосвязей (2.9), (2.10), (2.14), (2.15) между множителями Лагранжа ух и управлением и. Указанная особенность в первую очередь обусловлена принятой моделью перемещения ОУПН (1.2), (1.4) и ориентацией на оптимизацию только пространственной траектории.

3. Пример оптимизации пространственного траекторного управления наблюдениями. В качестве ОУПН рассмотрим пеленгатор на плоскости, используемый для оценки координат местоположения неподвижного ОН. Тогда т = п = 2, ю = 1, А = 0, В = 0,

+ ¿2 - Х2 ^ = аге1§-,

¿1 - Х1

Н = [ Н н2 ],

(3.1)

(3.2)

т

Т

0

где

H = -

z2 - x2 с + 2'

H2 =

z 1 - x 1

с + 2'

|D |D

D = V(zi - xi)2 + (z2 - x2)2.

В рамках рассмотренн^тх моделей для (2.3) с учетом (3.1)—(3.4) получим

dK = -KHTQ l HK, t е [ tH, tK ]' K(tH) = K0. dt

В результате ДТКЗ (2.2), (2.4), (2.6), (2.13) приобретает вид

dx, , .

— = COS Mi, xi(tH) = xio, dt

dx2

_ = COS M2 = Sin Mi, X2( tH) = X20 , dt

dVxj dt

d Vx2 dt

= -2

= -2

íi^ + íi^-2

íi ^ + íi

. dx2 dx2_

[ íiHi + Í2H2 ], tK) = 0,

[ íi Hi + Í2H2 ], (tK) = 0 ,

где

í = K( tK) fl ,

f к

K(tK) = K01 J.HTQTlHdt

(3.3)

(3.4)

(3.5)

(3.6)

(3.7)

(3.8)

(3.9)

(3.10)

(3.11)

Реализ

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком