научная статья по теме НАИСКОРЕЙШЕЕ ПРИВЕДЕНИЕ МНОГОМЕРНОГО ДИНАМИЧЕСКОГО ОБЪЕКТА НА ПОВЕРХНОСТЬ ЭЛЛИПСОИДА Математика

Текст научной статьи на тему «НАИСКОРЕЙШЕЕ ПРИВЕДЕНИЕ МНОГОМЕРНОГО ДИНАМИЧЕСКОГО ОБЪЕКТА НА ПОВЕРХНОСТЬ ЭЛЛИПСОИДА»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 78. Вып. 1, 2014

УДК 62-50

© 2014 г. Л. Д. Акуленко

НАИСКОРЕЙШЕЕ ПРИВЕДЕНИЕ МНОГОМЕРНОГО ДИНАМИЧЕСКОГО ОБЪЕКТА НА ПОВЕРХНОСТЬ ЭЛЛИПСОИДА

Исследована задача оптимального по быстродействию управления движением в форме программы и синтеза многомерного динамического объекта. Считается, что вектор силы ограничен невырожденным эллипсоидом. Терминальное множество описывается поверхностью эллипсоида, допускающего вырождение, конечное значение скорости не фиксируется. Начальное положение объекта может находиться как вне, так и внутри эллипсоида. С помощью принципа максимума установлены необходимые и достаточные условия оптимальности управления в виде системы полиномиальных уравнений, порядки которых зависят от размерности задачи и степени вырожденности терминального эллипсоида. Предложены итерационные процедуры и методика продолжения по параметрам аппроксимирующего эллипсоида в допустимой области изменения фазового вектора. Исследованы задачи управления для предельных форм терминального эллипсоида. Установлен качественный эффект разрывности функционала и управления в форме синтеза как функций фазового вектора.

1. Постановка задачи. Исследуется задача оптимального по быстродействию приведения n--мерного динамического объекта единичной массы на эллиптическое терминальное множество E (фигура) посредством ограниченной силы P [1, 2]

x = и, u = P; x( 0) = x°, u( 0) = и0

NP = u, |u| < 1, detNф 0 (1.1)

X = x (tf) e E( D), E( D) = {x; X Dx = 1}, tf ^ min

u

По предположению, матрица N неособая, т.е. между силой P и ограниченным по модулю управляющим воздействием u имеется взаимооднозначное соответствие: P = = N-1u. Дополнительные свойства симметричной матрицы D > 0 формулируются ниже. Без ограничения общности центр эллипсоида можно поместить в точку Ф 0.

В задаче (1.1) управление u (или P), фазовые переменные (x(t), u(t)), терминальная точка xf и время быстродействия f неизвестны и подлежат определению на основе необходимых и достаточных условий оптимальности в форме принципа максимума [1]. Заметим, что решение этой задачи с помощью динамического программирования на основе решения задачи Коши для уравнения Гамильтона—Якоби построить не удается, так как функционал качества ("функция Беллмана") является разрывной функцией фазовых переменных системы [1, 2]. Это свойство присуще задачам быстродействия для динамических объектов без фиксации конечного значения вектора скорости [1—7].

Посредством неособенного линейного преобразования Мх ^ х, N0 ^ и уравнения движения (1.1) приводятся к виду, в котором Р = и, а матрица В терминального эллипсоида (М-1)'ВМ-1 ^ В. Задача оптимального быстродействия упрощается:

х = и, и = и; х(0) = х°, и(0) = и0; |и| < 1

, (1.2) х (}) = X е Е( В), Е( В) = {х; X Вх = 1}, } ^ ш1п

и

Допустимое кусочно-непрерывное управление и (0, которое гарантирует [1, 8] согласно теореме Филиппова существование в допустимом классе оптимального управления, строится весьма просто. Если начальная точка х0 находится внутри терминального эллипсоида, то допустимым будет произвольное постоянное (ненулевое) управ-

ление u = const Ф 0. Если точка х0 находится вне эллипсоида, то в качестве начального этапа допустимого управления можно взять тормозящее воздействие u = —и0|и0|-1. Если точка х^) (t) до момента остановки t1 не пересечет поверхность эллипсоида, то на втором этапе при t > ?1 осуществляется управляющее воздействие u(2) в произвольную точку поверхности, в частности, ближайшую (см. разд. 3, 4). Допустимым будет наискорейшее приведение объекта в фиксированную точку эллипсоида.

Итак, ставится задача приведения геометрической точки x(t) системы (1.2) на фиксированную поверхность E(D) за кратчайшее время f посредством ограниченного по модулю единицей управляющего воздействия и. Начальная фазовая точка (х0, и0) считается произвольной, а конечная скорость u(tf) — не фиксированной. Финальная точка X е E(D) находится из условий оптимальности принципа максимума и заранее не известна. Требуется найти оптимальное управление в форме программы up(t, х0, и0), оптимальную фазовую траекторию х(?, х0, и0), u(t, х0, и0) и минимальное значение критерия качества управления t* = //(х0, и0). Наряду с решением задачи программного управления требуется определить оптимальный синтез и5(х, и) и условную "функцию Беллмана" Т(х, и), которая удовлетворяет задаче Коши для уравнения Гамильтона— Якоби в области ее непрерывной дифференцируемости [1, 2]. Нахождение множеств гладкости и разрывов указанного решения и соответствующего управления представляет существенный интерес для построения синтеза.

Постановка задачи типа (1.2), когда все полуоси эллипсоида стремятся к нулю (при этом D ^ да), т.е. х = 0, восходит к постановкам задач, изложенных в фундаментальной монографии [1]. Было проведено детальное исследование и исходной задачи, и задачи при учете малых нелинейных возмущений [4], а также при наличии вязкой среды [5]. Изучен случай многомерной терминальной сферы (все полуоси одинаковы) при отсутствии [2] и наличии [6] линейной диссипации. Как отмечалось, имеет место качественный эффект разрывов функционала (времени быстродействия) и управления при изменении фазовых переменных. Отсутствие центральной симметрии задачи управления (1.2) приводит к принципиальным отличиям ее полного решения [7] и существенным математическим затруднениям.

Исследование указанного класса задач представляет интерес для механики управляемого полета, для анализа процессов стыковки космических летательных аппаратов, задач перехвата целей, анализа фрагментов воздушного боя, управлением маневрированием мобильных транспортных систем и др.

2. Краевая задача принципа максимума. Введем сопряженные х, и переменные p, q и выпишем условия оптимальности на основе функции Гамильтона [1]

H = (p, и) + (q, u) ^ max, |u| < 1

u

u* = q|q|_1, q * 0; p = p Ф 0, q = p(tf-t), /= 0 (2Л)

p = 2XDxf, X = const, 0 < t < t/, u* = p|p|

Поскольку u* — постоянный орт вектора p = p, то траектории оптимального движения оказываются параболами. При этом должны выполняться условия трансверсальности (2.1), причем неизвестные векторы p, х, время быстродействия f и скалярный множитель Лагранжа X подлежат определению из соотношений

Е = и D (р( tf) + Е f/2), ц = 2 X\p\-1

(xf dX) = 1, x(t) = p(t) + Еt2/2 (2-2)

u* = Е = p|p|_1, 1Е1 = 1, p( t)- Xo + u°t, / = X (tf)

Вектор-функция p имеет смысл положения объекта при движении по инерции. Нахождение искомых n + 2 параметров Е, f, ц из системы (2.2) весьма затруднительно. Однако, если удается определить скалярные параметры f и ц, то остальные, в том числе векторные неизвестные Е, X и др., находятся просто. Такую процедуру возможно осуществить на основе простых операций.

Действительно, из первого соотношения (2.2) определим вектор Е через неизвестные tf, ц; имеем уравнение и искомое выражение для вектора Е

JЕ = иDp(tf), Е = Е*(tf, и) = и J1Dp(tf) (2.3)

J = I- (^tf/2)D, D = (dij) = (iy.;.), i, j = 1, ..., л (2.4)

где I — единичная матрица. Полученная зависимость Е* (2.3) подставляется в выражение x(t) (2.2); в частности, при t = f имеем

x* = x*(tf, и) = р(tf) + Е*(tf, и)f /2 (2.5)

Из условий Е*2 = 1, x*f е E, следуют два уравнения относительно искомых параметров tf, ц (указывается зависимость от матрицы D)

Ф(tf, и; D) = Е*2(tf, и)-1 -и2(J-1Dp(tf))2-1 = о

¥(tf, и; D) = (x*(tf, и), Dx*(tf, и)) -1 - (2.6)

-([p(tf) + Е*(tf, и)tj/2], D[p(tf) + Е*(tf, и)f /2])- 1 = о

Соотношения (2.6) приводятся к полиномиальным выражениям относительно неизвестных tf, ц. Заданными считаются Ж-векторы x0, и0 и n(n + 1)/2 параметров симметричной матрицы D. Определенные аналитические и вычислительные трудности представляет обращение матрицы J (2.4). Однако этой операции можно избежать на основе метода последовательных приближений, процедур прогонки и продолжения по параметрам (варьированием элементов d¡j матрицы D).

Действительно, на начальном шаге (к = 0) приближения матрицу D полагаем скалярной: D(0) = dI, т.е. E = S — сфера радиуса d, причем нормировкой можно добиться, чтобы d = 1. На последующих шагах к > 1 полагается

D(k) = I + (Ej( к)), Ej( к) = dij, к = к * (2.7)

где элементы e¡¡ изменяются требуемым образом при увеличении номера итерации к.

Решение задачи оптимального быстродействия о попадании на сферу S известно [2] в форме программы и синтеза. Оказывается, что система уравнений (2.6) при D = I вырождается. Анализ уравнения (2.3) дает соотношения (см. первое уравнение (2.6))

(t2f/2 - и)2 = l2 + 2clhtf + h2t2f, l = |x°|, h = |u°|

(2.8)

c = (x0, u°)/(Ih); и = -1, l > 1; и = +1, l < 1

Согласно соотношениям (2.8) требуется решить два уравнения четвертой степени относительно неизвестной ^ = Т±(х0, и0, В(0)) при ц = +1 (I § 1) для известных 0 < I < да и к > 0, |с| < 1. Итак, чтобы наискорейшим образом попасть на единичную сферу снаружи, требуется решить уравнение (2.8) при ц = —1 для соответствующих значений I и с, к и подставить в соотношения (2.3), (2.2). Оно может иметь от одного до трех положительных корней $ (I, с, к); наименьший принимается за искомый; возможны простые, двукратный и трехкратный корни. Последние обстоятельства свидетельствуют о наличии эффекта разрыва функционала времени быстродействия ("функции Беллма-на") по обобщенным фазовым переменным порождающей задачи I, с, к [2]. Характер движения отвечает режиму "пролета с возвращением". Из изложенного выше следует также, что эта задача управления оказывается плоской. Оптимальное управление и фазовые траектории лежат в плоскости, образованной неколлинеарными векторами х0, и0.

Теоретический и прикладной интерес представляют зависимости Т±(х0, и0; В(0)) от указанных переменных I, с, к. Наглядная картина семейства кривых Т+ получается [2] согласно соотношениям (2.8) вблизи сферы при 0 < I — 1 1, на среднем расстоянии I — 1 ~ 1 и вдали при I §> 1 для значений к > 0 и достаточно плотного множества значений параметра с, —1 < с < 1.

Решение задачи оптимального по быстродействию приведения динамического объекта на сферу изнутри (I < 1, ц = 1) качественно отлича

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком