научная статья по теме ОСОБЫЙ РЕЖИМ УПРАВЛЕНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО РАЗВОРОТА ПРОИЗВОЛЬНОГО ТВЕРДОГО ТЕЛА (КОСМИЧЕСКОГО АППАРАТА) Кибернетика

Текст научной статьи на тему «ОСОБЫЙ РЕЖИМ УПРАВЛЕНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО РАЗВОРОТА ПРОИЗВОЛЬНОГО ТВЕРДОГО ТЕЛА (КОСМИЧЕСКОГО АППАРАТА)»

СИСТЕМЫ УПРАВЛЕНИЯ ДВИЖУЩИМИСЯ ОБЪЕКТАМИ

УДК 629.78

особый режим управления в задаче оптимального

разворота произвольного твердого тела (космического аппарата)* © 2012 г. А. В. Молоденков, Я. Г. Сапунков

Саратов, Ин-т проблем точной механики и управления РАН, Саратовский государственный ун-т Поступила в редакцию 12.04.11 г., после доработки 13.09.11 г.

Рассматривается задача оптимального разворота космического аппарата как твердого тела произвольной динамической конфигурации при произвольных граничных условиях по угловому положению и угловой скорости космического аппарата в кватернионной постановке. В качестве критерия оптимальности используется функционал, который объединяет время и интегральную величину модуля вектора управления, затраченные на разворот космического аппарата. Приводится исследование особого режима управления космического аппарата. Даются примеры расчетов.

Введение. Построение управления пространственной переориентацией космического аппарата (КА) как твердого тела в традиционной постановке включает задачи программного углового движения (разворота), программного управления и поиска управления, стабилизирующего программу углового движения в малом. Задача расчета программного углового движения и реализующего его управления во многих случаях решается с помощью методов теории оптимального управления. Точное аналитическое решение этой задачи для наиболее часто используемых функционалов оптимизации при произвольных граничных условиях по угловому положению и угловой скорости КА не найдено даже в случае сферической симметрии КА, не говоря уже о его произвольной динамической конфигурации. Известны лишь некоторые частные случаи решения задачи (например, [1—8]). В общем случае приходится рассчитывать только на приближенные численные методы, при этом особые режимы управления не рассматриваются [2] (хотя для ряда функционалов оптимизации они возможны). Поэтому аналитическое исследование особых режимов управления в задаче оптимального разворота КА является актуальным.

Постановка задачи имеет традиционную форму, в которой управление — ограниченная по модулю кусочно-непрерывная функция. Функционал качества в задаче представляет собой линейную свертку двух критериев: времени и интегральной величины модуля вектора управляющего воздействия, затраченных на разворот КА; при этом каждый из критериев умножен на свой весовой коэффициент. На основании принципа максимума Л.С. Понтрягина получаются выражения для структуры оптимального управления, функции Гамильтона—Понтрягина и сопряженной системы уравнений для исходной задачи. Особым режимом управления принято называть ситуацию, когда гамильтониан явным образом не зависит от управления, тогда переходят к исследованию производных разных порядков функции Гамильтона—Понтрягина, фазовых и сопряженных переменных задачи. С использованием этого подхода подтверждено, что в зависимости от соотношения между весовыми коэффициентами функционала качества, граничными условиями задачи и заданной величиной, ограничивающей модуль вектора управления КА, особый режим в задаче возможен. Представлено его аналитическое исследование. Приводятся численные примеры, подтверждающие необходимость учета особого режима управления в задаче оптимального разворота КА. Статья продолжает исследования, начатые в [9, 10].

1. Постановка задачи. Движение КА как твердого тела произвольной динамической конфигурации вокруг центра масс описывается уравнениями [2]

2Ь = Ь ° м, (1.1)

М = я1 М - Я- [ м, Ям ], (1.2)

* Работа выполнена при финансовой поддержке РФФИ (проект № 08-01-00310). 10 ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ № 2 2012

где L(t) = l0(t) + /1(i)/1 + /2(0*2 + h(t)h — кватернион поворота КА, w(t) = w1(t)i1 + w2(t)i2 + w3(t)i3 — вектор угловой скорости, M(t) = [M1(t), M2(t), M3]T — вектор внешнего момента, действующего на КА, матрица

R =

/j 0 0

0 /2 0 0 0 /3

— тензор инерции. Фазовые координаты Z, w и управление ^удовлетворяют требованиям задачи оптимального управления [11] (Z(t), w(t) — непрерывные функции, M(t) — кусочно-непрерывная

функция); кватернион Z(t) нормирован, т.е. ||Z|| = /0 + ^ + /^ + /3 = 1; i2, i3 — орты гиперкомплексного пространства (мнимые единицы Гамильтона), символ "°" означает кватернионное умножение, а [. , .] — векторное произведение. В динамических уравнениях Эйлера (1.2) для твердого тела (КА) I1,12,13 — главные центральные моменты инерции твердого тела.

На модуль вектора управления наложено ограничение

M < Mmax. (1.3)

Заданы произвольные граничные условия по угловому положению

L (0) = L0, L( T) = LT (1.4)

и угловой скорости КА

w (0) = w0, w (T) = wT. (1.5)

Требуется определить оптимальное управление Мопт(0 системой (1.1), (1.2) при ограничении на управление (1.3) и граничных условиях (1.4), (1.5), доставляющее минимум функционалу

T

J = J(ai + a2 M) dt, (1.6)

0

где a1, a2 = const > 0. Время Т не задано.

2. Переход к безразмерным переменным. Перейдем от размерных переменных задачи к безразмерным по формулам

/ безраз у-раз , у-масш , л ~ ~ безраз раз я гмасш

kv = I k /I , k = 1, 2, 3; a2 = al M ,

_ безраз ~Ра^масш .безраз .раз л-г масш я,,-безраз я ,#-раз ,ц *-масш

w = w T , t = t /T , M = M /M ,

j6e3pa3 _ jраз/ Tмасш

где масштабные коэффициенты 1масш, ммасш задавались так

гмасш / / г2 г2 т2, ч 1/2 * ¿-масш -, г лт-гмасш г гмасш ,-, ж-масш 1/2

I = ((Ii + I2 + I3)/3) , M = Mmax, T = (I /M ) , при этом уравнения (1.1), (1.2), (1.4)—(1.6) не изменятся, а ограничение (1.3) запишется так

IM < i.

Далее будем иметь в виду постановку задачи в безразмерных переменных и верхние индексы у них будут опущены.

3. Применение принципа максимума. Выполним процедуру принципа максимума Л.С. Понтря-гина [1, 11]. Введем вспомогательные функции ¥(t) (кватернион) и ф(0 (вектор), соответствующие фазовым координатам Z(t), w(t). Составим функцию Гамильтона—Понтрягина

H = - у * (a1 + a21M) + (¥, L ° w) / 2 + (ф, RlM - R 1 [ w, Rw ]), (3.1)

где постоянная у* > 0, а (. , .) — скалярное произведение векторов.

Будем рассматривать невырожденные решения краевой задачи принципа максимума, для которых у* > 0. В силу однородности функции Гамильтона—Понтрягина Н[11] в формуле (3.1) положим у* =1. Сопряженная система

Р = Т ° (3.2)

1<р = - уей(Ь ° ¥)/2 - [Я 1 ф, Ям] + Я[Я 1 ф, м],

где уее1(.) обозначает векторную часть кватерниона, а — сопряжение кватерниона. Как видно, уравнения для переменных ¥ и Ь совпадают с точностью до константы. Используя это и введя обозначение [1]

р = уей(Ь ° ¥) = Ь ° cv ° Ь, (3.3)

где — произвольный постоянный вектор, сопряженную систему (3.2) запишем так:

Гр = [р, м ] ,

\ (3.4)

1<р = -р/2- [Я 4, Ям] + Я[Я 4, м].

Следует отметить, что применение этого приема [1], основанного на самосопряженности дифференциальной кватернионной системы уравнений (1.1) (замена кватернионной сопряженной переменной ¥ в (3.2) на векторную переменную р (3.3)), позволяет понизить размерность краевой задачи, получаемой после применения принципа максимума, на единицу. Условие максимума функции Гамильтона—Понтрягина (3.1) на компактном множестве (1.3) дает следующую структуру оптимального управления:

М°пт =

Г Я 1 ф/IЯ VI, если Я1 ф1 > а2;

0, если Я 41 < а 2; (3.5)

-Мособое, если Я41 = а2, г е[t*, t**],

Мособое = к(г)Я 1 ф/а2, 0 < к(г) < 1, (3.6)

где — моменты начала и окончания особого режима управления.

Таким образом, траектория углового движения КА может состоять из активных участков, участков свободного движения или иметь участки особого режима управления.

4. Исследование особого режима управления. Особый режим управления (3.6) характеризуется тем, что на нем гамильтониан (3.1) перестает явным образом зависеть от управления. Тогда следует перейти к исследованию производных разных порядков функции Гамильтона—Понтрягина, фазовых и сопряженных переменных задачи.

На особом режиме имеем

Я 41 = а 2, (4.1)

Н = - а1 + (м,р)/2- (ф, Я 1 [м, Ям]) = 0. (4.2)

Соотношение (4.1) можно записать в виде

(Я1 ф)2 = а2. (4.3)

Дифференцируя соотношение (4.3) по I и используя (3.4), получим

Л{Я]ф) = -(Я 2ф,р)- 2(Я 2ф, [Я 1 ф, Ям]) = 0. (4.4) аг

Дифференцируя соотношение (4.4) по I и учитывая, что на этапе особого управления

м = Я 2фк(г)/а2 - Я 1 [м, Ям], (4.5) выполним

,2/п-1 \2

d(R 1 ф ) = (R lp)2/2 - (Rp [Я 2ф, w]) + 2(Я2[Я2ф, w], [Я2ф, w]) = 0, (4.6)

dt

где матрицы R1 и R2 определяются как

A 0 0 D 0 0

Ri = 0 В 0 , R2 = 0 E 0

0 0 С 0 0 F

A = Г12(ii(I2 + i3) -12 - 2i2i3), D = /^(a -12)(ii -13), 5 = Г22(i2(ii + i3) -12 - 2ii), E = I22IiI3 (i2 - ii)(I2 -13),

с = i32(i3(ii + i2) -12 - 2iii2), f = i32iii2(i3 - ii)(i3 -12).

Обе части соотношения (4.6) дифференцируем по t. Тогда

d3( r 3(ф ) = (R 2f - ri [r~V w], [p, w]) + dt

(4.7)

(4.8)

+ ([(R 2p/2 + R~2[R 1 ф, Rw] - R~3[R 1 ф, w]), w] - [R~3[w, Rw], R~2(], R3p - 4R2[R 2ф, w]) = 0.

Таким образом, на этапе особого управления сопряженные переменныер, ф и фазовая переменная w удовлетворяют соотношениям (первым интегралам) (4.2)—(4.4), (4.6), (4.7), т.е. на шесть скалярных переменныхp1, p2, p3, ф1, ф2, ф3 на этапе особого управления налагаются пять условий (4.2)—(4.4), (4.6), (4.7).

Для определения оптимального управления на особом этапе вычислим производную по t от обеих частей соотношения (4.7), учитывая соотношения (1.2), (3.4), (3.6), (4.5)

diRii2 = (^ w] - Ri([R-»(-p/2 - [R-ф, Rw] + R[R-ф, w]), w] -

dt

- [R 2ф, R_1[w, Rw] ]), [p, w]) + (K2p - Ri [R 2ф, w], [[p, w], w] +

+ [p, R 2фк(t)/a2-R_1[w, Rw]]) + ([(R 2[p, w]/2 + R~2([R 1 (-p/2 -

- [R 3ф, Rw] + R[R 3ф, w]), Rw] - [R 3ф, [w, Rw]]) - R 3([R 3(-p/2 -

- [R 3ф, Rw] + R[R 3ф, w]), w ] + [R Зф, R 2фк(t)/a2 --R 3[w, Rw]])), w] + [(R 2p/2 + RT2[R Зф, Rw] -

- R 3[R 3ф, w]), R 2фк(t)/a2 - R 3[w, Rw] ] - ([R 3([R 2фк(t)/a2 --R 3[w, Rw], Rw] + [w, R 1 фк(t)/a2-[w, Rw]]), R~V] + + [R 3[w, Rw], RT2(-p/2 - [R Зф, Rw] + R[R Зф, w])]), R3p -

- 4R2[R-2ф, w]) + (R 2p/2 + R 2[R Зф, Rw] - R 1 [R Зф, w]), w] --R-3[w, Rw], R-2ф], Ri[p, w] - 4R2([R2(-p/2 - [R Зф, Rw] + + R [ R Зф, w ]), w ]-[ R 2 ф, R 3[ w, Rw ]])) = 0. Для краткости введем обозначения

-p/2-

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком