Автоматика и телемеханика, Л- 2, 2007
РАС Б 02.30.Yy. 07.05.Dz
© 2007 г. В. И. ГУРМАН, д-р техн. наук, М. Ю. УХИН, канд. техн. наук (Институт программных систем РАН, Переславль-Залесский)
СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПЕРИОДИЧЕСКИМИ ПРОЦЕССАМИ ПРИ НЕОГРАНИЧЕННОМ ВРЕМЕНИ1
Рассматриваются задачи синтеза оптимального управления периодическими и колебательными процессами, характерными для космических приложений, когда время управления жестко по ограничено, а в качестве ограниченного ресурса управления выступает запас рабочего тела управляющих реактивных двигателей. Используются методы теории сингулярных релаксационных расширений и вырожденных задач. Решение при этом получается в форме оцененной минимизирующей последовательности позиционных управлений, которая строится в результате аппроксимации в исходном классе допустимых режимов обобщенного решения циклического скользящего режима.
1. Введение
В литературе известны решения задач управления колебательными системами как сосредоточенными, так и распределенными (главным образом линейными), в которых различные цели, например успокоение колебаний, должны быть достигнуты за ограниченное или минимально возможное время [1 4]. Наряду с такого рода постановками существует ряд задач, в которых располагаемое время достаточно велико, но ограничены иные ресурсы. Такие задачи характерны для космических приложений, где в качестве ограниченного ресурса управления выступает запас рабочего тела управляющих реактивных двигателей. Имеющиеся решения задач по управлению различными маневрами космических аппаратов [5 8]. например задач гашения колебаний спутника с гравитационной системой стабилизации, и колебаний упругой конструкции, обнаруживают весьма экзотическую структуру импульсных и циклических скользящих режимов (по терминологии [6]). что существенно отличает их от регулярных решений, характерных для задач при ограниченном времени маневра.
В работе рассматривается задача синтеза оптимального управления достаточно общей периодической системой на неограниченном промежутке времени по критерию минимума нормы программы управления в Ь1, рассматриваемой в качестве ресурса управления.
Решение математических задач оптимального управления в форме синтеза позиционного управления в отличие от управления в форме программы весьма желательно с точки зрения практической реализации, поскольку оно фактически решает целое семейство задач для различных начальных условий и позволяет косвенно
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект 06-01-00330.
учесть поточности и возмущения, которые игнорируются при детерминированнои постановке математической задачи.
2. Постановка задачи и общий подход к решению
Рассматривается управляемая система, описываемая следующей достаточно общей моделью
(1) х = Н(х) + В]из, х е И", из е и с И
3
(2) г = Е и I
3
3
где и] - векторные управления, располагаемые множества которых из- содержат нулевые значения. Величину назовем ресурсом управления (по аналогии с [9]): уравнение (2) характеризует его динамику в процессе управления. Предполагается, что уравнение (1) при и3 = 0, т.е. х = Н(х), описывает периодические движения при лю-
х
н приложения, например линейную модель управления упругими колебаниями х = —Ах + Ви,
подробно исследованную в [9]: модели управления орбитальными маневрами космических аппаратов [5]:
г = —^т\т\-3 + 1а,
где г - радиус-вектор центра масс аппарата относительно центра гравитации, и их орионтационными маневрами (одна из моделей рассматривается в данной работе (раздел 5)): модель управления системой «хищник-жертва» [6].
На модели (1), (2) ставится следующая задача синтеза оптимального управления: найти закон управления с обратной связью (позиционное управление) и(х, г) = = {из (Ь, х)}, переводящий систему го любого начального состояния (х(0),г(0)) в конечное состояние (х(Ьр),г(Ьр)), с наименьшим значением функционала
(3) I = \(х(Ьр) — х(Ьр )|2,
г(0) = 0 г(Ьр), х(Ьр) - заданные величины. Конечное время Ьр не фиксировано. Если окажется, что МI = 0, то тем самым будет решена задача о переводе системы из (х(0),г(0)) в (х(Ьр),г(Ьр)) с наименьшим г(Ьр).
Из предшествующих исследований оптимизационных задач подобного рода можно заключить, что поставленная задача не имеет решения в обычном понимании и его следует искать в форме минимизирущой последовательности режимов, описываемых рассматриваемой моделью, на основе общего подхода, состоящего из следующих этапов:
1. Производится замена переменной времени как аргумента новым аргументом ресурсом управления (неубывающей функцией времени в силу (2)): в результате время исключается и получается система с неограниченным управлением V =
= (Е \из \) :
(4) х' = vh(x) + В313, I = {13} е Л,
( V1
где lj = И Uj, vmin ^ v < а ограниченное множество Л получается
непосредственным пересчетом совокупности {Uj}, vmin = minv/uj G Uj.
2. В соответствии с теорией [6, 10] находится набор n — 1 независимых первых интегралов периодического пассивного движения y = п(х) (yk = пк(х)) и делается переход к производной системе
(5) y' = VxY^ Bj lj , П(х) = У, l G Л, Пх = [Пх ], j
и соответственно к производной задаче о минимуме того же функционала I, в ко-
yj
с прежним l) - вектор х, стесненный связями пк (х) = yk, иначе говоря, положение на соответствующей траектории пассивного движения, однозначно определяемое временем как параметром х = £(n,t). При таком представлении новым управлением наряду с lj выступает время t.
3. Находится решение производной задачи в форме синтеза оптимального управления (точного или приближенного).
4. Применяется процедура построения минимизирующей последовательности позиционных управлений в исходной задаче [10] на основе информации п. 3 с верхней оценкой точности ее элементов (поскольку оптимального решения в традиционном понимании здесь не существует).
Отметим, что переход к производной задаче в явном виде возможен лишь при явном описании первых интегралов пк (х). Иначе требуется их неявное представление и соответствующее описание производной задачи и ее решения в терминах исходной задачи. В [6, 7, 10] разработаны общие неявные схемы представления, одна из которых ориентирована как раз на решение в форме синтеза. Рассмотрим далее этапы 3 и 4 подробно для обоих случаев, поскольку первый часто встречается в прикладных задачах (в том числе, во всех отмеченных выше).
3. Оптимальный синтез в случае явного описания производной задачи
Выполнив предварительно очевидную операцию частичной минимизации по t в исходном выражении функционала, получим новый минимизируемый функционал производной задачи
(6) J = F (n(zF)) = min ШФр), t) - x(tF)|2.
В такой форме она становится регулярной задачей оптимального управления, и для ее решения в форме синтеза применимо известное уравнение Гамильтона Якоби Боллмана с соответствующим граничным условием
(7) min b^xY, Вз li + bz = 0, b(zF ,y) = F (y),
где b(z,y) - функция Беллмана, (by,bz) - ее градиент в пространстве (y,z).
Предположим, что уравнение (7) решено точно или приближенно и в результате операций минимизации в (6), (7) получаются функции l* (z,x), x* (z,y). Графиком последней служит некоторое многообразие S* = {(z,x) : x = x* (y) ,y G R"~fc}, которое назовем магистральным. Будем считать его для простоты непрерывным. Функция v* (z, y) остается неопределенной и может быть задана произвольно в пределах своих ограничений vmin ^ v < ж.
Том самым получается решение производной задачи, определяющее мнннмнзн-рующую последовательность исходной задачи (с аргументом г), которая строится по общему правилу, описанному в [10]. В данном случае его следует интерпретировать в модели (1) с аргументом Ь, что ведет к упрощению этого правила.
Зададим (1/в)-окрестность 8* ((1/в)-слой), где в - помер члена последовательности
С (8*, 1/в) = {(г,х) : \х - х* (г, у) \ < 1/в}.
При (г,х) £ С (8*, 1/в) полагаем для определенности ¡3 (г,х) = I* (Ь,х) V = В противном случае находится точка (г, х*) на 8* такая, что при данном 2 точки х* х
аргументу Ь, в результате при заданном в получается следующий закон управления иа(г,х) = {и^8\(г,х) для системы (1), (2):
( 0, \х - х* (г,у) \ > 1/s,
(о) ие(г, х) = <
I ¡з* (г, х) /vmin, \х - х* (г, у) \ < 1/в.
В целом последовательность функций {и3 (г,х)} задает синтез оптимального управления с любой точностью при достаточно большом в. При этом время Ьр с ростом в неограниченно растет, а при заданном в тем меньше, чем больше vmin. С этой точки зрения практически выгодно из всех возможных значений V в задаче с исключенным временем брать именно vmin.
Несмотря на некоторую громоздкость описанной конструкции и3 (Ь, х), она отражает достаточно простое и наглядное правило: из любой точки (Ь,х), не лежащей (1/в) 8*
(1/в)
(¡* (г, х))
4. Общая процедура
Очевидно, выписать явно уравнение Боллмана (7) нельзя, если первые интегралы нелинейной системы (6) не выражаются аналитически в конечных формулах. В связи с этим предлагается схема неявного представления указанного уравнения и оптимального синтеза непосредственно в исходных терминах. Для удобства введем обозначения:
H (x.p) = maxpT I vh(x) + Bjlj) I /l = {lj} G Л. vmin ^ v < ж.
l,v V j J
H1 (y.p1) = max H (x.p). Тогда (7) записывается в форме
(9) H1 (y.b\) - blz =0.
Как показано в [6, 10], функция Беллмана b(z.x) для задач типа (4), (3) удовлетворяет при каждом z линейному уравнению кратных максимумов
(10) blh(x) = 0.
Соответствующая характеристическая система имеет вид
(Н)
dx dp
dt =h(x), dt = (x'p),
д = (х,Р)=0, ? (х,Р)= рТЬ(х).
Поставим задачу Коши для системы (11). Зададим гладкое (п)-параметрическое 8
x = K (z,y), У = v1,...,yn 1
и b(t, x) та нем как некоторую функцию bI(z,y) = b(z, n(t,y)), так что имеют место соотношения
bI (t, У) = b (t, K (t, У)), bl = Р1 = кТьх = кTP, (12) b\ = q1 = bz + K^bx = q + K^p.
Как обычно, будем предполагать, что многообразие S (t) не является характеристическим для системы (11) и, следовательно, величины x, p, q в лотках S (z) выражаются через z, y, p\ q1 из соотношений (12
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.