научная статья по теме СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПЕРИОДИЧЕСКИМИ ПРОЦЕССАМИ ПРИ НЕОГРАНИЧЕННОМ ВРЕМЕНИ Автоматика. Вычислительная техника

Текст научной статьи на тему «СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПЕРИОДИЧЕСКИМИ ПРОЦЕССАМИ ПРИ НЕОГРАНИЧЕННОМ ВРЕМЕНИ»

Автоматика и телемеханика, Л- 2, 2007

РАС Б 02.30.Yy. 07.05.Dz

© 2007 г. В. И. ГУРМАН, д-р техн. наук, М. Ю. УХИН, канд. техн. наук (Институт программных систем РАН, Переславль-Залесский)

СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПЕРИОДИЧЕСКИМИ ПРОЦЕССАМИ ПРИ НЕОГРАНИЧЕННОМ ВРЕМЕНИ1

Рассматриваются задачи синтеза оптимального управления периодическими и колебательными процессами, характерными для космических приложений, когда время управления жестко по ограничено, а в качестве ограниченного ресурса управления выступает запас рабочего тела управляющих реактивных двигателей. Используются методы теории сингулярных релаксационных расширений и вырожденных задач. Решение при этом получается в форме оцененной минимизирующей последовательности позиционных управлений, которая строится в результате аппроксимации в исходном классе допустимых режимов обобщенного решения циклического скользящего режима.

1. Введение

В литературе известны решения задач управления колебательными системами как сосредоточенными, так и распределенными (главным образом линейными), в которых различные цели, например успокоение колебаний, должны быть достигнуты за ограниченное или минимально возможное время [1 4]. Наряду с такого рода постановками существует ряд задач, в которых располагаемое время достаточно велико, но ограничены иные ресурсы. Такие задачи характерны для космических приложений, где в качестве ограниченного ресурса управления выступает запас рабочего тела управляющих реактивных двигателей. Имеющиеся решения задач по управлению различными маневрами космических аппаратов [5 8]. например задач гашения колебаний спутника с гравитационной системой стабилизации, и колебаний упругой конструкции, обнаруживают весьма экзотическую структуру импульсных и циклических скользящих режимов (по терминологии [6]). что существенно отличает их от регулярных решений, характерных для задач при ограниченном времени маневра.

В работе рассматривается задача синтеза оптимального управления достаточно общей периодической системой на неограниченном промежутке времени по критерию минимума нормы программы управления в Ь1, рассматриваемой в качестве ресурса управления.

Решение математических задач оптимального управления в форме синтеза позиционного управления в отличие от управления в форме программы весьма желательно с точки зрения практической реализации, поскольку оно фактически решает целое семейство задач для различных начальных условий и позволяет косвенно

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект 06-01-00330.

учесть поточности и возмущения, которые игнорируются при детерминированнои постановке математической задачи.

2. Постановка задачи и общий подход к решению

Рассматривается управляемая система, описываемая следующей достаточно общей моделью

(1) х = Н(х) + В]из, х е И", из е и с И

3

(2) г = Е и I

3

3

где и] - векторные управления, располагаемые множества которых из- содержат нулевые значения. Величину назовем ресурсом управления (по аналогии с [9]): уравнение (2) характеризует его динамику в процессе управления. Предполагается, что уравнение (1) при и3 = 0, т.е. х = Н(х), описывает периодические движения при лю-

х

н приложения, например линейную модель управления упругими колебаниями х = —Ах + Ви,

подробно исследованную в [9]: модели управления орбитальными маневрами космических аппаратов [5]:

г = —^т\т\-3 + 1а,

где г - радиус-вектор центра масс аппарата относительно центра гравитации, и их орионтационными маневрами (одна из моделей рассматривается в данной работе (раздел 5)): модель управления системой «хищник-жертва» [6].

На модели (1), (2) ставится следующая задача синтеза оптимального управления: найти закон управления с обратной связью (позиционное управление) и(х, г) = = {из (Ь, х)}, переводящий систему го любого начального состояния (х(0),г(0)) в конечное состояние (х(Ьр),г(Ьр)), с наименьшим значением функционала

(3) I = \(х(Ьр) — х(Ьр )|2,

г(0) = 0 г(Ьр), х(Ьр) - заданные величины. Конечное время Ьр не фиксировано. Если окажется, что МI = 0, то тем самым будет решена задача о переводе системы из (х(0),г(0)) в (х(Ьр),г(Ьр)) с наименьшим г(Ьр).

Из предшествующих исследований оптимизационных задач подобного рода можно заключить, что поставленная задача не имеет решения в обычном понимании и его следует искать в форме минимизирущой последовательности режимов, описываемых рассматриваемой моделью, на основе общего подхода, состоящего из следующих этапов:

1. Производится замена переменной времени как аргумента новым аргументом ресурсом управления (неубывающей функцией времени в силу (2)): в результате время исключается и получается система с неограниченным управлением V =

= (Е \из \) :

(4) х' = vh(x) + В313, I = {13} е Л,

( V1

где lj = И Uj, vmin ^ v < а ограниченное множество Л получается

непосредственным пересчетом совокупности {Uj}, vmin = minv/uj G Uj.

2. В соответствии с теорией [6, 10] находится набор n — 1 независимых первых интегралов периодического пассивного движения y = п(х) (yk = пк(х)) и делается переход к производной системе

(5) y' = VxY^ Bj lj , П(х) = У, l G Л, Пх = [Пх ], j

и соответственно к производной задаче о минимуме того же функционала I, в ко-

yj

с прежним l) - вектор х, стесненный связями пк (х) = yk, иначе говоря, положение на соответствующей траектории пассивного движения, однозначно определяемое временем как параметром х = £(n,t). При таком представлении новым управлением наряду с lj выступает время t.

3. Находится решение производной задачи в форме синтеза оптимального управления (точного или приближенного).

4. Применяется процедура построения минимизирующей последовательности позиционных управлений в исходной задаче [10] на основе информации п. 3 с верхней оценкой точности ее элементов (поскольку оптимального решения в традиционном понимании здесь не существует).

Отметим, что переход к производной задаче в явном виде возможен лишь при явном описании первых интегралов пк (х). Иначе требуется их неявное представление и соответствующее описание производной задачи и ее решения в терминах исходной задачи. В [6, 7, 10] разработаны общие неявные схемы представления, одна из которых ориентирована как раз на решение в форме синтеза. Рассмотрим далее этапы 3 и 4 подробно для обоих случаев, поскольку первый часто встречается в прикладных задачах (в том числе, во всех отмеченных выше).

3. Оптимальный синтез в случае явного описания производной задачи

Выполнив предварительно очевидную операцию частичной минимизации по t в исходном выражении функционала, получим новый минимизируемый функционал производной задачи

(6) J = F (n(zF)) = min ШФр), t) - x(tF)|2.

В такой форме она становится регулярной задачей оптимального управления, и для ее решения в форме синтеза применимо известное уравнение Гамильтона Якоби Боллмана с соответствующим граничным условием

(7) min b^xY, Вз li + bz = 0, b(zF ,y) = F (y),

где b(z,y) - функция Беллмана, (by,bz) - ее градиент в пространстве (y,z).

Предположим, что уравнение (7) решено точно или приближенно и в результате операций минимизации в (6), (7) получаются функции l* (z,x), x* (z,y). Графиком последней служит некоторое многообразие S* = {(z,x) : x = x* (y) ,y G R"~fc}, которое назовем магистральным. Будем считать его для простоты непрерывным. Функция v* (z, y) остается неопределенной и может быть задана произвольно в пределах своих ограничений vmin ^ v < ж.

Том самым получается решение производной задачи, определяющее мнннмнзн-рующую последовательность исходной задачи (с аргументом г), которая строится по общему правилу, описанному в [10]. В данном случае его следует интерпретировать в модели (1) с аргументом Ь, что ведет к упрощению этого правила.

Зададим (1/в)-окрестность 8* ((1/в)-слой), где в - помер члена последовательности

С (8*, 1/в) = {(г,х) : \х - х* (г, у) \ < 1/в}.

При (г,х) £ С (8*, 1/в) полагаем для определенности ¡3 (г,х) = I* (Ь,х) V = В противном случае находится точка (г, х*) на 8* такая, что при данном 2 точки х* х

аргументу Ь, в результате при заданном в получается следующий закон управления иа(г,х) = {и^8\(г,х) для системы (1), (2):

( 0, \х - х* (г,у) \ > 1/s,

(о) ие(г, х) = <

I ¡з* (г, х) /vmin, \х - х* (г, у) \ < 1/в.

В целом последовательность функций {и3 (г,х)} задает синтез оптимального управления с любой точностью при достаточно большом в. При этом время Ьр с ростом в неограниченно растет, а при заданном в тем меньше, чем больше vmin. С этой точки зрения практически выгодно из всех возможных значений V в задаче с исключенным временем брать именно vmin.

Несмотря на некоторую громоздкость описанной конструкции и3 (Ь, х), она отражает достаточно простое и наглядное правило: из любой точки (Ь,х), не лежащей (1/в) 8*

(1/в)

(¡* (г, х))

4. Общая процедура

Очевидно, выписать явно уравнение Боллмана (7) нельзя, если первые интегралы нелинейной системы (6) не выражаются аналитически в конечных формулах. В связи с этим предлагается схема неявного представления указанного уравнения и оптимального синтеза непосредственно в исходных терминах. Для удобства введем обозначения:

H (x.p) = maxpT I vh(x) + Bjlj) I /l = {lj} G Л. vmin ^ v < ж.

l,v V j J

H1 (y.p1) = max H (x.p). Тогда (7) записывается в форме

(9) H1 (y.b\) - blz =0.

Как показано в [6, 10], функция Беллмана b(z.x) для задач типа (4), (3) удовлетворяет при каждом z линейному уравнению кратных максимумов

(10) blh(x) = 0.

Соответствующая характеристическая система имеет вид

(Н)

dx dp

dt =h(x), dt = (x'p),

д = (х,Р)=0, ? (х,Р)= рТЬ(х).

Поставим задачу Коши для системы (11). Зададим гладкое (п)-параметрическое 8

x = K (z,y), У = v1,...,yn 1

и b(t, x) та нем как некоторую функцию bI(z,y) = b(z, n(t,y)), так что имеют место соотношения

bI (t, У) = b (t, K (t, У)), bl = Р1 = кТьх = кTP, (12) b\ = q1 = bz + K^bx = q + K^p.

Как обычно, будем предполагать, что многообразие S (t) не является характеристическим для системы (11) и, следовательно, величины x, p, q в лотках S (z) выражаются через z, y, p\ q1 из соотношений (12

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком