научная статья по теме АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ ДЛЯ НЕЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ Математика

Текст научной статьи на тему «АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ ДЛЯ НЕЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2008, том 48, < 11, с. 1942-1951

УДК 519.642.8

АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ ДЛЯ НЕЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ

© 2008 г. Я. О. Грудо, А. И. Калинин

(220030 Минск, пр-т Независимости, 4, Белорусский гос. ун-т, ФПМИ)

e-mail: jan_grudo@tut.by; kalininai@bsu.by

Поступила в редакцию 14.05.2007 г. Переработанный вариант 24.04.2008 г.

Рассматривается задача оптимального быстродействия для нелинейной сингулярно возмущенной системы с многомерными управлениями, значения которых ограничены по евклидовой норме. Предлагается алгоритм построения асимптотических приближений к ее решению. Основное достоинство алгоритма состоит в том, что при его применении исходная задача оптимального управления распадается на две невозмущенные задачи меньшей размерности. Библ. 9. Табл. 1.

Ключевые слова: оптимальное быстродействие, нелинейная система, сингулярные возмущения, асимптотические приближения.

1. ВВЕДЕНИЕ

В математической теории оптимальных процессов значительное внимание уделяется асимптотическим методам решения задач оптимизации сингулярно возмущенных систем (см. обзор в [1]). Как известно, численное решение задач оптимального управления предполагает неоднократное интегрирование прямой и сопряженной систем. В сингулярно возмущенных задачах эти динамические системы являются жесткими [2], и, как следствие, при вычислениях возникают серьезные трудности, выражающиеся в недопустимо большом времени счета и неизбежном накоплении вычислительных ошибок. Поэтому возрастает роль асимптотических методов, тем более, что при их применении исходные задачи оптимального управления распадаются на задачи меньшей размерности.

В настоящей статье описывается асимптотический метод решения задачи оптимального быстродействия для нелинейной сингулярно возмущенной системы с многомерными управлениями, значения которых ограничены по евклидовой норме. Задачи с такими ограничениями часто встречаются в приложениях. В первую очередь, это относится к задачам управления механическими системами, в которых управляющими воздействиями являются, как правило, ограниченные по величине силы.

Суть предлагаемого метода состоит в построении асимптотических приближений к конечномерным элементам, по которым можно восстановить решение задачи. К ним относятся длительность процесса и начальные значения для сопряженных переменных.

2. ПОСТАНОВКА ЗАДАЧИ

В классе r-мерных управляющих воздействий u(t) = (u1(t), ..., ur(t)) с кусочно-непрерывными компонентами рассмотрим задачу оптимального быстродействия

у = ax(y, t) + Ai(y, t)z + Bx(y, t)u, y(0) = y*, Iz = a2(y, t) + A2(y, t)z + B2(y, t)u, z(0) = z*,

y(T) = 0, z(T) = 0, IIu(t)\\ ^ 1, t e [0, T], J(u) = T min, (2.2)

1942

где ц - малый положительный параметр, у есть "-мерный вектор, г есть т-мерный вектор, \\и|| =

Г~2 2

= Л/и1 + ... + иг - евклидова норма вектора и.

Предположение 1. Матрица А2(у, г), у е К", г > 0, является устойчивой, т.е. действительные части всех ее собственных значений отрицательны.

Предположение 2. Функции, формирующие правые части системы (2.1), бесконечно дифференцируемы в области у е К", г > 0.

Введем понятия, которые позволят уточнить то, что будет пониматься под асимптотическими приближениями к решению рассмотренной задачи.

Определение. Управление и(Л)(г, ц), г е [0, Т(Л)(ц)], с кусочно-непрерывными компонентами назовем асимптотически су б оптимальным (субэкстремальным) управлением Л-го порядка (Л = 0, 1, 2, ...) в задаче (2.1), (2.2), если \\и(Л)(г, ц)\\ ^ 1, г е [0, Т(Л)(ц)], и имеют место асимптотические равенства

х(ЛЛ)(Т(ЛЛ)(ц), ц) = 01 (цЛ +1), Т(Л)(ц) - Т(ц) = 02(ЦЛ +1),

где х(Л)(г, ц) = (у(Л), (г, ц), г(Л)(г, ц)), г е [0, Т(Л)(ц)], - траектория системы (2.1), порожденная управлением и(Л)(г, ц), г е [0, Т(Л)(ц)], а Т(ц) - время оптимального быстродействия (время быстродействия некоторой экстремали Понтрягина).

В настоящей статье излагается и обосновывается алгоритм, с помощью которого для заданного числа N можно построить асимптотически субэкстремальное управление Л-го порядка в рассмотренной задаче.

3. ПЕРВАЯ БАЗОВАЯ ЗАДАЧА

Вычисления при построении асимптотически субэкстремальных управлений начинаются с решения вырожденной задачи

У = f о(y, u, t), y(0) = y*, y(T) = 0, \\u(t)|| ^ 1, t e [0, T], J0(u) = T^ min, '

где

f 0(У, u, t) = Ü0(y, t) + B0(y, t)u, Ü0(y, t) = Ü1 (y, t) - Ai(y, t)A-1 (y, t)a2(y, t), B0(y, t) = Bi(y, t) - Ai(y, t)A^1(y, t)B2(y, t).

В дальнейшем эту задачу будем называть первой базовой.

Численные методы решения нелинейных задач ориентированы на нахождение не столько оптимального управления, сколько экстремали Понтрягина (см. [3]). Поэтому будем считать, что в результате решения первой базовой задачи построена экстремаль u0(t), t e [0, T0]. Соответствующие траектории прямой и сопряженной систем обозначим соответственно, через y0(t), y°(t), t e e [0, T0]. Согласно принципу максимума из [3], имеем

Д°'(t)u°(t) = max A0'(t)u, t e[0, T0], (3.2)

INI « 1

где A0'(t) = v0'(t)B0(y0(t), t).

Предположение 3. Выполнено условие A0(t) Ф 0, t e [0, T0].

При таком предположении, как следует из (3.2), имеем u0(t) = A0(t)/||A0(t)||, t e [0, T0].

Пусть H0(y, у, t) = a0 (y, t)y + IIB0 (y, t)y||, а Y(t), ¥(t) t e [0, Г0], - матричные функции, являющиеся решением начальной задачи

d2 H д2 H

Y = ¿¡уу(У°(t),V°(t), t)Y + —-(y0(t),у°(t), t, Y(0) = 0,

д2 H д2 H

* =--Y(У0(t)> V°(t), t)Y - д-Д-0(у0(t), у°(t), t, 0) = £„,

ду дУдУ

(3.3)

где Еп - единичная матрица п-го порядка.

Предположение 4. Имеет место соотношение ёйТ(Т0) Ф 0.

4. ВТОРАЯ БАЗОВАЯ ЗАДАЧА

На втором этапе алгоритма решается линейная задача оптимального управления с бесконечной длительностью процесса:

= А2(0, То)г + В2(0, Т0)и, г(0) = А-^0, Т0)а2(0, Т0),

г (—) = - А—1 (0, Т 0) В2( 0, Т 0 )А0 (Т0)/|| Д°( Т0 )||, ||и (я )|| ^ 1, я ^ 0,

(4.1)

,(u) = J(A°' (T 0) u (s) -| |Д° (T ° )||) ds

max.

Эту задачу будем называть второй базовой. Динамическая система в ней является линейной, а множество допустимых значений управляющих воздействий ограничено гиперсферой единичного радиуса, т.е. представляет собой выпуклый компакт. Кроме того, критерий качества ограничен сверху нулем на множестве таких управлений. Поэтому вторая базовая задача имеет решение, если в ней существуют допустимые управления (см. [4]). Заметим, что она обладает следующей особенностью: точка -А- (0, Т0)В2(0, Т0)Д0(Т0)/||Д0(Т0)|| является положением равновесия динамической системы при управлении u(s) = Д0(Т0)/ ||Д0(Т0)||, которое обращает в нуль подынтегральное выражение в критерии качества. В силу этой особенности, для существования допустимых управлений в задаче (4.1) достаточно, чтобы они существовали в аналогичной задаче с конечной достаточно большой длительностью процесса.

Предположение 5. Задача (4.1) имеет решение u*(s), s =ё 0, и является нормальной.

Заметим, что это предположение будет выполнено, если динамическая система во второй базовой задаче является управляемой, и a2(0, T0) = 0.

Согласно принципу максимума [3], существуют постоянная п0 > 0 и решение n^(s), s =ё 0, сопряженной системы dПy/ds = -А2 (0, Т0)Пу такие, что п0 + ||П^(0)|| Ф 0, и выполняется условие

ПД' (s) u* (s) = max ПД'( s) u, s ^ 0, (4.2)

INI « 1

где ПД'(s) = Пу'^)В2(0, T0) + п0Д0'(Т0). Предположение о нормальности задачи (4.1) означает, что п0 Ф 0. Следуя установившейся традиции, без ограничения общности будем считать, что п0 = 1. Пусть п0 = Пу(0), тогда

Пу( s) = G (s )По, ПД' (s) = п0 ПФ( s) + Д0'( То), s ^ 0, (4.3)

где

ПФ(s) = G(s)B2(0, То), s ^ 0, (4.4)

а G(s), s =s 0, - матричная функция, являющаяся решением начальной задачи

dG/ds = -GA2(0, Т0), G(0) = Em. (4.5)

Предположение 6. Выполнено условие ПД^) Ф 0, s =ё 0.

Тогда, как видно из (4.2), будет u*(s) = ПД^)/||ПД(s)||, s =s 0.

J

Оптимальную траекторию, порожденную управлением ы*(я), s ^ 0, обозначим через z*(s), s ^ 0. Во второй базовой задаче гамильтониан вдоль оптимального управления равен нулю. Воспользовавшись этим свойством при ^ = 0, получим условие, которому удовлетворяет вектор п0:

В(0, Т0)По + Д°(Т0)|| + а2(0, Т0)П = ||а°(Т0)||.

После решения базовых задач найдем вектор

У0 = П0- (А1 (0, Т0)А-1(0, Т0))'^0,

(4.6)

где = у0(Т0). Вектор определен с точностью до положительного множителя. Выберем его таким, чтобы выполнялось условие ||Х01|2 + ||\"01|2 = 1.

5. ОСНОВНАЯ ТЕОРЕМА На следующем этапе алгоритма формируется матрица

10 =

/ Л

С1 0 п х т С2

С3 С4 С5

V ^0 V 0

размеров (п + т + 1) х (п + т + 1), блоки которой стоятся по следующим формулам:

С1 = У(Т0)Т-1(Т0), С2 = /0(0, ы0(Т0), П) + СЩ(0, ы"(П), Т0Л|,

Сз =

д /1,

где

^ (0, Т0) С1 + | (/ (0, Т0, 5) С1 + /з( 0, Т0, 5 )),

0

С4 = | ПФ(5)ПС(Б)ПФ'(5)Ж,

0

С5 = / (0, Т0) С2 + д/(0, Т0) + | (0, Т0, 5) С2 + /2(0, Т0, 5))Ж,

/1(у, г) = — А-1 (у, г)а2(у, г), /2(у, г, 5) = в(5)(А2(у, г)z*(5) + В2(у, г)ы*(5)) +

+ ПФ( 5 )П С ( 5 )

в (5) В2 (у, г) +1 в (а) А 2 (у, г) в 1 (а)ПФ( 5) йа

П0 + /з(у, г, 5Я0,

(5.1)

/з(у, г, 5) = ПФ(5)ПС(5)(В0(у, г) + А1 (у, г)А21 (у, г)ПФ(5))',

П С( 5) = (||ПА( 5 )||2 Ег — ПД(5 )ПА' (5))/|| ПД( 5 )||3,

а ПФ(я), в(я), 5 0, вычисляются по формулам (4.4), (4.5). Предположение 7. Имеет место соотношение 10 Ф 0.

Замечание 1. Если динамическая система в первой базовой задаче является линейной, то экстремаль ы0(г), г е [0, Т0], будет оптимальным управлением. Предположения 4, 7 в данном случае выполняются, если этому управлению соответствует, в силу принципа максимума, единственный (с точностью до положительного множителя) вектор сопряженных переменных.

Прежде чем продолжить изложение алгоритма, сформулируем и докажем теорему о существовании и асимптотических свойствах экстремали Понтрягина в исходной задаче. Доказатель-

0

ство будет конструктивным и предопределит дальнейшие вычисления при построении асимптотически субэкстремальных управлений.

Гамильтониан и сопряженная система в задаче (2.1), (2.2) представимы в виде Н = у(а1(у, г) + А1(у, г)г + В1(У, г)и) + у2(а2(у, г) + А2 (у, г )г + В2 (у, г) и),

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком