научная статья по теме АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ Математика

Текст научной статьи на тему «АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2010, том 50, № 3, с. 423-433

УДК 519.626

АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ

Рассматривается задача минимизации квадратичного терминального критерия качества на траекториях линейной сингулярно возмущенной системы. На правый конец траекторий наложены ограничения типа равенства, а значения многомерных управлений ограничены по евклидовой норме. Предлагается алгоритм построения асимптотических приближений к решению рассмотренной задачи. Библ. 10.

Ключевые слова: задача оптимального управления, линейная система, квадратичный функционал, сингулярные возмущения, асимптотические приближения, алгоритм построения асимптотических приближений.

В рамках математической теории оптимальных процессов значительное внимание уделяется задачам оптимизации сингулярно возмущенных систем (см. обзоры в [1]—[4]). Интерес к таким задачам вызван эффективностью асимптотических методов их решения, при применении которых они распадаются на задачи меньшей размерности. Кроме того, асимптотический подход позволяет избежать интегрирования сингулярно возмущенных систем, которые являются жесткими (см. [5]).

В настоящей статье описывается асимптотический метод решения линейно-квадратичной задачи терминального управления с подвижным правым концом траекторий для сингулярно возмущенной системы с многомерными управляющими воздействиями, значения которых ограничены по евклидовой норме. Асимптотические приближения к решению этой задачи могут быть также построены с помощью алгоритма, разработанного для нелинейной сингулярно возмущенной задачи терминального управления (см. [6]). Однако излагаемая ниже вычислительная процедура значительно проще этого алгоритма, поскольку учитывает специфику рассматриваемой задачи.

Суть предлагаемого метода состоит в построении асимптотики множителей Лагранжа в виде разложений по целым степеням малого параметра.

В классе г-мерных управляющих воздействий ы(0 = (ы^), ..., ыг(0), t е Т = [0, t^], с кусочно-

непрерывными компонентами рассмотрим следующую задачу оптимального управления линейной стационарной системой:

ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ

© 2010 г. А. И. Калинин

(220030 Минск, пр-т Независимости, 4, Белорусский гос. ун-т, ФПМИ)

e-mail: kalininai@bsu.by

Поступила в редакцию 06.07.2009 г. Переработанный вариант 22.09.2009 г.

1. ВВЕДЕНИЕ

2. ПОСТАНОВКА ЗАДАЧИ

y = A1 y + A 2 z + Bi u, ц z = A3 y + Aa z + B2 u, y (0) = y*, z( 0) = z *,

(2.1)

u(OH < 1, t e T, Hiy(t*) = gi, H2z(t*) = g2,

(2.2)

J( u) = y (t*) Dy( t*) /2 + c'y (t *) —- min,

(2.3)

где | — малый положительный параметр, — заданный момент времени, у, z, й, g2 — векторы раз-

2 2 u1 + ... + ur — евклидова норма век-

мерностей n, m, nb m1 соответственно (n1 < n, m1 < m), ||u|| = Ju^ тора u. Считаем, что D — симметрическая и неотрицательная матрица, а среди терминальных ограничений нет "лишних", т.е. rank H1 = n1, rank H2 = m1.

Предположение 1. Матрица A4 является устойчивой, т.е. действительные части всех ее собственных значений отрицательны.

Вектор-функцию u(t, ц), t е T, с кусочно-непрерывными компонентами называют допустимым управлением в задаче (2.1)—(2.3), если она вместе с порожденной ею траекторией y(t, ц), z(t, ц), t е T, системы (2.1) удовлетворяет ограничениям (2.2). Допустимое управление, на котором критерий качества (2.3) принимает минимальное значение, называется оптимальным. Наряду с этими общеупотребительными понятиями определим то, что будет пониматься под асимптотическими приближениями к решению рассмотренной задачи.

Определение. Вектор-функцию u(N)(t, ц), t е T, с кусочно-непрерывными компонентами и значениями, не превосходящими по евклидовой норме единицы, назовем асимптотически субоптимальным управлением N-го порядка (N = 0, 1, 2, ...), если она отклоняется по критерию качества (2.3) от оптимального управления на величину O(^ +1), а порожденная ею траектория системы (2.1) удовлетворяет терминальным ограничениям с точностью того же порядка малости.

В настоящей статье излагается алгоритм, с помощью которого для заданного числа N можно построить асимптотически субоптимальное управление N-го порядка в рассмотренной задаче. Алгоритм опирается на конструктивное доказательство теоремы о существовании гладкого оптимального управления и его асимптотических свойствах. В работе также показывается, как можно использовать построенные асимптотические приближения для точного решения задачи (2.1)—(2.3) при заданном значении малого параметра.

Для сокращения записи введем следующие обозначения:

(

А(ц) =

Ai

(

V A3/ц A4/ц )

ад =

Bi

B2/ц)1

х± —

(

y * V z * )

(2.4)

3. ПЕРВАЯ БАЗОВАЯ ЗАДАЧА

Вычисления при построении асимптотически субоптимальных управлений начинаются с решения вырожденной задачи

y = A0y + B0u, y(0) = y*, ||u(t)||< 1, t e T, Hly(t*) = gx, ^3 ^^

Jo(u) = y'(t*)Dy(t*)/2 + c'y(t*) —- min,

где A0 = A1 — A2A41A3, B0 = B1 — A2A41B2. В дальнейшем эту задачу будем называть первой базовой.

Предположение 2. В задаче (3.1) существует оптимальное управление u°(t), t e T, которое является нормальной экстремалью.

Последнее означает, что оптимальному управлению соответствует, в силу принципа максимума из [7], единственный (с точностью до нормировки) вектор множителей Лагранжа X = (А,*,

А°ь ..., А0п ), при этом А* > 0. Тогда можно считать, что А* = 1. Оптимальную траекторию, порожденную управлением u°(t), t e T, обозначим через y°(t), t e T. Согласно принципу максимума,

A°'(t)u (t) = maxА0 (t)u, t e T, (3.2)

И < i

где A°(t) = B0y0(t), а y°(t), t e T, — сопряженная переменная, являющаяся решением начальной задачи

V = -A0V, y(t*) = - (Dy°(t*) + c) + H'iА0, А0 = (А01, A0Bi).

Пусть

По = - (V(**) + с) + Н^о, (3.3)

тогда

Д°'(*) = п0Фо(*), * 6 Т, (3.4)

где

Ф°(*) = /°(*)В°, * 6 Т, (3.5) а ? 6 Т, есть (п х п)-матричная функция, удовлетворяющая дифференциальному уравнению

Ро = -Мо, Fо (**) = Еп. (3.6)

Предположение 3. Выполнено условие Д0(?) Ф О, I 6 Т.

При таком предположении, как следует из (3.2), оптимальное управление в первой базовой задаче представимо в виде

и0(0 = До(0До(о!, * 6 Т. (3.7)

4. ВТОРАЯ БАЗОВАЯ ЗАДАЧА

На втором этапе алгоритма решается линейная задача оптимального управления с бесконечной длительностью процесса:

(г/= А4 г + В2 и, г (-да) = -А-В До (**)/I До( ** )||,

||и (5 )|| < 1, 5 < о, Н2г( о ) = Н2А-1 Аз /( * * ) + §2, А(и) = сог(о) + (Д(и.)и(5) - Д(и.) )—»- тах,

к( и) = сог( о) + | (До' (* *) и( 5) -||До (* * )||) (

где

с'о = ПоА2А41. (4.2)

Эту задачу будем называть второй базовой. Она обладает следующей особенностью: точка -А4 гВ2Д° (* *)/| До (** )|| является положением равновесия динамической системы при управлении м(ж) = Д0(^)/||Д0(^)||, которое обращает в нуль подынтегральное выражение в критерии качества.

Отсюда следует, что вторая базовая задача имеет решение, если разрешима аналогичная задача с конечной достаточно большой длительностью процесса.

Предположение 4. В задаче (4.1) существует оптимальное управление «*(«), s < 0, которое является нормальной экстремалью.

Тогда, согласно принципу максимума из [7],

ПД'(5) и * (5) = тах ПД'( 5) и, 5 < о, (4.3)

И < 1

где

ПД( 5) = В2 Пу( 5) + До( **), (4.4)

а Пу(«), « < 0, есть решение сопряженной системы

= -А4 Пу, Пу( о) = со + в которой v0 — вектор множителей Лагранжа размерности т1. С другой стороны,

ПД(5) = ПФ '(5)(Со + НVо) + До(**), 5 < о, (4.5)

30

где

ПФ(^) = О(в)В2, в < 0, (4.6)

а G(s), s < 0, есть (m х m)-матричная функция, являющаяся решением начальной задачи

сСЮ/Св = _ЮА4 , Ю( 0) = Ет. (4.7)

Предположение 5. Выполнено условие ПД^) Ф 0, s < 0. Тогда, как видно из (4.3), имеем

и*(в) = ПД(в)ПД(в)||, в < 0. (4.8)

Оптимальную траекторию, порожденную управлением и*^), s < 0, обозначим через z*(s), s < 0. После решения базовых задач формируются матрицы

'*Фо( г)(||д0( г)|| ч - д0( од0'( т о (г) (л пл

С = Г-3-с, (4.9)

0 11д°(0«3

0 2 _1

С = -А1А с + ГПФ(в)( I I ПД (в ) I I Ег _ П Д(в)ПД'(в ) ) (АА_ ПФ (в ) + В0) '^ (4 10)

2 4 3 1 0 I I ПД (в ) 113 , .

0

3

С = Г Н П Ф (в ) ( II ПД( в) II Ег _ ПД (в ) П Д' (в) )ПФ' (в) Д2 ^ (411)

* _1 I I ПД( в) I I 3 . .

Заметим, что матрицы С1, С3 являются симметрическими и неотрицательными.

5. АСИМПТОТИЧЕСКИЙ АНАЛИЗ РЕШЕНИЯ ИСХОДНОЙ ЗАДАЧИ

Прежде чем продолжить изложение алгоритма построения асимптотически субоптимальных управлений, сформулируем и докажем теорему, на которую опираются дальнейшие вычисления.

Обозначим через у^, п, V, |), t е T, п е К", V е К 1, решение сопряженной системы

V = _А'(|)у (5.1)

с начальным условием

у(г*) = (п, |H2v) (5.2) и введем в рассмотрение вектор-функцию

Д(г, п, V, |) = В(|)у(г, п, V, |), (5.3)

которую называют коуправлением.

Теорема. При выполнении предположений 1—5 в задаче (2.1)—(2.3) с достаточно малым положительным | существует оптимальное управление, которое представимо в виде

и(г, |) = Д(г, п(|), V(|), |)Д(г, п(|), v(|), |)||, г е т, (5.4)

при этом имеют место асимптотические разложения

да да

п(|)~ X ^п*, V(|)~ X . (5.5)

к = 0 к = 0

Доказательство. Прежде чем перейти к доказательству теоремы, обратим внимание на то, что в разложениях (5.5) п0 есть начальное значение сопряженной переменной в первой базовой задаче, а V,) — вектор множителей Лагранжа, соответствующий решению второй базовой задачи.

В первую очередь, убедимся, что при достаточно малом ц и векторах п, V, достаточно близких к п0, v0 соответственно, коуправление (5.3), рассматриваемое как функция временного аргумента не обращается в нуль на отрезке Т. Как видно из (5.1), (5.2), оно представимо в виде

Д'(п, V, ц) = (п', ц^Н)Р(г, ц)B(ц), (5.6)

где ц), ? 6 Т, — матричная функция, удовлетворяющая дифференциальному уравнению

Р = -РА(ц), Р( **) = Еп + т. (5.7)

Представим решение этого сингулярно возмущенного уравнения в блочном виде:

Р(ц) =

( \ Р1(ц) Р2(ц)

V Рз(ц) Р4(ц) )

(5.8)

где ¥ъ Д2, Д3, Д4 — матрицы размеров п х п, п х т, т х п, т х т соответственно. С помощью метода пограничных функций (см. [8]) они могут быть разложены в асимптотические ряды

Р(ц)~ £ цк[Р1к(*) + ПкР1

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком