научная статья по теме АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Математика

Текст научной статьи на тему «АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 2, с. 194-206

УДК 519.626

АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

© 2015 г. А. И. Калинин, Л. И. Лавринович

(220030 Минск, пр-т Независимости, 4, Белорусский гос. ун-т, ФПМИ) e-mail: kalininai@bsu.by; lavrinovich@bsu.by Поступила в редакцию 26.06.2014 г.

Переработанный вариант 04.08.2014 г.

Рассматривается задача оптимизации переходного процесса в линейной сингулярно возмущенной системе, которая состоит в нахождении допустимого управления с минимальным значением интегрального квадратичного критерия качества. Строятся асимптотические приближения к оптимальному программному управлению и оптимальной обратной связи в этой задаче. Основное достоинство предлагаемых алгоритмов состоит в том, что при их применении исходная задача оптимального управления распадается на две невозмущенные задачи меньшей размерности. Библ. 15.

Ключевые слова: оптимальное управление, линейная система, квадратичный функционал, сингулярные возмущения, асимптотические приближения, субоптимальный синтез.

Б01: 10.7868/8004446691502012Х

ВВЕДЕНИЕ

Системы обыкновенных дифференциальных уравнений, содержащие малые параметры при части производных, принято называть сингулярно возмущенными. Задачи оптимизации таких систем в различных постановках исследовались многими авторами (см. обзор в [1]). Интерес к ним вызван эффективностью асимптотических методов их решения, при применении которых исходные задачи оптимального управления распадаются на задачи меньшей размерности. Кроме того, асимптотический подход позволяет избежать интегрирования сингулярно возмущенных систем, которые являются жесткими (см. [2]).

В настоящей статье рассматривается задача минимизации интегрального квадратичного функционала на траекториях линейной сингулярно возмущенной системы с закрепленным правым концом. Ее можно трактовать как задачу управления с минимальными энергетическими затратами. Сингулярно возмущенным линейно-квадратичным задачам оптимального управления посвящено значительное число работ (см., например, [3]—[6]), однако в них не накладывались ограничения на правый конец траекторий. Целью настоящей работы является построение асимптотических приближений к решению рассмотренной задачи в виде программы и обратной связи. Применяемый подход к исследованию представляет собой модификацию методики, изложенной в [7]. Суть модификации состоит в асимптотическом разложении по целым степеням малого параметра начальных значений сопряженных переменных (множителей Лагранжа) — конечномерных элементов, по которым можно легко восстановить решение задачи.

1. ПОСТАНОВКА ЗАДАЧИ

В классе г-мерных управляющих воздействий и(0, * е Т = [**, **], с кусочно-непрерывными компонентами рассмотрим следующую задачу оптимального управления:

у = 4(0}- + ¿2(0* + У(**) = У*,

(1.1)

V* = ¿з(*)у + ¿4(0* + Вг(р)и, *(**) = **,

У(г *) = 0,.(I *) = 0, (1.2)

т = 2 !(у - Щ,)у + 1И т ко. + „^ - „,„, (1.3)

где ^ — малый положительный параметр, I*, I* — заданные моменты времени (I* < I*), у — я-век-тор медленных переменных, г есть т-вектор быстрых переменных, и есть г-вектор управления, М (I), Ь ( I) — неотрицательно-определенные симметрические матрицы, а Р ( I) — положительно-определенная симметрическая матрица при всех I е Т.

Предположение 1. Матрица А4(0, I е Т, является устойчивой, т.е. действительные части всех ее собственных значений отрицательны.

Предположение 2. Элементы всех матриц, формирующих задачу, бесконечно дифференцируемы.

Управление с кусочно-непрерывными компонентами принято называть допустимым, если для порожденной им траектории системы (1.1) выполнены терминальные ограничения (1.2). Допустимое управление, на котором критерий качества (1.3) принимает наименьшее значение, называют оптимальным. Наряду с этими общеупотребительными понятиями определим то, что будет пониматься под асимптотическими приближениями к решению поставленной задачи.

Определение 1. Управление и(^((, |), I е Т, с кусочно-непрерывными компонентами назовем (программным) асимптотически субоптимальным управлением И-го порядка (N = 0,1, 2,...), если оно переводит систему в состояние 0(|N+1) и отклоняется по критерию качества / (и) от оптимального управления на величину того же порядка малости.

Определение 2. Вектор-функцию и}(у,z,I, и) назовем асимптотически субоптимальной обратной связью И-го порядка, если для любого начального состояния (у*, .*, I*), I* < I*, имеет место

и(^(у*, г*Л, и) = и(Л°(!*, и),

где и(^((, р), I е Т, — асимптотически субоптимальное управление И-го порядка в задаче (1.1)—(1.3).

В настоящей статье предлагается и обосновывается алгоритм, с помощью которого для заданного числа N можно построить асимптотически субоптимальное управление И-го порядка в рассматриваемой задаче. Его суть состоит в асимптотическом разложении по целым степеням малого параметра начальных значений сопряженных переменных, которые в силу принципа максимума (см. [8]) соответствуют оптимальному управлению. В работе также показывается, как можно построить асимптотически субоптимальную обратную связь нулевого порядка.

2. ПЕРВАЯ БАЗОВАЯ ЗАДАЧА

Вычисления при построении асимптотически субоптимальных управлений начинаются с решения вырожденной задачи

t*

y = Ao(t)y + Bo(t)u,y(t*) = y*, y(t*) = 0, Jl(u) = 1 J(yTM(t)y + uTP(t)u)dt ^ min, (2.1)

где

Ao(t) = 4(t) - A2(t)A-1(t)A3(t), Bo(t) = Д(0 - A2(t^A_1(t)B2(t). (2.2)

В дальнейшем задачу (2.1) будем называть первой базовой.

Предположение 3. Динамическая система в задаче (2.1) является вполне управляемой (см. [9]). Заметим, что для стационарной динамической системы это предположение эквивалентно требованию

rank(Bo, A0B0,..., A~lBo) = n. ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ том 55 № 2 2015 2*

При таком предположении в первой базовой задаче существуют допустимые управления, а тогда эта задача имеет единственное решение (см. [10]), которое является нормальной экстремалью. Последнее означает, что принцип максимума из [8] в данном случае может быть сформулирован следующим образом: пусть u0(t), y0(t), t e T, — оптимальные управление и траектория в задаче (2.1), тогда существует такое решение у0(t), t e T, сопряженной системы

Viz = - ¿0T(t)¥ + M (t)y 0(t),

что выполняется условие

V0T(t)B0(t)u0(t) -1 u0T(t)P(t)u0(t) = maxL0T(t)B0(t)u -1 uTP(t)u), t e T.

2 ueRr \ 2 /

Из этого условия непосредственно следует, что

u0(t) = P_1(t)B0T(fV(t), t e T. (2.3)

Предположение 4. Оптимальному управлению в первой базовой задаче соответствует в силу сформулированного принципа максимума единственный вектор сопряженных переменных.

Пусть у * = у 0(t*), тогда y 0(t), у 0(t), t e T, есть решение следующей задачи Коши:

y = 4(t)y + B0(t)P l(t)B0T(t)y, y(t*) = y*,

T (2.4)

V = M(t) y - A (t)y, y(t*) = у *.

Введем в рассмотрение фундаментальную матрицу F(t,t*), t e T, системы (2.4) как решение начальной задачи

F = A(t)F, F (t*) = E2n, (2.5)

в которой

4(t) B0(t)P

W(t) -AT(t) ;

A(t) =

а E2n — единичная матрица. Разобьем матрицу F в (2.5) на блоки размеров n х n:

¥ = Г ^ ^

\¥21 ¥22

Привлекая для записи решения начальной задачи (2.4) в момент времени * * фундаментальную матрицу, получаем

¥п(* *, **)у* + ^ *, **)у* = у 0(* *) = 0,

(2.6)

¥21Г,**)у* + ¥22ГЛ)у* = уУ). Вектор у* однозначно определяется из этой системы при условии невырожденности матрицы ¥12(**,**). Поэтому предположение 4 эквивалентно требованию

det ¥12(**,**) Ф 0. (2.7)

Аналогичное требование предъявим и к матрице ¥22(**,**).

Предположение 5. Имеет место соотношение det ¥г2(? ,**) Ф 0.

3. ВТОРАЯ БАЗОВАЯ ЗАДАЧА

Второй этап алгоритма состоит в решении следующей линейно-квадратичной задачи оптимального управления с бесконечной длительностью процесса:

^ = М *). + В( *)и, .(0) = *)В2Ц *)и "(I *), аз

о (3.1)

z(-o>) = о, J2(u) = - [ uT(s)P(t*)u(s)ds ^ min. 2 J

Эту задачу будем называть второй базовой.

Предположение 6. Выполнено условие управляемости

rank(B2(f ), AS*)B2(f ), ..., A4 l(t*)B2(t*)) = m.

Это предположение гарантирует существование допустимых управлений во второй базовой задаче. Отсюда в свою очередь следует, что задача (3.1) имеет единственное решение (см. [10]) и является нормальной. В этом случае принцип максимума из [8] для нее может быть сформулирован следующим образом: пусть u* (s), z* (s), s < 0, — оптимальные управление и траектория в задаче (3.1), тогда существует такое решение Пу (s), s < 0, сопряженной системы

—Пу = -A4T(t*)ny, ds

что выполняется условие

ПуТ (s) B2(t*)u* (s) -1 u*T (s) P(t*)u* (s) = max (пуТ (s) B2(t*)u - -uTP(f*)u), s < 0.

2 ueRr \ 2 /

Отсюда непосредственно следует, что

u*(s) = P--(t*)B2T(t*)n^(s), s < 0. (3.2)

Пусть a 0 = Пу(0), тогда имеем

ПуТ (s) = (s), ПуТ (s)B2(t*) = аТПФ(s), s < 0, (3.3)

где

ПФ(s) = G(s)B2(t*), s < 0, (3.4)

а G (s), s < 0, — матричная функция, являющаяся решением начальной задачи

—G = -GAt(t*), G (0) = Em • (3.5)

ds

Замечание 1. Подчеркнем, что единственная информация о решении второй базовой задачи, которая используется в дальнейшем при построении асимптотически субоптимальных управлений, — это начальное значение ст0 вектора сопряженных переменных. Нет необходимости строить оптимальное управление

u*(s), s < 0, что, впрочем, и невозможно, если задача решается численно. Во второй базовой задаче гамильтониан вдоль оптимального управления равен нулю. Воспользовавшись этим свойством при s = 0, получаем условия, которому удовлетворяет вектор ст0:

- ^¡B2(t*)P-\t*)BT2(t*)G0 + ^¡B2(f*)u 0(t*) = 0.

После решения базовых задач найдем вектор

v0 = a0 - (A2(t*)A4-1(t*))Т X0, (3.6)

где X 0 = у 0(t*), и сформируем матрицу

10 = | C | (3.7)

C2 C3

размеров (п + т) х (п + т), блоки которой имеют вид

С = ^ *, ^Л? *, ?*), (3.8)

о

С3 = |(пФ(*)Р _1(? *)ПФ ТС$))&, (3.9)

—да

С2 = -А-1((*)(Аъ(е)С1 + В2Г)Р-у^Г)) + Сз(А2(?*^А-1(?*))Т. (3.10)

Матричная функция ПФ(я), 5 < 0, определена ранее формулой (3.4). Матрица ^22(?*,?*) имеет обратную в силу предположения 5. Требование (2.7) и предположение 6 гаранти

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком