научная статья по теме АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОБ УПРАВЛЕНИИ МИНИМАЛЬНОЙ СИЛОЙ ДЛЯ ЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ Математика

Текст научной статьи на тему «АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОБ УПРАВЛЕНИИ МИНИМАЛЬНОЙ СИЛОЙ ДЛЯ ЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2011, том 51, № 12, с. 2115-2125

УДК 519.626.1

АСИМПТОТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ОБ УПРАВЛЕНИИ МИНИМАЛЬНОЙ СИЛОЙ ДЛЯ ЛИНЕЙНОЙ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМЫ

© 2011 г. А. И. Калинин

(220030 Минск, пр-т Независимости, 4, Белорусский гос. ун-т, ФПМИ) e-mail: kalininai@bsu.by Поступила в редакцию 24.05.2011 г.

Рассматривается задача оптимизации переходного процесса в линейной сингулярно возмущенной системе, которая состоит в нахождении управления (многомерного) с минимальной интенсивностью. Предлагается алгоритм построения асимптотических приближений к ее решению. Основное достоинство алгоритма состоит в том, что при его применении вместо исходной задачи решаются задачи оптимального управления меньшей размерности. Библ. 8.

Ключевые слова: оптимальное управление, линейная система, минимальная сила, сингулярные возмущения, асимптотические приближения, вычислительный алгоритм.

1. ВВЕДЕНИЕ

Системы обыкновенных дифференциальных уравнений, содержащие малые параметры при части производных, принято называть сингулярно возмущенными. Задачи оптимизации таких систем в различных постановках исследовались многими авторами (см. обзор в [1]). Интерес к ним вызван эффективностью асимптотических методов их решения, при применении которых исходные задачи оптимального управления распадаются на задачи меньшей размерности. Кроме того, асимптотический подход позволяет избежать интегрирования сингулярно возмущенных систем, которые являются жесткими (см. [2]).

Настоящая статья посвящена построению асимптотических приближений к решению задачи оптимизации переходного процесса в линейной сингулярно возмущенной системе. Эта задача состоит в нахождении управления (многомерного) с минимальной интенсивностью. Под интенсивностью в данном случае понимается максимум евклидовой нормы значений управляющего воздействия. В прикладных задачах управление зачастую имеет смысл обобщенной силы, а интенсивность оценивает тогда наибольшее значение этой силы. Поэтому рассматриваемую задачу называют задачей об управлении минимальной силой (см. [3]). Подобные задачи занимают особое место среди типичных задач оптимального управления вследствие негладкости функционала качества. Они возникают в приложениях, когда большие значения управляющих воздействий либо технически нереализуемы, либо нежелательны из-за чрезмерных перегрузок, вызванных ускорениями.

Суть предлагаемого асимптотического метода решения рассматриваемой задачи состоит в построении асимптотики оптимальной интенсивности и начальных значений сопряженных переменных в виде разложений по целым степеням малого параметра. Старшие коэффициенты разложений могут быть найдены в результате решения двух невозмущенных задач оптимального управления меньшей размерности, чем исходная задача. Помимо решения этих базовых задач вычислительная процедура метода включает в себя интегрирование линейных дифференциальных уравнений, а также нахождение корней невырожденных линейных алгебраических систем.

Предлагаемый метод является развитием результатов, полученных в [4], на системы с многомерным управлением.

2115

2116

КАЛИНИН

2. ПОСТАНОВКА ЗАДАЧИ

В классе r-мерных управляющих воздействий u(t) = (u1(t), ..., ur(t)), t e T = [0, t*], r > 2, с кусочно-непрерывными компонентами рассмотрим задачу оптимального управления линейной стационарной системой

y = A1y + A2z + B1 u, vz = A3y + A4z + B2u, y(0) = y* Ф 0, z(0) = z*, (2.1)

y(t*) = 0, z(t*) = 0, J(u) = sup II u(Oll —- min, (2.2)

t e T

в которой v — малый положительный параметр, t* — заданный момент времени, y, z — векторы размерностей n и m соответственно, ||u|| = (uj2 + ... + u1 )1/2 — евклидова норма вектора u.

Предположение 1. Матрица A4 является устойчивой, т.е. действительные части всех ее собственных значений отрицательны.

Предположение 2. Выполнены условия управляемости

rank (B0, A0 B0, ..., A"0 - lB0) = n, rank (Въ A4 Въ ..., A™ - lBj) = m,

где A0 = A1 - A2A-:A3, B0 = B1 - A2A-:B2.

Управление u(t, v), t e T, с кусочно-непрерывными компонентами принято называть допустимым, если для порожденной им траектории y(t, v), z(t, v), t e T, системы (2.1) выполняется условие y(t*, v) = 0, z(t*, v) = 0. Допустимое управление с минимальной интенсивностью J(u) называется оптимальным. Наряду с этими общеупотребительными понятиями определим то, что будет пониматься под асимптотическими приближениями к решению рассмотренной задачи.

Определение. Управление u(N)(t, v), t e T, с кусочно-непрерывными компонентами назовем асимптотически субоптимальным управлением N-го порядка (N = 0, 1, 2, ...) в задаче (2.1), (2.2), если оно переводит систему (2.1) в состояние 0(vN +1) и отклоняется по критерию качества J(u) от оптимального управления на величину того же порядка малости.

В настоящей статье излагается и обосновывается алгоритм, с помощью которого для заданного числа N можно построить асимптотически субоптимальное управление N-го порядка в рассмотренной задаче. Алгоритм опирается на конструктивное доказательство теоремы о существовании гладкого оптимального управления и его асимптотических свойствах. В работе также показывается, как можно использовать построенные асимптотические приближения для точного решения задачи (2.1), (2.2) при заданном значении малого параметра.

В дальнейшем для сокращения записи будут использованы следующие обозначения:

A (v) =

( . . ^ г B ^ г

B(v) = Bl

A1 A2 V A3/v A4/v )

=

V B2/ v >

y* z*

3. БАЗОВЫЕ ЗАДАЧИ

Вычисления при построении асимптотически субоптимальных управлений начинаются с решения вырожденной задачи

y = A0y + B0u, y (0) = y *, y (t*) = 0, J1 (u) = sup|| u (t)|| —- min,

t e T

которую впредь будем называть первой базовой. Согласно полученным в [3] результатам, при выполнении предположения 2 в этой задаче существует оптимальное управление u0(t), t е T, евклидова норма его значений постоянна: ||u0(t)|| = L0, t е T, и выполняется условие максимума

А0'(t)u0(t) = max А0'(t)u, t е T, (3.1)

IUI s L

где Д°(0 = B0 у°(0, а у°(0, t е T, — решение сопряженной системы у = -A0 у , стесненное краевым условием

у0 ' ( t* ) F0( 0 )y * = -1, (3.2)

в котором F°(T), t е T, есть (n х п)-матричная функция, удовлетворяющая дифференциальному уравнению

Fo = -F0A0, Fo ( t* ) = En. (3.3)

Предположение 3. Оптимальному управлению в первой базовой задаче соответствует, в силу сформулированного принципа максимума, единственный вектор сопряженных переменных, при этом выполнено условие Д°(0 Ф 0, t е T.

При таком предположении, как видно из (3.1), оптимальное управление представимо в виде

u0(t) = LoД0(t)Д0(t)||, t е T. (3.4)

Оптимальную траекторию, порожденную этим управлением, обозначим через y°(t), t е T, и пусть = y°(t*). Тогда

Д0'(t) = Ф0(t), t е T, (3.5)

где

Ф0(t) = F0(t)B0, t е T. (3.6)

На втором этапе вычислений решается задача оптимального управления с бесконечной длительностью процесса:

dz/ds = A4 z + B2u, z ( 0 ) = 0, ||u(s)||< 1, s < 0,

0

z (-сю) = —A—lB2 Д0 ( t * )/IД0 ( t* )||, J2 ( u ) = I (Д0'( t * ) u ( s ) -| |Д 0( t* )||) ds —- max,

—œ

которую будем называть второй базовой. Она обладает следующей особенностью: точка

—A41В2Д0 ( t * )/|| Д0 ( t* )|| является положением равновесия динамической системы при управлении

u(s) = Д°(^)/||Д°(^)||, которое обращает в нуль подынтегральное выражение в критерии качества.

Отмеченное свойство вместе с предположениями 1, 2 гарантирует существование допустимых управлений во второй базовой задаче. Отсюда, в свою очередь, следует, что эта задача имеет решение (см. [5]) и является нормальной. Последнее означает, что принцип максимума из [6] для нее может быть сформулирован следующим образом: пусть u*(s), s < — оптимальное управление во второй базовой задаче, тогда

ПД' (s ) u * (s ) = max ПД'( s ) u, s < 0, (3.7)

M < 1

где ПД^) = B2Пу (s) + Д0(t^), а ny(s), s < — решение сопряженной системы

d Пу/ ds = —A4 Пу.

Заметим, что при этом оптимальному управлению соответствует единственный вектор сопряженных переменных.

Пусть п° = Пу(°), тогда

ПД( s ) = ПФ'( s )п0 + Д0 ( t * ), s < 0, (3.8)

где

ПФ(s) = G(s)B2, s < 0, (3.9)

2118

КАЛИНИН

а G(s), s < 0, есть (m х m)-матричная функция, являющаяся решением начальной задачи

йв/йэ = -ОАа , в( 0) = Ет. (3.10)

Предположение 4. Выполнено условие ПД^) Ф 0, s < 0.

Тогда, как видно из (3.7),

и*(э) = ПД(э)ПД(э)||, э < 0. (3.11)

Оптимальную траекторию, порожденную управлением ^(э), s < 0, обозначим через z*(s), s < 0.

Подчеркнем, что единственная информация о решении второй базовой задачи, которая используется в дальнейшем при построении асимптотически субоптимальных управлений, — это начальное значение % вектора сопряженных переменных. Нет необходимости строить оптимальное управление s < 0, что, впрочем, и невозможно, если задача решается численно.

Замечание. Во второй базовой задаче гамильтониан вдоль оптимального управления равен нулю. Воспользовавшись этим свойством при s = 0, получим условие, которому удовлетворяет вектор

В По + Д0 (и )|| = ||Д0( г* )||. (3.12)

После решения базовых задач находим вектор

Vо = По - (А2А-1 До (3.13)

и формируем матрицу

(

h =

Ci 0

n х m ^l C2 C3 C2

(3.14)

^ от о)

с размерами (п + m + 1) х (п + m + 1), блоки которой строятся по формулам

' * Фо (г )(||д о( г )|| Ч - До (г )До'(г ))Ф о (г)

Ci = Lo I -

0 0

0

IIA t )ll3

-dt,

C = -A ~iAC + L Г ПФ( s)( II ПА (s ) II 2 E - П A(s )ПА' (s ) ) (A A-1 ПФ ( s) + B, ) ' ^ 2 4 3 1 II ПА (s ) || 3 ,

0

ПФ( s )(||ПА( s )|| 2Er - nA(s )ПА'( s ))ПФ'( s)

C3 = L0 Г - ' V-/ v II - - - V" / II -r ^ I - v I / I - - I - / I - I - I I Ids,

J ||ПА( s )||3

t* 0

Ci = j Ф°А^А)Г£) dt = -p0( 0 )y */ L0, C2 = -A4-1A3 ci, C3 = F0 (0 )y *.

II А0 (t )||

Заметим, что матрицы C1, C3 симметрические и неотрицательные.

4. АСИМПТОТИЧЕСКИЙ АНАЛИЗ РЕШЕНИЯ ИСХОДНОЙ ЗАДАЧИ

Прежде чем продолжить изложение алгоритма построения асимптотически субоптимальных управлений, сформулируем и докажем теорему, которая позволяет установить вид и асимптотические свойства решения задачи (2.1), (2.2).

Обозначим через X, V, ц), t

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком