научная статья по теме ПРИМЕНЕНИЕ МЕТОДА ВОЗМУЩЕНИЙ К ЗАДАЧЕ МИНИМИЗАЦИИ ИНТЕГРАЛЬНОГО КВАДРАТИЧНОГО ФУНКЦИОНАЛА НА ТРАЕКТОРИЯХ КВАЗИЛИНЕЙНОЙ СИСТЕМЫ Кибернетика

Текст научной статьи на тему «ПРИМЕНЕНИЕ МЕТОДА ВОЗМУЩЕНИЙ К ЗАДАЧЕ МИНИМИЗАЦИИ ИНТЕГРАЛЬНОГО КВАДРАТИЧНОГО ФУНКЦИОНАЛА НА ТРАЕКТОРИЯХ КВАЗИЛИНЕЙНОЙ СИСТЕМЫ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2014, № 2, с. 3-12

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

УДК 517.977

ПРИМЕНЕНИЕ МЕТОДА ВОЗМУЩЕНИЙ К ЗАДАЧЕ МИНИМИЗАЦИИ ИНТЕГРАЛЬНОГО КВАДРАТИЧНОГО ФУНКЦИОНАЛА НА ТРАЕКТОРИЯХ КВАЗИЛИНЕЙНОЙ СИСТЕМЫ

© 2014 г. А. И. Калинин, Л. И. Лавринович

Белоруссия, Минск, Белорусский государственный ун-т Поступила в редакцию 13.03.13 г., после доработки 14.11.13 г.

Рассматривается задача оптимизации переходного процесса в квазилинейной системе (содержащей малый параметр при нелинейностях), которая состоит в нахождении допустимого управления с минимальным значением интегрального квадратичного критерия качества. Строятся асимптотические приближения к оптимальному программному управлению и оптимальной обратной связи в этой задаче. Вычисления сводятся к решению невозмущенной линейно-квадратичной задачи, интегрированию систем линейных дифференциальных уравнений, а также к нахождению корней линейных алгебраических систем.

DOI: 10.7868/S0002338814020115

Введение. Многие прикладные задачи оптимизации динамических систем в своих математических моделях содержат малые параметры, причем зачастую модели существенно упрощаются, если эти параметры положить равными нулю. В таких случаях целесообразно использовать асимптотические методы, основное достоинство которых состоит в том, что при их применении исходные задачи, которые принято называть возмущенными, сводятся к коррекции решений более простых задач оптимального управления. В частности, это относится к задачам оптимизации квазилинейных систем, содержащих малые параметры при нелинейностях. Такие задачи в различных постановках исследовались многими авторами (см., например, [1—6]). Выигрыш от применения к ним асимптотических методов состоит, прежде всего, в том, что вместо исходных по существу нелинейных задач решаются задачи оптимального управления линейными системами.

В статье рассматривается задача минимизации интегрального квадратичного функционала на траекториях квазилинейной системы с закрепленным правым концом. Ее можно трактовать как задачу управления с минимальными энергетическими затратами. Целью работы является построение асимптотических приближений к решению рассмотренной задачи в виде программы и обратной связи. Применяемый подход к исследованию — модификация методики, предложенной в [6]. Суть модификации состоит в асимптотическом разложении по целым степеням малого параметра начальных значений сопряженных переменных — конечномерных элементов, по которым можно легко восстановить решение задачи.

1. Постановка задачи. В классе r-мерных управляющих воздействий u(t) = (u1(t), ..., ur(t)), t e T= = [t*, t*], с кусочно-непрерывными компонентами рассмотрим следующую задачу оптимального управления:

x = A (t)x + fx, t) + B( t) u, x( t*) = x*, (1.1)

t*

x (t *) = 0, J( u) = 1 j(xTQ (t)x + uTP( t) u )dtmin, (1.2)

t*

где ц — малый (по модулю) параметр, t*, t* — заданные моменты времени (t* < t*), х — я-вектор,

f (х, t), х e R", t e T, — нелинейная вектор-функция, Q(t) — неотрицательно-определенная симметрическая матрица, а P(t) — положительно-определенная симметрическая матрица для всех t e T. В дальнейшем для определенности будем считать управления непрерывными справа в любой момент времени.

Предположение 1. Элементы матриц Аф, Вф, 6(0, АО, д/(х, 0/дх, х е В", I е Т, принадлежат классу Ср, р > 1.

Управление и(1, ц), I е Т, с кусочно-непрерывными компонентами принято называть допустимым, если для порожденной им траектории х^, ц), I е Т, системы (1.1) выполняется условие х(^~, ц) = 0. Допустимое управление, минимизирующее функционал /(и), называют оптимальным. Наряду с этими общеупотребительными понятиями определим то, что будет пониматься под асимптотическими приближениями к решению рассматриваемой задачи.

Определение 1. Управление и(М)^, ц), I е Т, с кусочно-непрерывными компонентами назовем (программным) асимптотически субоптимальным управлением ^-го порядка N = 0, 1, 2, ...) в задаче (1.1), (1.2), если оно переводит систему (1.1) в состояние о(ц^) и отклоняется по критерию качества /(и) от оптимального управления на величину того же порядка малости.

Определение 2. Вектор-функцию и(М)(х, I, ц) назовем асимптотически субоптимальной обратной связью ^-го порядка, если для любого начального состояния (х,, I,), < I*, имеет место и(М)(х^, I,, ц) = и(ЛГ)(^, ц), где и(М)(1, ц), I е Т, — асимптотически субоптимальное управление ^-го порядка в задаче (1.1), (1.2).

В статье предлагается алгоритм, с помощью которого для заданного числа N N<р) можно построить асимптотически субоптимальное управление ^го порядка в рассматриваемой задаче. Алгоритм опирается на конструктивное доказательство теоремы о существовании при сделанных далее предположениях гладкого оптимального управления и его асимптотических свойствах. Его суть состоит в построении полиномов Тейлора начальных значений сопряженных переменных, которые в силу принципа максимума [7] соответствуют оптимальному управлению. Эти начальные значения как функции малого параметра принадлежат классу Ср. В работе также показывается, как можно построить асимптотически субоптимальные обратные связи нулевого и первого порядков.

2. Базовая задача. Вычисления при построении асимптотически субоптимальных управлений начинаются с решения базовой задачи, которая формально получается из исходной при ц = 0 и в отличие от нее является задачей оптимизации линейной системы.

Предположение 2. Базовая задача имеет решение, которое является нормальной экстремалью.

Последнее означает, что принцип максимума [7] в данном случае может быть сформулирован следующим образом: пусть и°(0, х°(0, I е Т, — оптимальные управление и траектория в базовой задаче, тогда существует такое решение у0(0, I е Т, сопряженной системы

у = - АТ ( г)у + О ( г) х° ( г),

что выполняется условие

у°Т( г) В( г) и0 (г) - 1 / ( г) Р( г) и0 (г) = шахГу°Т ( г) В( г) и - - ЫТ Р( г) и), г е Т.

2 и е Д 2

Из этого условия непосредственно следует и°(г) = Р1 (г)Вт(г)у°(г), г е Т.

Предположение 3. Оптимальному управлению в базовой задаче соответствует в силу сформулированного принципа максимума единственный вектор сопряженных переменных.

Пусть V,) = у0(?*), тогда х°(0, у0(0, I е Т, есть решение следующей начальной задачи:

X = А(г)х + В(г)Р \г)Вт(г)у(г), х(г*) = х*, у = О(г)х(г) -Ат(г)у, у(г*) = v°.

Введем в рассмотрение фундаментальную матрицу Е^, I,!.), I е Т, системы (2.1) как решение начальной задачи

Р = А(г)Р, Р(г*) = Е1п,

в которой

(

А (I) =

А(I) В( I) Р 1 (I) ВТ (I)

^ е (о -ат( ?) ;

Разобьем матрицу Рна блоки размеров п х п: Р =

( \ Р11 Р12

^ Р21 Р22 '

Привлекая для записи решения начальной задачи (2.1) в момент времени 1* фундаментальную матрицу, получим

Р11 (I*, I*)х* + Р12(?*, I*)vo = х0(I*) = 0. (2.2)

Вектор V,) однозначно определяется из системы (2.2) при условии невырожденности матрицы Р12(1*, Следовательно, предположение 3 эквивалентно требованию

ёе1Ри(?*, I*) ф 0. (2.3)

3. Асимптотический анализ решения исходной задачи. Говорить об асимптотически субоптимальных управлениях можно лишь в том случае, когда исходная задача имеет решение. Убедимся, что при сделанных предположениях в задаче (1.1), (1.2) с достаточно малым ^ существует оптимальное управление. Доказательство будет конструктивным и предопределит дальнейшие вычисления при построении асимптотически субоптимальных управлений. Рассмотрим начальную задачу

х = А(I)х + цДх, I) + В(I)Р \I)Вт(, х(I*) = х*,

( ы Л т (3.1)

V = е(?)х(I) - (А(I) + цдХ(х, <)) у,у(I*) = V,

в которой 1 е Т. В силу теоремы о дифференцируемости решений обыкновенных дифференциальных уравнений по начальным данным и параметрам [8] и предположений 1, 2, существуют такие положительные числа е0, ц0, что задача (3.1) имеет единственное решение х(1, V, ц), V, ц), 1 е Т, принадлежащее классу О, если только — V,)) < е0, |ц| < ц0.

Те о р е м а. При выполнении предположений 1—3 в задаче (1.1), (1.2) с достаточно малым (по модулю) ц существует единственное оптимальное управление, которое представимо в виде

и0(I, ц) = Р1 (I)Вт(?МI, V(ц), ц), I е Т. (3.2)

Начальное значение v(ц) вектора сопряженных переменных удовлетворяет уравнению

х (г *, V, ц) = о, (3.3)

причем v(ц) е С, v(0) = V,.

Доказательство. Введем в рассмотрение вектор-функцию Я(у, ц) = х(1*, V, ц), что позволяет записать систему (3.3) в виде

Я^, ц) = 0. (3.4)

С помощью теоремы о неявной функции убедимся, что эта система уравнений однозначно разрешима относительно V при достаточно малых ц. Прежде всего, заметим, что вектор-функция Я^, ц), определенная в области IV — V,!! < е0, |ц| < ц0, принадлежит классу С. Поскольку х(1, V,, 0) = = х0(1), 1 е Т, то 0) = х0(1*) = 0. Привлекая для записи решения задачи (3.1) при ц = 0 фундаментальную матрицу, а затем дифференцируя, получаем дЛ(у0, 0)/5У = Р12(?*/^). В предыдущем

разделе было показано, что при выполнении предположения 3 эта матрица Якоби будет невырожденной. Таким образом, для системы (3.4) или, что то же самое, (3.3) выполнены условия тео-

ремы о неявной функции. Согласно этой теореме, в некоторой окрестности нуля |ц| < ц1 однозначно определена вектор-функция v(ц) из класса Ср, удовлетворяющая уравнению (3.3) и условию v(0) = V,.

Рассмотрим управление (3.2). Оно будет допустимым в исходной задаче, поскольку для порожденной им траектории х0^, ц) = х^, v(ц), ц), I е Т, системы (1.1) выполняется условие х(^~, ц) = 0. Вместе с тем это управление удовлетворяет принципу максимума [7] с вектором сопряженных переменных у0(?, ц) = у^, v(ц), ц), I е Т. Заметим, что управление (3.2) является нормальной экстремалью.

Покажем, что экстремаль и0^, ц), I е Т, будет единственным оптимальным управлением в задаче (1.1), (1.2), если ц достаточно мало. Предположим противное, тогда существует такая последовательность цк —»- 0, что управление и0^, цк), I е Т, к = 1, 2, ..., либо не является оптимальным в исходной задаче с ц = цк, либо существует другое оптимальное управление. Поскольку установлено, что в задаче (1.1), (1.2) с достаточно малым ц существует допустимое управление, то эта задача имеет решение в классе и

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком