научная статья по теме СИНТЕЗ ОПТИМАЛЬНЫХ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАКОНОВ УПРАВЛЕНИЯ НА ОСНОВЕ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ Автоматика. Вычислительная техника

Текст научной статьи на тему «СИНТЕЗ ОПТИМАЛЬНЫХ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАКОНОВ УПРАВЛЕНИЯ НА ОСНОВЕ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ»

Автоматика и телемеханика, Л- 3, 2007

Детерминированные системы

PACS 02.30.Yy

© 2007 г. Д.В. БАЛАНДИН, д-р физ.-мат. наук (Нижегородский государственный университет им. H.H. Лобачевского), М.М. КОГАН, д-р физ.-мат. наук (Нижегородский государственный архитектурно-строительный университет)

СИНТЕЗ ОПТИМАЛЬНЫХ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАКОНОВ УПРАВЛЕНИЯ НА ОСНОВЕ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ1

Классические задачи построения оптимального по квадратичному критерию закона управления лилейным динамическим объектом в детерминированном и стохастическом случаях сводятся, как известно, к решению нелинейных матричных уравнений Риккати. Показано, как понятие #2-нормы передаточной матрицы системы позволяет формулировать и решать указанные задачи в терминах линейных матричных неравенств.

1. Введение

В XX в. оптималыюму управлению линейным динамическим объектом по квадратичному критерию качества было уделено, наверное, столько внимания, сколько ни одной другой теме в теории управления (см.. например. [1 3]). В частности, были сформулированы условия существования оптимальных законов управления как в детерминированном, так и в стохастическом случаях и получены формулы вычисления их параметров в терминах решений нелинейных матричных уравнений Риккати.

В рамках этого подхода наибольшую сложность представляет синтез оптимального линейно-квадратичного управления в случае неизмеряемого состояния объекта, когда для измерения доступен только вектор выходных переменных, имеющий меньшую размерность, чем вектор состояния. Особый интерес здесь вызывает синтез оптимальных регуляторов заданного порядка (в частности, стационарных регуляторов по выходу). Кроме того, как правило, рассматриваются только невырожденные задачи. когда весовая матрица управления в функционале является невырожденной, хотя это ограничение иногда выглядит искусственным.

В качестве альтернативы методу уравнений Риккати для синтеза оптимального линейно-квадратичного управления может быть применен метод линейных матричных неравенств. Линейные матричные неравенства уже нашли широкое применение в теории управления [4 6] в связи с появлением эффективных алгоритмов их

1 Работа выполнена ири финансовой поддержке Российского фонда фундаментальных исследований (проекты 04-01-00222 и 05-01-00123) и 1NTAS (проект 03-51-5547).

решения, реализованных в различных пакетах программ (например, Ма11аЬ). Применение линейных матричных неравенств для построения оптимальных линейно-квадратичных регуляторов основано на следующей идее.

Известно [7], что оптимальное линейно-квадратичное управление может трактоваться как Н2-оптимальное управление линейным объектом, на вход которого подается импульсное воздействие или белый шум. В свою очередь условие ограниченности Н2-нормы передаточной матрицы объекта может быть выражено в терминах линейных матричных неравенств. Основанный на этой идее синтез оптимальных статических регуляторов по выходу был рассмотрен в [8]. В общем случае синтез динамических регуляторов по выходу сводится к задаче иевыпуклой оптимизации, связанной с поиском двух взаимнообратных матриц, удовлетворяющих линейным матричным неравенствам. Для решения этой задачи были предложены различные алгоритмы [9 12], которые с разной степенью успешности находят требуемые матрицы.

В данной работе показано, что необходимые и достаточные условия существования оптимального линейно-квадратичного регулятора по состоянию или полного порядка по выходу, минимизирующего квадратичный функционал (в вырожденном и невырожденном случаях), и его параметры выражаются в терминах линейных матричных неравенств. Вводится понятие 7-оптимальных законов управления, при которых отношение значения квадратичного функционала к квадрату нормы начального состояния объекта не превышает заданное число 72 для любого начального состояния. Такие законы управления можно рассматривать как обеспечивающие гашение в заданном отношении 7 возмущений объекта, вызванных отклонением его начального состояния. Кроме того, показано, что синтез 7-оптимальных регуляторов пониженного порядка сводится к решению упомянутой выше задачи поиска двух взаимнообратных матриц, удовлетворяющих линейным матричным неравенствам, а синтез 7-оптимальных регуляторов по выходу полного порядка или по состоянию может быть осуществлен в терминах только линейных матричных неравенств. В случае, когда оптимальное линейно-квадратичное управление обеспечивает асимптотическую устойчивость замкнутой системы, оно с любой заданной степенью точности совпадает с 7-оптимадьным управлением при значении 7, сколь угодно близком к предельному минимальному значению.

2. Предварительные сведения: вычисление Нг-нормы передаточной матрицы

Введем пространство ЯЬ2 передаточных матриц Н(в), для которых выполняется

с

J Ьг [Нт(-]ш)Н(]ш)\ ¿ш < ж.

Н2

с \ I/2

(1) \\Н||2 = | 1 I Ьг [Нт(-3ш)Н(Зш)\ ¿ш

Пусть

Н(в) = С(в1 - А)-1 В. Рассмотрим управляемую, наблюдаемую и устойчивую систему X = Ах + Ву, х(0) = 0,

2)

^ = Сх,

где х € Еп% и € Еп^ и г € Яп*, реализующую эту передаточную матрицу в пространстве состояний. Напомним две интерпретации Н2-нормы, которые в последующем будут применяться для нахождения оптимального управления в детерминированном и стохастическом случаях (см.. например. [7]).

Сначала подадим па вход (2) последовательно импульсные сигналы и(1)(Ь) = = 6(Ь) вг, где 6(Ь) — импульсная функция, в^ — г-й столбец (пу х пу )-единичной матрицы, г = 1, 2,...,пу, и обозначим через г(г) соответствующий выход, а через ^ ^^^ ^^^^^^^^^^^^^жение. Как известно, Z(г)(3ы) = Н(3ы)вг. Применяя равенство Парсеваля, получим

с

21

НИ2 = 21П / ^ НТ(-^)Н3)] ды =

1 г 1

ос

5>ТНТ(-зи)Н(3и)в* ды =— J2zт(-3^М(3и) ды =

-ос 4=1 -оо г=1

п с

дЬ.

1

Н2

квадрата нормы выходов, соответствующих входным импульсным сигналам.

Так как г(г)(Ь) = СвмБви Ь > 0, то с учетом того, что гг(КТБК) = гг(БККТ) для произвольной матрицы К и произвольной симметрической матрицы получим

ос

(3) \\НУ2 = £ / вТБТвлТгСТСвмБвг дЬ =

г=1 о

пV с

= Ё 11 (вАТ'СТСвмБвгвТБТ) дЬ = г=1о

= 1^ СТСвА БвнвТБТ^ дЬ =

сс

= ! а (еАТ'СТСвмББТ) дь =

о

с

= ^ | БТ [ вА^СТСвА дЬБ I = ^ | С I вАТгББТвм дС

оо

Как известно, значения последних двух интегралов могут быть найдены как решения соответствующих уравнений Ляпунова, а именно: в предположении, что матрица А гурвицева, непосредственно проверяется, что матрица

с

Р = Р0 = ( вАТ'СТСвм дь

о

удовлетворяет уравнению (4) АТР + РА + СТС = 0,

а матрица

сс

P=ft=/ dt

о

удовлетворяет уравнению

(5) AP + PAT + BBT = 0.

Согласно лемме Ляпунова эти уравнения в рассматриваемом случае имеют единственные неотрицательно определенные решения, и тогда искомая H2-норма вычисляется одним из двух следующих образов:

(6) \\н 112 = tr (BTPoB),

где Po — решение уравнения (4), или

(7) \\н\2 = tr (CPrCT),

где Pr - решение уравнения (5).

Теперь подадим на вход системы (2) белый шум v единичной интенсивности, т.е. E[v(t)vT(t + т)] = S(t)I, и введем критерий

J = lim E\z(t)\2,

t—>с

E

J = lim E tr zzT

= lim tr E

t—>00

lim tr

t—>с

lim tr

t

j ^(t,T)v(t) dT J vT(a)<S>T(t,a) da

оо t

J Ф(^т) J E [v(t)vT(a)] ФT(t, a) da dT

оо t

J Ф(^т)ФT(t,T) dT

где Ф(£, v) V'B. Полагая теперь л = t — т и сравнивая с (3), получим

J = lim tr

t

C ^eA»BBTeAY» dC

tr

C J eA»BBTeA» d^C

\\н\\2.

Н2

матического ожидания квадрата модуля выхода линейной системы, когда на ее вход поступает белый шум.

Н2

ний линейных матричных неравенств.

t

t

t

Теорема 1. Пусть в объекте (2) матрица A гурвицева. Тогда следующие утверждения эквивалентны:

(a) \\H||2 <7;

(b) существуют такие матрицы X = XT > 0 и S = ST, что fo\ ( ATX + XA XB N n ( X CT N _ WCA

(8) btx )<0 [c s )>0 tr(S) <y ;

(c) существуют такие матрицы Y = YT > 0 и R = RT, что

ta\ ( AY + YAT YCT N - ( Y B N

(9) CY -yi )<0 \BT r)> 0 tr(R) <Y'

Доказательство. Пункт (а) эквивалентен тому, что выполнено неравенство tr (BTPoB) < 72, где Po — решение уравнения (4). Так как это уравнение имеет единственное решение, то это эквивалентно существованию X = XT > 0 такой, что

(10) ATX + XA + CTC< 0, tr (BTXB) <72. Действительно, рассмотрим уравнение

ATX + XA + CT C + £2I = 0,

которое имеет единственное решение X > Po. Отсюда следует, что tr (BTPoB) < < tr (BTXB) < 72. С другой стороны, если tr (BTPoB) < 72, то найдется такое е, что tr (BTXB) < y2.

Возьмем теперь в (10) X = Y-1, умножим первое из неравенств слева и справа YR

YAT + AY + YCTCY < 0, BTY-1B < R, tr R<72.

Заменяя в этих неравенствах Y на 7-1Y и R на yr и не меняя обозначений, с учетом леммы Шура [13] получим (с). Эквивалентность пунктов (Ь) и (с) следует из принципа двойственности и того, что \\H\\2 = \\НТ\\2.

В заключение этого раздела приведем так называемую лемму исключения (elimination lemma [14]), которая в дальнейшем будет использоваться для получения конструктивных условий разрешимости линейных матричных неравенств определенного вида.

Лемма. Пусть заданы симметрическая матрица Ф и две матрицы P и Q с нетривиальными нуль-пространствами. Линейное матричное неравенство

(И) Ф + PТ©ТQ + QT6P < 0

разрешимо относительно матрицы © тогда и только тогда, когда выполнены следующие два неравенства:

(12) WT^WP < 0, w^wq < 0,

в которых WP и Wq - матрицы, столбцы которых составляют базисы нуль-PQ

3. 7-°птимальные регуляторы по состоянию

Рассмотрим задачу 7-оптимального управления объектом

х = Ах + Ви, х(0) = хп.

(13) и' ^ ; я = Сх + Ви

в случае измеряемого состояния, состоящую в нахождении стабилизирующего управления вида

(14) и = Ох.

которое для заданного значения -у > 0 обеспечивает выполнение неравенства

с

(15) J = J\z(t)\2 dt<Y2\xo\2, Ухо = 0.

Этот закон управления можно рассматривать как обеспечивающий гашение в заданном отношении y возмущений объекта, вызванных отклонением его начального состояния.

Заметим, что оптимальное линейно-квадратичное управление объектом (13), ми-

J

Y-оптимадьным управлением при значении y, сколь угодно близком к предельному минимальному значению y в (15)- Так, в случае CTD = 0 DTD > 0 и при условии, что пара (A, B) стабилизируема, а пара

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком