Автоматика и телемеханика, №11, 2011
© 2011 г. А.Д. МИЖИДОН, д-р техн. наук, (Восточно-сибирский государственный технологический университет, Улан-Удэ)
ОБ ОДНОЙ ЗАДАЧЕ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА1
Статья посвящена дальнейшему развитию методики аналитического конструирования оптимального регулятора на случай функционалов с подынтегральной функцией вида х'^х + х'Ри + и'Ки. При этом рассмотрены задачи аналитического конструирования как без возмущений, так и при постоянно действующих возмущениях. Приведена постановка задачи оптимального управления виброзащитной системой, для решения которой может быть использована изложенная в статье методика решения задачи аналитического конструирования оптимального регулятора.
1. Введение
Теория оптимального управления в настоящее время получила интенсивное развитие, охватив при этом широкий круг проблем прикладного характера. К числу таких проблем относится проблема аналитического конструирования оптимальных регуляторов (АКОР), поставленная в начале 1960-х гг. А.М. Летовым [1], получившая дальнейшее развитие в работах [2-6] и в ряде других. Практически одновременно с А.М. Летовым несколько иным способом были решены те же задачи Р. Кал-маном [7]. Большинство разработанных в настоящее время методов аналитического конструирования охватывают, главным образом, задачи управления, в которых отсутствуют внешние возмущения или предусматривается действие частных видов возмущений [6, 8, 9]. В частности, в [6] рассмотрена задача АКОР, в которой в качестве возмущений выступали ограниченные исчезающие на бесконечности функции. В [3] приведено решение задачи АКОР при постоянно действующих возмущениях в случае конечного интервала наблюдения. Обобщение АКОР для случая неограниченного интервала наблюдения при постоянно действующих возмущениях получено в [10].
В приведенных выше задачах АКОР в качестве критерия качества рассматривались в случае конечного интервала наблюдения функционал вида
J (и) = J (x'Qx + u'Ru)dt,
о
и в случае неограниченного интервала наблюдения функционал
сю
J (и) = (x'Qx + и' Ru)dt.
1 Работа выполнена при поддержке аналитической ведомственной целевой программы Министерства образования и науки Российской Федерации "Развитие научного потенциала высшей школы" (2009-2010 гг.), № 2.1.1/1533.
Выбор таких функционалов был обусловлен изначально поставленной задачей стабилизации, при решении которой регулятор должен обеспечить такое движение управляемого объекта, при котором отклонения объекта от некоторой программной траектории будут в каждый момент времени минимальными.
В приложениях можно встретить задачи проектирования технических устройств, в которых ограничения на фазовые переменные и управляющие воздействия носят совместный характер, т.е. зависят одновременно и от траектории, и от управления. В частности, такие ограничения могут иметь вид:
Р'х(г) + ч'иЦ) < к.
Учет таких ограничений может быть обеспечен путем введения в подынтегральное выражение целевого квадратичного функционала дополнительного слагаемого вида х'Ри. В [11, 12] в случае конечного интервала наблюдения и при отсутствии внешних возмущений была отмечена возможность сведения решения задач АКОР с такими дополнительными слагаемыми к решению эквивалентной задачи АКОР с традиционным квадратичным функционалом. В случае бесконечного интервала наблюдения при отсутствии внешних возмущений решение задачи АКОР с функционалом с подынтегральной функцией вида х'(х + х'Ри + и'Ки было получено с помощью аппарата функций Ляпунова [13]. В целом, судя по публикациям, до настоящего времени рассмотрению задач АКОР с такими функционалами не уделено должного внимания.
В данной работе рассматривается задача АКОР с квадратичным функционалом вида
сю
1 Г ' ' '
J{u) = / (х С^х + х Ри, + и Ии)&,
1
I
о
а при постоянно действующих возмущениях с функционалом
т
1
J{u) = Ит —— / (х С^х + х Ри + и Ии)&. т2Т ,]
о
2. Задача АКОР
Рассмотрим линейную систему с постоянными коэффициентами
(1) х = Ах + Ви,
где х — п-мерный вектор фазовых координат системы; и — г-мерный вектор управления; А — постоянная (п х п)-матрица; В — постоянная (п х г)-матрица.
Требуется определить управление и(х), доставляющее минимум функционалу
сю
1
1
(2) — I (х С^х + х Ри + и Ии)&.
о
Здесь ( — неотрицательно определенная постоянная (п х п)-матрица; Р — постоянная (п х г)-матрица; К — положительно определенная постоянная (г х г)-матрица.
Дополнительно матрицы Q, Р, К удовлетворяют требованию: матрица Ш, составленная из этих матриц
Ш
-Р' К \2
является положительно определенной.
Вначале рассмотрим задачу АКОР с конечным интервалом наблюдения. Требуется определить управление и(х), доставляющее минимум функционалу
т
1
1 Г ' ' '
(3) •/(■и) — I (х С^х + х Ри + и Ии)&,
2
о
где Т — заданный момент времени. Необходимое условие оптимальности управления для этой задачи следует из принципа максимума Понтрягина. Введем функцию Понтрягина
(4) Н = ф'(1)Ах + ф'(1)Ви - - ^х'Ри - ^и'Еи,
где ф(¿) — п-мерный вектор, удовлетворяющий сопряженной системе дифференциальных уравнений
(5) ф = —А'ф + д.т + ^ Ри
с условием на правом конце
(6) ф(Т ) = 0.
Согласно принципу максимума оптимальное управление должно доставлять функции Понтрягина (4) максимум. Так как на управления ограничения не наложены, то управление, доставляющее экстремум функции Н, найдем из условия
дн 1
(7) — = В'- -Р'х - Ей = 0.
У 7 ди к ' 2
Поскольку К — положительно определенная матрица, то ее обратная матрица существует. Таким образом, из системы (7) можем найти
(8) и*(г) = к^в'ф{1) - \к^Р'х.
Так как матрица вторых производных д2Н
ди2
-К
является отрицательно определенной, то найденное управление (8) доставляет максимум функции Понтрягина (4). Будем искать ф(Ь) в виде
(9) ф(г) = -к (ъ)х,
где К(¿) — (п х п)-матрица, подлежащая определению.
С учетом (9) оптимальное управление (8) примет вид (10) и*{г) = - + ж.
Подставив управление (10) в исходную систему (1) и в сопряженную систему (5), получим:
(И) х = - В И'1 В'К - ^ВД^Р'
(12) -Кх - Кх = А'Кх + Ях - \р (^К~1В'К + ) ж. Далее подставив (11) в (12) и преобразовав, получим
(к + К А + А'К - КВН^В'К - - КВН^Р'-
(13) 1 1 \ 2
- ~рн~1в'к - -рд^р' + д ж = о.
2 4 ^)
Соотношение (13) должно выполняться при любом х, откуда следует, что матрица К(£) удовлетворяет матричному дифференциальному уравнению
К + К А + А! К - КВН~1В'К - -КВЕ^Р' -(14) 1 1 2
- -РН~1В'К - -РД^Р' + <3 = 0. 2 4
Сравнив выражение (9) с условием на правом конце (6) для функции ф(Ь), получим условие для матрицы К(¿)
(15) К (*)=0.
Нетрудно показать, что решение К(£) матричного дифференциального уравнения (14) с условием (15) является симметрической матрицей. Подсчитаем значение функционала
т
1
1
(16) J('u) = т^ / (х <5ж + ж Ри + и Ни)Л =
г
при оптимальном управлении (10) т
(17) <р*Ю = \! (х*'(т)С}х*(т) +х*'(т)Ри*(т) + и*'(т)Е:и*(т))(1т,
г
где х*(Ь) - некоторое решение системы (11) при оптимальном управлении (10).
Для этого, подставив управление (10) в (17), представим р*(£) следующим образом:
т ,
<РЧ*) = \ ¡х*\т) [д-р [к-1 В'к + ^р') +
4 ^
+ (Е-1 В'К + ^Е^Р'^ Я (иг1 В'К + ) Х*(т) (1,Т +
+ \ ! х*'{т) (-К - К А - А'К + КВН-1 В'К + ^ КВИ^Р' +
4
+\ря~1в'к + ^рн^р' - д^ х*(т) ¿г.
Здесь заметим, что второй интеграл, в силу (14), равен нулю. Преобразуем последнее выражение к виду т
(18) р*(Ь) =
—х*'(т)Кх*(т) +х*'(т)К ( -А + ВЕ-1В'К+-ВЕ-1Р') ж* (г) +
+ ж *'(т) ( -А' + К В В-1 В' + -РЕ-1 В' ) Кх*(т)
¿т.
Учитывая, что х*(£) - решение системы (11), произведем дальнейшие преобразования выражения (18):
(19) ¥>*(*) = ^ I —х*'(т)К(т)х*(т) — х*'(т)К(т)х* (т) — х*'(т)К(т)х* (т)
¿т =
т
1 Г с1
2
Таким образом, оптимальное значение критерия качества (16) определяется следующим образом:
т
(20) [?*(*) = ^ I (ж*'(г)дж*(г) +ж*'(т)Ри*(т)+и*'(т)11и*(т))<1т =
4
Так как матрицы таковы, что матрица
Ж =
'д V
V 2 \\р' Е
является положительно определенной, то функционал (16) при любом управлении и(Р) = 0 будет иметь положительные значения. Следовательно, в силу представления (19) решение К(£) матричного дифференциального уравнения (14) с условием (15) является симметричной, как было отмечено выше, и положительно определенной матрицей при всех £ € [0,Т].
Обозначим решение матричного дифференциального уравнения (14) с условием (15) так:
(21) К (t) = К (t,T).
Теорема 1. Если ранг матрицы [В, AB,..., Ап-1В] равен п:
(22) rank [В, AB,..., Ап-1В] = п,
(23) Ä = A-^BR-ip', а матрица
(24) Q = Q- jPR^P'
— неотрицательно определенная, то решение К(t, T) матричного дифференциального уравнения (14) с условием (15) имеет при T ^ ж предел
lim К(t,T) = К,
Т ^то
где К — постоянная, симметричная положительно определенная матрица, являющаяся 'решением матричного алгебраического уравнения Риккати
(25) К А + А! К - KBR^B'K - ^KBR^P' - ^PR^B'K - ^PR^P' + Q = 0, при этом система дифференциальных уравнений
(26) х = (А - BR^B'K - ^BR^P'^j х
является асимптотически устойчивой.
Доказательство. Представим матричное дифференциальное уравнение (14) в виде
(27) К + К (А - \BR-lP^j + - \pR-lB^j К - KBR^B'K +
+ Q--PR-1P' = 0. 4
Учитывая обозначения (22), (23) перепишем (26)
(28) К + К А + А К - КВР-1В 'К + Q = 0.
В силу того, что ранг матрицы (21) равен п, следует, что система х = Ах + Ви
является вполне управляемой. Калманом [8] было показано, что в этом случае решение матричного дифференциального уравнения Риккати (27) с условием (15) имеет при T ^ ж предел К, который является постоянной, симметричной положительно
определенной матрицей, являющейся решением матричного алгебраического уравнения Риккати
К А + А! К - КВЕ-1В'К + <5 = 0,
и при этом система
{А - ВЕ-1В'К
является асимптотически устойчивой. Теорема 1 доказана. Нетрудно показать, что управление
(29) и{х) = - (в-1 В'К + х
доставляет минимум функционалу (2) и при этом оптимальное значение функционала определяется выражением
./*(«*(•)) = ^х*'{0)Кх*{0).
Таким образом, можем полученные результаты представить в виде следующей теоремы.
Теорема 2. Если справедливы усло
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.