научная статья по теме ОБ ОДНОЙ ЗАДАЧЕ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА Автоматика. Вычислительная техника

Текст научной статьи на тему «ОБ ОДНОЙ ЗАДАЧЕ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА»

Автоматика и телемеханика, №11, 2011

© 2011 г. А.Д. МИЖИДОН, д-р техн. наук, (Восточно-сибирский государственный технологический университет, Улан-Удэ)

ОБ ОДНОЙ ЗАДАЧЕ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА1

Статья посвящена дальнейшему развитию методики аналитического конструирования оптимального регулятора на случай функционалов с подынтегральной функцией вида х'^х + х'Ри + и'Ки. При этом рассмотрены задачи аналитического конструирования как без возмущений, так и при постоянно действующих возмущениях. Приведена постановка задачи оптимального управления виброзащитной системой, для решения которой может быть использована изложенная в статье методика решения задачи аналитического конструирования оптимального регулятора.

1. Введение

Теория оптимального управления в настоящее время получила интенсивное развитие, охватив при этом широкий круг проблем прикладного характера. К числу таких проблем относится проблема аналитического конструирования оптимальных регуляторов (АКОР), поставленная в начале 1960-х гг. А.М. Летовым [1], получившая дальнейшее развитие в работах [2-6] и в ряде других. Практически одновременно с А.М. Летовым несколько иным способом были решены те же задачи Р. Кал-маном [7]. Большинство разработанных в настоящее время методов аналитического конструирования охватывают, главным образом, задачи управления, в которых отсутствуют внешние возмущения или предусматривается действие частных видов возмущений [6, 8, 9]. В частности, в [6] рассмотрена задача АКОР, в которой в качестве возмущений выступали ограниченные исчезающие на бесконечности функции. В [3] приведено решение задачи АКОР при постоянно действующих возмущениях в случае конечного интервала наблюдения. Обобщение АКОР для случая неограниченного интервала наблюдения при постоянно действующих возмущениях получено в [10].

В приведенных выше задачах АКОР в качестве критерия качества рассматривались в случае конечного интервала наблюдения функционал вида

J (и) = J (x'Qx + u'Ru)dt,

о

и в случае неограниченного интервала наблюдения функционал

сю

J (и) = (x'Qx + и' Ru)dt.

1 Работа выполнена при поддержке аналитической ведомственной целевой программы Министерства образования и науки Российской Федерации "Развитие научного потенциала высшей школы" (2009-2010 гг.), № 2.1.1/1533.

Выбор таких функционалов был обусловлен изначально поставленной задачей стабилизации, при решении которой регулятор должен обеспечить такое движение управляемого объекта, при котором отклонения объекта от некоторой программной траектории будут в каждый момент времени минимальными.

В приложениях можно встретить задачи проектирования технических устройств, в которых ограничения на фазовые переменные и управляющие воздействия носят совместный характер, т.е. зависят одновременно и от траектории, и от управления. В частности, такие ограничения могут иметь вид:

Р'х(г) + ч'иЦ) < к.

Учет таких ограничений может быть обеспечен путем введения в подынтегральное выражение целевого квадратичного функционала дополнительного слагаемого вида х'Ри. В [11, 12] в случае конечного интервала наблюдения и при отсутствии внешних возмущений была отмечена возможность сведения решения задач АКОР с такими дополнительными слагаемыми к решению эквивалентной задачи АКОР с традиционным квадратичным функционалом. В случае бесконечного интервала наблюдения при отсутствии внешних возмущений решение задачи АКОР с функционалом с подынтегральной функцией вида х'(х + х'Ри + и'Ки было получено с помощью аппарата функций Ляпунова [13]. В целом, судя по публикациям, до настоящего времени рассмотрению задач АКОР с такими функционалами не уделено должного внимания.

В данной работе рассматривается задача АКОР с квадратичным функционалом вида

сю

1 Г ' ' '

J{u) = / (х С^х + х Ри, + и Ии)&,

1

I

о

а при постоянно действующих возмущениях с функционалом

т

1

J{u) = Ит —— / (х С^х + х Ри + и Ии)&. т2Т ,]

о

2. Задача АКОР

Рассмотрим линейную систему с постоянными коэффициентами

(1) х = Ах + Ви,

где х — п-мерный вектор фазовых координат системы; и — г-мерный вектор управления; А — постоянная (п х п)-матрица; В — постоянная (п х г)-матрица.

Требуется определить управление и(х), доставляющее минимум функционалу

сю

1

1

(2) — I (х С^х + х Ри + и Ии)&.

о

Здесь ( — неотрицательно определенная постоянная (п х п)-матрица; Р — постоянная (п х г)-матрица; К — положительно определенная постоянная (г х г)-матрица.

Дополнительно матрицы Q, Р, К удовлетворяют требованию: матрица Ш, составленная из этих матриц

Ш

-Р' К \2

является положительно определенной.

Вначале рассмотрим задачу АКОР с конечным интервалом наблюдения. Требуется определить управление и(х), доставляющее минимум функционалу

т

1

1 Г ' ' '

(3) •/(■и) — I (х С^х + х Ри + и Ии)&,

2

о

где Т — заданный момент времени. Необходимое условие оптимальности управления для этой задачи следует из принципа максимума Понтрягина. Введем функцию Понтрягина

(4) Н = ф'(1)Ах + ф'(1)Ви - - ^х'Ри - ^и'Еи,

где ф(¿) — п-мерный вектор, удовлетворяющий сопряженной системе дифференциальных уравнений

(5) ф = —А'ф + д.т + ^ Ри

с условием на правом конце

(6) ф(Т ) = 0.

Согласно принципу максимума оптимальное управление должно доставлять функции Понтрягина (4) максимум. Так как на управления ограничения не наложены, то управление, доставляющее экстремум функции Н, найдем из условия

дн 1

(7) — = В'- -Р'х - Ей = 0.

У 7 ди к ' 2

Поскольку К — положительно определенная матрица, то ее обратная матрица существует. Таким образом, из системы (7) можем найти

(8) и*(г) = к^в'ф{1) - \к^Р'х.

Так как матрица вторых производных д2Н

ди2

является отрицательно определенной, то найденное управление (8) доставляет максимум функции Понтрягина (4). Будем искать ф(Ь) в виде

(9) ф(г) = -к (ъ)х,

где К(¿) — (п х п)-матрица, подлежащая определению.

С учетом (9) оптимальное управление (8) примет вид (10) и*{г) = - + ж.

Подставив управление (10) в исходную систему (1) и в сопряженную систему (5), получим:

(И) х = - В И'1 В'К - ^ВД^Р'

(12) -Кх - Кх = А'Кх + Ях - \р (^К~1В'К + ) ж. Далее подставив (11) в (12) и преобразовав, получим

(к + К А + А'К - КВН^В'К - - КВН^Р'-

(13) 1 1 \ 2

- ~рн~1в'к - -рд^р' + д ж = о.

2 4 ^)

Соотношение (13) должно выполняться при любом х, откуда следует, что матрица К(£) удовлетворяет матричному дифференциальному уравнению

К + К А + А! К - КВН~1В'К - -КВЕ^Р' -(14) 1 1 2

- -РН~1В'К - -РД^Р' + <3 = 0. 2 4

Сравнив выражение (9) с условием на правом конце (6) для функции ф(Ь), получим условие для матрицы К(¿)

(15) К (*)=0.

Нетрудно показать, что решение К(£) матричного дифференциального уравнения (14) с условием (15) является симметрической матрицей. Подсчитаем значение функционала

т

1

1

(16) J('u) = т^ / (х <5ж + ж Ри + и Ни)Л =

г

при оптимальном управлении (10) т

(17) <р*Ю = \! (х*'(т)С}х*(т) +х*'(т)Ри*(т) + и*'(т)Е:и*(т))(1т,

г

где х*(Ь) - некоторое решение системы (11) при оптимальном управлении (10).

Для этого, подставив управление (10) в (17), представим р*(£) следующим образом:

т ,

<РЧ*) = \ ¡х*\т) [д-р [к-1 В'к + ^р') +

4 ^

+ (Е-1 В'К + ^Е^Р'^ Я (иг1 В'К + ) Х*(т) (1,Т +

+ \ ! х*'{т) (-К - К А - А'К + КВН-1 В'К + ^ КВИ^Р' +

4

+\ря~1в'к + ^рн^р' - д^ х*(т) ¿г.

Здесь заметим, что второй интеграл, в силу (14), равен нулю. Преобразуем последнее выражение к виду т

(18) р*(Ь) =

—х*'(т)Кх*(т) +х*'(т)К ( -А + ВЕ-1В'К+-ВЕ-1Р') ж* (г) +

+ ж *'(т) ( -А' + К В В-1 В' + -РЕ-1 В' ) Кх*(т)

¿т.

Учитывая, что х*(£) - решение системы (11), произведем дальнейшие преобразования выражения (18):

(19) ¥>*(*) = ^ I —х*'(т)К(т)х*(т) — х*'(т)К(т)х* (т) — х*'(т)К(т)х* (т)

¿т =

т

1 Г с1

2

Таким образом, оптимальное значение критерия качества (16) определяется следующим образом:

т

(20) [?*(*) = ^ I (ж*'(г)дж*(г) +ж*'(т)Ри*(т)+и*'(т)11и*(т))<1т =

4

Так как матрицы таковы, что матрица

Ж =

'д V

V 2 \\р' Е

является положительно определенной, то функционал (16) при любом управлении и(Р) = 0 будет иметь положительные значения. Следовательно, в силу представления (19) решение К(£) матричного дифференциального уравнения (14) с условием (15) является симметричной, как было отмечено выше, и положительно определенной матрицей при всех £ € [0,Т].

Обозначим решение матричного дифференциального уравнения (14) с условием (15) так:

(21) К (t) = К (t,T).

Теорема 1. Если ранг матрицы [В, AB,..., Ап-1В] равен п:

(22) rank [В, AB,..., Ап-1В] = п,

(23) Ä = A-^BR-ip', а матрица

(24) Q = Q- jPR^P'

— неотрицательно определенная, то решение К(t, T) матричного дифференциального уравнения (14) с условием (15) имеет при T ^ ж предел

lim К(t,T) = К,

Т ^то

где К — постоянная, симметричная положительно определенная матрица, являющаяся 'решением матричного алгебраического уравнения Риккати

(25) К А + А! К - KBR^B'K - ^KBR^P' - ^PR^B'K - ^PR^P' + Q = 0, при этом система дифференциальных уравнений

(26) х = (А - BR^B'K - ^BR^P'^j х

является асимптотически устойчивой.

Доказательство. Представим матричное дифференциальное уравнение (14) в виде

(27) К + К (А - \BR-lP^j + - \pR-lB^j К - KBR^B'K +

+ Q--PR-1P' = 0. 4

Учитывая обозначения (22), (23) перепишем (26)

(28) К + К А + А К - КВР-1В 'К + Q = 0.

В силу того, что ранг матрицы (21) равен п, следует, что система х = Ах + Ви

является вполне управляемой. Калманом [8] было показано, что в этом случае решение матричного дифференциального уравнения Риккати (27) с условием (15) имеет при T ^ ж предел К, который является постоянной, симметричной положительно

определенной матрицей, являющейся решением матричного алгебраического уравнения Риккати

К А + А! К - КВЕ-1В'К + <5 = 0,

и при этом система

{А - ВЕ-1В'К

является асимптотически устойчивой. Теорема 1 доказана. Нетрудно показать, что управление

(29) и{х) = - (в-1 В'К + х

доставляет минимум функционалу (2) и при этом оптимальное значение функционала определяется выражением

./*(«*(•)) = ^х*'{0)Кх*{0).

Таким образом, можем полученные результаты представить в виде следующей теоремы.

Теорема 2. Если справедливы усло

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком