научная статья по теме О СИНТЕЗЕ СУБОПТИМАЛЬНОЙ ПО БЫСТРОДЕЙСТВИЮ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ Автоматика. Вычислительная техника

Текст научной статьи на тему «О СИНТЕЗЕ СУБОПТИМАЛЬНОЙ ПО БЫСТРОДЕЙСТВИЮ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ»

Автоматика и телемеханика, № 5, 2015

© 2015 г. А.Е. ПОЛЯКОВ, канд. физ.-мат. наук (andrey.polyakov@inria.fr)

(Инриа, Лилль, Франция)

О СИНТЕЗЕ СУБОПТИМАЛЬНОЙ ПО БЫСТРОДЕЙСТВИЮ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ЛИНЕЙНЫХ МАТРИЧНЫХ НЕРАВЕНСТВ

Рассматривается задача оптимального быстродействия для объекта, описываемого цепочкой интеграторов. Субоптимальное решение, построенное на основе метода неявных функций Ляпунова, предлагается в виде непрерывного финитного регулятора с обратной связью по состоянию. Алгоритм оптимальной настройки параметров регулятора представлен в виде конечномерной задачи полуопределенного программирования. Сравнение субоптимального и оптимального решений на предмет робастности при практической реализации регулятора произведено на численном примере для двойного интегратора.

1. Введение

В практике управления нередко возникает необходимость разработать регулятор, который обеспечивает завершение переходного процесса за минимально возможное время. Соответствующую проблему принято называть задачей оптимального быстродействия. Она возникает в робототехнике, аэрокосмических приложениях, при управлении подводными и наземными мобильными системами. Несмотря на богатую историю теории оптимального управления, сформировавшиеся еще в 50-60-х гг. XX в. на основе работ А.А. Фельдбаума [1], Л.С. Понтрягина и др. [2], Р. Беллмана [3] задачи оптимального управления все еще остаются важными и актуальными темами исследований [4-7].

Алгоритм "разгон-торможение" ("bang-bang" control) является классическим разрывным решением задачи оптимального быстродействия, которое основано на теореме Фельдбаума об n интервалах [1]. Соответствующий закон управления традиционно реализуется алгоритмами программного управления (без обратной связи), за исключением случаев малой размерности, когда удается синтезировать оптимальный по быстродействию регулятор на скользящих режимах (см., например, [5, 6]). Между тем на практике качество алгоритма управления оценивается не только его быстродействием, но и другими критериями, которые отражают робастность и точность алгоритма, его энергетическую эффективность и пр. Указанные критерии часто противоречат друг другу, сводя проблему синтеза регулятора к весьма сложной задаче многокритериальной оптимизации. Наконец, разрывные оптимальные по быстродействию законы часто бывает невозможно реализовать ввиду физических особенностей системы [8, 9]. В связи с этим важное прикладное значение имеют субоптимальные регуляторы [10, 11]. Они синтезируются при дополнительных ограничениях на класс допустимых обратных связей (на-

пример, при условии робастности закона управления) и на другие (не всегда конструктивные) практические требования.

В настоящей статье рассматривается задача оптимального быстродействия для простейшего объекта, описываемого цепочкой интеграторов, который управляется посредством линейной динамической обратной связи по состоянию. Несмотря на линейную постановку задачи, синтез регулятора будет осуществляться на основе методов, которые больше известны в нелинейной теории управления. В частности, нелинейный неявный закон управления, который будет предложен в данной статье, делает замкнутую систему обобщенно однородной (weighted homogeneous) с отрицательным показателем [12-15], что позволяет гарантировать робастность и финитную устойчивость, т.е. достижение асимптотически устойчивой системой своего положения равновесия за конечное время. Кроме того, идеи обобщенной однородности лежат в основе метода неявных функций Ляпунова [16, 17], который в данной статье применяется для синтеза субоптимального регулятора. Этот метод предлагает использовать для анализа устойчивости функцию Ляпунова, которая определена неявно, например в виде алгебраического уравнения. Анализ устойчивости и оценка скорости сходимости, вообще говоря, не требуют отыскания решения этого уравнения, поскольку классическая теорема о неявной функции [18] позволяет проверить все необходимые условия теоремы Ляпунова, исследуя лишь свойства данного алгебраического уравнения и правых частей системы. В русскоязычных публикациях схожие идеи были предложены В.И. Коробовым [19] при построении "функции управляемости", которая, в сущности, является финитной функцией Ляпунова замкнутой системы.

Особенность сочетания метода неявных функций Ляпунова с теорией однородных систем состоит в том, что даже в случае существенно нелинейных обратных связей [17] алгоритмы их настройки параметров удается формализовать в виде линейных матричных неравенств [20, 21]. В настоящее время метод линейных матричных неравенств является одним из наиболее эффективных вычислительных подходов к синтезу линейных законов управления [20]. Этот метод позволяет существенно упростить построение H2/И^-ро-бастных регуляторов [21]. Многие другие проблемы теории управления [20] могут быть сведены к задаче полуопределенного программирования (Semi-Definite Programming), т.е. оптимизации функционала (обычно линейного) при линейных матричных ограничениях. В ряде работ, проводимых под руководством Б.Т. Поляка в последние годы, данный метод использовался для синтеза робастного управления, оптимально подавляющего внешние возмущения в линейной системе [21]. Развитие этих идей на случай нелинейных объектов управления можно найти в [22]. В данной статье синтез нелинейного субоптимального по быстродействию регулятора тоже сводится к решению задачи полуопределенного программирования.

Используемые обозначения: R+ = {x € R : x > 0}, R— — {x € R : x < 0}, где R - поле вещественных чисел; diag {Ai}n=i - диагональная матрица с элементами Лi на главной диагонали; непрерывная функция а : R+ — R+ принадлежит классу K, если она является монотонно возрастающей и a(s) — 0+ при s — 0+; если данная функция не ограничена при s — то говорят, что а принадлежит классу непрерывная функция в : R+ х R+ — R+ при-

надлежит классу KL, если ß(-,t) € при любом фиксированном t € R+, ß(s, ■) - монотонно убывающая функция при любом фиксированном s € R+; для матрицы P € Rnxn с вещественным спектром минимальное и максимальное собственные числа будем обозначать через Amin(P) и Amax(P) соответственно; для симметричной матрицы P € Rnxn неравенство P > 0 (P ^ 0, P < 0, P ^ 0) используется для обозначения положительной определенности (положительной полуопределенности, отрицательной определенности, отрицательной полуопределенности); Ck - пространство функций, непрерывно дифференцируемых до порядка к включительно; L - пространство функций, интегрируемых по Лебегу; L^ - пространство измеримых почти всюду ограниченных функций.

2. Постановка задачи

В статье исследуется объект управления с одним входом, который представляет собой цепочку из n интеграторов:

(1) X(t) = Ax(t) + bu(t), t € [0,T], x(0) = xo € Rn,

где T € R+ - конечный момент времени, x € Rn - вектор состояния, u € R -управляющий вход, A = ^ 0 ^q-1 ^, ^ = (0, • • •, 0,1)T € Rn. Важность исследования данной модели продиктована различными механическими и электромеханическими приложениями [5, 23, 24].

Рассмотрим задачу оптимального по быстродействию управления в классической постановке:

(2) T ^ min при ограничениях

u(') € U = (u(-) €L(o,t) : |u(t)| < Uo,t € [0,T]},

(3) Г x(t) = Ax(t) + bu(t), t € (0,T),

x(0 e c[0;T] ^ x(0) = x(T) =

где ж0 € Rn и u0 € R+ - заданы.

В соответствии с теоремой Фельдбаума [1] оптимальным решением данной задачи является так называемое "bang-bang" управление, которое представляет собой кусочно-постоянную функцию Uopt(t) € {—u0,u0}, t € (0, T), с n — 1 точками разрыва. Автора же будет интересовать решение задачи (2), (3) при некоторых дополнительных ограничениях. Во-первых, ограничиваем класс допустимых входных сигналов гладкими функциями u(-) € C^y). Данное ограничение является естественным во многих практических задачах [25, 26]. Часто данные условия необходимы для физической реализуемости закона управления [27]. Линейные законы управления могут быть синтезированы близко к оптимальным [11]. Поэтому дополнительно ограничимся классом гладких линейных динамических регуляторов по состоянию:

(4) u(-) = wT(>(-) eU, w = (wi,w2,...,wn) ' , Wi(-) e C0T).

Не менее важным моментом для практики является "робастификация" оптимальных регуляторов [5-7]. Это вынуждает разработчиков использовать алгоритмы управления по обратной связи. В данной статье автора будут интересовать непрерывные нелинейные робастные регуляторы с обратной связью по состоянию (и(£) = Uf (х(£)), £ > 0, Uf : Мп ^ М), которые глобально стабилизируют систему (1) в нуле при всех £ > 0 и, кроме того, являются допустимым решением задачи оптимизации (2)-(4). Субоптимальное решение задачи оптимального быстродействия (2)-(4) для заданного х0 € Мп будем искать в классе таких обратных связей.

Еще одним, вообще говоря, неконструктивным ограничением в рассматриваемой задаче станет необходимость разработки алгоритма синтеза субоптимального регулятора на основании метода линейных матричных неравенств. Данное требование может оказаться чуть ли не самым важным для практики управления, которая всегда ориентирована на поиск наиболее простых и эффективных способов настройки регулятора. Кроме того, это позволит свести бесконечномерную задачу оптимизации (2)-(4) к конечномерной.

Заметим, что задача оптимального быстродействия с терминальным состоянием х(Т) = Х1 := (£, 0,... , 0)т € Мп, £ = 0, очевидно, может быть сведена к задаче (2)-(4) заменой переменных Х = х — х1.

Задачу синтеза управления, удовлетворяющего условиям (3), принято называть задачей финитного управления. Задача такого рода традиционно рассматривается на конечном интервале времени, часто оставляя без внимания вопросы устойчивости и робастности, поскольку ее решением обычно является некоторый закон программного управления. В данной статье, напротив, автора будут интересовать финитные регуляторы, которые задают стабилизирующий закон управления по обратной связи, и, помимо асимптотической устойчивости замкнутой системы, гарантируют достижение положения равновесия за конечное время [28-32].

Рассмотрим задачу Коши для обыкновенно

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком