научная статья по теме РАЗРЕЖЕННАЯ ОБРАТНАЯ СВЯЗЬ В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ Автоматика. Вычислительная техника

Текст научной статьи на тему «РАЗРЕЖЕННАЯ ОБРАТНАЯ СВЯЗЬ В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ»

Автоматика и телемеханика, № 12, 2014

© 2014 г. Б.Т. ПОЛЯК, д-р техн. наук (boris@ipu.ru), М.В. ХЛЕБНИКОВ, д-р физ.-мат. наук (khlebnik@ipu.ru), П.С. ЩЕРБАКОВ, д-р физ.-мат. наук (sherba@ipu.ru) (Институт проблем управления им. В.А. Трапезникова РАН, Москва)

РАЗРЕЖЕННАЯ ОБРАТНАЯ СВЯЗЬ В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ

Рассматривается классическая задача синтеза стабилизирующей статической линейной обратной связи в линейной системе x = Ax + Bu при нестандартном ограничении, состоящим в том, чтобы вектор управления u = Kx имел возможно большее число нулевых компонент.

Предлагается простой подход к приближенному решению такого рода невыпуклых задач путем их овыпукления. В результате задача сводится к минимизации специальных матричных норм при ограничениях, имеющих вид линейных матричных неравенств.

Подход может быть распространен на многочисленные задачи робаст-ного и оптимального управления, допускающие "разреженную" переформулировку. Новым является не только решение, но и сама постановка задачи.

1. Введение

Идеи разреженности широко используются в обработке сигналов и изображений, распознавании образов и многих других областях. Одной из первых областей применения концепции разреженности является li-оптимизация, восходящая к работе [1] и в дальнейшем успешно развиваемая в различных направлениях, таких как compressed sensing1, ^-фильтрация и др. (см., например, [2-4]).

Математически задача сводится к минимизации числа ненулевых компонент вектора, определяемого так называемой 1о-(квази)нормой, при выпуклых ограничениях. Вместо этой трудной задачи обычно рассматривается результат ее овыпукления, получаемый при минимизации li-нормы. При этом, как правило, строгие оценки точности получающегося решения отсутствуют, однако его качество обычно достаточно высоко. Однако, насколько можно судить, идеи разреженности не нашли широкого применения в управлении; среди немногочисленных публикаций по построению разреженной обратной связи можно упомянуть [5, 6], в которых разреженная структура оговорена заранее; особое внимание в этих работах уделено оптимизационным алгоритмам.

1 К сожалению, удовлетворительного перевода термина "compressed sensing" на русский язык в настоящее время не существует. Наиболее часто употребительные варианты "опознание со сжатием", "сжатие измерений", "опознание" представляются неудовлетворительными и не отражающими специфику понятия. Поэтому авторы предпочли оставить в тексте оригинальное написание термина.

В данной работе развивается подход, связанный с минимизацией числа не ненулевых компонент вектора, а ненулевых строк или столбцов матрицы. Такие матрицы будем называть строчно-разреженными и столбцово-разре-женными соответственно; при этом будем говорить о разреженной обратной связи. При этом концепция разреженности используется для синтеза линейной обратной связи по состоянию или выходу в системах управления при нестандартных целочисленных критериях качества, таких как число ненулевых компонент вектора управления. Такие задачи являются трудными, их непосредственное решение приводит к комбинаторному перебору. Вместо этого можно воспользоваться овыпуклением задачи, основанным на использовании специальных матричных норм, и явным образом получить субоптимальное решение. Похожим образом можно переформулировать задачу синтеза статической линейной обратной связи по выходу, сведя ее к конструированию специального маломерного линейного выхода.

Прозрачная мотивация использования идей разреженности при синтезе управления предлагается так называемой C3-парадигмой. Она включает в себя триаду Control, Communication, Computation, компоненты которой анализируются с единой точки зрения [7-9]. В рамках этого подхода уменьшение числа задействуемых при построении управления состояний системы естественно трактовать как число сенсоров или измеряющих устройств, число используемых управлений связано с числом необходимых управляющих устройств, а уменьшение числа требуемых выходов системы эквивалентно минимизации количества информации, передаваемой по каналу управления.

Сенсоры Управляющие устройства Объект управления

Информация

Предлагаемый подход отличается простотой (исходные задачи сводятся к решению маломерных задач выпуклого программирования, а для их численного решения могут быть использованы стандартные средства, такие как среда Matlab), универсальностью (задачи в непрерывном и дискретном времени рассматриваются единообразно, подход распространим на построение линейной обратной связи как по состоянию, так и по выходу, на различные робастные постановки), а также распространимостью на различные задачи оптимального управления, такие как линейно-квадратичное управление, -оптимизация и др.

Насколько авторам известно, новым является не только предложенный метод решения рассматриваемых задач, но и сама их постановка. Предварительные результаты работы докладывались на конференциях [10, 11].

2. Специальные матричные нормы

Начнем с хорошо известной задачи минимизации так называемой векторной 1о-нормы

n

1|х||о = ^ | sign Xi\,

i= 1

являющейся суммой ненулевых компонент вектора х € Кп. Поскольку 1о-(квази)норма невыпукла, ее оптимизация сопряжена с большими трудностями; поэтому вместо нее часто используют векторную 11-норму.

Напомним классический результат, лежащий в основе 11-подхода к разреженной оптимизации.

Лемма 1. Если задача

где А € Мтхп, Ь € Мт, х € Мп, т < п, разрешима, то найдется ее 'решение х, имеющее не более т ненулевых компонент.

Соответственно, можно ожидать, что минимум 11-нормы на множестве, образованном выпуклыми ограничениями более общего вида, также будет хорошей аппроксимацией разреженного решения.

Чтобы сформулировать основной результат данного раздела — матричный аналог леммы 1 — введем специальные матричные нормы.

Пусть X € Мпхр; введем в рассмотрение следующие матричные нормы:

Эти нормы хорошо известны. Первая из них иногда называется гх-нормой или 11,^-нормой; ее основное применение — восстановление строчно-разре-женных решений матричных уравнений [12, 13]; аналогично, С1-норма восстанавливает столбцово-разреженные решения.

Теорема 1. Если задача

где А € Мтхп, т < п, В € Жтхр и X € Мпхр, разрешима, то найдется ее решение, имеющее не более т ненулевых строк.

Доказательство теоремы приведено в Приложении.

Теорема 1 может быть легко переформулирована и для случая С1-нормы.

Итак, минимизация Г1-нормы приводит к уменьшению Го-(квази)нормы; аналогичная ситуация имеет место и для столбцовых норм. В последующих разделах покажем, как систематическое использование Г1- или С1-норм (в зависимости от целей управления) приводит к требуемой разреженности матрицы регулятора.

Отметим, что обе введенные матричные нормы являются выпуклыми функциями относительно элементов матрицы и минимизация каждой из них (так называемые задачи п- или ¿^-оптимизации) при ограничениях в виде линейных матричных неравенств представляет собой стандартную задачу выпуклого программирования.

x\\\ —> min при ограничении Ax = b,

n

Р

\\X\\ri —> min при ограничении AX = B,

3. Синтез разреженных регуляторов

На примере задач, рассматриваемых в этом разделе, обсудим специфику развиваемого подхода, который позволяет регулярным образом строить разреженные регуляторы в гораздо более сложных ситуациях.

3.1. Уменьшение числа управлений Рассмотрим линейную систему в непрерывном времени

(1) х = Ах + Ви

с фазовым состоянием х € Мга и управлением и € Мт, так что А € Мгахга, В € € Мгахт, и пара (А, В) управляема. Задача состоит в синтезе разреженного стабилизирующего управления

и = Кх,

под которым понимается наличие у вектора управления нулевых компонент. Эта задача эквивалентна нахождению строчно-разреженной матрицы стабилизирующего регулятора К € Мтхга, т.е. имеющей некоторое количество нулевых строк.

Понятно, что за исключением вырожденных случаев управляемую систему всегда можно стабилизировать скалярным управлением. Соответственно, оптимальное решение может быть найдено обнулением всех строк матриц регулятора К, кроме одного. Это означает, что надо перебрать лишь т строк матрицы, а не их всевозможные комбинации. С другой стороны, подобный метод "грубой силы" применительно к рассматриваемым ниже задачам потребует полного комбинаторного перебора, тогда как предлагаемый подход гораздо более прост и весьма эффективен.

При синтезе обратной связи по состоянию будем следовать стандартному "ляпуновскому" подходу [14, 15]. А именно, матрица А + В К замкнутой системы устойчива тогда и только тогда, когда существует положительно-определенная матрица Q У 0 такая, что

(А + В К )ТQ + Q(A + В К) х 0.

Умножая матричное неравенство слева и справа на Р = Q-1, получим

АР + РАТ + ВКР + РКТВт х 0

и, введя новую переменную У = КР, придем к линейному матричному неравенству

(2) АР + РАТ + ВУ + УТВт х 0, Р У 0,

относительно матричных переменных Р = Рт € Мгахга и У € Мтхга. Тогда любой стабилизирующий регулятор для системы (1) дается выражением

К = гР-1,

где матрицы Р и К удовлетворяют (2).

Ясно, что если матрицу, содержащую нулевые строки, умножить справа на матрицу соответствующего размера, то эти же нулевые строки появятся и в результирующей матрице; иными словами, умножение справа сохраняет строчно-разреженную структуру матрицы. Поэтому, если решение Y линейного матричного неравенства (2) является строчно-разреженным, то и соответствующий регулятор К строчно-разрежен. В свою очередь, строчной разреженности матрицы Y можно добиться, минимизируя ее ri-норму.

Утверждение 1. Решение P и Y задачи выпуклого программирования

II Y ||Г1 —► min

при ограничениях

AP + PAT + BY + YTBT х 0, P У 0

относительно матричных переменных P = Pt € Rnxn и Y € Rmxn определяет строчно-разреженный стабилизирующий регулятор

Ksp = Y Y-1

для системы (1).

Утверждение 1 позволяет определить управления, стабилизирующие систему; эти управления определяются номерами ненулевых строк матрицы Ksp. При этом, вообще говоря, нельзя гарантировать, что получившееся решение обязательно окажется разреженным, однако ее наличие можно ожидать в силу теор

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком