научная статья по теме УНИВЕРСАЛЬНЫЕ РЕГУЛЯТОРЫ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ЭТАЛОННОЙ МОДЕЛЬЮ ПРИ НЕИЗВЕСТНЫХ ВНЕШНИХ СИГНАЛАХ Кибернетика

Текст научной статьи на тему «УНИВЕРСАЛЬНЫЕ РЕГУЛЯТОРЫ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ЭТАЛОННОЙ МОДЕЛЬЮ ПРИ НЕИЗВЕСТНЫХ ВНЕШНИХ СИГНАЛАХ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2012, № 2, с. 49-62

ОПТИМАЛЬНОЕ ^^^^^^^^^^^^^^ УПРАВЛЕНИЕ

УДК 517.97+519.71+51-74

УНИВЕРСАЛЬНЫЕ РЕГУЛЯТОРЫ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ЭТАЛОННОЙ МОДЕЛЬЮ ПРИ НЕИЗВЕСТНЫХ

ВНЕШНИХ СИГНАЛАХ* © 2012 г. А. В. Проскурников, В. А. Якубович

Санкт-Петербург, Санкт-Петербургский государственный ун-т Поступила в редакцию 17.02.11 г., после доработки 22.11.11 г.

Изучаются линейно-квадратичные задачи оптимального управления с эталонной моделью при неизвестных внешних сигналах и наличии помех в объекте управления. Доказывается, что при естественных предположениях для двух практически значимых классов внешних сигналов (стохастических с неизвестной быстро убывающей спектральной плотностью и полигармонических с известным спектром, но неизвестными амплитудами) существуют регуляторы, которые универсальны в том смысле, что при любом сигнале из указанного класса порождают оптимальный или приближенно оптимальный процесс в задаче. Показывается, что среди таких регуляторов есть линейные, и полностью описывается класс линейных универсальных регуляторов.

Введение. Проблема построения обратной связи, которая обеспечивает соответствие системы управления заданной эталонной модели (в англоязычной литературе — model matching problem), — одна из важнейших задач теории управления. Различные постановки задач синтеза систем управления с эталонной моделью и подходы к их решению в специальных случаях могут быть найдены в [1—5] и др. Наиболее изучен линейный вариант задачи при отсутствии неизвестных возмущений и ограничений на управление: для заданного линейного объекта построить регулятор, обеспечивающий близость установившегося выхода замкнутой системы к выходу модели. Известно (см. [6] и лемму 1 ниже), что для существования такого регулятора необходимо условие, близкое к минимальной фазовости объекта.

На практике указанные необходимые условия часто не выполнены. Кроме того, как правило, необходимо учитывать наличие неизвестных возмущений в объекте управления. В этом случае естественна оптимизационная постановка задачи о соответствии модели, при этом целевой функционал должен "штрафовать" отклонение выхода системы управления от эталонного, а также рост внутренних переменных системы. Наличие в системе неизвестных параметров или неизвестных сигналов приводит к тому, что множество оптимальных процессов не может быть найдено явно. Как правило, при решении задач с неопределенными параметрами применяются либо минимаксные подходы [7, 8], в том числе Дш-оптимизация [9], либо методы стохастической оптимизации [10, 11], берущие начало в работе Винера и Хопфа [12]. При первом подходе ищется регулятор, который оптимизирует "наихудшее" возможное значение функционала в некотором классе внешних сигналов. При втором подходе неизвестные сигналы считаются случайными функциями с известными спектральными характеристиками, и оптимизируется ожидаемое значение функционала. Недостатком обоих подходов является то обстоятельство, что оптимизация функционала гарантируется только при "наихудших" сигналах либо в среднем.

В данной работе рассматривается иной подход к решению задач оптимизации в условиях неопределенности, связанный с понятием универсального регулятора [13—15]. Именно для некоторых практически значимых классов внешних сигналов (например, полигармонических с известным спектром) удается построить регулятор, который порождает оптимальный (или приближенно оптимальный с заданной точностью) процесс в задаче при любых сигналах из данного класса, решая таким образом одновременно бесконечное семейство оптимизационных задач. Это свойство регулятора — оптимальность порождаемого процесса при любом внешнем сигнале — и подчеркивается термином "универсальный".

* Работа выполнена при финансовой поддержке РФФИ (гранты № 09-01-00245; 11-08-01218) и ФЦП "Научные и научно-педагогические кадры инновационной России" на 2009—2013 годы (контракт 16.740.11.0042).

Отметим, что, по-видимому, впервые термин "универсальный регулятор" в указанном смысле был употреблен Г.В. Щипановым [16] применительно к закону обратной связи, обеспечивающему "полную компенсацию возмущений". В современной терминологии данную цель управления принято называть инвариантностью выхода системы управления от внешнего возмущения либо иных неизвестных параметров системы. С историей развития теории инвариантности и ее современным состоянием можно ознакомиться, например, в [13, 17—22] (см. также библиографию в указанных источниках). Близкий смысл к понятию универсального регулятора имеют также распространенные в теории управления термины "робастный регулятор" (закон управления, обеспечивающий достижение цели управления при изменении неизвестных параметров системы в некоторых пределах) и "адаптивный регулятор", подразумевающий, как правило, что регулятор содержит некоторый вспомогательный контур оценки неизвестных параметров.

В настоящей работе изучается вопрос о существовании оптимальных универсальных регуляторов для двух важных классов внешних сигналов: полигармонических с известным спектром и стохастических с неизвестной быстро убывающей спектральной плотностью. Доказывается, и это основной результат работы, что при ряде естественных условий оптимальные универсальные регуляторы существуют, более того, среди них имеются линейные стабилизирующие регуляторы. Класс линейных универсальных регуляторов удается охарактеризовать полностью.

1. Точная формулировка рассматриваемых задач. Всюду ниже объект управления описывается уравнениями

dx(f> = Ax(t) + Bu(t) + F^t) + Fww(t) при t > 0,

(1.1)

dt

z(t) = Czx(t) + Dzu(t).

Здесь x(t) e R", u(t) e Rm, ф(0 e R' — состояние системы, управление и внешний задающий сигнал, w(t) е Rd — неизвестное внешнее возмущение. Вещественные матрицы A, B, Cz, Dz, F^, Fw соответствующих размеров заданы. Сигналы ф(?), w(t) заранее неизвестны, причем возмущение w(t) недоступно для измерения. Выход системы z(t) е Rк должен быть близок (в смысле, уточняемом ниже) к выходу zm(t) системы, называемой эталонной моделью:

A" (7) ^ = Fm 7) ^ (1-2)

Здесь Am(X) — гурвицев (k x ^-матричный полином (det Am(X) Ф 0 при ReX > 0), Fm(X) — матричный полином размера k x l.

Наиболее изучена линейная задача управления с эталонной моделью следующего вида: возмущение в объекте (1.1) отсутствует (Fw = 0), требуется построить линейный регулятор вида

D(p)u(t) = C(p)x(t) + ОЩ}\ (1.3)

который стабилизирует замкнутую систему и обеспечивает при любом задающем сигнале ф(-) асимптотическое соответствие выхода z(t) выходу эталонной модели zm(t):

Um(z(t) - Zm(t)) = 0. (1.4)

t ^

В (1.3) по определению имеем p = 7, D, C, G — матричные полиномы размеров m x m, m x n, m x l

соответственно. Как обычно, регулятор (1.3) называется стабилизирующим, если det D Ф 0 и при ReX > 0 имеем det Е(Х) ^ 0, где

ЕМ =

(1.5)

'XI„ - А -В ' _ -С(Х) Б(Х)_

(иными словами, Е(Х) — гурвицев матричный полином). Вводя в рассмотрение передаточную функцию замкнутой системы (1.1), (1.3) от ф к у, можно, как нетрудно видеть, сформулировать задачу в альтернативной форме: построить стабилизирующий регулятор (1.3), обеспечивающий выполнение соотношения

Жу/„(Х) = Жт(Х), УХ 6 С. (1.6)

Ниже в разд. 2 приводится полная характеристика класса регуляторов (1.3), решающих задачу об асимптотическом соответствии модели. Данное описание обобщает результаты [6] на случай объекта, описываемого уравнениями в пространстве состояний (1.1). Подчеркнем, что в общем случае для разрешимости задачи помимо сделанного предположения об отсутствии возмущений = 0) необходимо также выполнение условия, близкого к минимальной фазовости объекта (1.1).

Наибольший интерес представляет случай, когда указанные условия разрешимости задачи не выполнены либо когда требуется ограничить рост переменных системы. Тогда естественно рассмотреть задачу оптимального управления с подходящим целевым функционалом. Применительно к задаче о соответствии модели целевой функционал должен, очевидно, штрафовать ошибку отслеживания е(?) = г(?) - 2т(?), а также, при необходимости, рост переменных состояния и управления х(?), и(?). Ниже будем изучать задачу с функционалом квадратичного типа

т

ф[х(-), «(•)] = ит 1 [о - Zm(t))*R(z(t) - ги(0) + и(?))]]. (1.7)

т I •>

Здесь 0(х, и) = х*с@х + 2х*gu + и*Ги — квадратичная форма переменных х е Ки е Ы.т (матрицы Щ = Щ*, Г = Г* и g соответствующих размеров заданы) и Я = Я* — матрица размера к х к. Символ * здесь, как и всюду ниже в статье, обозначает транспонирование для вещественных и эрмитово сопряжение (транспонирование с комплексным сопряжением) для комплексных матриц.

Первое слагаемое в (1.7) штрафует отклонение выхода системы z(t) от выхода модели, второе — рост переменных управления и состояния сстемы (1.1). Такой функционал представляется естественным в случае, когда внешние сигналы ограничены, но не затухают с течением времени. Отметим, что при Я = 0 (уравнение модели не играет роли) функционал Ф соответствует цели оптимального подавления колебаний. В случае модели специального вида 1т(?) = ф(?) функционал (1.7) соответствует задаче оптимального отслеживания задающего сигнала. Как правило, Я > 0 и 0(х, и) = и* Г и, где Г > 0 — заданная матрица.

Очевидно, что как оптимальное значение функционала, так и множество оптимальных решений х(), и(-) зависят от неизвестных сигналов ф, w и найдены явно быть не могут. Вместе с тем для некоторых практически значимых классов внешних сигналов (например, полигармонических с известным спектром) удается построить регулятор, который оптимален и универсален в том смысле, что порождает оптимальный (или субоптимальный) процесс в задаче при любых сигналах из данного класса.

Ниже в разд. 3 и 4 изучается вопрос о существовании оптимальных универсальных регуляторов для двух важных классов внешних сигналов: полигармонических с известным спектром и стохастических с неизвестной быстро убывающей спектральной плотностью. Доказывается, что при естественных предположениях универсальные оптимальные (либо субоптимальные) регуляторы существуют, более того, среди них есть лин

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком