научная статья по теме ОПТИМИЗАЦИЯ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ ПО ИНТЕГРАЛЬНО-ЛОГАРИФМИЧЕСКОМУ ПОКАЗАТЕЛЮ Автоматика. Вычислительная техника

Текст научной статьи на тему «ОПТИМИЗАЦИЯ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ ПО ИНТЕГРАЛЬНО-ЛОГАРИФМИЧЕСКОМУ ПОКАЗАТЕЛЮ»

Автоматика и телемеханика, № 12, 2014

Линейные системы

© 2014 г. А.Л. БУНИЧ, д-р техн. наук (alexbunich@mail.ry) (Институт проблем управления им. В.А. Трапезникова РАН, Москва)

ОПТИМИЗАЦИЯ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ ПО ИНТЕГРАЛЬНО-ЛОГАРИФМИЧЕСКОМУ ПОКАЗАТЕЛЮ

Поставлена и решена задача синтеза линейной дискретной системы по критерию дифференциальной энтропии на единицу времени стабилизируемой переменной в установившемся режиме. Установлена независимость оптимального регулятора от спектрального состава возмущений. Для объекта с фиксированной передаточной функцией по управлению построено полное семейство оптимальных регуляторов в классе стабилизирующих обратных связей.

1. Введение

Линейно-квадратичная гауссовская задача для дискретного стационарного объекта подробно изучена. Эффективная реализация ее решения методом факторизации (методом Винера-Хопфа [1, 2]) и запросы приложений стимулировали исследования более общих задач для не полностью определенных объектов.

Синтез оптимального (винеровского) регулятора предполагает регулярность возмущения априорно заданного спектрального состава [3, с. 67], что эквивалентно заданию физически реализуемого фильтра (предфильтра), порождающего возмущение из белошумного процесса. Обращение предфильтра (отбеливание возмущения) сводит синтез регулятора к аффинной оптимизации в пространстве Харди Н2, и решение (передаточная функция винеров-ского регулятора) для возмущений с рациональной спектральной плотностью определяется аналитически.

Задача синтеза существенно усложняется в условиях неполной информации о возмущении. Ее решение методом подстановки, состоящим в замене неизвестной спектральной плотности ее эмпирической оценкой, требует обоснования, включая проверку регулярности, исследование чувствительности обращенного предфильтра к ошибкам оценивания спектральной плотности и возможность реализации решения в классе регуляторов не очень высокого порядка.

Последнее важное для практической реализации условие не связано с предположением регулярности и даже с существованием спектральной плотности возмущения. Например, для полигармонических возмущений с апри-

орно заданным спектром система с нулевой стоимостью управления определяется элементарными средствами (на основе "принципа поглощения" [4]). В классе же возмущений с абсолютно непрерывным спектром регулярность представляет редкое (в категорном смысле) свойство: спектральные плотности регулярных процессов образуют в классе всех спектральных плотностей множество первой категории Бэра [5]. С другой стороны, "бедный" класс регулярных возмущений слишком широк для реализации регулятора, что вынуждает использовать рациональные аппроксимации спектральной плотности.

Радикальный способ устранения трудностей предоставляет теория Нте-оп-тимального управления [6]. Однако минимаксный подход к задаче синтеза регулятора преувеличивает неопределенность описания возмущений и приводит к консервативным результатам, что демонстрируется вырожденными задачами (с нулевой ценой управления [5]). Модификация стандартной задачи синтеза Нте-оптимального регулятора введением в критерий частотно-зависимых множителей (весовых функций, учитывающих доступную проектировщику информацию) осложнена не только высокими порядками расчетных регуляторов, но и отсутствием формализованной процедуры выбора частотных множителей, означающим на практике неоднозначность решения. Видимо, высокая доля в действующих системах, вопреки рекомендациям теории, эвристически построенных регуляторов малых порядков подтверждает неадекватность моделей возмущений в традиционных методиках.

Тем не менее манипуляции критерием стоимости (переход от квадратичных к равномерно-частотным показателям, модификация критерия введением весовых функций, комбинированный Н2/Нподход) и отказ от типичной для выпуклых задач единственности решения расширяют возможности проектировщика по сравнению с "банком стандартных моделей" [7], представленным в основном типовыми задачами аффинной оптимизации (интерес к невыпуклым задачам [8] не нашел отражения в методиках синтеза линейных систем). Неединственность решения позволяет учитывать дополнительные требования к проектируемой системе, отброшенные в формальной постановке задачи синтеза с целью ее упрощения.

Обозначим через Шу передаточную функцию (п.ф.) от возмущения V к выходу у в системе с регулятором К € К, где К - класс допустимых (стабилизирующих) регуляторов, отождествляемых со своими п.ф. В установившемся режиме выход представляет стационарный процесс у со спектральной плотностью ву = рз^. Стоимость управления определим показателем

п

(1) 3(К,вь) = У я(8у) ¿А, К €К,

—п

где непрерывная монотонная функция потерь д : (0, то) — (-то, то) удовлетворяет условию сходимости интеграла (1) независимо от спектральной плотности регулярного возмущения.

Выбор функции потерь, обобщающий случай винеровского регулятора (.д(з) = §.), предоставляет проектировщику возможность регулировать чувствительность решений экстремальной задачи 3(К,ву) — к вариаци-

ям плотности ву. Рассматривая ву как мультипликативную неопределенность в соотношении ву = |Шу |2ву, реализуем инвариантность регулятора к спектральному составу возмущения выбором д(в) = 1п в. Принимая без ограничения общности возмущение белошумным, получаем задачу оптимизации системы управления по интегрально-логарифмическому показателю:

п

(2) (2п)—1 [ 1п |2 (1\ — М

.] ж ем'

где М = + Ь Э, Э - кольцо устойчивых (без полюсов в замкнутом единичном диске) рациональных функций (д.р.ф.) над полем действительных чисел, - п.ф. от возмущения к выходу для системы с некоторым фиксированным допустимым регулятором. Каждому решению Шу задачи (2) однозначно соответствует вторая п.ф. Ши, которая однозначно определяется соотношением аШу — ЬШи = 1 и п.ф. оптимального регулятора К = Ши Ш-1.

Величину 1(К) = (2п)—1 /—п 1п|Шу|2^Л, однозначно определенную выбором К € К, назовем ^-показателем системы управления.

Информационная интерпретация ^-показателя состоит в следующем. Обозначим через Ну, дифференциальные энтропии на единицу времени процессов у и V соответственно. Напомним, что для гауссовских процессов эти характеристики определяются логарифмическими интегралами от их спектральных плотностей [9, с. 51]. Тогда Ну — = I(К), т.е. ^-показатель представляет приращение дифференциальной энтропии возмущения при его преобразовании V — у системой управления. Этот показатель не зависит от возмущения и характеризует неопределенность, обусловленную самой системой. Установлено, что ^-показатель неотрицателен, причем его нулевое значение достигается для оптимальных и только таких регуляторов. Из формулы Се-ге [10] для дисперсии ошибки оптимального линейного прогноза на такт вперед вытекает, что оптимальность системы по ^-показателю означает наилучшую предсказуемость выхода по его значениям в прошлом.

Необходимо отметить, что информационная интерпретация ^-показателя корректна лишь для регулярных возмущений, в то время как постановка (2) задачи синтеза (оптимизация системы по ^-показателю) не требует принятия гипотез о формировании возмущений.

Интегрально-логарифмические показатели имеют давнюю предысторию, восходящую к идее Винера и Леви о сведении факторизации спектральной плотности к сепарации ее логарифма: в терминах логарифмических интегралов формулируется критерий регулярности процессов максимального ранга, определение средней на единицу времени анизотропии случайной последовательности [11].

Оптимизация по ^-показателю разительно отличается от стандартных методик, прежде всего, существенной неединственностью решения. Например, ^-оптимальны любые допустимые дискретные ПИД-регуляторы. Отметим, что аналитические теории, рекомендующие сложные (высоких порядков) регуляторы, не могут объяснить факт широкого распространения "эвристических" ПИД-регуляторов в промышленности [12].

—п

Статья построена следующим образом. В разделе 2 приводятся определения класса объектов, возмущений, допустимых стратегий и стоимости управления. Примеры оптимальных систем, демонстрирующие существенную неоднозначность решения задачи синтеза, приведены в разделе 3. Условия разрешимости и критерий оптимальности допустимого регулятора приведены в разделах 4 и 5. Доказательства вспомогательных утверждений вынесены в Приложение.

2. Критерий стоимости управления

Ограничимся простейшей задачей синтеза для скалярного объекта с измеряемой без помех стабилизируемой переменной. Объект с дискретным временем Ь описывается уравнением

(3) а (V) уг = Ь (V) щ + Vt, Ь = 0,1,...,

где а (V), Ь (V) - известные взаимно простые полиномы от оператора сдвига на такт назад по времени V (а(0) = 1, Ь(0) = 0), все переменные (стабилизируемый выход у, управление и и неизмеряемое возмущение V) скалярные. Возмущение V = представляет регулярный гауссовский стационар-

ный процесс Evt = 0, Ev2 = 1, где Е - математическое ожидание. Далее для сокращения используется одинаковое обозначение Q для заданного семейства таких процессов и семейства их спектральных плотностей.

Класс К допустимых регуляторов образован линейными обратными связями

(4) а (V) иг = в (V) уг, а(0) = 1,

стабилизирующими объект (3) без ограничения на порядки полиномов а(*), в(*).

Фиксируем некоторый регулятор К € К (здесь и далее регулятор отождествляется со своей п.ф.). Установившаяся реакция системы у на возмущение V € Q представляет регулярный гауссовский процесс с дифференциальной энтропией на единицу времени

п

(5, ^М^ + М-'/ь.,« *

_п

(интеграл в правой части (5) сходится в силу включений К € К, V € Q). Определенное в (5) отображение К х Q — Я1 назовем функционалом стоимости управления, а нижнюю границу стоимости т£к е к Л,у (К, ) - ценой управления. Если для некоторого регулятора К € К стоимость управления совпадает с ценой, то регулятор К называется оптимальным (логарифмическая функция потерь обеспечивает независимость свойства оптимальности регулятора от V € Q).

Представляет интерес сравнение интегрально-логарифмического и интег-рально-квадратического показателя ^ = /_п ву ^А.

В силу вогнутости логарифмическо

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком