научная статья по теме МОДЕЛИРОВАНИЕ СИСТЕМЫ СУБОПТИМАЛЬНОГО РОБАСТНОГО СЛЕЖЕНИЯ ПРИ НЕИЗВЕСТНЫХ ВЕРХНИХ ГРАНИЦАХ ВНЕШНИХ И ОПЕРАТОРНЫХ ВОЗМУЩЕНИЙ Автоматика. Вычислительная техника

Текст научной статьи на тему «МОДЕЛИРОВАНИЕ СИСТЕМЫ СУБОПТИМАЛЬНОГО РОБАСТНОГО СЛЕЖЕНИЯ ПРИ НЕИЗВЕСТНЫХ ВЕРХНИХ ГРАНИЦАХ ВНЕШНИХ И ОПЕРАТОРНЫХ ВОЗМУЩЕНИЙ»

Автоматика и телемеханика, № 5, 2014

Робастные и адаптивные системы

© 2014 г. В.Ф. СОКОЛОВ, д-р физ.-мат. наук (vicsokol@gmail.com) (Коми научный центр УрО РАН, Сыктывкар)

МОДЕЛИРОВАНИЕ СИСТЕМЫ СУБОПТИМАЛЬНОГО РОБАСТНОГО СЛЕЖЕНИЯ ПРИ НЕИЗВЕСТНЫХ ВЕРХНИХ ГРАНИЦАХ ВНЕШНИХ И ОПЕРАТОРНЫХ ВОЗМУЩЕНИЙ1

Исследуется задача субоптимального робастного слежения для объекта управления с дискретным временем при неизвестных верхних границах возмущений. Передаточная функция номинальной модели управляемого объекта предполагается известной, а верхние границы внешнего возмущения, помехи измерений и операторных возмущений по выходу и управлению предполагаются неизвестными. Приводятся и анализируются результаты численного моделирования алгоритма субоптимального робастного слежения, базирующегося на ослабленной верификации оценок верхних границ в замкнутом контуре и использовании соответствующего такой верификации показателя качества задачи слежения в качестве идентификационного критерия. Результаты численного моделирования иллюстрируют эффективность предлагаемого метода синтеза управления.

1. Введение

Начальный период развития теории робастного управления пришелся на 1980-е гг. В 1992 г. в Санта-Барбаре (США) состоялся важный семинар, собравший ведущих мировых специалистов двух смежных научных областей: робастного управления и идентификации систем [1]. На семинаре было признано, что две основные проблемы, затрудняющие применение результатов теории робастного управления к реальным задачам управления, заключаются в построении модели номинального объекта и определении верхних границ возмущений и неопределенностей по данным измерений. Причиной этих проблем было то, что возмущения и неопределенности в различных вариантах теории робастного управления предполагаются детерминированными и не обладающими никакими статистическими характеристиками, в то время как результаты теории идентификации систем относились к системам с внешними возмущениями, но без неопределенностей, и опирались на предположения о стохастических свойствах возмущений. Указанные проблемы были основополагающими для продолжающихся до настоящего времени активных исследований в области идентификации для робастного управления [2, 3].

1 Работа выполнена при поддержке программы фундаментальных исследований УрО РАН (проект №12-П-1-1013).

Подходы к идентификации систем, не использующие априорных предположений о стохастической природе возмущений и неопределенностей, получили англоязычные названия set membership approach и worst-case identification. Именно такие подходы соответствуют природе теории робастного управления, имеющей дело с детерминированными неопределенностями и возмущениями. Для систем без неопределенностей и с известными верхними границами возмущений такие подходы задолго до начала 1990-х гг. разрабатывались и применялись в СССР в задачах адаптивного управления [4, 5] и в задачах управления с гарантированным результатом [6, 7]. Однако задачи оценивания верхних границ возмущений по данным измерений в рамках названных выше подходов как правило рассматривались вне контекста задач синтеза робастного управления. В опубликованном в 2006 г. обзоре [8] отмечалось, что "деятельность по оцениванию верхних границ возмущений по данным измерений зачастую ошибочно относилась к области идентификации для управления, поскольку цель управления в большинстве случаев не учитывалась при идентификации".

В [9, 10] был предложен общий подход к синтезу адаптивного субоптимального управления, основанный на использовании показателя качества задачи управления в качестве идентификационного критерия. Этот подход предусматривает построение множественных оценок неизвестных параметров системы, согласованных с данными измерений, и минимизацию показателя качества на этих множественных оценках для вычисления текущих точечных оценок, используемых для построения управления. Порождаемые этим подходом оптимальные задачи в общем случае являются слишком сложными как с теоретической, так и с вычислительной точек зрения, и интерес представляет поиск задач, допускающих эффективные численные решения. Одной из таких задач оказывается рассматриваемая в этой статье задача робаст-ного слежения для линейного дискретного объекта управления с известной номинальной моделью и неизвестными верхними границами операторных и внешних возмущений.

Для наглядного описания этой задачи рассмотрим следующий пример. Предположим, что динамика некоторого реального объекта управления описывается моделью с дискретным временем

( ) y(t) - 2,876y(t - 1) + 3,1165y(t - 2) - 1,355y(t - 3) =

= 2u(t - 2) + 0,5u(t - 1) + v(t),

где полиномы

a(A) = 1 - 2,876A + 3,1165A2 - 1,355A3, b(A) = 2A2 + 0,5A3

характеризуют номинальную модель объекта управления. Пусть априорная информация об объекте и его номинальной модели состоит в том, что в суммарном возмущении v(t) в уравнении модели должны учитываться неопределенность (т.е. возможная неточность самой номинальной модели) и ограниченное внешнее возмущение. Измерению доступен выход z(t) = y(t) + w(t) c ограниченной помехой измерений w(t). Цель управления заключается в минимизации ошибки слежения |z(t) - r| для заданного значения выхода r = 100.

7 - Г 20

-20

0г1000

Рис. 1. Ошибка слежения £ — г в системе с 1\-оптимальным регулятором.

Пусть для управления объектом выбран 1\-оптимальный регулятор [11, 12], минимизирующий наихудшую ошибку слежения для модели с ограниченным возмущением V(£) без учета неопределенности и без помехи измерений. График ошибки слежения £ (г) — г в замкнутой системе с -оптимальным регулятором на промежутке времени [0,1000] представлен на рис. 1.

Спрашивается, насколько хорош используемый 1\-оптимальный регулятор и можно ли предложить лучший регулятор слежения, основываясь на данных измерений, если информация о верхних границах возмущений и неопределенности недостаточна или слишком груба для априорной оценки качества слежения и выбора регулятора? Ответ на эти вопросы в рамках теории ро-бастного управления невозможен без оценивания верхних границ всех возмущений по данным измерений.

Теоретические ответы на поставленные выше вопросы даны в статье [13], содержащей формальное описание и строгое обоснование в рамках 1\-теории робастного управления [14-16] алгоритма синтеза субоптимального робаст-ного регулятора слежения при неизвестных верхних границах всех возмущений. Цель настоящей статьи заключается в демонстрации работоспособности и эффективности этого алгоритма посредством численного моделирования. В разделах 5 и 6 также иллюстрируются и обсуждаются достоинства алгоритма, проявляющиеся при численном моделировании, но не поддающиеся строгому математическому обоснованию. Для облегчения понимания алгоритм излагается в данной статье в более наглядной форме, проясняющей все основные идеи его построения.

2. Модель объекта управления и ее верификация

Пусть поведение объекта управления моделируется уравнениями

(2) а(д-1 )у (г) = д ^ Ъ(д-1 )«(*) + V (*),

(3) £ (г) = у (г) + т(г), г = 0,1,2,...,

где вещественные числа у(г),£(г),и(£)^(£),ш(£) обозначают соответственно неизмеряемый и измеряемый выходы объекта, управление, возмущение в объекте и помеху измерений в момент времени г. Взаимно простые полиномы от оператора сдвига назад д-1 (д-1 ж(£) := ж(£ — 1))

а(д-1) = 1 + «1 д-1 + ... + ап д-п,

Ъ(д-1) = Ьо + &1 д-1 + ... + ът д-т, Ьо = 0,

и запаздывание в управлении d (d ^ 1) характеризуют номинальную модель и предполагаются известными. Суммарное возмущение v в модели (2) имеет вид

(4) v := w + SyAiy + ¿„A2U,

где w - неизвестное внешнее возмущение, удовлетворяющее ограничению

(5) ||w|| := sup |w(t)| ^ Sw,

t

и Ai , A2 - неизвестные нормализованные операторные возмущения, удовлетворяющие ограничениям

(6) |(Aiy)(t)| < py(t) := tmax<t |y(s)|, |(A2u)(t)| < Pu(t) := t max<t |u(s)|.

Параметр ^ в неравенствах (6) характеризует память операторных возмущений и выбирается заранее исходя из доступной априорной информации, при этом он может быть выбран сколь угодно большим без ущерба для гарантируемого качества слежения (ограничение сверху на ^ диктуется необходимостью хранить в памяти ^ предыдущих значений измеряемых выходов и управлений). Неизвестные неотрицательные числа Sw, Sy и Su характеризуют соответственно верхнюю границу внешнего возмущения w и верхние границы (коэффициенты усиления) операторных возмущений SyAi и SuA2. Неизвестная помеха измерений m € удовлетворяет ограничению

(7) ||m|| := sup |m(t)| ^ Sm

t

с неизвестной верхней границей Sm.

Для оценки качества слежения и настройки регулятора по данным измерений необходимо в замкнутом контуре получать оценки верхних границ всех возмущений. Для этого будет использоваться следующий тест верификации верхних границ, основанный на включении помехи измерений в состав внешнего возмущения. Заменив в уравнении (2) неизмеряемый выход y(t) его представлением y(t) = z(t) - w(t) в силу (3) и используя неравенства

|a(q-1)m(t)| ^ Sm||a||, ||a|| := + ^ |afc| j , Py(t) ^ Pz(t) + Sm, Pz(t) := max |z(s)|,

t—^s<t

и ограничения (5)-(7), получаем

|a(q—1)z(t) - q—db(q—1)u(t)| < Sw + Sm||a|| + Sy (pz (t) + Sm) + SuPu(t). Введя обозначение

Se := Sw + Sm|a| + Sy Sm,

приходим в неравенствам

(8) КГ1)^) - 9-<*Ь(д-1)и(*)| < бе + 5уРг(*) + б«р«(*). Именно информация о модифицированном наборе верхних границ

б = (бе, бу, б«),

заключенная в неравенствах (8), будет использоваться для оценки качества модели и настройки субоптимального регулятора в замкнутом контуре. Неприемлемая вычислительная сложность и теоретическая некорректность задачи "неущербной" верификации верхних границ возмущений в модели (2)—(7), а также консерватизм, вносимый в оценку качества модели тестом ослабленной верификации в форме (8), подробно обсуждались в [13, 17].

Пусть г(*) - известный задающий сигнал, т.е. желаемый выход объекта управления. Управление объектом осуществляется регулятором К вида

(9) К : а*(д-1)-и(*) = &(9-1)г(*) + 7(9-1М* + * = 0,1, 2,...,

где 7(Л) = +=о ТкЛк — заранее выбранная устойчивая передаточная функция, а а^(Л) (а^(0) = 1) и в*(Л) - по

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком