научная статья по теме СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ Автоматика. Вычислительная техника

Текст научной статьи на тему «СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ»

Автоматика и телемеханика, Л- 11, 2007

Управление системами

PACS 02.30.Yy

© 2007 г. A.C. ВОРТАКОВСКИЙ, канд. физ.-мат. наук (Московский авиационный институт)

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ1

Получены достаточные условия оптимальности логико-динамических систем. логическая часть которых моделирует работу автомата с памятью. Выведены уравнения для определения оптимального программного управления и управления с полной обратной связью. Исследованы оптимальные процессы с многократными переключениями логической (автоматной) части в фиксированные моменты времени. На основе достаточных условий предложены алгоритмы построения субоптималыюго управления логико-динамическими системами в условиях параметрической неопределенности. Применение условий оптимальности и субоптималыюсти демонстрируется па примерах.

1. Введение

Рассматривается детерминированная логико-динамическая система (ЛДС). динамическая часть которой описывается дифференциальными уравнениями, а логическая. моделирующая работу автомата с памятью. рекуррентными уравнениями [1 5]. Такие системы являются частным случаем гибридных систем [6 11]. в которых непрерывная компонента, как правило, отражает физические законы, технологические или технические принципы, а дискретная часть показывает работу устройства управления, например цифровых автоматов с памятью. Обе части системы взаимосвязаны и влияют друг на друга в процессе управления. В отличие от дискретных систем, изменение состояний которых происходит в заранее заданные (тактовые) моменты времени, переключения логической (автоматной) части ЛДС может быть в произвольные моменты времени. Более того, выбор в промежутке времени функционирования системы моментов, когда срабатывает автоматная часть, считается ресурсом управления и подлежит оптимизации. Каждое переключение автоматной части "оценивается", и его "стоимость" учитывается в критерии качества ЛДС. Это. как правило, оказывает регуляризирующее влияние на оптимальные процессы, исключая из их числа процессы с многочисленными переключениями. Например, в задаче перевода искусственного спутника Земли с одной орбиты на другую последовательность процессов, минимизирующая энергозатраты, состоит из

1 Работа выполнена ири финансовой поддержке Российского фонда фундаментальных исследований (гранты № 05-01-00458, 06-08-00882).

коротких включений двигателя в перигее и апогее орбиты [12]. В пределе получаем бесконечную последовательность мгновенных включений двигателя. Такое решение практически не реализуемо. Рассматривая задачу в классе ЛДС. нужно учитывать, что каждое включение реактивного двигателя от его запуска до достижения номинальной тяги, а также и выключение двигателя представляют собой немгновенный переходной процесс, сопровождаемый расходом топлива. Добавляя в критерий качества соответствующие штрафные слагаемые, получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя. Процессы, требующие бесконечного числа включений, отбрасываются как неоптимальные. Аналогичным образом, штрафуя переключения, в класс ЛДС можно отнести все задачи, в которых оптимальными являются релейные законы управления. При этом решения будут более практичными.

К математическим моделям рассматриваемых систем близки переключательные системы (switched systems [11. 13 15]). Как правило, динамика таких систем описывается дифференциальными уравнениями с конечным набором возможных правых частей [11. 13]. Дискретная часть (устройство управления) определяет одну из допустимых правых частей, задавая тем самым поле скоростей динамической части. В классе ЛДС возможность такого управления динамической частью изучалась начиная с [1]. В настоящей работе динамика системы зависит от состояния автоматной части, множество возможных состояний которой не обязательно конечно. В отличие от непрерывно-дискретных [16] и переключательных систем в классе ЛДС исследуются последовательности процессов, приводящие к многократным переключениям автоматной части в фиксированный момент времени. Такие процессы, как показывают примеры, не являются исключениями, встречающимися только в специальных системах. Наоборот, они появляются в совершенно обычных задачах, в частности, в задаче управления линейными ЛДС с квадратичным критерием качества [17]. Заметим, что эта задача аналогична хорошо изученной проблеме аналитического конструирования оптимальных регуляторов Летова [18].

Вместе с задачей управления при полной информации рассматривается задача управления ЛДС в условиях параметрической неопределенности. Предполагается, что состояние ЛДС в каждый момент времени точно неизвестно, а известно целое множество возможных состояний, т.е. речь идет об управлении пучком траекторий [19. 20]. Синтез управления ЛДС производится с целыо минимизации среднего или максимального значений показателя качества управления изолированной траекторией. Другими словами, синтезируется либо оптимальное в среднем [20]. либо оптимальное гарантирующее [19] управления пучком траекторий.

Для управления пучками траекторий предлагается использовать оптимальное управление с обратной связью, в котором вместо неизвестного состояния системы подставляется его оценка (либо оптимальная гарантирующая, либо оптимальная в среднем). Таким образом, для управления пучком траекторий предлагается применять оптимальное управление для одной, специальным образом выбранной, траектории системы. Разумеется, что получаемое таким способом управление пучком является субоптимальным. Однако оно может оказаться удовлетворительным для практики. Такой подход к синтезу оптимального управления аналогичен применяемому в стохастических системах, когда для управления пучком траекторий используют оптимальное замкнутое управление для математического ожидания состояния системы. Обоснование этого метода опирается на теорему разделения [3]. которая справедлива не для всех систем. На практике такой подход часто применяется даже и без обоснования.

Представляют интерес задачи, в которых субоптимальное управление пучком оказывается оптимальным. Достаточным условием такого совпадения является гипотеза об оптимальности эффективных управлений [21]. Для пучка траекторий рассматриваются два множества программных управлений. Первое множество множе-

ство оптимальных управлений образуют оптимальные программные управления для каждой изолированной траектории пучка. Второе множество множество слабо эффективных управлений включает такие программные управления, которые нельзя улучшить сразу для всех траекторий пучка. Равенство этих двух множеств, а именно в этом и состоит гипотеза об оптимальности эффективных управлений, является достаточным уловнем для того, чтобы субоптималыгое управление пучком траекторий оказалось оптимальным.

В статье выведены уравнения для синтезирующих функций ЛДС, предложены алгоритмы синтеза оптимального в среднем и оптимального гарантирующего управлений. Приведены примеры, демонстрирующие применение условий оптимальности и субоптимальности ЛДС.

2. Оптимальное управление при полной информации

2.1. Постановка задачи

Пусть поведение модели ЛДС описывается уравнениями

(1) ¿(¿) = / (¿,ж(*),у(*),и(*)),

(2) у(т)= 3(т,ж(т), у(т - 0),«(т)),

где ж, у — векторы состояния динамической и логической частей ЛДС, ж € X С К", у € У С Кт; и - вектор управления динамической частью, и € и С Кр v - вектор управления логической (автоматной) частью, V € V С К9; £ - время, £ € Т = [¿о, ¿1 ], Т - промежуток времени функционирования системы, ¿о, ¿1 _ заданные моменты начала и окончания процесса управления; т - момент времени изменения состояния (переключения) логической части системы, т € Т С Т , Т — конечное множество моментов переключений автоматной части; / (£, ж, у, и): Т х X х У х и —> К" -непрерывная по совокупности аргументов вектор-функция, непрерывно дифференцируемая по ж; ж, у, V): Т х X х У х V —> Кт - ограниченная вектор-функция, удовлетворяющая при всех ж, у условию #(£, ж, у, о) = у для пулевого элемента о € К9. Множества X, У возможных состояний ЛДС, а также множества и, V допустимых значений управлений предполагаем компактными. В ряде случаев от предположения компактности можно отказаться (см. пример 1). На практике эти множества, как правило, ограниченные.

Дифференциальное уравнение (1) описывает динамическую часть ЛДС. Скорость /(¿, ж, у, и) изменения состояния ж(£) зависит, в частности, от состояния у(£) логической части системы. Рекуррентное уравнение (2) определяет логическую часть

у(т)

ной) части системы формируется в зависимости от ее предшествующего состояния у(т — 0), управляющего воздействия v(т) и текущего состояния ж(т) динамической части системы.

Множество допустимых процессов Р(£0, ж0, у0) образуют четверки функций (ж(-), у(-),и(-), v(•)), где и(-) - измеримая функция и: Т —> и; ж(-) - абсолютно непрерывная функция ж: Т —> X; у(0 _ непрерывная справа кусочно-постоянная функция у: Т —> У, точки разрыва которой образуют множество Т; v(•) - кусочно-постоянная функция V: Т —> V, почти всюду па Т равная нулевому элементу = о € К9) и отличная от него на Т; причем тройка функций (ж(-), у(-), и(-)) Т

условием ж (¿о) = ж0; тройка фун кций (ж(-),у(-)^(-)) всюду на Т удовлетворяет рекуррентному уравнению (2) с начальным условием у(^ — 0) = уо, т.е. у(^о) = = g(íо,жо,yо, v(íо))•

На множестве D(t0, x0, у0) определен функционал

ti

(3) I = F(x(tj),y(tj)) + j f 0(t,x(t),y(t),u(t))dt + £ д°(т,х(т),у(т — 0),v(t)),

to T

где функция F: X x Y —> R непрерывна по x; функция f0 (t,x,y,u): T x X x Y x x U —> R — непрерывна то совокупности аргументе в, а функция g0(t,x,y,v): T x x X x Y x V —> R - неотрицательная, причем g0(t, x,y, o) = 0 при всex t, x, y для пулевого элемента o £ R9. Суммирование в (3) ведется по в сем точкам т £ T разрывов функции у() Заметим, что множество таких точек конечно для каждого допустимого процесса. Каждое слагаемое g0(T,x(T),у(т — 0),v(t)) можно понимать как "штраф" за переключение логической (автоматной) части ЛДС.

Требуется найти оптимальный про

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком