научная статья по теме ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ СИСТЕМ АВТОМАТНОГО ТИПА Кибернетика

Текст научной статьи на тему «ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ СИСТЕМ АВТОМАТНОГО ТИПА»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2013, № 1, с. 18-44

== ДИСКРЕТНЫЕ СИСТЕМЫ

УДК 519.8

ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ СИСТЕМ АВТОМАТНОГО ТИПА*

© 2013 г. А. С. Бортаковский, А. А. Коновалова

Москва, МАИ (национальный исследовательский ун-т) Поступила в редакцию 09.07.12 г.

Рассматривается дискретная система, моделирующая работу динамического автомата с памятью. В отличие от обычных моделей дискретных систем, изменения состояний (переключения) которых происходят в заранее заданные моменты времени, изменения состояний системы автоматного типа могут быть в произвольные моменты времени. Более того, выбор множества моментов времени, когда "срабатывает" автомат, считается ресурсом управления и подлежит оптимизации. Доказаны достаточные условия оптимальности таких систем при ограниченном или неограниченном количестве переключений. Выведены уравнения для синтеза оптимального позиционного управления. Применение условий оптимальности демонстрируется на примере.

БО1: 10.7868/80002338813010046

Введение. Дискретные системы автоматного типа (САТ) описываются рекуррентными уравнениями или включениями и служат математическими моделями устройств управления в форме автомата с памятью. САТ является одной из составляющих в динамических системах с автоматной частью [1], логико-динамических и гибридных системах [2—10]. В отличие от классических моделей дискретных систем [11, 12], изменения состояний (переключения) которых происходят в заданные (тактовые) моменты времени, переключения САТ могут быть в произвольные, заранее не заданные моменты времени [13]. Выбор тактовых моментов является одним из ресурсов управления и подлежит оптимизации.

В прикладных задачах нередко возникают ограничения на количество переключений. Например, для перевода спутника с низкой круговой орбиты на высокую (геостационарную) используется разгонный блок "Бриз-М" [14]. Допустимое количество запусков маршевого двигателя разгонного блока не более 8. Поэтому если состояние двигателя (включен/выключен) описывается дискретной системой, то общее количество ее переключений будет, естественно, ограничено.

В САТ так же, как в ЛДС, возможны оптимальные процессы с мгновенными многократными переключениями [15]. К таким процессам сходятся минимизирующие последовательности, в которых тактовые моменты времени, не нарушая взаимного расположения, стремятся к одному предельному значению. Получается, что в этой предельной точке САТ совершает мгновенные многократные переключения. Такие процессы, как показывают примеры, не являются исключениями, встречающимися только в специальных системах. Наоборот, они возникают в совершенно обычных задачах, в частности, в задаче управления линейными САТ с квадратичным критерием качества. Заметим, что в непрерывных [16], дискретных [11, 12], непрерывно-дискретных [17], импульсных [18, 19] и переключательных [3, 8, 20—24] системах процессы с мгновенными многократными переключениями не возникают. Если зафиксировать тактовые моменты времени, то вместо САТ получим дискретную систему с мгновенными многократными переключениями. Такую систему можно использовать для приближенного решения задачи. Оптимальное для нее управление оказывается субоптимальным для САТ.

В статье рассматриваются задачи, в которых САТ в каждый тактовый момент времени совершает однократное переключение, причем общее количество переключений может быть ограничено. Для этих задач на основе принципа расширения [25] доказаны достаточные условия оптимальности. Выведены уравнения для функции цены (функции Беллмана). Разработана методика синтеза оптимального позиционного управления. Применение условий оптимальности демонстрируется на примерах.

* Работа выполнена при финансовой поддержке РФФИ (грант № 12-08-00464-а).

У

■о

У(то) •

--Ф

У(тз) ?-

?0 т0 Т1

т2 т3 11 1

Рис. 1

1. Постановки задач. Траектория дискретной САТ представляется кусочно-постоянной функцией у(-), определенной на промежутке Т = t]\. Точки разрыва функции у(-) образуют конечное множество $ тактовых моментов времени, $ с Т. В каждый тактовый момент времени состояние САТ изменяется (происходит переключение состояния). Считаем, что траектория САТ непрерывна справа.

Рассмотрим два варианта постановок задач оптимального управления дискретными САТ, отличающимися допустимым количеством переключений состояния:

1) количество переключений произвольное;

2) количество переключений ограничено.

В случае 1) множество $ тактовых моментов времени не задано и находится в результате решения оптимизационной задачи. Каждая траектория САТ определяется произвольным (хотя и конечным) числом параметров. Поэтому множество допустимых траекторий является функциональным (бесконечномерным) пространством, а задача поиска оптимальной траектории относится к вариационным. В случае 2) общее число переключений ограничено. Такие ограничения на практике обусловлены техническими характеристиками применяемых устройств. Например, это могут быть ограничения на количество включений реактивного двигателя. В этом случае каждая допустимая траектория САТ определяется конечным числом параметров, не превосходящим заданного значения. Поэтому множество допустимых траекторий является конечномерным пространством, а задача поиска оптимальной траектории оказывается задачей минимизации функции нескольких переменных, как и в случае дискретных систем [11, 12]. Типовая траектория САТ с четырьмя тактовыми моментами времени т0, т2, т3 изображена на рис. 1.

В классической задаче [11, 12] оптимального управления переключения происходят в заранее заданные тактовые моменты времени. Такой вариант дискретной системы является частным случаем САТ, который получается при задании одного и того же множества $ для всех допустимых процессов управления.

Для описания математической модели САТ можно использовать рекуррентные уравнения или рекуррентные включения [13]. Оба способа применимы для большинства прикладных задач. Однако с теоретической точки зрения постановки задач с разными формами описания не эквивалентны. Поэтому их исследование будет проводиться отдельно.

1.1. Оптимальное управление САТ. Пусть поведение модели объекта управления описывается рекуррентным уравнением

где у — вектор состояния системы, у е У с Кт; V — вектор управления, V е V с ; 1 — время, t е Т = t]\ — промежуток времени функционирования системы, 10, 11 — заданные моменты начала и окончания процесса управления; g : Т х У х V ^ — непрерывная справа по 1 вектор-функция, удовлетворяющая при всех 1, у условию

где о — некоторый нейтральный элемент, о е V. Равенство (1.2), в частности, означает, что возможно сохранение состояния системы в любой момент. Начальное состояние САТ задано

у(0 = g(t, у( - 0К(0),

(1.1)

g(t,y,o) = у,

(1.2)

y(t0 - 0) = y0. (1.3)

Здесь предполагается, что либо функция y(t) доопределена левым пределом y(t0 - 0), либо равенство (1.3) считается эквивалентной формой записи условия y(t0) = g(t0, y0, v(t0)).

Рекуррентное уравнение (1.1) описывает систему в форме автомата с памятью [1, 3]. Состояние y(t) формируется в зависимости от ее предшествующего состояния y(t - 0), управляющего воздействия v(t) и времени t. Из (1.2) следует, что при v(t) = o уравнение (1.1) принимает вид у(() = y(t - 0), реализуя условие непрерывности слева траектории y(-) системы.

Множество допустимых процессов % l(t0,y0) образуют пары функций (y(-),v(-)), где y(-) — непрерывная справа кусочно-постоянная функция y : T ^ Y, точки разрыва которой образуют конечное множество $ = $(y( )) тактовых моментов времени, $ с T; v(-) — функция v : T ^ V, всюду на T \ $ равная нейтральному элементу (v(t) = o) и отличная от него только на $; причем пара функций (y(), v()) всюду на Tудовлетворяет рекуррентному уравнению (1.1) с начальным условием (1.3).

На множестве %:(t0, y0) задан функционал качества управления

ti

I = \ f 0(t,y(t))dt + £ g0(t,y(t - 0), v(t)) + F(y(ti)), (1.4)

t0 $

где функции F : Y ^ R, f0: T x Y ^ R непрерывны по совокупности аргументов, а функция g0 : T х Y х V ^ R — ограниченная. Суммирование в (1.4) ведется по всем точкам те $ разрывов функции y(-) (множество $ = $(y()) конечное для каждого допустимого процесса).

Требуется найти минимальное значение функционала (1.4) и оптимальный допустимый процесс d* = (y*(-), v*(-)), на котором это значение достигается:

I (d*) = min I (d). (1.5)

d e a1(t0,y0)

Если наименьшее значение (1.5) не существует, то ставится задача нахождения минимизирующей последовательности dj е %1(t0,y0), j = 1,2,..., допустимых процессов [25, 26]

I(dj) ^ inf I(d) = I* при j ^ +<х>. (1.6)

d Е S1(t0,y0)

Предполагаем, что функционал (1.4) без учета суммы по т ограничен снизу на множестве допустимых процессов. Условия

g°(х, y,v) > 0, g0(т,y, o) = 0 (1.7)

позволяют рассматривать каждое слагаемое g°(х,y(x - 0), v(x)) в (1.4) как "штраф" за переключение у(т - 0) ^ у(т) состояния системы. Бесконечное количество переключений у оптимального процесса становится невозможным, если усилить условие неотрицательности в (1.7):

g°(t,y,v) >Х + > 0 при v ф o. (1.8)

Применение таких "штрафов" в критерии качества необходимо в тех прикладных задачах, где решением служит минимизирующая последовательность релейных законов управления, приводящая к неограниченному росту числа переключений. Условие (1.8) отбрасывает такие последовательности, как неоптимальные.

Чтобы исключить многократные переключения системы в фиксированный момент времени, достаточно предположить, что

g((,y,V) ^ g((,g(t,y,V) ,V). (1.9)

g0(t,y, v') < g0(t,y,v) + g\t,y',v), v Ф o, v' Ф o, v'' Ф o. (1.10)

Условие (1.9) означает, что любое двукратное переключение y ^ y' ^ y'' (сначала из y в y' = g(t, y, v) под действием управления v, а затем из y в y'' = g(t, y', v') под действием v') можно заменить однократным переключением y ^ y" из состояния y в состояние y'' = g(t, y, v'' ) под действием управления v'' (такое управление v'' существует в силу включения (1.9)). Другими слова-

ми, множество состоянии, в которые можно попасть за одно переключение, содержит множество состояний, достижимых за два пер

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком