научная статья по теме СИНТЕЗ ОПТИМАЛЬНЫХ ПЕРЕКЛЮЧАЮЩИХ СИСТЕМ Кибернетика

Текст научной статьи на тему «СИНТЕЗ ОПТИМАЛЬНЫХ ПЕРЕКЛЮЧАЮЩИХ СИСТЕМ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 5, с. 48-72

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

УДК 519.977

СИНТЕЗ ОПТИМАЛЬНЫХ ПЕРЕКЛЮЧАЮЩИХ СИСТЕМ*

© 2015 г. А. С. Бортаковский

Москва, МАИ (национальный исследовательский ун-т) Поступила в редакцию 14.11.14 г., после доработки 17.02.15 г.

Рассматривается динамическая система, моделирующая работу переключающего устройства (переключателя). За время функционирования система изменяет свое состояние конечное число раз. Изменение состояния (переключение) описывается рекуррентным включением, что соответствует представлению переключателя в форме динамического автомата с памятью, при этом допускаются мгновенные многократные переключения. Тактовые моменты времени, в которые происходят переключения, а также их количество заранее не заданы. Они находятся в результате оптимизации функционала, в котором учитываются количество переключений и затраты на каждое из них. Доказаны достаточные условия оптимальности таких систем. Разработан метод синтеза оптимальных переключателей, который заключается в построении семейства вспомогательных функций — условных функций цены и условных позиционных управлений, из которых формируются функция цены (функция Гамильтона-Яко-би-Беллмана) и оптимальная конструкция переключателя. Применение этого метода демонстрируется на примерах.

Б01: 10.7868/8000233881504006Х

Введение. Математическими моделями многорежимных систем автоматического управления служат гибридные [1-5], переключаемые [6-10], непрерывно-дискретные [11], логико-динамические [12-18] и другие динамические системы [19-21]. В состав таких систем входит переключающая подсистема (переключатель) - устройство, реализующее "закон переключения режимов" [10]. Состояние переключателя определяет "активный" режим работы динамической системы, а его изменение (переключение) соответствует структурным изменениям процесса функционирования. Как правило, переключатель реализуется в форме динамического автомата с памятью, текущее состояние которого формируется в зависимости от времени, текущего состояния управляемой системы и предшествующего состояния самого переключателя. В непрерывно-дискретных, динамических системах с автоматной частью или логико-динамических системах переключателем является дискретная, автоматная или логическая часть системы соответственно.

В статье рассматривается задача оптимизации именно переключающего устройства многорежимных систем. Так как переключения происходят на непрерывном временном промежутке функционирования системы в конечном числе точек (в тактовые моменты времени), а между ними состояние переключателя не меняется, то траектории являются кусочно-постоянными функциями. Для их описания обычно применяются рекуррентные уравнения или включения. Возможно также использование дифференциальных уравнений с импульсными воздействиями, как, например, в дискретно-непрерывных системах [22]. Качество работы переключателя оценивается функционалом, в котором кроме интегрального и терминального членов, характеризующих поведение системы при фиксированных режимах, имеется еще и слагаемые, учитывающие затраты на переключение этих режимов.

В отличие от классических моделей дискретных систем [23, 24], изменения состояний (переключения) которых происходят в заданные тактовые моменты времени, переключения рассматриваемых систем могут быть в произвольные, заранее не заданные моменты времени [25]. Выбор тактовых моментов является одним из ресурсов управления и подлежит оптимизации. Более того, не исключаются многократные переключения в фиксированный момент времени [26]. К таким процессам сходятся минимизирующие последовательности, в которых тактовые моменты времени, не нарушая взаимного расположения, стремятся к одному предельному значению. Именно в этой предельной точке переключатель совершает мгновенные многократные пере-

* Работа выполнена при финансовой поддержке РФФИ (грант № 15-08-01902-а) и Минобрнауки РФ (проект 634).

ключения. Разумеется, что такой процесс является математической моделью и на практике не встречается. Однако существование оптимального процесса с мгновенными многократными переключениями заставляет инженеров задуматься о быстродействии разрабатываемой конструкции переключателя, реализующего на практике движение, близкое к оптимальному. Важно, что такие процессы не являются исключениями, встречающимися только в специальных системах. Они возникают, например, в задачах управления линейными гибридными системами с квадратичным критерием качества [27]. Заметим, что в непрерывных [28], дискретных [23, 24], непрерывно-дискретных [11] и переключаемых [6—10] системах процессы с мгновенными многократными переключениями не возникают.

Мгновенные многократные воздействия исключаются в импульсных [29—31] и дискретно-непрерывных [22] системах, в которых траектории описываются дифференциальными уравнениями с мерой. Определяя решение такого дифференциального уравнения, многократные импульсные воздействия в один и тот же момент времени заменяются одним "суммарным" импульсом, интенсивность которого равна сумме воздействий всех импульсов.

В прикладных задачах нередко возникают ограничения на количество переключений. Например, для перевода спутника с низкой круговой орбиты на высокую (геостационарную) используется разгонный блок "Бриз-М". Допустимое количество запусков маршевого двигателя разгонного блока не более 10. Поэтому если состояние двигателя (включен/выключен) описывается дискретной системой, то общее количество ее переключений будет, естественно, ограничено [32].

В статье рассматриваются задачи, в которых переключатель в каждый тактовый момент времени совершает однократные или многократные переключения, причем общее количество переключений либо произвольное конечное, либо ограниченное заданной максимально допустимой величиной. Тактовые моменты времени, а также количество мгновенных переключений в каждый из них заранее не заданы и определяются в процессе оптимизации. Для формулировки и доказательства условий оптимальности применяется новый подход, при котором используются новые понятия — условная функция цены [33] и условная конструкция переключателя. Настоящая функция цены (функция Гамильтона—Якоби—Беллмана) строится из последовательности условных функций цены, а оптимальная позиционная конструкция переключателя формируется из последовательности условных конструкций. Выведено рекуррентное уравнение с интегральными членами для последовательности условных функций цены. Разработана методика решения этого уравнения и синтеза оптимальной конструкции переключателя. Применение этой методики демонстрируется на примерах.

По сравнению с задачей оптимального управления дискретными системами автоматного типа [33] задача синтеза переключающей системы отличается формой описания траекторий движения: вместо рекуррентных уравнений в [33] используются рекуррентные включения. Достаточные условия в [33] представляют собой систему дифференциального и рекуррентного уравнений относительно условных функции цены. Условия оптимальности переключателей проще. Они сводятся к одному рекуррентному уравнению с интегральными членами. При этом в отличие от [33] не требуется существования производной условной функции цены по времени. Это означает, что достаточные условия оптимальности переключателя применимы к более широкому кругу задач, чем аналогичные условия, полученные ранее для систем автоматного типа [33].

Рассматриваемую систему, как указал профессор М.М. Хрусталев, можно свести к дискретной системе, считая каждый момент переключения новым дополнительным управлением, при этом "дискретным временем" становится номер переключения. Применяя такой подход, получаем задачу оптимального управления дискретной системой, которая все же отличается от классической [23, 24, 34, 35]. Во-первых, количество дискретных моментов времени, т.е. переключений, не задано, а подлежит оптимизации. Во-вторых, в классической постановке в функционале качества суммируются затраты в каждый дискретный момент времени даже в том случае, когда состояние системы в этот момент времени не меняется. В рассматриваемой задаче если состояние системы не меняется, то не меняется и "дискретное время". Другими словами, в классической дискретной системе "первично" дискретное время. Оно служит независимой переменной. В задаче синтеза переключателя "первично" состояние системы, так как только изменение состояния означает факт переключения. Эти отличия отражаются в достаточных условиях оптимальности, где используется новое понятие — условная функция цены.

1. Постановка задачи. Рассмотрим постановки двух задач оптимизации переключаемых систем: с произвольным конечным количеством переключений или с ограниченным максимально допустимым числом переключений. В каждом случае формулируется задача поиска оптимальной траектории и задача синтеза оптимальной конструкции переключателя.

Динамическую систему, которая на непрерывном промежутке времени конечное число раз меняет свое состояние, будем называть переключающей системой (или просто переключателем). В тактовые моменты времени, когда происходят изменения состояния (переключения), траектория системы имеет скачки. В интервалах между тактовыми моментами времени система сохраняет свое состояние, а траектория постоянна. Другими словами, траектория переключающей системы является ступенчатой функцией [36].

Пусть на промежутке времени Т = [?0, t1] траектория переключающей системы является непрерывной справа кусочно-постоянной функцией у : Т ^ У с Кт, имеющей конечное множество

$ = Ж)) = {те « 0, ^]|у(т- 0) Ф у(т)}

точек разрыва первого рода, в которых система изменяет свое состояние, согласно включению у(т) е У (т, у(т- 0)), те (1.1)

У У

где у) ^ У(t, у): Т х У ^ 2 - замкнутое многозначное отображение [37, 38], 2 - множество всех подмножеств У. Начальное состояние системы задано

у( 0) = у0 . (1.2)

Множество у0) допустимых траекторий с однократными переключениями составляют непрерывные справа кусочно-постоянные функции, удовлетворяющие в точках разрыва включению (1.1) и начальному условию (1.2). Качество допуст

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком