научная статья по теме ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ЗАПАЗДЫВАНИЕМ С УЧЕТОМ ТЕРМИНАЛЬНЫХ ОГРАНИЧЕНИЙ НА ИХ СОСТОЯНИЯ Автоматика. Вычислительная техника

Текст научной статьи на тему «ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ЗАПАЗДЫВАНИЕМ С УЧЕТОМ ТЕРМИНАЛЬНЫХ ОГРАНИЧЕНИЙ НА ИХ СОСТОЯНИЯ»

Автоматика и телемеханика, Л- 12, 2007

Детерминированные системы

РАС Б 02.30.Yy. 07.05.Dz

© 2007 г. Р. ГАВАСОВ, д-р физ.-мат. наук, О.П. ГРУШЕВИЧ (Белорусский государственный университет, Минск), Ф.М. КИРИЛЛОВА, д-р физ.-мат. наук

(Национальная Академия Наук Беларуси, Институт математики, Минск)

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ЗАПАЗДЫВАНИЕМ С УЧЕТОМ ТЕРМИНАЛЬНЫХ ОГРАНИЧЕНИЙ НА ИХ СОСТОЯНИЯ1

Исследуется линейная задача оптимального управления одним типом систем с запаздыванием (в математической модели системы управления запаздывание присутствует в одпом уравнении). Терминальные состояния системы ограничены. оптимальное управление осуществляется с помощью дискретных управляющих воздействий, удовлетворяющих геометрическим ограничениям. Рассматриваются решения двух типов программное и позиционное. Приводится двойственный метод вычисления оптимальных программ. Описывается алгоритм работы оптимального регулятора, формирующего в режиме реального времени текущие значения позиционного решения (оптимальной обратной связи). Результаты иллюстрируются па примере управления системой с запаздыванием четвертого порядка.

1. Введение

Эффект последействия присущ разнообразным физическим процессам [1]. Математические модели многих из них описываются дифференциальными уравнениями с запаздывающим аргументом, которые интенсивно исследуются с конца 40-х гг. XX в. В теории оптимального управления (ОУ) системы с запаздыванием стали изучаться сразу после открытия принципа максимума Понтрягина для обыкновенных систем [2]. На системы с запаздыванием удалось обобщить многие результаты, полученные в теории ОУ для систем обыкновенных дифференциальных уравнений. Однако решение центральной проблемы теории ОУ проблема синтеза для систем с запаздыванием даже для случая задачи Летова-Калмана [3. 4] наталкивается на значительные вычислительные трудности, связанные, в частности, с тем. что пространство состояний систем с запаздыванием бесконечномерно.

В классической постановке проблема синтеза оптимальных систем для задач с геометрическими ограничениями на управляющие воздействия пока не получила полного решения даже для обыкновенных систем. В [5. 6] предложен подход к решению проблемы синтеза, использующий принцип ОУ в реальном времени. Цель настоящей работы обобщить результаты [5. 6] на один класс систем с запаздыванием.

1 Работа частично финансируется ВРФФИ (грант Ф06М-027) и Г11Ф14 (Матоматичоскио модели 14).

В раздело 2 рассматривается линейная нестационарная система управления с запаздыванием в одном уравнении. Такие системы часто встречаются в приложениях [7 11]. Одной из особенностей исследуемой задачи является наличие в ней терминальных ограничений на состояния системы. В качестве доступных выбираются дискретные управляющие воздействия с конечным периодом квантования времени. Подобные управляющие воздействия естественны для современных приложений, в которых широко используются устройства дискретного действия. Кроме того, они позволяют обойти многие аналитические трудности. Здесь же вводятся понятия оптимальной программы, оптимальной обратной связи, реализации последней в реальном времени. В разделе 4 обоснован двойственный метод вычисления оптимальных программ. В нем решающую роль играет квазиредукция сопряженной системы дифференциальных уравнений с опережением (раздел 3). В итоге, для осуществления итерации двойственного метода достаточно интегрировать системы обыкновенных дифференциальных уравнений на небольшом количестве периодов квантования. Результаты численных расчетов по построению оптимальных программ содержатся в разделе 5. Раздел 6 включает описание алгоритма работы оптимального регулятора. Его эффективность иллюстрируются в разделе 7 на примере прикладной задачи, в которой математическая модель объекта управления состоит из системы дифференциальных уравнений с запаздыванием четвертого порядка.

2. Постановка задачи

Рассмотрим линейную задачу оптимального управления2:

г*

7(и) = с'х(г*) + J с'(г)х(г)& ^ тах,

г*-'в

х(г) = Л(г)х(г) + в1а'(г)х(г — &) + Б(г)и(г), (1) х(г*) = хо, а'(в + &)х(в) = хо(в), в £ [г* — &,г*[;

г*

Их(г*) + I н (гух(г)А £ у * = {у £ мт : д* < у < д*},

г*-в

и(г) £ и = {и £ Мг : и* < и < и*}, г £ Т. Здесь заданы кусочно-непрерывные функции с(г) £ МП Л(г) £ М"х", а(г) £ М",

Б(г) £ мпхг, н (г) £ мтх" г £ Т; х0(в) £ м, в £ [г* — г* [; вектор ы в! = (1, о,..., о),

с, х0 £ М"; д*, д* £ Мт; и*, и* £ Мг; матрица И £ Мтх"; запаздывание & £ М, (&& > 0^; промежуток управления Т = [г*,г*], —ж <г* <г* < ж.

Задачу (1) будем исследовать в классе дискретных управляющих воздействий

и(г) £ мг, г £ т-.и(г) = и(в), г £ [в,в+н[, в £ Тк = {г*,г*+н,...,г*—н}, н = (г*—г*)/к, N - заданное натуральное число.

Назовем вектор х(г) = (х1(г),... ,хп(г)) положением, функцию хг(•) = = (а'(в + &)х(в), в £ [г — &,г[) историей, пары хг(•) = (х(г); хг() и (г, хг(•)) состоянием и позицией системы (1) в момент времени г. Каждой паре хг* (•), и(^) = = (и(г), г £ Т) соответствует единственная траектория х(г), г £ Т, системы (1).

Управляющее воздействие и(г) £ и, г £ Т, для которого выполняется условие г*

Их(г*) + / И(г)х(г)& £ у*, называется программой. Программу и0(•) назовем г*-в

~ В качество целевого функционала исследуемой задачи может использоваться линейный функционал но управляющим воздействиям (см. раздел о) и фазовым переменным.

оптимальной, если J(u0) = max J(u), где максимум вычисляется по всем программам.

Построение оптимальной программы первый тип решения задачи (1) (программное решение). Для введения второго типа решения задачи (1) погрузим ее в семейство задач

г*

c'x(t*) + j x(t,T)c'(t)x(t)dt ^ max, г*-■в

X(t) = A(t)x(t) + ela'(t)x(t — *) + B(t)u(t), x(t) = z, a'(s + *)x(s) = zT(s), s £ [t — •&, т[;

г*

Hx(t*)+ J x(t, т)H(t)x(t)dt £ Y*; u(t) £ U, t £ T(т) = [T,t*],

(2)

г*-в

зависящих от момента т £ Th и состояния zT(■) = (z £ Rn; zT(s) £ R, s £ [т — *,т[), где zT (s), s £ [т — *,т[ - кусочно-непрерывная функция,

x(tZ) = [°' t* — * ^ *<C,

X(,Z) = \ 1, z < t < t*; t £ [t* — *,t*], Z

£ T.

Обозначим: и0Щт, zт(•)), t € Т(т) - оптимальная программа задачи (2) для позиции (т, zт(•)); ^^ ^ состояпий zт(•), для которых существуют оптимальные программы задачи (2).

Оптимальной обратной связью называется функционал

(3) и0(т, Zт(•)) = и0(т 1т, Zт(•)), Zт(•) £ Zт,т £ Тк.

Построение оптимальной обратной связи (3) (позиционное решение задачи (1)) называется синтезом, оптимальной системы.

Замкнем обьект управления (физический прототип математической модели (1)) обратной связью (3):

(4) х(г) = Л(г)х(г) + в1а'(г)х(г — -&) + Б(г)и0(г,х^)) + ш, г £ Т,

где и0(г,х^)) = и0(т,хт(•)) = и0(т 1т, хт(•)), г £ [т,т + Н[, т £ Тн; ш £ Rn - совокупность членов, описывающих возмущения, действующие на физический объект в процессе управления, а также неточности моделирования и построения обратной связи. Для краткости в дальнейшем будем называть ш возмущением и считать, что в каждом процессе управления возмущение ш реализуется в виде ограниченной кусочно-непрерывной функции ш(г), г £ Т.

Под решением х(г), г £ Т, нелинейного уравнения (4) понимается совокупность непрерывно состыкованных решений линейных уравнений

х(г) = Л(г)х(г) + в1а'(г)х(г — -&) + Б(г)и(г) + ш(г), г £ [т,т + н[, т £ Тк, х(г*) = х0; а'(в + $)х(в) = Ж0(в), я £ [г* — [,

С и(г) = и0(т,хт(•)), г £ [т,т + Н[, т £ Тн.

Рассмотрим конкретный процесс управления, в котором реализуется возмущение ш*(г), г £ Т. В замкнутой системе (4) оно породит траекторию х*(г), г £ Т, которая удовлетворяет тождеству:

х*(г) = Л(г)х*(г) + в1а'(г)х*(г — -&) + Б(г)и0(г,х*(•))+ ш*(г), г £ Т.

Управляющее воздействие и*(г) = и0(г,х*(•)), г £ Т, которое в процессе управления поступает на объект, назовем реализацией оптимальной обратной связи (3) в рассматриваемом процессе управления.

Создание и*(г), г £ Т, с помощью синтезированной до начала процесса управления обратной связи (3) называется оптимальным управлением (физическим объектом) по принципу замкнутого контура. Поскольку проблему оптимального управления по замкнутому контуру до сих пор не удается решить даже для объектов без запаздывания, в данной работе предлагается метод оптимального управления объектами с запаздыванием в реальном времени, при котором обратная связь (3) не строится, а при каждом т £ Т^ элемент и*(т) ее реализации создается по ходу кон-

н

выполнять эту работу, называется оптимальным регулятор ом (ОР).

В разделе 4 будет описан двойственный метод решения задачи (1). представляющий собой быструю реализацию адаптивного метода линейного программирования (ЛП) ¡12, 13]. При решении задачи (2) в произвольный момент т £ Т^ двойственный метод быстро корректирует результаты, полученные при решении этой же задачи

т— н

задаче ЛП и основные элементы двойственного метода.

3. Квазиредукция сопряженной системы

Основная трудность при построении оптимальной программы задачи (1) состоит в интегрировании на итерациях двойственного метода (см. раздел 4) сопряженной системы (П.8). (П.9). уравнения (П.9) которой являются дифференциальными уравнениями с опережением. Поэтому в основу предлагаемого метода положим процедуру квазиредукции уравнений (П.9) к обыкновенным дифференциальным уравнениям. решения которых сколь угодно точно аппроксимируют решение исходных уравнений. Это позволит (раздел 6) обосновать быстрый алгоритм работы ОР.

Пусть функция ф(г)(г), г £ [г*, г* — &] - решение уравнения (П.9). Построим ее аппроксимацию.

Разобьем отрезок [г*,г* — &] точками г* = < г(г)1 < ... < = г* — &

па промежутки Т= [г^),^^, £ Т^, I = 0,1(г) — 1. Построим конечно-параметрические аППрОКСИМаЦИИ ^\г)(г) £ М г £ Т^), фуНКЦИИ ф(г)1{Ь), г £ Т[г), I = = 0,1 (г) — 1. Положим 7(г)(г) = 1(г)(г); 1 £ Т[г), I = 0,1 ^ — 1, (^(г)(в) = ф(г)г(в), в £ £ [г* — &, г*]), где ф(г)1(в) - первая компонента вектора ф(г)(в). Введем вспомогательную систему обыкновенных дифференциальных уравнений

^—л" — !

(5) Ф(г)у = — к = 1 ак+1у (г)ф(г)к — а1у (г)7(г)(г) — аз (г + &Ь(г)(г + &) ,

г £ [г*,г* — &], 3 = 1,п — 1,

где акз (г), к,3 = 1, п - элементы ма

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком