научная статья по теме ОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ ПЕРЕСЕЧЕНИЕ СФЕРЫ В ВЯЗКОЙ СРЕДЕ Кибернетика

Текст научной статьи на тему «ОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ ПЕРЕСЕЧЕНИЕ СФЕРЫ В ВЯЗКОЙ СРЕДЕ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 1, с. 23-30

== ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ =

УДК 62-50

ОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ ПЕРЕСЕЧЕНИЕ СФЕРЫ

В ВЯЗКОЙ СРЕДЕ*

© 2007 г. Л. Д. Акуленко, А. М. Шматков

Москва, ИПМех РАН Поступила в редакцию 09.06.06 г.

Рассмотрены многомерные управляемые движения материальной точки в однородной вязкой среде. Решена задача о приведении этой точки посредством ограниченной по модулю силы на фиксированную сферу (снаружи или изнутри) за минимальное время. Для произвольного начального положения и любой начальной скорости с помощью принципа максимума Л.С. Понтрягина в явном виде построены оптимальное управление как в форме программы, так и в форме синтеза, время быстродействия и функция Беллмана, а также оптимальная фазовая траектория. Проведены аналитическое и численное исследования решения, обнаружены качественные механические свойства оптимальных характеристик движения (немонотонная зависимость времени быстродействия от величины начального вектора скорости, разрыв функции Беллмана и др.).

Введение. Управление движениями динамических систем в многомерном пространстве, содержащем геометрические и другие фазовые ограничения, представляет существенный интерес в прикладном аспекте. Особо важное значение имеет разработка методов решения задач управления и оптимизации для летательных и космических аппаратов, робототехнических манипуляционных и мобильных систем, автоматических регуляторов и других механических систем. Математическая теория управления движением при наличии фазовых ограничений развивается довольно интенсивно, получен ряд фундаментальных результатов [1-8]. Однако, как справедливо говорил А.М. Ле-тов еще в 1964 г. [9], "инженеру мало одних утверждений о существовании или возможности получения частных решений в численном виде с помощью ЭЦВМ". Через 10 лет [10] отмечалось, что "работ, посвященных решению детерминированной задачи синтеза оптимальной замкнутой системы терминального управления, в отечественной и зарубежной литературе опубликовано значительно меньше, чем работ, в которых управление ищется в виде программы u(t). Лишь в некоторых из них решение доведено до конечной формы или указана эффективно реализуемая вычислительная процедура решения". Спустя 20 лет [11] положение оставалось прежним: "в настоящее время трудно указать хотя бы одну проблему качественной теории, которая не была бы уже достаточно полно решена для рассматриваемой задачи. Вместе с тем не легче указать и хотя бы один эффек-

*

Работа выполнена при финансовой поддержке РФФИ (грант < 05-01-00563, 05-01-00647, 05-08-50226) и Программы поддержки ведущих научных школ (грант НШ-9831.2006.1).

тивный алгоритм численного решения задачи, позволяющий быстро и устойчиво получать достаточно хорошие управления, на которых ограничения выполняются с любой заданной точностью". К сожалению, за прошедшие с того времени годы продвижение вперед в данной области в основном было связано с прогрессом в сфере вычислительной техники.

Авторами [12-14] решен ряд многомерных задач оптимального управления в упрощенной постановке, когда область, в которую приводится объект или от которой он уклоняется, аппроксимируется неподвижной сферой постоянного радиуса. Динамический объект моделируется материальной точкой постоянной массы, находящейся под действием ограниченной по модулю управляющей силы. Ниже изложено решение задачи оптимального по быстродействию попадания на сферу снаружи либо изнутри при наличии изотропной вязкой среды, вызывающей линейное по скорости сопротивление.

С технической точки зрения такая проблема возникает, например, при исследовании регулятора, работающего в двух режимах: обычном и форсированном, причем длительное применение последнего нежелательно. В обычном режиме на систему почти постоянно действует некоторая неопределенная возмущающая сила, величина которой сравнительно невелика, а направление достаточно часто меняется. При этом совместное действие возмущения и регулятора таковы, что объект не выходит за пределы определенной области фазового пространства. Сравнительно редко величина возмущения резко возрастает, после чего быстро возвращается к обычным значениям. В результате объект оказывается "выбро-

шенным" из расчетной области. Регулятор переходит на форсированный режим с целью как можно скорее вернуть объект обратно. При этом обычное возмущение можно считать малым по сравнению с управляющим воздействием в данном режиме. Аналогичная задача наискорейшего попадания на сферу изнутри возникает при наличии "запрещенной" области фазового пространства, когда цель регулирования состоит в том, чтобы объект находился внутри нее как можно меньше времени.

1. Постановка задачи. Рассмотрим многомерное движение материальной точки постоянной массы т в однородной вязкой среде с коэффициентом линейного по скорости сопротивления к. На точку (динамический объект) действует ограниченная по модулю управляющая сила К Требуется найти закон управления в виде программы и синтеза (по обратной связи), приводящий динамический объект на терминальное множество (поверхность «-мерного шара) - сферу $Я снаружи или изнутри за минимальное время ц; скорость в конечный момент времени не фиксируется. Сформулируем соответствующую задачу оптимального быстродействия для «-мерного динамического объекта

тх + кх = х(0) = х0 й $Я, х(0) = V0, п > 2, х(ц)е $пЯ(х0) = {х : \х - х0= Я}, (1Л)

-min F

IF < F0.

x = v v (0) = v

V = - k v

0

u, x (0) = x

x (tf)\ = 1, tf -

1x0 * 1,

min,,

(1.2)

Исследуемая задача оптимального быстродействия (1.2) содержит один безразмерный параметр к и «-векторы начальных значений х0, V0. Для нее требуется найти законы управления в виде программы ир и синтеза и, время оптимального быстродействия Тр и функцию Беллмана Т., а также оптимальные фазовые траектории х*(0, движения, т.е. построить функции

u * = up( t, x , v , k), u * = us(x, v, k); t* = Tp(x0, v0, k), t* = Ts(x, v, k);

(1.3)

Параметры системы к, х0, Я предполагаются фиксированными. Ранее были рассмотрены частные постановки задачи (1.1): вариант Я = 0 исследован численно в [15], а случаи к = 0 и к = Я = 0 -соответственно в [12, 16]. Следует отметить, что решение задачи, аналогичной (1.1), но для п = 1 и Я Ф 0 при попадании на окружность фазовой плоскости снаружи, приведено в [1]. Кроме того, одномерная задача наискорейшего попадания на окружность изнутри решена как частный случай в [17].

Для дальнейшего существенно предположение Я > 0, что позволяет в качестве единицы длины взять величину Я. Таким образом, требуется привести динамический объект на единичную п-мерную сферу. За единицу времени удобно принять (тЯ/^0)1/2, что дает возможность с помощью стандартной процедуры обезразмеривания и переноса начала системы координат в точку х = х0 уменьшить число параметров и представить задачу (1.1) в виде

х * = х (t, х , V , к), V * = V (t, х , V , к).

Сделаем ряд замечаний.

1. Задача (1.2) эквивалентна двумерной, т.е. случаю п = 2. Оптимальное движение в силу симметрии происходит в плоскости, определяемой векторами х0, V0 (т.е. х0 - х0, V0 для исходной задачи (1.1)) и требуется попасть на окружность х2г + + х2 = 1 при |х0| ^ 1.

2. К данной двумерной задаче сводится более общий случай, когда терминальное множество есть «*-мерный цилиндр, 2 < п* < п. Управление движением осуществляется в п*-мерном пространстве, содержащем указанную сферу; задача вновь сводится к случаю п* = 2.

3. Построение программного управления ир из (1.3) для фиксированного значения к и произвольных векторов х0, V0 может быть осуществлено с помощью необходимых условий оптимальности в форме принципа максимума. Тогда управление по обратной связи (синтез) и. строится посредством функции ир в виде и.(х, V, к) = ир(0, х, V, к).

4. Если найдено время оптимального быстродействия Т , то функция Беллмана Т. получается заменой начальной фазовой точки на текущую: Т.(х, V, к) = Тр(х, V, к). Более того, вследствие связи между принципом максимума и методом динамического программирования [1] имеем

и* = и,(х, V, к) = -(ЭТ./ЭV)|ЭТ./Э V)(1.4)

Как следует из дальнейшего анализа (см. разд. 2), после подстановки и. из (1.4) или (1.3) в уравнения движения (1.2) и интегрирования задачи Коши на интервале времени 0 < t < Т.(х0, V0) для программного управления ир из (1.3) следует свойство

u* = up( t, x°, v°, k) =

*=

0 0 0 0

\u\ < 1, 0 < k

= us(x(t, x , v , k), v(t, x , v , k), k) = (I.5)

= us(x°, v0, k) = const.

5. Постановку задачи можно обобщить на случай неоднородной среды с кусочно-постоянным

t

коэффициентом вязкости: к = к± для значений х0 в области |х 0| ^ 1 соответственно.

2. Применение принципа максимума. Допустимое управление, приводящее динамический объект на сферу, существует для произвольных к >0, х0, V0 и может быть построено весьма просто. В частности, оно может содержать два этапа: сначала торможение с управлением и = -у°/|у°| до полной остановки в некоторый момент времени в промежуточной точке х*, т.е.

v(t*) = 0, х(t*) = х* = x^ + П~~пТ(I v°| - t*),

элементарных функциях. В частности, имеем вы-

k\ v

1

Г* = (1+ к VI), к

и затем управляемое движение по прямой, соединяющей точку х* и некоторую точку на сфере (например, ближайшую). Отсюда следует существование искомого оптимального по быстродействию неособого управления в классе кусочно-непрерывных функций времени. Оно строится ниже с помощью принципа максимума [1].

Для задачи (1.2) выпишем функцию Гамильтона Н и условие максимума по и

H = (p, v) - k(q, v) + (q, v),

H

■ maxu

lul < 1.

(2.1)

Здесь р и q - векторы, сопряженные соответственно х и V. Из условия (2.1) максимума функции Н по и получим выражения

u * = qlql = n, H* = H(u*) = (p - kq, v) + |q|.

(2.2)

x =

dH* дp

= v, x (0) = x0, |x (tf) | = 1;

dH* , о

v = —— = - kv + n, v(0) = v ; dq

dH * д x

(2.3)

= 0, p = const, p = Xx (tf) | x(tf)| 1;

д H *

v

= - p + kq, q (tf) = 0.

ражения для q и u* = n

q = pkl(1 - expk(t - tf)), i* = n = xf sign X = const.

(2.4)

Через х1 в (2.4) обозначен неизвестный единичный вектор, характеризующий конечное положени

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком