научная статья по теме ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Математика

Текст научной статьи на тему «ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2013, том 53, № 12, с. 2014-2028

УДК 519.626

ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

© 2013 г. А. Ю. Горнов, А. И. Тятюшкин, Е. А. Финкельштейн

(664033 Иркутск, ул. Лермонтова, 134, Ин-т динамики систем и теории управления СО РАН)

e-mail: tjat@icc.ru Поступила в редакцию 27.12.2013 г.

Для задачи оптимального управления с ограничениями на фазовые координаты рассматривается итерационный метод поиска численного решения, основанный на редукции к конечномерной задаче и применении к последней алгоритма последовательной линеаризации с использованием модифицированной функции Лагранжа. Эффективность учета фазовых ограничений при расчете оптимального управления иллюстрируется численным решением прикладных задач. Библ. 24. Фиг. 3.

Ключевые слова: оптимальное управление, фазовые ограничения, модифицированная функция Лагранжа, последовательная линеаризация, численные методы итераций.

DOI: 10.7868/S0044466913120077

ВВЕДЕНИЕ

Для прикладных задач оптимального управления характерны нелинейность управляемой системы, высокая размерность фазового пространства и наличие ограничений как на управление, так и на фазовые координаты (см. [1], [2]). Применение современной методологии "вычислительного эксперимента", основанного на триаде "модель—метод—программа", к исследованию нелинейных управляемых динамических процессов с ограничениями на фазовые координаты предъявляет особые требования к эффективности методов оптимизации управления и программных средств, ориентированных на решение задач с ограничениями на траекторию динамической системы. Метод штрафов в этих задачах не всегда обеспечивает требуемую на практике точность, поэтому, как правило, он применяется только на первой стадии решения задачи для получения достаточно хорошего начального приближения. Для дальнейшего улучшения управления, которое обеспечивало бы более точное выполнение ограничений и уменьшило бы значение целевого функционала, необходимы итерационные методы, в которых ограничения на фазовые координаты учитываются на всем временном интервале еще при расчете вариации управления.

Дискретный аналог непрерывной задачи управления предполагает табличное представление управляющих функций на заданной сетке временного интервала. На итерациях численного метода оптимизации обычно осуществляется выбор таких числовых значений управляющих функций в узлах этой сетки, при которых с некоторой заданной точностью будут выполнены все ограничения задачи и улучшено значение целевого функционала. Таким образом, редукция к конечномерной задаче открывает возможность использования богатого арсенала методов нелинейного программирования для приближенного решения сложных задач оптимального управления (см. [3]—[6]).

Основой алгоритмического обеспечения задач оптимального управления с фазовыми ограничениями являются специальные методы решения больших задач линейного программирования. Для решения задач линейного программирования, полученных дискретизацией линейных задач оптимального управления с фазовыми ограничениями, в [7] рассматриваются различные по трудоемкости и по требованиям к объему памяти алгоритмы, учитывающие специфические свойства этих задач. Например, задачам, в которых доминирующую роль играют фазовые ограничения, соответствуют задачи линейного программирования с большим числом основных ограничений, а задачам с ограничениями только на правом конце траектории — задачи с большим

2014

числом переменных. Решение этих задач алгоритмами со специальным правилом выбора опорных строк и столбцов позволяет избежать появления плохо обусловленных матриц. Кроме того, применение специальной мультипликативной формы с плотной записью мультипликаторов для обратной опорной матрицы блочной структуры позволяет решать задачи больших размеров.

Рассматриваемый в данной статье численный метод также основан на редукции к конечномерной задаче оптимизации и конструктивно учитывает фазовые ограничения путем применения эффективных алгоритмов линейного (см. [7]) и нелинейного программировании (см. [8]) для решения вспомогательных задач большой размерности. На внешних итерациях этого метода решаются задачи минимизации специально сконструированного нелинейного функционала — модифицированного лагранжиана при линеаризованных на полученном приближении фазовых ограничениях. Приближенные решения этих задач находятся итерационным методом приведенного градиента с использованием сопряженной системы для расчета градиентов. Высокая трудоемкость внешней итерации этого алгоритма окупается тем, что наряду с улучшением управления здесь одновременно уточняются и значения двойственных переменных, через которые формируются необходимые условия оптимальности и вычисляется оптимальное управление в задаче с фазовыми ограничениями. Вместе с тем следует отметить, что современные информационные технологии и многопроцессорная вычислительная техника допускают достаточно эффективную реализацию сложных алгоритмов, например, путем применения параллельных вычислений (см. [9]). Программное обеспечение, разработанное на основе данного подхода и реализующее многометодную технологию расчета оптимального управления, успешно применяется для решения сложных прикладных задач оптимального управления из различных областей науки и техники (см., например, [1], [10]—[15]).

1. ПОСТАНОВКА ЗАДАЧИ. ГРАДИЕНТЫ ФУНКЦИОНАЛОВ И ПРИМЕНЕНИЕ МЕТОДА ШТРАФОВ

Пусть управляемый процесс описывается системой

х = Л(х, и, ?), х(?0) = х0, ? е Т = [?0, ?!], х(?) е К", и(?) е К", (1)

с терминальными условиями

Ц и) = ф}(х( ?!)) = 0, / = тт, (2)

при заданных фазовых ограничениях

и, ?) = ¿(х (?)) = 0, г = й, ? е Т, (3)

и ограничениях на управление

а,(?)< и1 (/)<р(?), I = ТГг, ? е Т. (4)

Целевой функционал определен как функция конечного состояния системы

1о (и) = Ф°(х (?!)) — шт. (5)

Пусть вектор-функция/(х, и, ?) непрерывно дифференцируема по х и и, и кусочно-непрерывна по ?, а функции фу', ] = 0, т , и I = !, ^ , непрерывно дифференцируемы по х.

Градиенты функционалов 1(и),] = 0, т , с помощью функций Н (у], х, и, ?) = у/ (?/(х, и, ?) и сопряженной системы

У/ = -Лх(х, и, ?)'У/(?) , У/(?!) = -фх(х(?!)) (6)

традиционно определяются по формулам

V Ци) = -Ни (У/, х, и, ?), / = 0~т. (7)

Для каждого ? е Т можно аналогично вычислить градиенты функционалов

1(и, ?), Ц = !, я,

VI/(и, ?) = -Н}(Ф/, х, и, г, Т), ?0 < т < ? < ?х,

где HJ (Фу, х, u, t, т) = Ф^ (t, т)/(х, u, т), Фу(?, т), j = 1, s, — решения сопряженной системы

д Фу( t, т ) _ 3f(x, u, т )

дт дх

Ф/^т), т е [to, t], (9)

с краевыми условиями

Ф/1, t) _- täpn, J _ 17s.

дх

Заметим, что в представлении градиентов (7), (8) учитывается лишь влияние вариации управления на изменение значений 9/'(x(t1)), j = 0, m и gi(x(t)), i = 1, s , через систему (1). Другими словами, расчет градиентов VIj(u), j = 0, m , по формулам (6), (7) ведется без учета связей (3), а при

расчете V/i(u, t), i = 1, s, по формулам (8), (9) не учитываются терминальные условия (2). Однако при построении численных методов нередко используются именно градиенты вида (7), (8). Например, в градиентном методе (см. [16]) вариация управления du вычисляется как линейная комбинация градиентов (7):

m

du(t) _ VI0(u) + ^XtVI(u) (10)

i _ 1

с коэффициентами Xi, i = 1, m , которые находятся из решения системы, полученной линеаризацией условий (2) в окрестности к-то приближения.

Вариацией (10) ограничения (3) не учитываются, поэтому применение методов такого типа к задачам с фазовыми ограничениями требует введения штрафного функционала, например, следующего вида:

1о ( и ) = Ф° (X ( ?!)) + £ ( . (11)

1= 1

Функционал (11) существенно снижает их эффективность в силу необходимости выбора коэффициентов Щ > 0, ] = 1, ^, обеспечивающих достижение заданной точности выполнения ограничений (3).

Заметим, что при отсутствии ограничений на фазовые координаты (2), (3) можно применять не только методы градиентного типа, но и более эффективные для этих задач численные методы, основанные на принципе максимума (см. [17]—[19]). В отличие от градиентных методов они применимы, например, и в задачах с дискретным множеством допустимых управлений и, используя различные способы игольчатого варьирования управления (см. [1], [2], [19]), эти алгоритмы обеспечивают сходимость к управлениям, на которых выполняется принцип максимума. На основе формулы приращения второго порядка, полученной на игольчатой вариации, конструируется также алгоритм (см. [19]) для нахождения особого управления в случае вырождения принципа максимума.

В последнее время для конструирования численных методов оптимизации широко применяются модифицированные функции Лагранжа (см. [3]), структура которых обычно тесно связана с видом ограничений задачи оптимизации. Учитывая специфику ограничений задачи оптимального управления (1)—(5), строим для нее модифицированную функцию Лагранжа, а для ее минимизации используем наиболее подходящий вариант метода линеаризации.

s

2. АЛГОРИТМ ПОСЛЕДОВАТЕЛЬНОЙ ЛИНЕАРИЗАЦИИ ОГРАНИЧЕНИЙ С ПРИМЕНЕНИЕМ МОДИФИЦИРОВАННОЙ ФУНКЦИИ ЛАГРАНЖА

Теперь перейдем к рассмотрению полной задачи (1)—(5). Сначала получим для нее вид сопряженной системы, решение которой позволит записать градиент функционала в форме (7), но

с учетом не только дифференциальных связей (1), но и ограничений (2), (3). Для этого составим лагранжиан, включающий все условия типа равенств задачи (1)—(5):

m 'i 'i s

L(u, x, у, X, и) = ф°(x('1)) + ^hy(x(ti)) + Jy(t)'[x-f(x, u,')]dt + J^t)g(x('))dt, (12)

i = 1 t t i = 1

'o 'O

и, дифференцируя его по переменным х и и, находим для него первую вариацию:

m

5 L = фх°(х( 'i ))5x( 'i) + £ фХ (x( 'i ))5 x('i) +

i = i

(13)

+ |у(?)'[5х(?) -/Х(х, и, ?)5х(?) -/и(х, и, ?)5и(?)]dг + |£(х(?))5х(?)dг.

I I г = !

'0 '0

Затем, применив интегрирование по частям к члену Р!у(?)'х(?) dг, запишем (13) в следующем виде:

J ?0

5L =

фx0 (x( ti)) + £ ti) + у( ti)

i = i

5x (ti) +

-у'(?) - у(?) 'Л(х, и, ?) + £ ?)¿х(х(?))

- г =!

Пусть теперь функция у (?) будет решением сопряженной системы

&

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком