научная статья по теме К ВОПРОСУ О РАСШИРЕНИИ ЗАДАЧИ НА МАКСИМИН Автоматика. Вычислительная техника

Текст научной статьи на тему «К ВОПРОСУ О РАСШИРЕНИИ ЗАДАЧИ НА МАКСИМИН»

Автоматика и телемеханика, № 7, 2014

© 2014 г. А.Г. ЧЕНЦОВ, чл.-корр. РАН (chentsov@imm.uran.ru), Ю.В. ШАПАРЬ, канд. физ.-мат. наук (shaparuv@mail.ru) (Институт математики и механики им. Н.Н. Красовского УрО РАН, Екатеринбург, Уральский федеральный университет, Екатеринбург)

К ВОПРОСУ О РАСШИРЕНИИ ЗАДАЧИ НА МАКСИМИН1

Рассматривается абстрактная версия задачи на программный макси-мин с ограничениями импульсного и моментного характера; «<момент-ные» ограничения ослабляются, исследуется асимптотика реализуемых значений максимина в задачах с ослабленными ограничениями и ее представление в классе обобщенных элементов (управлений), определяемых в виде конечно-аддитивных мер. В частности, исследуются вопросы об универсальном «в заданном диапазоне» представлении упомянутой выше асимптотики.

1. Введение

В задачах управления техническими системами нередко возникает необходимость в учете действия неопределенных факторов при допущении их наименее благоприятной реализации. Это касается как управления по принципу обратной связи, так и случая, когда по смыслу исходной задачи возможно использование только программных управлений; см. [1—3]. Ограничиваясь вторым случаем, отметим, что как формирование полезного (программного) управления, так и реализация неопределенных факторов зачастую осуществляются при соблюдении некоторых условий. В то же время на этапе реализации законов управления нередко возникают неучтенные обстоятельства, а потому логично говорить о приближенном соблюдении условий исходной задачи, причем саму степень возможного нарушения «строгих» ограничений бывает трудно указать и приходится ориентироваться на допустимость управлений-программ в асимптотическом смысле. Это касается, в частности, вопросов соблюдения краевых и промежуточных условий, играющих важную роль в задачах управления.

Рассмотрим игровую задачу программного терминального управления на

промежутке 10 △ [¿о,'&о] (здесь и ниже △ — равенство по определению), где ¿о < Имеется две линейные системы £1 и £2, управляемые соответственно игроками I и II, преследующими противоположные цели и формирующими скалярные программные управления п(-) = (и(£), ¿о ^ £ < $о) и

1 Работа выполнена в рамках программы Президиума РАН «Математическая теория управления» (проекты №№ 12-П-1-1019, 12-П-1-1012) и при финансовой поддержке Российского фонда фундаментальных исследование (проекты №№ 12-01-00537, 13-01-00304, 13-0800643).

у(') = ^ t < ); эти управления полагаем для простоты кусочно-

постоянными (к.-п.) и непрерывными справа (н.спр.). Полагаем, что движение £1 является неопределенным (и, по смыслу, помеховым). Тем не менее получающийся результат зависит как от движения £1, так и от движения £2. Так, например, возможна ситуация, когда игрок II стремится уклониться от встречи с системой £1, считая такую встречу потенциально опасной. Ограничимся сейчас случаем зависимости от конечных состояний. Итак, в момент реализуются состояния у(&0) и г(-д0), определяемые действием п(-) и у(-) соответственно при заданных начальных условиях (н.у.). Этим состояниям сопоставляется значение /0(у($0), г($0)) целевой функции /0. Игрок I стремится это значение минимизировать, а игрок II — максимизировать; рассматриваем задачу с позиций игрока II, естественным образом приходя к максимину /0 в качестве оценки оптимальности. Итак, интересуемся результатом, который гарантирует себе игрок II в классе простейших программных управлений. Действия игрока I рассматриваем при этом как помеховые, хотя возможно и целенаправленное построение «мешающих» управлений.

Полагаем, что на выбор программ п(-) и у(-) накладываются два типа ограничений: импульсные и моментные. Первые связаны с энергетикой, а вторые могут, в частности, порождаться краевыми и промежуточными условиями. С практической точки зрения бывает важно рассматривать режимы управления, когда моментные ограничения соблюдаются приближенно, хотя в их составе могут присутствовать компоненты, требующие повышенной точности. Отметим в связи с задачами импульсного управления оригинальный подход Н.Н. Красовского, связанный с применением обобщенных функций (см. [1]) и послуживший основой для многих исследований в этой области.

Конструкции на основе решения задач на максимин в классе программных управлений (программный максимин) с геометрическими ограничениями использовались Н. Н. Красовским и его учениками в теории дифференциальных игр (построение методов решения так называемых регулярных дифференциальных игр; см. [2, 3]).

В этой связи представляется актуальным вопрос о значениях максимина при ослаблении моментных ограничений, которое, в принципе, может иметь различный характер. Сама степень ослабления условий зачастую неизвестна, а потому логичным представляется асимптотический вариант постановки, ориентированной на последовательное ужесточение ослабленных ограничений (данное ужесточение может «не приводить» к исходной постановке, так как нередко отсутствует устойчивость по результату при ослаблении ограничений). Вопросы такого рода, связанные с проблемой достижимости, рассматривались в [4-7] и целом ряде других работ. В этих построениях исходная постановка преобразовывалась к задаче о достижимости с ограничениями асимптотического характера. В [8] данный весьма общий подход был распространен на игровую задачу. В [9, 10] подобные построения связывались с конструкциями расширения в классе конечно-аддитивных (к.-а.) мер.

В упомянутом игровом варианте задачи управления объектом расширения является, строго говоря, пара управлений (п(-),у() игроков или совокупное управление; это существенно в ряде случаев (см. [11, 12]), когда действие (п^),у(1)) € Р х Q «заменялось» действием борелевской меры на произве-

дении конечномерных компактов Р и не сводящейся, вообще говоря, к произведению мер. В то же время в других задачах нужная схема расширения допускает [8-10] декомпозицию: требуемое расширение пространства совокупных управлений допускает сведение к естественной комбинации процедур расширения игроков I и II. Такая декомпозиция доставляет целый ряд полезных свойств (см. [13]); в частности, удается достаточно просто представить асимптотику реализуемых значений максимина при ужесточении ослабленных ограничений моментного характера. В этих построениях реализуется некоторый бесконечномерный игровой аналог конструкций декомпозиции из [14, 15]; идеи В.С. Танаева в части построения декомпозиций задач математического программирования сыграли важную роль в таких приложениях, как дискретные технологические процессы сложной структуры в машиностроении (см. [14, гл. 5-7]). Настоящее исследование доставляет еще одно направление, связанное с декомпозициями.

В настоящей работе, имея в виду возможность использования формулы Коши для представления результатов действия программных управлений в линейных системах, будем придерживаться абстрактного варианта задачи на максимин с ослабляемыми ограничениями; представляется, что такой способ изложения в большей степени отвечает идейным аналогиям процедур декомпозиции работ [8-10, 13] и методов [14, 15]. При этом будем использовать некоторые термины из теории управления, имея в виду упомянутую в начале раздела задачу о взаимодействии систем £1; £2 на промежутке 10; соответствующие конкретные примеры см. в [9, 10, 13]. Существенно новым в сравнении с [9, 10] обстоятельством является то, что здесь будут допускаться различные варианты ослабления стандартных ограничений. Основное внимание будет уделено нахождению условий, гарантирующих существование «общей» асимптотики реализуемых значений максимина. Будет построена обобщенная игровая задача управления в классе конечно-аддитивных мер, определяющая упомянутую асимптотику.

2. Обозначения общего характера

Ниже используется стандартная теоретико-множественная символика, включающая кванторы, связки; ёе£ заменяет фразу «по определению». Через Р(Н) (через Р'(Н)) обозначаем семейство всех (всех непустых) подмножеств множества Н.

Если А и В — множества, то (следуя [16]) через ВА обозначаем множество всех отображений (функций) из А в В (для / € ВА используем также запись / : А — В). Для всяких непустых множеств X, У и 2 € Р'(Х), а также отображения д € Ух сужение (д |2) € У2 данного отображения определяем традиционно: (д|2)(г) = д(г) при г € 2. Если А и В — множества, Н € ВА и С € Р(А), то Н1(С) △ {Н(х) : х € С} € Р(В) есть образ С при действии /. Через М обозначаем вещественную прямую, N = {1; 2;...} € Р'(М) и Т~ш △ {г € N | г ^ т} € Р'^) V т € N.

Полагая (как обычно), что элементы N не являются множествами, для каждого множества Т и числа т € N вместо Т1,т используем более традиционное Тт, получая множество всех кортежей в Т «длины» т. Используем индексную форму записи функций [17]. При т € N т-мерное арифметическое пространство Мт рассматриваем как совокупность кортежей :

1, т —> М; если у = (yг)ie:Y^¡ G Мт, то ||у||^ = тах G [0, оо[ (здесь и ниже

г€1,т

для обозначения промежутков в М используем только квадратные скобки).

В качестве конкретной нормы в Мт используем || ■ ||(т) △ (||ж||(т))хемт; если 5 € Р(Мт) и к €]0, то

(2.1) OKm)[S] △ {y € Rm| 3 s € S : \\y - s\\(m) < к}

есть /í-окрестность S в смысле нормы || • если M G V(l, m), то полагаем,

(2.2) 0Km) [S |M ]△

= {(Уг)г& —г e Mm13 (зг)г&—г G5: (y3 = s3 Vj G MM\Vj -SjI < « Vj € M)} .

Линейные операции, произведение и порядок в пространствах веществен-нозначных (в/з) функций определяем поточечно.

Элементы топологии. Если (X, т) - топологическое пространство (ТП) [18] и A G P(X), то cl(A, т) есть def замыкание множества A в (X,т), а т|a = = {A П G : G G т} - топология A, индуцированная (в A) из (X, т). Каждой точке x G X сопоставляем семейство N°(x) △ {G G т| x G G}, порождающее фильтр NT(x) △ {H G P(X)| 3 G G N°(x) : G С H} окрестностей [19] x в (X, т). Если (X, т1 ) и (Y, т2) - два ТП, то через C(X, т}, Y, т2) обозначаем множество всех непрерывных (в смысле этих ТП) отображений из YX. Если

(T, т) - ТП, то полагаем C(T, т) △ C(T, т, R, тк), где т« есть def обычная | ■ | -топология R. При s G N оснащаем Rs обычной топологие

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком