научная статья по теме МИНИМАКСНОЕ ПРОГРАММНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ СБЛИЖЕНИЯ В ДВУХУРОВНЕВОЙ ИЕРАРХИЧЕСКОЙ ДИСКРЕТНОЙ ДИНАМИЧЕСКОЙ СИСТЕМЕ Автоматика. Вычислительная техника

Текст научной статьи на тему «МИНИМАКСНОЕ ПРОГРАММНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ СБЛИЖЕНИЯ В ДВУХУРОВНЕВОЙ ИЕРАРХИЧЕСКОЙ ДИСКРЕТНОЙ ДИНАМИЧЕСКОЙ СИСТЕМЕ»

Автоматика и телемеханика, № 3, 2014

© 2014 г. А.Ф. ШОРИКОВ, д-р физ.-мат. наук (Уральский федеральный университет, Институт математики и механики УрО РАН, Екатеринбург)

МИНИМАКСНОЕ ПРОГРАММНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ СБЛИЖЕНИЯ В ДВУХУРОВНЕВОЙ ИЕРАРХИЧЕСКОЙ ДИСКРЕТНОЙ ДИНАМИЧЕСКОЙ СИСТЕМЕ1

Рассматривается динамическая система, состоящая из трех объектов, динамика которых описывается векторными линейными дискретными рекуррентными уравнениями. В системе выделено два уровня принятия управленческих решений — основной и второстепенный, имеющие различные критерии функционирования и объединенные между собой априори определенными информационными и управляющими связями. Для исследуемой динамической системы предлагается математическая формализация в форме решения многошаговой задачи двухуровневого иерархического минимаксного программного управления процессом сближения с неполной информацией и приводится общая схема ее решения.

1. Введение

В данной работе рассматривается линейная дискретная динамическая система, состоящая из трех управляемых объектов, в которой выделены два уровня принятия управленческих решений — основной (или первый уровень) и второстепенный (или второй уровень), имеющие различные критерии функционирования и объединенные между собой априори определенными информационными и управленческими связями. Предполагается, что на заданном целочисленном промежутке времени динамика каждого из объектов I, II и II этой системы, управляемых доминирующим игроком-преследователем Р, подчиненным игроком 5 и игроком-уклоняющимся Е соответственно, описывается соответствующим векторным линейным дискретным рекуррентным соотношением. Управляющие параметры, фазовые состояния объектов и все априори неопределенные параметры рассматриваемой системы стеснены заданными геометрическими ограничениями, имеющими вид выпуклых многогранников в соответствующих конечномерных векторных пространствах. Для исследуемой динамической системы в работе предлагается математическая формализация в форме решения многошаговой задачи двухуровневого иерархического программного минимаксного управления (оптимизации гарантированного результата) процессом сближения с неполной информацией и приводится общая схема ее решения.

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 12-01-00043-а).

Полученные в данной работе результаты основываются на исследованиях [1-10] и могут быть использованы при компьютерном моделировании и создании многоуровневых систем управления для сложных механических, экономических и других динамических процессов, функционирующих в условиях дефицита информации. Математические модели таких процессов представлены, например, в [1-4, 6, 9, 10].

2. Динамика объектов двухуровневой системы

Пусть на заданном целочисленном промежутке времени 0,Т = {0,1,... ..., Т} (Т > 0) рассматривается дискретная динамическая система, которая состоит из трех объектов. Динамика объекта I — основного, управляемого доминирующим игроком Р — игроком-преследователем, описывается векторным линейным дискретным рекуррентным соотношением вида

(1) у(* + 1) = А(*)у(*) + В (*)и(*) + С (¿)и(1) (*), у(0) = уо,

динамика объекта II — вспомогательного, управляемого подчиненным игроком 5, описывается следующим соотношением

(2) у(1)(£ + 1) = А(1)(£)у(1)(£) + В(1)(£)и(£) + С (1)(£)и(1)(£), у(1)(0) = у^

и динамика объекта II, управляемого игроком-уклоняющимся Е, описывается соотношением вида

(3) г(г + 1) = А(*)г(*) + 5(*)ф), г(0) = го.

Здесь I £ 0,Т — 1] у £ Кг, у^ е КГ1 и геК8- фазовые векторы объектов I, I! и II соответственно (г, Т1,в € N где N — множество всех натуральных чисел; для п € N И,га — к-мерное векторное пространство, элементы которого будем представлять в виде вектор-столбцов, даже если из экономии места они записаны в строчку); и(£) € Ир, и(1)(£) € ИР1 и -и(£) € И,9 — векторы управляющих воздействий (управлений) игроков Р, 5 и Е соответственно, стесненные заданными ограничениями

(4) п(г) € ии и(1)(¿) € и(1), €

действительные матрицы А(£), В(£) и С(¿) определяют динамику объекта I и имеют размерности (г х г), (г х р) и (г х Р1) соответственно; действительные матрицы А(1)(£), В(1)(£) и определяют динамику объекта ^ и имеют

размерности (п х п), (г1 х р) и (п х Р1) соответственно; действительные матрицы А(£) и В(£) определяют динамику объекта II и имеют размерности (в х в) и (в х д) соответственно; для всех í € 0, Т каждая из матриц А(1), (1) и является невырожденной, т.е. для них существуют соответствующие им обратные матрицы [А(£)]-1, [А(1)(¿)]-1 и [А(£)]-1.

Предполагается также, что для всех моментов времени I € 0, Т фазовые векторы у(£), у(1)(£) и г(£) объектов I, Il и II соответственно, кроме удовлетворения начальным условиям в соотношениях (1)-(3), стеснены заданными

ограничениями

(5) y(t) € y(1)(t) € Y(1), z(t) € Zi,

где в ограничениях (4) и (5) множества Ui, V1, Y1, Y1(1) и Zi являются

выпуклыми многогранниками в соответствующих конечномерных векторных пространствах (здесь и далее под выпуклым многогранником в конкретном конечномерном векторном пространстве понимается выпуклая оболочка конечного числа точек).

Игроки P, S и E в совокупности образуют основной (или первый) уровень рассматриваемого процесса управления, и в сфере их интересов находятся значения фазовых состояний объектов I, I1 и II. Игрок S в одиночку образует второстепенный (или второй) уровень рассматриваемого процесса управления, и в сфере его интересов находятся значения фазовых состояний только объекта I1, которые зависят от поведения игрока P.

3. Информационные условия для субъектов управления

Процесс управления в дискретной динамической системе (1)-(5) осуществляется при наличии следующих информационных условий.

Игроком Р для любого момента времени т€1,Т измеряются и запоминаются значения следующих величин: у(0) = у0, у(1)(0) = у0^; и(-) = = {иЦ)}г&0 т-1, и^^(-) = г_1; реализации информационного сиг-

нала ш(-) = € 11т, ш(0) = Шо; т € N, т ^ в), значения

которого формируются в соответствии с соотношением (уравнением измерений сигнала)

(6) = сшм*)+^(¿)е(^), сад е Н1.

Здесь для всех векторов у е Кг: О (у) и ^ есть действительные матрицы размеров (т х з) и (т х 1) соответственно, при этом предполагается, что для всех у ранг матрицы О(у) равен т — размерности вектора ш; множество есть выпуклый многогранник в пространстве К1.

В течение процесса управления игроку Р известно также множество 2 (0) = 2 Q 2 всех возможных состояний начального фазового вектора ¿(0) = ¿о объекта II, которое совместимо (см. [1]) с начальным информационным сигналом ш>о и является выпуклым многогранником в пространстве К5.

Игроком ¿> для любого момента времени т € 1, Т измеряются и запоминаются значения следующих величин: у^1\т)] и(-) = {и(1)}1&т Т-1; =

t&r.T -1'

При этом предполагается, что в любой момент времени I € 0, Т — 1 основного промежутка времени 0 , Т выбор игроком ¿> своего управления 11,^(1) стеснен не только ограничением (4), но и зависит от выбора управления п(Ь) е е и1 игрока Р на основании априори задаваемого отображения Ф1. А именно,

пусть отображение Ф1 такое, что выполняется

Ф1 : Ui ->■ comp([41}); V t € О, Г - 1, V u(t) € Ub (7) u(1)(t) € Ф1(и(*)) € comp(U1(1)),

где Ф1(и(г)) есть выпуклый многогранник пространства Rp1 для всех u(t) € € U1. При этом введенное ограничение (7) устанавливает, что поведение игрока S явно зависит от поведения игрока P.

Предполагается также, что в рассматриваемом процессе управления для любого момента времени t € 0,Т игроку Р известны соотношения (1)—(7), а игроку S — соотношения (2), (4), (5), (7).

В рассматриваемом процессе предполагается, что игрок E может располагать полной информацией обо всех параметрах дискретной динамической системы (1)—(7) и реализациях фазовых векторов объектов I, I1 и II.

4. Определения и вспомогательные свойства системы

Для фиксированных числа к € N, целочисленного промежутка времени т,г? СО, Т (т ^ '&) символом Sfc(r, '&) будем обозначать метрическое пространство функций целочисленного аргумента <р : т,§ —> Rfc, в котором метрика pk определяется как

pk{ipi{-),ip2{-)) = max || Lpi{t) - ip2{t) ||fc ((^i(-), У2(■)) € Sfc(r, tf) x Sfc(r, §)),

а символом comp(Sfc(r, $)) — множество всех непустых и компактных в смысле этой метрики подмножеств пространства Sд.(т, Здесь для х € Rfc всюду далее || x ||k — евклидова норма вектора x в пространстве Rk. На основании ограничения (4) определим множество

U(rTi?) € comp(Sp(r,tf - 1))

допустимых программных управлений и(-) = {u(t)}teT ,l9_l игрока Р на промежутке времени т, § С О, Т (т < §) соотношением

U(rTi?) = {и(-) : и(-) € Sp(r,i? - 1), V t € т, tf - 1, u(t) € lh}.

Аналогичным образом в соответствии с ограничениями (4)—(6) определяются следующие множества:

т, V(r, 3(т, :д).

Будем называть множества: §) — всех возможных программных

управлений игрока S] V(r, 1?) — всех возможных программных управлений игрока Е] 3(т, (?) —допустимых ошибок (погрешностей) измерения информационного сигнала, моделируемого соотношением (6), которые в совокупности соответствуют промежутку времени т,§.

На основании ограничений (4) и (7) для фиксированного допустимого программного управления и(-) € и(т, §) игрока Р определим множество € сотр(8Р1(т, :д — 1)) допустимых программных управлений

£ §) игрока 5 на промежутке времени т,§, соответствующих

допустимому программному управлению и(-) игрока Р, соотношением

= {и{1)(-) ■■ и(1)(-) е У г 11{1\г) е ф^/^))}.

Обозначим через Г2(т, (?) сБт(т + 1, (?) множество всех допустимых в силу (1)-(7) реализаций ш(-) = ^ информационного сигнала на проме-

жутке времени т, 1?.

Назовем набор «>(т) = {т,у(т),у(1)(т), 2(т)} € О/Г х Кг х КГ1 х сотр(НЛ') (где 2(т) есть множество всех допустимых состояний фазового вектора ¿(т) е е К5 объекта II в момент времени т, ш(0) = ш0 = {0, у0, у0^, 20}, ш*(0) = = гу5 = {0,уо,Уо1},2о*}) и набор ад(1)(т) = {т,у{1)(т)} € 0/Г х КГ1 (ги(1)(0) =

= -шО^ = {0, уО^ }) соответственно т-позицией игрока Р и т-позицией игрока 5 в дискретной динамической системе (1)-(7), где непустое

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком