научная статья по теме О РЕШЕНИИ ИЕРАРХИЧЕСКОЙ ИГРЫ ПРИ НЕОПРЕДЕЛЕННОСТИ С СУММАРНЫМ РИСКОМ ИГРОКОВ Кибернетика

Текст научной статьи на тему «О РЕШЕНИИ ИЕРАРХИЧЕСКОЙ ИГРЫ ПРИ НЕОПРЕДЕЛЕННОСТИ С СУММАРНЫМ РИСКОМ ИГРОКОВ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 5, с. 11-17

== УПРАВЛЕНИЕ В СТОХАСТИЧЕСКИХ СИСТЕМАХ

И В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

УДК 519.816

О РЕШЕНИИ ИЕРАРХИЧЕСКОЙ ИГРЫ ПРИ НЕОПРЕДЕЛЕННОСТИ С СУММАРНЫМ РИСКОМ ИГРОКОВ*

© 2007 г. А. В. Родшков, А. Ф. Тараканов

Борисоглебск, Борисоглебский государственный педагогический ин-т Поступила в редакцию 01.11.06 г.

В работе исследована статическая двухуровневая иерархическая игра в условиях неопределенности. Между игроками уровней строится гарантированное равновесие по Нэшу, основанное на функции суммарного риска. Показано, что предлагаемое равновесие в такой игре частично взаимозаменяемо другой ситуацией равновесия и неулучшаемо. Выявлены свойства функции риска. Сформулирован алгоритм решения игры. Приведен пример.

Введение. Начиная с основополагающих работ Р. Айзекса, Н.Н. Воробьёва, Р.Д. Льюса, Н.Н. Кра-совского, О. Моргенштерна, Дж. Фон Неймана, Г. Оуэна, Л.С. Понтрягина, X. Райфы и др., теории игр уделялось постоянное внимание. Это связано с тем, что постановка и решение задач в игровой форме дает возможность адекватно описывать средствами теории игр сложные управляемые системы. Дальнейшее ее развитие отражено, например, в [1-7].

Систематическое использование понятия риска в игровых задачах, по-видимому, осуществлено в [8] и [9]. В них принцип минимаксного сожаления Сэвиджа [10] формализован в функции риска игрока. Эта функция строится как разность максимума функции выигрыша конкретного игрока по его стратегии и ее значения на любых допустимых стратегиях всех игроков. Полученная новая функция численно оценивает сожаление (риск) игрока, что он использует стратегию не из множества максимизирующих стратегий. Были изучены некоторые математические свойства этой функции в игровой ситуации, а также построен ряд гарантированных равновесий для статических бескоалиционных игр с квадратичными функциями выигрыша игроков.

Сравнительно новым направлением в теории игр являются иерархические игры. К соответствующим математическим моделям приводят исследования в области экономики, политической, социальной и военной сфер, международных отношений, экологии. Иерархические варианты игр пока исследованы слабо, о чем можно судить как по содержанию работ, указанных в списке литературы, так и по весьма редким публикациям в периодической печати (см., например, принцип Штакельберга в [11]).

* Работа выполнена при финансовой поддержке Федерального агентства по образованию РФ (грант < 1.1.05).

В данной статье исследуется статическая иерархическая игра двух лиц в условиях неопределенности, при этом предлагается новая функция суммарного риска игроков. Между игроками уровней строится гарантированное равновесие по Нэшу. Показано, что предлагаемое равновесие частично взаимозаменяемо другой ситуацией равновесия и неулучшаемо. Выявлен ряд свойств суммарной функции риска. Сформулирован алгоритм решения игры.

1. Постановка задачи. Игра двух лиц в условиях неопределенности задается набором

N = {1, 2}, У, /х, у)>. (1.1)

В игре (1.1) множество N = {1, 2} - номера игроков, х = (х1, х2) - ситуация игры, каждая из которых образуется соответствующими стратегиями

игроков: х1 е [К 1 - стратегия игрока верхнего

уровня (1-й игрок), х2 е [ 2 - стратегия игрока

нижнего уровня (2-й игрок), У е [ - компактное множество неопределенностей, у е У - неопределенность, функция выигрыша /-го игрока задана

непрерывной на [ х У (п = п1 + п2) скалярной функцией /(х, у), вектор /х, у) = (/¡(х, у), /2(х, у)).

Цель /-го игрока - выбор такой стратегии, чтобы в ситуации х = (х1, х2) его выигрыш/(х, у) принял возможно большее значение. При этом каждый игрок при выборе своей стратегии ориентируется на возможность реализации наименее благоприятных для него значений неопределенности у е У. Предполагается, что игроки обладают достоверной информацией о выбранных ими стратегиях и множестве неопределенностей. Игрокам известны функции выигрыша друг друга.

Игра протекает следующим образом. Центр у*)). Нетрудно видеть, что по построению ситуация (х* , х* (X* )) е X х Х2.

формирует подмножество стратегий

Х1 = {Х1 е К"1)/1 (Х1, Х2, у) = = шах/,(Х1, Х2,у), Х2 е К"2,у е У }

Как известно [11], решение задачи

шах(/1( Х1, Х2, У)+/2 (Х1, Х2, у))

и информирует о нем игрока нижнего уровня дает паретовскую ситуацию (хР , х2Р ). Поэтому (2-го). В ответ 2-й игрок формирует подмножество стратегий

Хг = {Х2 = Х2(Х1) е К 2|/2(Х1, Х2, у) =

= шах/2(Х1, Х2, у), у е У },

Х2

выбирает стратегию Х2 е Х2 и информирует о

значение ^(х*, у*) в равенстве (2.3) численно выражает сожаление игроков, что для неопределенности у* е У (заранее игрокам неизвестной, из-за чего и возникает риск) они выбрали ситуацию

равновесия по Нэшу (х* , х* , (х* )), не являющуюся максимальной по Парето.

Определение 2. Ситуации равновесия из

ней Центр. Таким фразам стратегия 2-го игрока множества N. в игре (1.1) назовем частично взаи-явно зависит от стратегии Центра, который принимает окончательное решение. Затем вычисляются значения функций выигрыша игроков. Игра заканчивается.

мозаменяемыми, если для любых ( х1 , х2 , у1) е N

и ( х2 , х2 , у2) е N выполняются равенства (г = 1, 2)

На множестве К х У определим суммарную функцию риска игроков

X, у) = шах(/1 (Х1, Х2, у) + /2(Х1, Х2, у)) -

Х1, Х2

- (/1( Х1, Х2, у ) + /2( Х1, Х2, у )) .

Нетрудно видеть, что ^(х, у) > 0. Эта функция используется игроками для построения гарантирующей неопределенности.

2. Определение равновесия и его свойства.

Определение 1. Тройку ( х* , х* ( х* ),у*) е

е К 1 х К 2 х У назовем гарантированным равновесием Нэша в игре (1.1), если существует такая неопределенность у*, что выполняются следующие условия:

1) ситуация (х* , х* (х* )) является равновесной по Нэшу в игре

< N = { 1, 2 }, /. (Х1; Х2 ( X! ), у * ). = 1> 2> ,

т.е.

шах/1 ( х1; х* ( х1 ), у *) = /1 ( х*, х* ( х* ), у *), (2.1)

Х1

шах/2 ( х*, Х2 ( х* ), у *) = /2 ( х*, х* ( х* ), у*), (2.2)

/г (Х'Ь Х2, у ) = /.(х\, Х2, у ),

(2.4)

I, к, у = 1, 2, к Ф у.

Свойство 1. Ситуации равновесия из множества N в игре (1.1) частично взаимозаменяемы.

Доказательство. Возьмем произвольные

(х\ , х\ , у1) е N и (х2 , х2 , у2) е N Согласно (2.1)

и (2.2), имеем (хк1 , хк2) е Х\ х Х2, к = 1, 2, и поэтому

/1 (х1, Х2, у) = шах/1 (Х1, Х2, у),

/2(Х1, Хк2, у) = шах/2(Хь Х2, у),

хг е К г, у е У.

Пусть в первом равенстве максимум достигается на х2 , а во втором - на х2 . Тогда при к = 1 будет

/1 (X1, Х2, у ) = /1 ( X2, Х2, у ),

/2 (Х1, х1 у) = /2 (Х1, х2, у) . Полагая в первом равенстве х2 = хк2, а во втором

2) неопределенность у* максимальна в задаче Х1 = Х1, при у = у получим справедливость (2.4) <У, х* , х* (х* ), у)>, т.е. для всех у е У выполняется равенство (х* = (х* , х* (х* )))

х *, у*) = х *, у). (2.3)

/1(х1, Хк2, ук) = /1 (X2, Хк2, ук),

г / к I кк г / к 2 к-.

Л(Х1, Х2, у ) = /2(Х1, Х2, у ) .

Свойство 1 доказано.

Таким образом, в отличие от обычных игр с

(х* ), у*) игры (1.1) обозначим N.. Решением равн°весием Нэша (в вторых взаим°заменяем°-

сти стратегий нет), в иерархической игре выполняется свойство частичной взаимозаменяемости.

Множество гарантированных равновесий (х* ,

X* ( X

игры назовем совокупность (х* , х* (х* ),у*, ^(х*,

12

2

2

Определение 3. Тройку (х*, х* (х*), у*) е Для правой части справедливо неравенство

е ^ назовем неулучшаемым гарантированным равновесием Нэша в игре (1.1), если для любых (х1, х2) е [п выполняются неравенства

/(хъ х2, у* )< /1 (х*, х* (х*), у*), / = 1, 2.

Свойство 2. Пусть тах / (х/, хЖ/, у*) = 0 при

х1

любых х/ е [ '. Тогда любая тройка (х* , х* (х* ), у*) е ^ в игре (1.1) является неулучшаемым га- Вычитая из обеих частей неравенства сумму/1(х*,

/1 ( х *, у * ) + /2 ( х *, у * )<

< 1т ах( /1( хь х2, у *) + /2 (хь х2, у*)).

х1, х2

Поэтому

та^^1 (х1; х* (х!), у *) + та^./2 (х*, х2, у*) <

х1 х2

< тах( /1( хь х2, у *) + /2 (хь х2, у*)).

рантированным равновесием Нэша.

Доказательство. Предположим (х*,

х* (х* ), у*) е Из определения множества Х1 при у = у* и из (2.1) соответственно следует, что

/1( хь х2, у * )< /1 (х2, у*), х/ е [п', /,(х„ х* (х1), у * )< /1( х*, х* (х*), у*), х1 е

Так как для любых х2 е Х2 при х1 е Х1 выполняется

/1 (х2, у*) = тах/1 (х1, х2, у *) = 0,

х1

то, полагая во втором неравенстве х1 = х1 с учетом первого неравенства, получим

/1 (х1, х2, у* )< /1 (х*, х* (х*), у *), х/ е [',

т.е. (х* , х*(х* ),у*) е N - неулучшаемое гарантированное равновесие Нэша. Аналогичное неравенство доказывается для функции /2. Свойство 2 доказано.

Свойство 3. Суммарный риск игроков не меньше суммы их индивидуальных рисков: Щ(х*,

у*) > Щ\(х*, у*) + ^(х*, у*), где Щ(х, у) = тах/ (х,

х/

xN\', у) - /(х1, х2, у) - функция индивидуального риска игрока.

Доказательство. Пусть (х* , х*(х*),

у*) е Так как х* = (х* , х* (х* )) - ситуация равновесия по Нэшу, то

тах/1 (хь х* (х1), у *) = /1 (х *, у *),

х1

тах/2( х*, х2, у *) = х *, у *).

х2

Суммируя, получаем

тах/1 (х1, х* (х1), у *) + та^,/2 (х*, х2, у*) =

х1 х2

= /1( х *, у * ) + /2 ( х *, у * ) .

у*) + /2(х*, у*), имеем

тах/1 (хь х* (х1), у *) + та^./2 (х*, х2, у *) -

х 1 х2

- /1 ( х *, у * ) - /2 ( х *, у* )<

< так (/1 (хь х2, у*) + /2( хь х2, у *)) -

х1' х2

-/1(х*, у* ) - /2(х*, у* )

или

Щ1(х*, у*) + Щ2(х*, у*) < Щх*, у*). Свойство 3 доказано.

Определение 4. Пусть (х* , х* (х* ), у*) е е Ситуация (х* , х* (х*)) называется максимальной по Парето в игре (1.1), если для любых (х1, х2) е [п несовместна система неравенств

/(х* , х* (х* ), у*) </(хь х2, у*), / = 1, 2,

и по крайней мере одно из них строгое.

Свойство 4. Если ситуация (х* , х* (х* )) е

е [п удовлетворяет равенству (условию коллективной рациональности)

/1 (х*, х* (х*), у *) + /2 (х*, х* (х*), у * ) =

= тах[ /(хь х2, у *) + /2 (хь х2, у*)], (2.5)

х1, х2

то она максимальна по Парето в игре (1.1) и тогда Щх* , х* (х* ), у*) = 0.

Доказательство. Предположим противное: ситуация (х* , х* (х*)) не является максимальной по Парето в игре (1.1), т.е. совместна система неравенств

/(х* , х* (х* ), у*) </(х,, х2, у*), / = 1, 2,

из к

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком