WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 15 |

действий с определенной вероятностью. Тогда выбор игрока будет {(повысить, повысить), (повысить, пасовать), (пасовать, поописываться вероятностным распределением на множестве высить), (пасовать, пасовать)}. В этих парах первый элемент озвозможных в данной игровой ситуации действий, которое назыначает действие игрока в случае выпадения красной, второй – в вается смешанной стратегией. Оказывается, что такое поведение случае выпадения черной карты.

в некоторых ситуациях может привести игрока к более выгодному Второй игрок имеет одно информационное состояние и две распределению полезностей. Например, пусть в рассмотренной возможных стратегии {(Принять), (Пасовать)}.

выше игре «Минипокер» (см. примеры 4 и 10), первый игрок в Нормальная форма игры, построенная с учетом усреднения результате долгого размышления выбрал стратегию повышать, полезности по состояниям природы (цвета выбранной карты) тоесли выпала красная карта, и пасовать, если выпала черная. Тогда, гда будет следующей:

если игрок 2 достаточно умен, он может повторить со своей Принять Пасовать стороны рассуждения первого игрока, и считать, что если игрок Повысить, повысить (0,0) (1,-1) повышает, значит, выпала красная карта, и ему нужно пасовать31.

Повысить, пасовать (0.5,-0.5) (0,0). • Если же игрок 1 может использовать смешанные стратегии, то (-0.5,0.5) (1,-1) Пасовать, повысить второй игрок уже не может установить цвет карты по ходу первого игрока. Его задача усложняется. Таким образом, блеф (а в данном Пасовать, пасовать (0,0) (0,0) случае именно так можно охарактеризовать использование первым Понятно, что непрерывную игру, в которой множество страигроком смешанных стратегий) может быть очень полезен. Мало тегий не является конечным, изобразить в виде конечного графа того, оказывается, что возможность использования игроками невозможно. Однако, в большинстве случаев можно непосредстсмешанных стратегий играет немалую роль в доказательстве венно построить соответствующую игру в нормальной форме.

существования решения теоретико-игровых задач.

3.4. Смешанные стратегии Определение 4: Смешанной стратегией i i-го игрока При построении нормальной формы игры по ее развернутой ( i N ) для игры в нормальной форме называется распределение форме, множества стратегий исходной игры превращаются во множества действий игры в нормальной форме. Зачастую действие игрока в игре в нормальной форме также называют стратегией. Это не совсем верно. Обычно термин «стратегия» имеет более Класс игр, в которых наблюдение выборов партнеров дает игрокам широкий смысл и используется для обозначения «плана», который дополнительную информацию, получил название signaling games [74].

57 Теорема 2 [82]. Для произвольной обстановки в смешанных вероятности на множестве действий Xi с плотностью i(xi), где стратегиях найдется чистая стратегия, являющаяся «наилучшим xi Xi.

ответом» на данную обстановку, то есть Определение 5: Вектор действий x-i = (x1,..., xi-1, xi+1,..., xn) -i max K(i, -i ) = max K (xi, -i ).

i xiXi всех игроков, кроме i-го, называется обстановкой игры для i-го игрока ( i N ).

Более того, любая смешанная стратегия i, которая содержит Определение 6: Распределение вероятности (с плотностью с ненулевой вероятностью чистую стратегию, не являющуюся -i (x-i ) = (xj ) ) реализации заданной обстановки при исполь j лучшим ответом на обстановку -i, не будет и сама лучшим отвеji том на обстановку -i.

зовании игроками смешанных стратегий j называется обстановДоказательство. Множество смешанных стратегий – это кой в смешанных стратегиях для i-го игрока, i N.

компакт, в котором содержатся и чистые стратегии. Для игрока i Ожидаемый выигрыш игроков при использовании ими смезафиксируем обстановку в смешанных стратегиях -i. Тогда шанных стратегий будет вычисляться как математическое ожиожидаемый выигрыш игрока i будет функцией только его смедание их функции выигрыша. Для дискретных игр ~ шанной стратегии i. Очевидно, существует смешанная стратегия Ki () = (xi, x-i )i (xi )-i (x-i ), i N.

Ki xiX x-iX-i i i*, при использовании которой ожидаемый выигрыш достигает Смешанная стратегия для непрерывных игр представляет сомаксимума.

бой вероятностную меру на множестве чистых стратегий игрока.

Для стратегии i* ожидаемый выигрыш есть Ожидаемая полезность игроков при использовании ими смешан(6) Ki (i*, ) = i* (xi ) (xi, x-i ) (x-i ).

ных стратегий будет интегралом функции полезности по декартову -i Ki -i xiX x-iX i -i произведению этих вероятностных мер.

* Так как (xi ) = 1, то Ki (i*, -i ) представляет собой Дискретную игру, в которой игроки используют смешанные i xiXi стратегии, можно привести к непрерывной игре, в которой игроки используют только чистые стратегии. Это достигается путем взвешенную с весами i*(.) сумму величин ~ замены множества чистых стратегий игрока на множество его (7) Ki (xi ) = (xi, x-i ) (x-i ).

Ki -i смешанных стратегий, а функции выигрыша – ее математическим x-iX -i ожиданием.

Взвешенная сумма (6) не может превышать своего максиТогда можно исследовать свойства новой игры в предполомального слагаемого, то есть существует чистая стратегия xi**, для жении, что игроки используют только чистые стратегии. Это, од~ ** которой Ki (xi ) Ki (i*, -i ). Но в правой части этого неравенстнако, не всегда бывает удобным, так как такой переход приводит к замене более простой, дискретной игры, более сложной – не- ва стоит максимальный ожидаемый выигрыш, возможный при прерывной. использовании смешанных стратегий. Значит, неравенство можно заменить равенством, а это, в свою очередь, значит, что максиПриведем несколько свойств смешанных стратегий в дисмальный ожидаемый выигрыш достигается на некоторой чистой кретных играх.



стратегии. Кроме того, если любой не максимальный элемент (7) Лемма 1 [82]. Ожидаемая полезность дискретной игры – невходит в сумму (6) с ненулевым весом, то ожидаемая полезность прерывная функция смешанных стратегий. • 59 будет строго меньше максимально возможной, и смешанная стра- этом исследователю приходится становиться на точку зрения каждого из игроков, то есть абстрагироваться (хотя бы на время) от тегия не будет наилучшим ответом на обстановку -i. • непосредственных интересов оперирующей стороны. Аналогично Смешанные стратегии – довольно хрупкая конструкция. Их и задача описания рациональных исходов распадается на задачи использование в ряде практических задач неоднократно подверрационального выбора всех игроков, то есть рассмотрения игры с галось критике. Один из аргументов [21] против использования точки зрения каждого из игроков. Тем не менее, эти два подхода смешанных стратегий таков: «Применение смешанных стратегий несколько различаются в методическом плане. В некоторых ситуаподходит только для игр с большим числом повторений. Расциях (например, в иерархических играх – см. шестую главу) более смотрим игру, которая должна быть сыграна лишь один раз. При продуктивным оказывается подход теории принятия решений, в использовании смешанных стратегий игрок должен выбирать свое других же ситуациях лучше подходит описательный метод. Соотрешение на основании реализации случайного процесса, заветственно, различные концепции решения игр более склонны к даваемого распределением вероятности его смешанной стратегии.

тому подходу, в рамках которого они зародились.

Однако эта реализация может дать стратегию, настолько «экзоРешением игры в самом общем смысле можно назвать любое тическую», что ее применение в единичной игре будет малоэфописание того, каким образом должны вести себя игроки в той или фективно, несмотря на теоретические обоснования эффективности иной игровой ситуации [18]. Это не обязательно должен быть такой смешанной стратегии в смысле среднего выигрыша на набор рекомендуемых для каждого игрока действий. Решением, протяжении многих игр».

например, может быть набор исходов игры. Такое решение можно Поэтому, когда возможно, особенно при моделировании реинтерпретировать как набор ситуаций, рациональных относиальных систем, следует использовать только чистые стратегии.

тельно некоторых предположений о поведении игроков. То есть при рациональном поведении игроков должны реализовываться 3.5. Различные концепции решения игр только ситуации, принадлежащие решению. Решением игры моВыше были перечислены постановки задач теории игр. Тежет быть и набор смешанных стратегий, если одних только чисперь наступило время для того, чтобы приступить к решению этих тых стратегий недостаточно.

задач. Но что означает найти решение игры, решить теоретикоВ настоящее время в теории игр не существует единой конигровую задачу цепции решения, одинаково подходящей для всех классов игр.

С формальной точки зрения можно разделить задачи приняСвязано это, во-первых, с тем, что формальное описание игры тия решений в теории игр, когда игра рассматривается с точки представляет собой лишь очень грубый «слепок» с чрезвычайно зрения одного из игроков, которому (на основании исследования сложных реальных процессов, происходящих в ходе игры: обмена игры) рекомендуется то или иное поведение, и задачи прогнозироинформацией, возможных договоров между игроками, самования результатов игры, то есть описательные задачи, когда исслестоятельных действий игроков по увеличению своей информиродователь занимается поиском возможных устойчивых исходов игванности. Нельзя исключать и возможности иррационального ры при рациональном поведении игроков. Понятно, что, в силу поведения игроков, которое на сегодняшний день практически не специфики теории игр, эти задачи взаимосвязаны, так как задача поддается формализации.

принятия решений в теории игр с неизбежностью требует прогноЕсли ставить целью включить все подобные детали в описазирования поведения других рациональных игроков. Предположение игры, то оно может стать слишком сложным для конструкние о разумности противников/партнеров требует рассмотрения их тивного анализа.

поведения с не меньшей подробностью, чем поведения ЛПР, при 61 Другая сложность состоит в том, что само понимание того, Сами предположения о рациональном поведении при этом что такое рациональное поведение, различно у разных людей. То, остаются на заднем плане. Их обоснование не является, на самом что кажется рациональным одним, может показаться не рацио- деле, сферой действия теории игр или теории принятия решений, и нальным другим, и современная наука зачастую не знает объек- относятся скорее к сфере психологии, социологии и философии.

тивных причин, лежащих за этими различиями в поведении [31, Этот подход был продемонстрирован выше при определении 38, 39, 46, 73].

условий, которым должно удовлетворять отношение предпочтеВ связи с этим теория игр не всегда может точно предсказать ния, чтобы на его основе можно было определить функцию поповедение игроков в реальной игровой ситуации или дать одно- лезности (см. раздел 2.2). Условия формулировались в виде набора значную рекомендацию по принятию решения. аксиом. Аналогично можно поступить и при формулировке концепции решения [18, 46]:





Это общая проблема всех формальных, модельных исследований, не только в теории игр, но и в физике, экономике и т.д. Тем Шаг 1. Определить аксиомы, фиксирующие некоторое предне менее, ценность модельных исследований конфликта бесспорна, ставление о рациональном поведении.

поскольку они дают возможность, исследуя достаточно простые Шаг 2. Проверить, что аксиомы не противоречат друг другу.

модели, выяснять основные закономерности, которые лежат в Шаг 3. Убедиться, что аксиомы позволяют сузить множество основе рационального поведения в конфликтных ситуациях.

рассматриваемых игроками альтернатив.

Шаг 4. На основе введенных аксиом построить механизм наЗадачей теории игр на современном этапе ее развития явля- хождения решения игры.

ется не поиск единственного решения игры, то есть полного пред- Шаг 5. Исследовать свойства решений: их существование для сказания поведения игроков, а, скорее, отсечение ситуаций и спо- всех (или некоторых) классов игр, единственность решения и т.д.

собов поведения игроков, которые рациональными, разумными, Шаг 6. Разработать алгоритмы вычисления решения.

назвать нельзя.

Известные на сегодняшний день концепции решения облаФормально теоретико-игровую концепцию решения можно дают одним из двух недостатков: либо решение существует не для представить, как некоторое отображение множества игр на мно- всех игр, либо существуют игры, для которых это решение прожество решений. Это отображение может не охватывать все воз- тиворечит здравому смыслу. Трудности с поиском приемлемой можные игры, то есть решение может не существовать для неко- общей концепции решения привели к появлению многочисленных торых игр или их классов, может быть неоднозначным, то есть частных концепций, удовлетворяющих требованиям здравого ставить в соответствие некоторой игре несколько решений, кото- смысла, но существующих только для ограниченного класса игр.

рые представляются разумными с точки зрения этой концепции.

Определение любой концепции решения невозможно без не- Ниже рассматриваются наиболее часто используемые в теории которых предположений относительно психологии игроков, того, игр и в теории принятия решений принципы рационального что они понимают под рациональным поведением. По сути, любое поведения и соответствующие им концепции равновесия (решения такое предположение, которое позволяет сузить множество аль- игры). Соотношение между различными концепциями равновесия тернатив в игровой задаче выбора, определяет некоторую концеп- обсуждается в разделе 3.13.

цию решения [18]. После этого можно говорить о формализации концепции решения, проверке существования или единственности решения для всех игр или некоторых классов игр, исследовать свойства решений, разрабатывать алгоритмы их нахождения.

63 3.6. Удаление доминируемых стратегий вания первой смешанной стратегии ниже, чем от использования второй стратегии.

Определение 7: Стратегия xi Xi называется строго доминиУдаление доминируемых стратегий, тем не менее, довольно руемой стратегией игрока i, если существует стратегия yi Xi таслабая концепция решения, так как во многих практически интекая, что для произвольной обстановки x-i, выполняется неравенресных играх все стратегии строго недоминируемы. Ее применество32 Ki ( yi, x-i ) > Ki (xi, x-i ).

ние к анализу игры оправданно на первоначальном этапе, когда, за Определение 8: Стратегия xi Xi называется строго недомисчет исключения из рассмотрения доминируемых стратегий, нируемой стратегией игрока i, если для произвольной стратегии исследование игры упрощается.

yiXi найдется обстановка x-i такая, что Ki ( yi, x-i ) Ki (xi, x-i ).

Использование строго доминируемых стратегий представля3.7. Равновесие в доминантных стратегиях ется неразумным способом поведения, ведь, независимо от повеОпределение 9: Стратегия xi* называется доминантной страдения противников, можно получить больший выигрыш, испольтегией игрока i, если для любой обстановки x-i X и для лю-i зуя одну из строго недоминируемых стратегий.

бых xi Xi справедливо неравенство Ki (xi* | x-i ) Ki (xi x-i ).

Первое, что можно сделать для сужения множеств альтернаЭто определение означает, что, если у игрока, независимо от тив игроков – это убрать из рассмотрения строго доминируемые действий противников, есть стратегия, дающая ему максимальный чистые стратегии. После удаления из игры доминируемых страпо сравнению с другими его стратегиями выигрыш, то эта стратетегий одного из игроков может оказаться, что одна или несколько гия называется доминантной.

стратегий другого игрока, недоминируемых в исходной игре, Целесообразность использования каждым игроком своих достановятся доминируемыми в новой игре. Тогда процесс удаления минантных стратегий очевидна.

можно повторять до тех пор, пока все стратегии всех игроков Определение 10: Если для каждого игрока i существует домибудут недоминируемыми.

* нантная стратегия xi*, то их совокупность x* = (xi )iN называется Легко показать, что для любой дискретной игры множество строго недоминируемых стратегий для каждого игрока не пусто. равновесием в доминантных стратегиях (РДС).

Действительно, поскольку отношение доминирования транзитив- Равновесие в доминантных стратегиях существует далеко не но, а стратегий конечное число, всегда найдется недоминируемая для всех игр. Приведем несколько лемм, определяющих некоторые стратегия. классы игр, в которых существует равновесие в доминантных стратегиях.

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.