WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 12 | 13 || 15 |

x2 X – компактные ком стратегии наказания) отрезку [0, 0.5], так как только н x2 X = [0,10] физическое ог- на этом отрезке его затраты равмножества действий.

2 L2 = max f2(x1 (x2), x2 ) = x2X 2 ны C, а дальше только возрастараничение по производительно= max min f2 (x1, x2 ). ют. То есть L2 = –C.

сти работы.

0 x2X x1XСтратегия центра – Трудовой контракт, который Множество действий второ~ ~ x1 = x1(x2), то есть предпо- центр предлагает работнику, сого игрока, обеспечивающих стоит в указании зависимости лагается следующий поряему максимальный выиг~ ~ x1 = x1(x2) зарплаты x1 от редок функционирования:

рыш при использовании игрок 1, обладая правом зультата работы x2. Зарплата выпервым игроком стратегии первого хода, сообщает иг- плачивается по результату рабонаказания року 2 план выбора своей ты, то есть после выбора работн E2 = {x2 | f2 (x1 (x2 ), x2 ) =L2}.

стратегии в зависимости от ником действия x2.

Множество достижимости Здесь множество D представляет выбранной игроком 2 стра- Считается, что работник выбирасобой совокупность всех зарплат D ={(x1, x2): f2(x1, x2) > L2} тегии x2. После этого вто- ет свое действие из условия маки действий, которые выгодны рой игрок выбирает дейст- симизации своей целевой функ- – это договорное множество 123 рассматриваемой игры, то для работника (по сравнению с Наилучший результат пер- Для данного примера целевая есть множество сочетаний угрозой получения результата – вого игрока на множестве функция центра есть разница стратегий первого и второ- C). достижимости дохода и затрат x1 на стимулиго игроков, которые гаран- Множество открытое «снизу», не (x sup f1(x1, x2), D рование. Нижняя грань затрат,x2 )D тировали бы второму ре- включает границу, поскольку K = при этом достигается на нижней, D = - зультат, строго больший неравенство строгое (см. рисунок границе D (см. рис. 11). Поэтому того, что тот может полу- 10). выбор наиболее выгодного для Принадлежность ситуации чить даже при наихудших центра x2 сводится к поиску множеству достижимости для него действиях первого максимума разницы дохода ценгарантирует реализуемость игрока (то есть при исполь- этого результата путем ис- тра и затрат работника (это и зовании первым игроком пользования стратегии на- есть «нижняя грань D»), то есть стратегии наказания). подставляем казания.

0, x2 < 0. x1(x2 ) = x2 - C, x2 0.5.

Как показано на рис. 11, в зависимости от параметров игры, этот максимум может достигаться как при x2=0 (невыгодность производства, K=0), при x2=0.(средняя производительность), так и при x2>0.5 (при f1’(x2)=0).

Рис. 11. Выбор плана x Действие игрока 1, реалиx1 – это размер вознаграждения зующее K - при выборе работнику, который гарантирует Рис. 10. Множество достижимости игроком 2 рекомендуемого центру результат, не более чем на действия из D меньший, чем K при выборе ( f1(x1, x2 ) K -, работником действия x2. При (x1, x2 ) D ).

этом, данный результат дости жим, так как (x1, x2 ) D.

125 В приведенных условиях этот Формулировка теоремы: Для задач стимулирования всегда M = inf sup f1(x1, x2) – x2E2 x1Xрезультат достигается при x2+0 В указанных условиях наи- K>M, так как выше найдено K0, гарантированный результат и равен –B. Он символизирует больший гарантированный в отличие от отрицательного M.

центра при применении им гарантированный выигрыш, результат центра равен Можно показать, что при стратегии наказания (так который получает центр при max [K, M ]. довольно необременительных как стратегии игрока отказе от даже минимального условиях на целевые функции ограничены множеством сотрудничества (если оно ока- игроков (в частности, при допуE2).

зывается невыгодным), то есть щении возможности даже пронаихудшее, что центр может извольно малых положительных ожидать от рациональных дей- побочных платежей игроку 2), ствий работника при нулевой это условие всегда выполняется зарплате. [21, 22, 57]. В данном же случае a зарплата предоставляет возможВ этом примере, из-за монотонСтратегия x1 (x2) реализуность практически неограниченного убывания прибыли центра ет (с точностью ) наилучных побочных платежей работпри возрастании зарплаты, эта ший ответ игрока 1 на дейнику.

изоляционистская стратегия ствие x2 игрока 2, то есть почти совпадает со стратегией Как уже показано, именно эта При K>M -оптимальная a f1(x1 (x2)) sup f1(x1,x2) -.

наказания, (она состоит из проситуация всегда реализуется в 0 стратегия игрока x1Xизвольных действий x1 [0, ]).

x1, при x2 = x2 задаче стимулирования. СтратеЭто -доминантная страте~ x1 (x2) =.

гия состоит в обещании наказы Тем не менее, эти стратегии мон гия.

(x2),при x2 x2 вать (использовать стратегию xгут и сильно отличаться друг от наказания) работника при любом друга (формально связи между его отклонении от некоторого их определениями нет).

действия x2. Это действие, как показано выше, выбирается из условия максимизации прибыли центра в пределах «переговорного множества» D.

127 Как показано выше, данный При K M оптимальная 1) Если sup f2(~1 (x2 ), x2 ) > L2, то центр никак не гарантиx стратегия игрока 1 заклю- случай не является оптимальным x2Xчается в применении опти- поведением в нашем примере, рован от выбора x2, такого, что (x1(x2 ), x2 ) D, что гарантирует мальной стратегии наказа- так как здесь всегда K>M. Эта центру не более K.

стратегия в данном случае ния.

2) Если sup f2(~1 (x2 ), x2 ) = L2 (меньше быть не может, по x вырождается в стратегию накаx2Xзания, то есть выплату нулевой определению L2), то эта верхняя грань достигается при всех зарплаты. Более широко эту x2 E2, так как L2 = inf f2(x1, x2) f2 (~1, x2 ) sup f2 (~1, x2) = L2.



x x стратегию можно понимать, как xx2X попытку ограничения выбора Тогда центр не застрахован от наихудшего для себя выбора x2 из работника множеством E2, на E2, что дает ему гарантированный результат M. • котором центр не в силах накаКаким же образом соотносятся выигрыши центра в играх Г1 и зать работника более чем до L2, Г2 с одинаковыми функциями выигрыша Существуют ли более при этом центр выбирает наирациональные для центра методы обмена информацией, дающие лучший ответ на любое действие ему больший выигрыш Ответ на эти вопросы дает рассмотрение из E2, в противном случае – наинформационных расширений игры, или метаигр.

казывает. Использование этой стратегии говорит о невозмож6.3. Метаигры ности компромисса.

Если центр не планирует самостоятельно получить информацию о действии агента, он может первым выбрать действие, Доказательство. В случае K > M, sup f2 (~1 (x2 ), x2 ) достига- реализуя игру Г1. Однако ему можно порекомендовать и более x x2X сложное поведение. Центр может попросить агента сообщить ему ~ ется при x2 = x2, так как только выбор этой стратегии позволяет свою стратегию x2 = x2(x1), которая основана на ожидаемой агентом информации о действии центра. Реализация права первого агенту получить более L2. Значит, агент выберет x2 = x2, что гахода центром состоит в этом случае в сообщении агенту стратегии рантирует центру K –. Если K M, то, выбирая стратегию ~ ~ x1(~2(x1)). Эту стратегию можно интерпретировать, как обещание x x2 E2, по определению E2, агент получит строго меньше L2. В то ~ ~ же время, из непрерывности f2 следует достижимость результата Lцентра выбрать действие x1(~2(x1)) при условии, что агент x выбором x2 E2.

~ обещает выбирать свое действие в соответствии с x2 (x1). Так При этом центр гарантирует себе образуется игра Г3. Здесь также не рассматривается возможность a inf f1(x1, x2) inf sup f1(x1, x2) - = M -.

блефа, как со стороны центра, так и со стороны агента.

x2E2 x2E2 x1XТо есть показано, что данная стратегия центра действительно Если центр определяет порядок обмена информацией, он приводит к обещанному результату.

может выбирать, играть ему Г1 или Г3. В обеих играх центр выНеобходимо еще показать, что произвольная стратегия нужден выбирать действие, не зная действия, выбранного агентом.

~ x1 = x1(x2) не может гарантировать центру больше max[K,M ].

Можно считать Г3, в некотором роде, усложнением игры Г1.

129 Аналогично тому, как, с помощью образования дополнитель- ре Г3, а тот, в свою очередь, не меньше гарантированного выигной «петли обратной связи», из Г1 была образована Г3, можно ус- рыша в игре Г1.

ложнить и игру Г2. Так образуется игра Г4. В ней агент, ожидая от Этот результат показывает, что Г2 является «идеальной» иг~ центра, как и в Г2, информацию вида x1(x2 ), формирует и сорой для центра. Соответственно, если центр имеет возможность ~ ~ общает центру свою стратегию x2(~1). Центр, обладающий пра- определять порядок и содержание обмена информацией, и, кроме x ~ того, при выборе своего действия знает действие, выбранное ~ ~ ~ вом первого хода, пользуется стратегиями x1(~2 ), которые опреx агентом, он должен играть Г2. Если центр на момент выбора сво~ деляют, какую функцию x1(x2 ) выберет центр в зависимости от его действия не знает действия агента – ему наиболее выгодна игра ~ ~ Г3.

сообщения агента x2.

В заключение стоит остановиться на определении равновесТаким же способом можно на основе Г3 построить игру Г5, и ных ситуациях в метаиграх. Выше в примере 17 было показано, так далее.

как расширение множества стратегий игроков позволяет уравноВ каждой из построенных четных игр Г2m, m = 1, 2…, центр весить ранее неравновесные исходы. Интуитивно понятно, что, использует в качестве стратегий отображения множества стратегий добавляя возможности информационного обмена между игроками, агента в этой игре на множество стратегий центра в игре Г2m-2.

можно добиться устойчивой реализации большего числа исходов.

Аналогично, стратегиями агента являются отображения множества Выше также было упомянуто, что в задаче стимулирования стратегий центра в Г2m на множество стратегий агента в игре Г2m-2.

равновесий Нэша чрезвычайно много. Следующий результат формулирует это утверждение более строго:

Такую рефлексию можно было бы наращивать бесконечно, Теорема 22 [21]. В игре Г2m (при m 1) те, и только те, исхопереходя к все более сложным схемам обмена информацией, если 0 ды (x1, x2 ), которые удовлетворяют условиям бы рассмотрение этих игр увеличивало выигрыш центра (в инте0 0 0 ресах которого и проводится исследование всех метаигр). Однако f1(x1, x2 ) min max f1(x1, x2), f2(x1, x2 ) max min f2(x1, x2 ), 0 0 0 x2 X x1X x2X x1Xимеет место следующий результат: 2 1 могут быть ситуациями равновесия Нэша игры со стратегиями Теорема 20 [21]. Максимальный гарантированный результат ~~ (~10, x2 ) (здесь стратегии понимаются в метаигровом смысле, как x центра в игре Г2m при m > 1 равен максимальному гарантированфункции информированности соответствующей метаигры).

ному результату центра в игре Г2. В играх же Г2m+1 при m > 1 макТаких исходов действительно может быть очень много. В симальный гарантированный результат центра равен его максиэтом смысле метаигровые схемы можно рассматривать, как средмальному гарантированному результату в игре Г3.





ство расширения множества равновесий Нэша, если множество Таким образом, при исследовании гарантированного резульравновесий исходной игры почему-то не устраивает исследователя тата центра можно ограничиться исследованием только игр Г1, Гили одного из игроков. Большое количество общих теоретических и Г3. Следующая теорема устанавливает взаимосвязь между гарезультатов исследования равновесий в метаиграх получено в [16, рантированными выигрышами центра в этих играх:

35, 76].

Теорема 21 [21]. Максимальный гарантированный результат центра в игре Г2 не меньше его гарантированного результата в иг 131 ЗАКЛЮЧЕНИЕ ЛИТЕРАТУРА 1. Айзекс Р. Дифференциальные игры. М.: Мир, 1967.

Таким образом, в настоящем учебном пособии приведены 2. Айзерман М.А., Алескеров Ф.Т. Выбор вариантов: основы теории.

основные сведения из теории игр, необходимые для построения и М.: Наука, 1990.

анализа математических моделей управления организационными 3. Ауман Р., Шепли Л. Значения для неатомических игр. М.: Мир, системами. Эффективность теоретико-игрового моделирования в 1977.

организационном управлении подтверждается как принципиаль4. Бабкин В.Ф., Баркалов С.А., Щепкин А.В. Деловые имитационные ной необходимостью исследования возможных реакций агентов на игры в организации и управлении. Воронеж: ВГАСУ, 2001.

те или иные управления в отсутствии возможности проведения 5. Берж К. Общая теория игр нескольких лиц. М.: Физматгиз, 1961.

натурного эксперимента, так и опытом практического использо6. Блекуэлл Д., Гиршик М. Теория игр и статистических решений. М.:

вания значительного числа моделей и методов управления в реИностранная литература, 1958.

альных социально-экономических системах (см. ссылки в [14]).

7. Бондарева О.Н. Некоторые применения методов линейного проДля более плодотворного применения теории игр в прикладных граммирования к теории кооперативных игр / Проблемы кибернетики.

задачах необходимо как дальнейшее развитие теории (поиск новых Вып. 10. М.: Физматгиз, 1963. С. 119 – 140.

8. Бондарева О.Н. О теоретико-игровых моделях в экономике. Л.: ЛГУ, адекватных концепций решения игр, методов их анализа и т.д.), 1974.

так и систематическое привлечение результатов менеджмента, 9. Бурков В.Н., Данев Б., Еналеев А.К. и др. Большие системы: модесоциологии и психологии как эмпирической базы формальных лирование организационных механизмов. М.: Наука, 1989.

моделей.

10. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функционирования социально-экономических систем с сообщением информации // Автоматика и Телемеханика. 1996. № 3. С. 3 - 25.

11. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и Телемеханика. 1993. № 11. С. 3 - 30.

12. Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. М.: Синтег, 2001.

13. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. М.: Наука, 1981.

14. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. М.: СИНТЕГ, 1999.

15. Вагнер Г. Основы исследования операций. М.: Мир, 1972. Т. 1 – 3.

16. Васин А.А., Гурвич В.А. Коалиционные ситуации равновесия в метаиграх / Вестник МГУ. Вычислительная математика и кибернетика.

1980. № 3. С. 38 – 44.

17. Вилкас Э.Й. Аксиоматическое определение значения матричной игры // Теория вероятностей и ее применения. 1962. Том. 8. № 3. С. 324327.

18. Вилкас Э.Й. Оптимальность в играх и решениях. М.: Наука, 1990.

133 19. Воробъев Н.Н. Основы теории игр. Бескоалиционные игры. М.: 39. Ларичев О.И. Объективные модели и субъективные решения. М.:

Наука, 1984. Наука, 1987.

20. Воробъев Н.Н. Теория игр для экономистов-кибернетиков. М.: Нау- 40. Лефевр В.А. Конфликтующие структуры. М.: Советское радио, ка, 1985. 1973.

21. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Нау- 41. Льюс Р., Райфа Х. Игры и решения. М.: Иностранная литература, ка, 1976. 1961.

22. Гермейер Ю.Б., Ерешко Ф.И. Побочные платежи в играх с фикси- 42. Мак-Кинси Д. Введение в теорию игр. М.: Физматгиз, 1960.

рованной последовательностью ходов // ЖВМ и МФ. 1974. № 14. С. 43. Математическая энциклопедия. М.: Советская энциклопедия, 1979.

1437 – 1450. Том. 2.

23. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия 44. Миркин Б.Г. Проблема группового выбора. М.: Наука, 1974.

решений в эколого-экономических системах. М.: Радио и связь, 1982. 45. Морозов В.В., Сухарев А.Г., Федоров В.В. Исследование операций в 24. Горелик В.А., Фомина Т.П. Элементы теории игр. Липецк: ЛГТУ, задачах и упражнениях. М.: Высшая школа, 1986.

1999. 46. Мулен Э. Кооперативное принятие решений: аксиомы и модели. М.:

25. Губко М.В., Караваев А.П. Матричные структуры управления // Ав- Мир, 1991.

томатика и Телемеханика. 2001. № 10. С. 132 – 146. 47. Мулен Э. Теория игр с примерами из математической экономики.

26. Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр. М.: М.: Мир, 1985.

Наука, 1981. 48. Нейман Д., Моргенштерн О. Теория игр и экономическое поведе27. Ерешко Ф.И. Моделирование рефлексивных стратегий в управляе- ние. М.: Наука, 1970.

мых системах. М.: ВЦ РАН, 2001. 49. Новиков Д.А., Чхартишвили А.Г. Активный прогноз. М.: ИПУ РАН, 28. Жуковский В.И., Салуквадзе М.Е. Некоторые игровые задачи управ- 2002.

Pages:     | 1 |   ...   | 12 | 13 || 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.