WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 15 |

нимум, свойству асимметрии. Для продуктивного использования, 4. Если x y, y z, то x z (условие транзитивности однако, необходимы дополнительные условия на отношение предотношения предпочтения).

почтения (см. [44, 77]). При этом то, какие дополнительные 5. Если x y, y z, то x z, то есть если x лучше y и y предположения необходимо сделать, чтобы получить инструмент, равнозначно z, то x лучше z. На самом деле, эта аксиома вводит с которым можно работать, не отходя в то же время от встречаюпредположение о произвольно глубокой разрешающей способнощихся в реальной жизни предпочтений – это вопрос, который на сти агента – о том, что последний всегда может различить сколь протяжении многих лет служил предметом дискуссий и продолугодно близкие ситуации.

жает обсуждаться до сих пор. Дело в том, что подобные дополни6. Если x y, y z, то x z (аналогично аксиоме 5).

тельные предположения вводятся в виде аксиом, некоторых гипоЭтих предположений хватает [62], чтобы ввести функцию f (.) тез о закономерностях процесса выбора, и обоснованность введетаким образом, чтобы выполнялось условие (1). Однако, их недосния тех или иных предположений отнюдь не бесспорна.

таточно, чтобы определить эту функцию однозначно. И действиКроме того, некоторые аксиомы, которые по отдельности тельно, в случае конечного числа исходов нестрогое упорядочение представляются достаточно логичными, вступают в противоречие позволяет лишь выстроить их в порядке от наихудшего до наидруг с другом [2, 17, 34, 46, 71, 86]. То есть необходимо опреде- лучшего. Этой последовательности событий можно сопоставить лить минимальные комбинации аксиом, которые, не вступая друг с любую последовательность возрастающих чисел, назначая в качедругом в противоречие, дают достаточный для конструктивного стве значения функции полезности соответствующий элемент чииспользования набор предположений о закономерностях выбора. словой последовательности (другими словами, функция полезности определена с точностью до монотонного преобразования).

Приведем типичный набор таких аксиом (отметим, что некоЧтобы от отношения предпочтения перейти к определенной с торые из перечисленных ниже аксиом зависимы). Другие примеры точностью до линейного преобразования функции полезности, введения аксиоматики можно найти в [68].

требуются дополнительные аксиомы (так называемые, аксиомы Введем следующие аксиомы полезности:

комбинирования), определяющие модель поведения в условиях 1. Если – отношение предпочтения (асимметричное), – неопределенности.

отношение неразличимости, то для любых исходов x и y имеет Пусть x и y – любые исходы из A0 и 0 < r, s < 1. Тогда выраместо одно из событий: либо x y, либо y x, либо x y, то есть для любой пары исходов либо первый исход предпочтительнее жение r x + (1 – r) y будет обозначать исход, представляющий второго, либо второй предпочтительнее первого, либо же исходы собой лотерею, которая реализует два исхода x и у с вероятностями с с r и (1 – r) соответственно. Тогда от этой лотереи потребуем равнозначны. Если a b a b и b a, то эта аксиома вывыполнения следующих условий:

полняется всегда.

7. rx + (1 – r) y = (1 – r) y + r x для любой лотереи r на x, y.

2. x x, для любого исхода x, то есть исход всегда неотличим Это свойство коммутативности лотереи, имеющее лишь техниот себя самого, что также очевидным образом следует из опческое значение. Оно, по сути, не ограничивает предпочтения.

ределения отношения безразличия.

39 8. r x + (1 – r) (s y + (1 – s) z) = r x + (1 – r) s y + (1 – r) (1 – жим f(z)=s. В случае d) положим f(z)=0. В случае e) существует t [0,1], такое, что tz + (1 - t)x y. Положим f(z)=(t-1)/t.

s) z для любых лотерей s и r на исходах x, y, z A0. Это свойство Теперь необходимо доказать, что введенная таким образом вводит предположение о том, что для ЛПР порядок лотерей не функция удовлетворяет условию (2) для произвольных событий zважен.

и z2. Доказательство довольно длинно и состоит в последователь9. r x + (1 – r) x = x (рефлексивность лотереи).

ном рассмотрении z1 и z2, удовлетворяющих условиям a)-e) в раз10. Если x z, то для любых y, r имеем личных сочетаниях.

(r x + (1 – r) y) (r z + (1 – r) y).

Докажем один из случаев, в котором и для z1, и для z2 выпол11. Если x z, то для любых r > 0 и y имеем нено условие c) (остальные 14 случаев доказываются аналогично).

(r x + (1 – r) y) (r z + (1 – r) y).

Итак, пусть f(z1)=s1, f(z2)=s2, причем s1>s2. Надо показать, что 12. Пусть x z y. Тогда существует 0 r 1, такое, что z1 z2.

(r x + (1 – r) y) z. Эта очень важная аксиома имеет отдельное z1 s1e1 + (1- s1)e0 (s1 - s2 )e1 + s2e1 + (1- s1)eназвание – аксиома непрерывности.

Теорема 1 (Неймана-Моргенштерна) [62]. Если для отноше - s2 ) (1- s1) (s s2e1 + (1- s2 ) e1 + eния предпочтения выполнены аксиомы 1-12, то существует 1- s2 1- s функция f: A0 R, что для любых x, y из A0 и любого r [0, 1] - s2 ) (1- s1) (2) f (x) > f (y) x y, (s s2e1 + (1- s2 ) e0 + e(3) f (rx + (1- r)y) = r f (x) + (1- r) f ( y). 1- s2 1- s Эта функция единственна с точностью до положительного s2e1 + (1- s2 )e0 z2.

линейного преобразования, то есть если некоторая функция F() Повторяя те же действия в обратном направлении, получаем и удовлетворяет условиям (2), (3), то F(x) = f (x) +, где > 0 и обратное утверждение.

– некоторые константы. Докажем, что для функции f, введенной выше, справедлива Доказательство. Если для всех исходов x, y верно x y, то f() формула (3). Известно, что z1 s1e1 + (1 - s1)e0, можно положить всюду равной константе, например, нулю.



z2 s2e1 + (1- s2 )e0. Следовательно, для произвольного 0 < r < Пусть, однако, существуют исходы x, y такие, что x y. Товыполняется условие гда для произвольного исхода z имеется пять возможностей:

rz1 + (1- r)z2 r(s1e1 + (1- s1)e0 ) + (1- r)(s2e1 + (1- s2 )e0 ) a) z x, rs1e1 + r(1- s1)e0 + (1- r)s2e1 + (1- r)(1- s2)eb) z x, (rs1 + (1- r)s2 )e1 + (r(1- s1) + (1- r)(1- s2))e0 = c) x z y, d) z y, [rs1 + (1- r)s2]e1 +[1- (rs1 + (1- r)s2)]e0.

e) y z.

Обозначим := rs1 + (1- r)s2. По построению f (.), Обозначим x = e1, y = e0. Положим f(e1) = 1, f(e0) = 0.

f (e1 + (1- )e0 ) =. Значит, По аксиоме непрерывности, в случае a) существует r, такое, f (rz1 + (1- r)z2 ) = rs1 + (1- r)s2 = rf (z1) + (1- r) f (z2 ).

что rz + (1 - r)y x. Положим тогда f(z)=1/r. В случае b) положим f(z)=1. В случае с) существует s, такое, что sx + (1- s)y z. Поло- Пусть теперь некоторая F() удовлетворяет (2) и (3). Так как e1 e0, значит, F(e1)>F(e0). Положим = F(e1) - F(e0 ) > 0, 41 полезность (или выигрыш) игрока, понятно, что в этом случае ча = F(e0). Пусть теперь e1 z e0. Если f(z)=s, то стью описания исходов (на множестве которых определена функz se1 + (1 - s)e0, то есть ция полезности) должно быть количество денег или материальных F(z) = F(se1 + (1- s)e0 ) = sF(e1) + (1- s)F(e0) = s( + ) + (1- s), ценностей, являющихся средством обмена. Можно показать [62], и, значит, F(z) = s + = f (z) +. • что для того, чтобы уменьшение полезности «донора» d при переИтак, предположений 1-12 достаточно, чтобы построить по даче некоторого количества денег соответствовало пропорциоотношению предпочтения функцию полезности, единственную с нальному увеличению полезности «акцептора» a, их функции поточностью до переноса координат и изменения масштаба [62], то лезности Fi() должны иметь вид:

есть описать полезность в виде функции F(x) = f (x) +, где (4) Fi (xi,ci ) = gi (xi ) + ici, i {d,a} f(x) – некоторая известная функция, а константы > 0 и не опгде Fi() – функция полезности игрока i, сi – сумма денег в его ределены. Выбор этих констант сходен с выбором нулевой точки и распоряжении, xi – остальные компоненты описания исхода для шкалы измерения (по Цельсию, по Фаренгейту) для измерения игрока i, а gi() – полезность компонент x ситуации.

температуры.

Если функции полезности имеют вид (4) для всех рассматриВ постановках задач математической экономики и управления ваемых индивидуумов, то говорят о существовании отделимого отношение предпочтения, как таковое, фигурирует крайне редко.

линейно трансферабельного товара. При этом соответствующим Функция полезности в этом случае строится почти эмпирически выбором масштаба функций предпочтения можно сделать прира(на самом деле при этом используются уже полученные, готовые щения полезности при передаче некоторого количества денег не результаты теории полезности [46, 47, 68, 82]), например, часто в просто пропорциональными, но и равными по абсолютной велиэкономических задачах полезность компании равна стоимости чине. Наличие линейно трансферабельного товара облегчает исактивов в ее распоряжении и т.д. (см. подробности в [44, 68, 70, следование игровых моделей.

77]). Тем не менее, всегда необходимо помнить, что для Завершив описание предпочтений участников организацикорректного использования функции полезности Нейманаонных систем, перейдем к классификации игр и рассмотрению Моргенштерна, предпочтение, которым она определяется, должно примеров игровых моделей.

удовлетворять аксиомам 1-12.

Выше была построена функция полезности отдельного агента.

2.3. Классификация и примеры игр Однако задачей теории игр является исследование взаимодействия Теория игр является сравнительно молодой наукой. Ее самомногих агентов. Поэтому интересен вопрос о том, как соотносятся стоятельная27 история насчитывает менее века [43]. В 1911 году друг с другом полезности разных агентов, как «привести к общему Э. Цермело описал теоретико-игровой подход к шахматной игре, в знаменателю» шкалы измерения их полезностей. Особенную акту1921 году Э. Борель начал систематическое изучение матричных альность этот вопрос представляет при рассмотрении игровых моигр, в 1928 году вышла в свет работа Дж. Фон-Неймана «К теории делей, в которых игроки могут передавать друг другу полезность (так называемые игры с трансферабельной полезностью, или ТПЗарождение теории игр как математической дисциплины можно игры, в отличие от игр с нетрансферабельной полезностью, или датировать 29 июля 1654 г., то есть днем, когда Б. Паскаль написал НТП-игр, в которых передача полезности запрещена правилами известное письмо П. Ферма (это же письмо считается началом теоигры). Передача полезности между игроками может принимать рии вероятностей) [43]. Идеи, которые можно отнести к теоретиковид денежных выплат или передачи иных материальных ценноигровым, высказывались на протяжении 17-19 вв. Д. Бернулли, стей. Поскольку целью таких платежей является воздействие на П. Лапласом, П.Л. Чебышевым, Г. Минковским и др.

43 стратегических игр», содержащая основные идеи современной По количеству повторений игры различают однократные и теории игр. В 1944 году, после выхода в свет книги Дж. Фон- динамические игры. Динамические игры с дискретным временем Неймана и О. Моргенштерна «Теория игр и экономическое пове- называются повторяющимися играми [33, 52, 58, 74, 82]. Динадение» [48] теория игр окончательно сформировалась как само- мические игры, в которых динамика описывается дифференциальстоятельная наука. ными или разностными уравнениями, называются дифференциВ настоящее время теория игр – развитая математическая альными играми [1, 28, 32, 34].





теория с большим количеством направлений и сложными взаимоПо мощности множества исходов и/или стратегий разделяют связями между ними. Одним из оснований системы классифидискретные и непрерывные игры (в отличие от непрерывных игр, каций теоретико-игровых задач может служить количество сторон в дискретных играх множество исходов конечно).

(или, как принято говорить, игроков), участвующих в конфликте По возможности совместных действий различают некоопе(игре). Различают игры двух лиц и игры многих лиц28. Так, конративные и кооперативные игры. Некооперативные игры – это фликт контрабандиста и пограничников (см. раздел 2.1) – игра класс моделей теории игр, в постановке которых предполагается, двух лиц. Игры двух лиц являются наиболее исследованной модечто в процессе выработки решений игроки не могут действовать лью, для них получено наибольшее число результатов [17, 20, 21, совместно. Это значит, что запрещены договоры между игроками, 37, 48, 63]. Тем не менее, игры многих лиц привлекают не менее передача игроками друг другу ресурсов и информации, образовапристальное внимание исследователей, в первую очередь потому, ние каких-либо коалиций и пр. Наоборот, отличительной чертой что именно такие игры наиболее часто встречаются в задачах кооперативных игр является то, что при их исследовании реуправления.

шающее значение имеет возможность игроков выбирать действия совместно, объединяясь для этой цели в коалиции.

В зависимости от ограничений на выигрыши среди игр двух лиц различают игры с нулевой суммой (антагонистические игры), В большинстве игровых моделей принимается порядок функв которых сумма выигрышей игроков при каждом исходе равна ционирования, в соответствии с которым игроки выбирают странулю, и игры с произвольной суммой, в которых сумма вытегии одновременно. Рассмотрение последовательности ходов игрышей игроков может отличаться от нуля для всех или некотопозволяет выделить иерархические игры. Теория иерархических рых исходов игры.

игр [21-24, 33, 35, 76] занимается изучением игровых моделей, в Другим основанием классификации является информирован- которых фиксирован порядок ходов игроков, то есть предписана ность сторон. Существуют игры с полной информированностью и последовательность, в которой игроки выбирают свои действия.

игры с неполной информированностью о различных параметрах Рассмотрим некоторые содержательные (можно сказать, хреигры29. Полная информированность не означает, что рассматривастоматийные для теории игр) примеры постановок теоретикоется задача принятия решения с полной информированностью, а игровых задач.

лишь то, что в задаче имеется только игровая неопределенность, а Пример 4 [82]. «Минипокер».

остальные типы неопределенности (см. первую главу) отсутствуют.

Игры, в которых имеется один активный игрок, называются играми с природой и рассматриваются, в основном, в теории статистических решений.

Параметрами игры являются компоненты моделей принятия решений участниками игры (см. раздел 1.1).

45 Такое представление игры называется игрой в развернутой форме. По введенной выше классификации, эта задача – дискретная некооперативная однократная игра двух лиц с неполной ин1. красная 2. наугад формированностью одного из игроков относительно внешних 2, -(природных) факторов. • Повысить Пример 5. «Два начальника».

1, -Этот пример является частным случаем примера 3. Имеются два игрока-начальника. У них есть один подчиненный. Каждый из 1, -1. черная начальников дает подчиненному задание и может как разрешить -2, выполнять свое задание совместно с заданием противника (другого Повысить начальника), так и потребовать выполнения своего задания в первую очередь. Назовем первый выбор «сотрудничество», а 1, -второй – «эгоистическое поведение». Если задания выполняются -1, 1 совместно, то каждый из начальников получает по 10 единиц выигрыша. Если только один из начальников потребовал первоочередного выполнения своего задания, он получает 15 единиц выигрыша, времени на выполнение задания второго начальника у Рис. 5. Игра в развернутой форме подчиненного не остается и второй начальник несет убытки в размере 5 единиц. Если оба начальника потребовали выполнения Опишем правила игры (см. рисунок 5). Два игрока кладут по своего задания в первую очередь, подчиненный отказывается радоллару на кон. Первый игрок наугад выбирает карту из ботать вообще, и начальники получают нулевые выигрыши. Выперетасованной колоды, замечая ее цвет (красный – червы или игрыши игроков можно представить в виде следующей матрицы:

бубны, черный – пики или трефы). Второй игрок не знает цвета [ сотр. эгоист.] карты. После этого первый игрок имеет две альтернативы:

сотр. 10,10 - 5,15 (игра является биматричной).

А) повысить ставку эгоист15, - 5 0, Б) спасовать.

Если он пасует, то забирает все деньги (2 доллара), если выЗдесь паре чисел в каждой из четырех ячеек матрицы соотбрана красная карта и, наоборот, все деньги забирает второй игветствуют выигрыши первого и второго игрока при том или ином рок, если карта черная, и игра заканчивается. Если первый игрок их поведении. Строки соответствуют выбору первого игрока, повышает ставку, то он кладет еще один доллар на кон и игра столбцы – второго.

продолжается следующим образом. Второй игрок выбирает свое Эта классическая игра широко известна под другим названием действие: принять кон и доложить свой доллар на кон или спасо– «дилемма заключенного» [5, 19, 62, 65, 82].

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.