WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 | 2 || 4 | 5 |   ...   | 11 |

Во-вторых, оптимальный согласованный план (5) эффективен по Парето, так как максимизирует сумму целевых функций участников – центра и агента. Это свойство оптимального согласованного плана выполняется и в более широком классе организационных систем (см. ниже и [2, 6, 8, 10, Глава 11]). Оно имеет важный методологический смысл: если рассматривать организационную систему в целом, то сумма целевых функций ее участников является характеристикой именно системы в целом («внутренние» побочные платежи взаимно сокращаются при суммировании). Поэтому важность согласования интересов заключается в том, что оно позволяет не только скоординировать взаимодействие участников, но и повысить эффективность функционирования всей системы в целом. Этот вывод справедлив и для вертикального, и для горизонтального, согласования.

Пример 1.1. Пусть (y) = 5 – y, f(y) = 2 y – y2 / 4, y 0.

Тогда получаем, что центр хотел бы, чтобы агент выбрал действие y* = 0; агент в отсутствии управления выберет действие y* = 4; при этом его выигрыш составит f * = 4, а выигрыш центра – (y*) = 1. Находим множество согласованных планов S = [0; 4], и оптимальный согласованный план x* = – см. Рис. 1.1. •Таким образом, в рассмотренном простейшем случае задачи вертикального согласования интересов двух участников ее решение заключается в поиске побочных платежей (3) со стороны центра агенту за выполнение оптимального согласованного плана (5). Аналогичным образом ищутся согласованные побочные платежи и в случаях, когда центр устанавливает систему штрафов [1]; когда имеется нескольких невзаимодействующих друг с другом агентов, подчиненных одному центру [2, 8, 10]; когда согласование достигается не за счет побочных платежей, а выбором управляющих параметров, входящих в целевые функции участников [2].

Символ «•» здесь и далее обозначает окончание примера.

Задачи согласования интересов участников организационных систем (y) + f(y) (y) f(y) y y* x* y* 0 4 7 S Рис. 1.1. Множество согласованных планов в примере 1.Еще раз отметим, что общая идея согласования интересов посредством системы побочных платежей заключается в следующем. Во-первых, система платежей может быть выбрана такой, что агент не получает вознаграждения, если он не выполнил план. Во-вторых, для согласованности плана достаточно компенсации центром потерь агента, связанных с выполнением плана по сравнению с выбором действия, оптимального с точки зрения агента. И, наконец, в третьих, оптимальный согласованный план должен максимизировать выигрыш центра с учетом платежей агенту. Обобщим эту схему решения задачи согласования интересов на случай, когда имеется несколько взаимосвязанных агентов.

Рассмотрим двухуровневую организационную систему веерного типа, состоящую из одного центра на верхнем уровне иерархии и n агентов на нижнем. Множество агентов Глава обозначим N = {1, 2,..., n}. Действие i-го агента yi принадлежит множеству допустимых действий Ai. Взаимосвязь агентов отражается тем, что целевая функция каждого из них зависит в общем случае от действий всех, то есть fi = fi(y), где y = (y1, y2, …, yn) – вектор действий агентов. Множество допустимых векторов действий агентов обозначим A’ = Ai.

iN В качестве отступления напомним [6, 9], что равновесием Нэша игры агентов, принимающих решения однократно, одновременно и независимо, является такой вектор yN A’ их действий, одностороннее отклонение от которого не выгодно никому из агентов:

N i N, yi Ai fi(yN) fi(yi, y-i ), (6) где y-i = (y1, y2, …, yi-1, yi+1, …, yn) A-i = Ai – обстановка ji игры для i-го агента.

Доминантной стратегией i-го агента называется такое его действие yiD Ai, которое доставляет максимум его целевой функции при любой обстановке игры [6]:

y-i A-i, yi Ai fi( yiD, y-i) fi(yi, y-i). (7) Равновесием в доминантных стратегиях (РДС) yD A’ называется совокупность доминантных стратегий агентов D D D (если таковые существуют): yD = ( y1, y2,..., yn ).

Фиксируем вектор планов x = (x1, x2,..., xn) и рассмотрим две системы платежей со стороны центра агентам:

max fi ( i, y-i ) - fi (xi, y-i ), yi = xi iAi iD (xi, y) =, i N, (8) 0, yi xi max fi ( i, x-i ) - fi (x), yi = xi iAi iN (x, yi ) =, i N. (9) 0, yi xi Содержательно, при использовании системы платежей (8) центр говорит каждому из агентов: «При условии выполЗадачи согласования интересов участников организационных систем нения плана, я компенсирую тебе потери (по сравнению с тем, что ты мог бы получить, максимизируя свою целевую функцию), независимо от того, выполнили ли план другие агенты». При использовании системы платежей (9) центр говорит каждому из агентов: «При условии выполнения плана, я компенсирую тебе потери (по сравнению с тем, что ты мог бы получить, максимизируя свою целевую функцию), считая, что остальные агенты выполнили план».

Оказывается [8, 11], при использовании системы платежей (8) выполнение плана является РДС игры агентов;

а при использовании системы платежей (9) выполнение плана является равновесием Нэша игры агентов.

Обозначим y0 A’ – вектор действий, который агенты выбирают в отсутствии воздействий со стороны центра (например, РДС или равновесие Нэша их игры). Так как в рамках (8) или (9) агентам выгодно выполнять планы, то можно вычислить суммарные по всем агентам затраты центра на платежи в случае выполнения плана (эти суммарные затраты одинаковы для систем платежей (8) и (9)):

C(x) = (10) max fi ( yi, x-i ) - fi (x), yiAi iN и найти множество согласованных планов (с учетом условия индивидуальной рациональности центра):

S = {x A’ | (x) – C(x) (y0)}. (11) Задача оптимального согласованного планирования примет вид:



x* = arg max [(x) – C(x) ], (12) xS Итак, выражения (12) и (8) или (9) дают решение задачи вертикального согласования интересов центра и подчиненных ему взаимосвязанных агентов. Отметим, что решение задачи стимулирования, приведенное ниже в разделе 2.3, соответствует описанной выше схеме. В «предельном» случае – при n = 1 – многоагентная модель перейдет в рассмотГлава ренную выше в настоящем разделе: (10) совпадет с (3), (11) – с (4), а (12) – с (5).

Из (10) и (12) следует, что оптимальный согласованный план (12) максимизирует сумму целевых функций участников системы (центра и агентов):

x* = arg max [(x) + fi (x) ]. (13) xS iN Таким образом, при использовании побочных платежей, решая задачу согласования интересов, удается достичь эффективного по Парето состояния системы (на множестве состояний, удовлетворяющих условиям индивидуальной рациональности участников).

Пример 1.2. Рассмотрим дуополию Курно:

fi(y) = (10 – y1 – y2) yi – (yi)2 / [4 i + 2], i = 1, 2, (14) в которой неотрицательные действия агентов интерпретируются как объемы выпускаемой ими продукции, первое слагаемое в (14) – как выручка (равная произведению цены на объем выпуска), второе слагаемое в (14) – как затраты агента.

Взаимосвязь агентов отражена тем, что цена линейно убывает с ростом суммарного предложения.

Дифференцируя (14) и решая соответствующую систему уравнений, найдем равновесие Нэша: yN = (90/31; 100/31).

При выборе агентами равновесных по Нэшу стратегий сумма значений целевых функций всех участников системы равна 18,96.

Пусть целевая функция центра имеет вид:

(y) = – (y1 – 2)2 – (y2 – 2)2, то есть центр заинтересован в том, чтобы объемы выпуска обоих агентов были как можно ближе к y* = (2; 2). Центром в данном случае может быть, например, государство или надгосударственный орган, обеспечивающий согласование интересов производителей в различных государствах-участниках.

Задачи согласования интересов участников организационных систем Считая, что в отсутствии управлений со стороны центра агенты выбирают равновесие Нэша (то есть, y0 = yN), вычислим (y0) - 2,32.

Положим x = y* = (2, 2), то есть найдем систему платежей, побуждающих агентов выбрать наиболее выгодные для центра действия. Вычисляем: f1(y*) = 34/3, f2(y*) = 58/5, C(y*) 5,33. Получаем, что (y*) – C(y*) – 5, 33 < (y0) 2,32, то есть, центру не выгодно побуждать агентов выбирать оптимальные для него действия.

Найдем план, максимизирующий сумму целевых функций центра и обоих агентов: x0 (2,17; 2,30). Вычисляем:

f1(x0) 11, 21, f2(x0) 12,19, C(x0) 3,23. Получаем, что (x0) – C(x0) – 3, 35 < (y0) - 2,32, то есть, план x0 не удовлетворяет условию индивидуальной рациональности центра.

Найдем из (13) оптимальный согласованный план:

x* (2,37; 2,47). Вычисляем: f1(x*) 11, 28, f2(x*) 12,15, C(x*) 1,96. Получаем, что (x*) – C(x*) = (y0) - 2,32, то есть, план x* удовлетворяет условию индивидуальной рациональности центра (оно выполняется как равенство).

При использовании центром оптимальной согласованной системы платежей сумма значений целевых функций всех участников системы равна 23,07, то есть, согласование интересов позволило увеличить этот показатель примерно на 22 %. • Завершив рассмотрение вертикального согласования интересов, перейдем к описанию «горизонтального» согласования, то есть изучению моделей согласованного взаимодействия нескольких равноправных (находящихся на одном и том же уровне иерархии) агентов.

Глава 1.2. Горизонтальное согласование Рассмотрим организационную систему, состоящую из n агентов, находящихся на одном (и единственном) уровне иерархии. Множество агентов обозначим N = {1, 2,..., n}.

Действие i-го агента yi принадлежит множеству допустимых действий Ai. Целевая функция i-го агента в общем случае зависит от действий всех агентов, то есть fi = fi(y), где y = (y1, y2, …, yn) – вектор действий агентов. Множество допустимых векторов действий агентов обозначим A’ = Ai.

iN Вопрос, какие действия выберут агенты, в общем случае, остается открытым. Если существует равновесие в доминантных стратегиях (РДС), то обычно предполагают, что агенты выберут именно доминантные стратегии. Если РДС не существует, то в качестве состояния системы обычно принимается равновесие Нэша. Если равновесий Нэша несколько, и среди них существуют равновесия, недоминируемые по Парето другими равновесиями, то, как правило, считают, что агенты выберут недоминируемые равновесия.

Содержательно, концепции равновесия в доминантных стратегиях и равновесия Нэша отражают индивидуальную рациональность поведения агентов. В первом случае существует оптимальное действие, не зависящее от обстановки; во втором – индивидуальное отклонение любого агента не выгодно ему, если все остальные агенты не отклоняются от равновесия.

К сожалению, во многих случаях индивидуальная рациональность входит в противоречие с коллективной рациональностью (условно отражаемой аксиомой Парето – предположением, что состояние системы должно быть эффективно). Противоречие следующее – с одной стороны, набор индивидуально рациональных действий (например, РДС или равновесие Нэша) может доминироваться другим Задачи согласования интересов участников организационных систем набором действий (при котором все агенты получают не меньшие выигрыши, а кто-то – строго большие). С другой стороны, коллективно рациональных действий (эффективных по Парето) может быть несколько, и они могут быть неустойчивы относительно индивидуальных отклонений агентов (может найтись агент, который один, изменяя свое действие, еще более увеличивает свой выигрыш). Более того, в кооперативных играх [6, 9] отклоняться могут коалиции (множества из нескольких игроков) и решение игры должно быть устойчиво относительно подобных отклонений. Таким образом, соотношение индивидуальной и коллективной рациональности является одной из ключевых проблем теории игр (см. примеры и ссылки в [6, 9, 15]).





Интуитивно ясно, что если существует лучшая для всех агентов (по сравнению с индивидуально рациональным) линия поведения, то следует выработать процедуру (механизм) наказания тех агентов, которые будут от нее отклоняться. Эти «наказания» могут осуществляться либо самими агентами, либо/и метаигроком – центром. Следует отметить, что механизм наказания является «внешним» по отношению к агентам и зачастую навязывается им извне, например, центром, или является предметом их договоренности (расширение игры [5, 7]). Поясним это утверждение.

Если последовательно разыгрываются несколько партий игры, то, изменяя свои действия, агенты могут в текущем и будущих периодах наказать агента, отклонившегося в предыдущем периоде. Задачи построения таких стратегий решаются в теории повторяющихся игр (см. [15], а также обзор в [12]). Сложнее дело обстоит в статике – при разыгрывании одной единственной партии игры, так как в этом случае угроза будущего наказания со стороны партнеров бессмысленна.

Угроза наказания приобретает смысл в статике, если имеется третий (по отношению к агентам) субъект, наделенный соответствующими властными полномочиями, например Глава – центр. Осуществляя управление, т.е. поощряя агентов, налагая на них штрафы и т.д., центр может сделать невыгодным индивидуальное отклонение от коллективного оптимума, то есть сделать Парето-оптимальную стратегию устойчивой по Нэшу. Это – первое, что может предложить центр агентам. Второй эффект от введения центра заключается в снижении объема информации, перерабатываемой агентами.

Действительно, для «вычисления», например, равновесия Нэша каждый из агентов должен знать целевые функции и допустимые множества всех агентов с тем, чтобы, опять же, каждый из них мог независимо решить систему неравенств (6) раздела 1.1. При введении центра последнему достаточно, обладая информацией о каждом из агентов (информированность агентов друг о друге [13] уже не нужна), вычислить все равновесия, разработать согласованную систему побочных платежей (см. описание задачи вертикального согласования интересов в разделе 1.1), и дать соответствующую информацию агентам. Решением вышеприведенной задачи управления может заняться один из агентов – инициатор согласования интересов, либо агенты могут выбрать такого представителя из своего числа. Возможен вариант, когда для решения задачи согласования интересов агентами приглашается стороннее лицо – аналитик, консалтинговая фирма, банк и т.д.

Рассмотрим случай, когда центр в явном виде отсутствует, и опишем соответствующую задачу горизонтального согласования интересов.

Фиксируем вектор x A’ и рассмотрим следующую систему побочных платежей:

sij (x), y = x j j ij(x, yj) = (1) 0, y x, i, j N, j j где ij() 0 – платеж от i-го агента j-му, i, j N. Естественно считать, что x A’ sii(x) = 0, то есть агент сам себе ничего Задачи согласования интересов участников организационных систем не платит, i N. То есть, система платежей (1) задается n2 – n числами.

Запишем условие того, что x – равновесие Нэша игры агентов (учтем при этом, что любой агент осуществляет платежи другим агентам, независимо от того, какое действие выбрал он сам):

(x) max fi(yi, x-i) – fi(x), i N. (2) ski yiAi kN Отметим, что мы оставили вне рассмотрения вопрос о том, как заставить агентов осуществлять выплаты друг другу, предполагая, что соответствующий механизм принуждения существует1 (в противном случае может оказаться, что какойто агент, получив платежи от других агентов, откажется платить им). Одним из механизмов является введение центра – представителя более высокого уровня иерархии, наделенного полномочиями налагать штрафы на агентов, отказавшихся от выполнения своих обязательств. Подобные вопросы (оппортунистическое поведение) подробно рассматриваются в теории контрактов [14, 16, 17].

Предположим, что существует вектор u = (u1, u2,..., un) ограничений на выигрыши агентов – так называемая резервная полезность, то есть ui – размер гарантированного выигрыша i-го агента, который должен быть ему обеспечен при участии в данной организационной системе, i N. Резервная полезность может рассчитываться исходя из равновесия Нэша в отсутствии согласования интересов: ui = fi(yN), или как гарантированный выигрыш: ui = max min fi(yi, y-i), или yiAi y-iA-i каким-либо другим способом (см., например, [2]).

Тогда условие индивидуальной рациональности для i-го агента (условие его участия в процедуре согласования интересов) можно записать в следующем виде:

Примером является суд, в который можно подать исковое заявление в случае нарушения оппонентом условий договора/контракта.

Глава fi(x) + (x) – (x) ui, i N. (3) ski sij kN jN то есть выигрыш агента в новом равновесии с учетом получаемых и отдаваемых платежей должен быть не меньше его резервной полезности.

Суммируя (3) по всем агентам («внутренние» платежи при этом взаимно сокращаются), получим, что за счет побочных платежей можно осуществить переход в такое состояние системы, чтобы сумма выигрышей всех участников в этом состоянии была не меньше, чем в первоначальном состоянии.

Pages:     | 1 | 2 || 4 | 5 |   ...   | 11 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.