WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 11 |

3) функция дохода центра непрерывна и достигает максимума при ненулевых действиях агентов.

Второе предположение означает, что независимо от действий других агентов любой агент может минимизировать Глава свои затраты выбором нулевого действия. Остальные предположения – такие же, как и в одноэлементной модели (см.

раздел 2.1).

Так как и затраты, и стимулирование каждого агента в рассматриваемой модели зависят в общем случае от действий всех агентов, то агенты оказываются вовлеченными в игру, в которой выигрыш каждого зависит от действий всех. Обозначим P() – множество равновесных при системе стимулирования стратегий агентов – множество решений игры (тип равновесия пока не оговаривается; единственно предположим, что агенты выбирают свои стратегии одновременно и независимо друг от друга, не имея возможности обмениваться дополнительной информацией и полезностью).

Как и в одноэлементной ОС, рассмотренной в разделе 2.1, в рамках гипотезы благожелательности эффективностью стимулирования является максимальное значение целевой функции центра на соответствующем множестве решений игры:

K() = max) (, y). (3) yP( Задача синтеза оптимальной функции стимулирования заключается в поиске такой допустимой системы стимулирования *, которая имеет максимальную эффективность:

* = arg max K(). (4) M Из результатов раздела 2.1 следует, что в частном случае, когда агенты независимы (вознаграждение и затраты каждого из них зависят только от его собственных действий), то оптимальной (точнее – -оптимальной, где = ) является комi iN пенсаторная система стимулирования:

ci (xi ) + i, yi = xi i K (xi, yi ) =, i N, (5) 0, yi xi Базовые математические модели стимулирования где {i}i N – сколь угодно малые строго положительные константы (мотивирующие надбавки), а оптимальное действие x*, реализуемое системой стимулирования (5) как равновесие в доминантных стратегиях1 (РДС), является решением следующей задачи оптимального согласованного планирования:

x* = arg max {H(y) – (yi) }.

ci yA iN Если стимулирование каждого агента зависит от действий всех агентов (рассматриваемый в настоящем разделе случай коллективного стимулирования) и затраты несепарабельны (то есть затраты каждого агента зависят в общем случае от действий всех агентов, что отражает взаимосвязь и взаимозависимость агентов), то множества равновесий НэшаEN () A и РДС yd A имеют вид:

EN () = {yN A’ | i N yi Ai (6) N N i (yN) – ci ( yN ) i (yi, y-i ) – ci (yi, y-i )};

yid Ai – доминантная стратегия i-го агента, тогда и только тогда, когда yi Ai, y–i A–i i( yid, y–i) – ci( yid, y–i) i(yi, y–i) – ci(yi, y–i).

Если при заданной системе стимулирования у всех агентов имеется доминантная стратегия, то говорят, что данная система стимулирования реализует соответствующий вектор действий как РДС.

Напомним, что РДС называется такой вектор действий агентов, что каждому агенту выгодно выбирать соответствующую компоненту этого равновесия независимо от того, какие действия выбирают остальные агенты.

Напомним, что равновесием Нэша называется такой вектор действий агентов, что каждому агенту выгодно выбирать соответствующую компоненту этого равновесия при условии, что все остальные агенты выбирают равновесные действия.

Глава Фиксируем произвольный вектор x A действий агентов и рассмотрим следующую систему стимулирования:

ci (xi, y-i ) + i, yi = xi i (x, y) =, i 0, i N. (7) 0, yi xi В [29] доказано, что при использовании центром системы стимулирования (7) x – РДС. Более того, если i > 0, i N, то x – единственное РДС.

Содержательно при использовании системы стимулирования (7) центр использует следующий принцип декомпозиции. Он предлагает i-му агенту: «выбирай действие xi, а я компенсирую тебе затраты независимо от того, какие действия выбрали остальные агенты, если же ты выберешь любое другое действие, то вознаграждение будет равно нулю».

Используя такую стратегию, центр декомпозирует игру агентов.

Если стимулирование каждого агента должно зависеть только от его собственного действия, то, фиксировав для каждого агента обстановку игры, перейдем от (7) к системе индивидуального стимулирования следующим образом:

фиксируем произвольный вектор действий агентов x A и определим систему стимулирования:

ci (xi, x-i ) + i, yi = xi i (x, yi) =, i 0, i N. (8) 0, yi xi Содержательно при использовании системы стимулирования (8) центр предлагает i-му агенту: «выбирай действие xi, а я компенсирую тебе затраты, считая, что остальные агенты также выбрали соответствующие компоненты – x-i, если же ты выберешь любое другое действие, то вознаграждение будет равно нулю». Используя такую стратегию, центр также декомпозирует игру агентов, то есть реализует вектор x как равновесие Нэша игры агентов.

Отметим, что функция стимулирования (8) зависит только от действия i-го агента, а величина x-i входит в нее как Базовые математические модели стимулирования параметр. Кроме того, при использовании центром системы стимулирования (8), в отличие от (7), каждый из агентов имеет косвенную информацию обо всех компонентах того вектора действий, который хочет реализовать центр. Для того чтобы система стимулирования (8) реализовывала вектор x как РДС, необходимо введение дополнительных (по сравнению со случаем использования (7)) предположений относительно функций затрат агентов – (см. [29]).

Здесь же уместно качественно пояснить необходимость введения неотрицательных констант {i}i N в выражениях (5), (7) и (8). Если требуется реализовать некоторое действие как одно из равновесий Нэша, то эти константы могут быть выбраны равными нулю. Если требуется, чтобы равновесие было единственным (в частности, чтобы агенты не выбирали нулевые действия), то агентам следует доплатить сколь угодно малую, но строго положительную величину за выбор именно того действия, которое предлагается центром. Более того, величины {i}i N в выражениях (5), (7) и (8) играют важную роль и с точки зрения устойчивости компенсаторной системы стимулирования по параметрам модели. Например, если функция затрат i-го агента известна с точностью до i / 2, то компенсаторная система стимулирования (7) все равно реализует действие x (см. [6, 22]).



Вектор оптимальных реализуемых действий агентов x*, фигурирующий в качестве параметра в выражении (7) или (8), определяется в результате решения следующей задачи оптимального согласованного планирования:

x* = arg max {H(y) – (y) }, (9) ci yA iN а эффективность системы стимулирования (7), (9) равна следующей величине:

= H(x*) – (x*) –.

ci iN Глава В [29] доказано, что система стимулирования (7), (9) является оптимальной, то есть обладает максимальной эффективностью, среди всех систем стимулирования в многоэлементных ОС.

Рассмотрим несколько примеров решения задач синтеза оптимальных систем коллективного стимулирования в многоэлементных ОС.

Пример 2.2. Решим задачу стимулирования в ОС с двумя агентами, имеющими функции затрат:

(yi +l y3-i )ci (y) =, i = 1, 2, где l – параметр, отражающий 2ri степень взаимозависимости агентов. Пусть функция дохода центра H(y) = y1 + y2, а фонд заработной платы ограничен величиной R. Если центр использует систему стимулирования (7), то задача стимулирования сводится к поиску оптимальных реализуемых действий:

H ( y) max y.

( y) + c2( y) R cПрименяя метод множителей Лагранжа, получаем, что решение имеет вид:

2R l r2 - r1 * 2R l r1 - r* y1 =, y2 =.

r1 + r2 l2 - 1 r1 + r2 l2 - Подставляя равновесные действия агентов в целевую функцию центра, получаем, что оптимальный размер ФЗП равен:

r1 + rR* = arg max [ 2R(r1 + r2) /(1 – l) – R] =. • R2(l -1)Пример 2.3. Вторым примером является модель совместного производства. Рассмотрим многоэлементную двухуровневую ОС, состоящую из центра и n агентов.

Пусть целевая функция i-го агента fi (y, ri) представляет собой разность между доходом hi (y) от совместной деятельноБазовые математические модели стимулирования сти и затратами ci (y, ri), где ri – тип агента (параметр эффективности его деятельности), то есть fi (y, ri) = hi (y) – ci (y, ri), i N.

Выберем следующий вид функций дохода и затрат:

yihi (y) = pi Y, i N, ci (y, ri) =, i N, 2(ri ± li y ) j ji где Y = yi, pi =1.

iN iN Для случая, когда в знаменателе стоит знак «–», предri полагается, что yj <.

li ji Содержательно набор агентов может интерпретироваться как фирма, подразделения которой (агенты) производят однородную продукцию, реализуемую на рынке по цене.

Суммарный доход Y распределяется между агентами в соответствии с фиксированными долями {pi}i N. Затраты агента возрастают по его действиям, а эффективность деятельности определяется типом агента ri.

Взаимодействие агентов моделируется зависимостью затрат (эффективности деятельности) каждого из них от действий всех (других) агентов.

Знак «+» в знаменателе соответствует эффективному взаимодействию агентов (убыванию затрат на масштаб) – чем большие действия выбирают другие агенты, тем меньше затраты (выше эффективность деятельности) рассматриваемого агента, что на практике может соответствовать снижению удельных постоянных издержек, обмену опытом, технологиями и т. д.

Знак «–» в знаменателе соответствует неэффективному взаимодействию агентов (возрастанию затрат на масштаб) – чем большие действия выбирают другие агенты, тем больше затраты (ниже эффективность деятельности) рассматриваеГлава мого агента, что на практике может соответствовать нехватке основных фондов, ограничениям на побочные показатели (например, загрязнение окружающей среды) и т. д.

Коэффициенты {li 0}i N отражают степень взаимозависимости агентов.

Пусть рыночная цена известна всем участникам ОС.

Тогда, дифференцируя целевые функции агентов, приравнивая производные нулю и складывая получившиеся при этом выражения yi = p (ri ± li y ), i N, j j i получим следующую зависимость суммарных действий Y+ от параметра :

i 1p ri ± pili iN Y+( ) =. • i 1p li ± pili iN Пример 2.4. Третьим примером является аккордная система оплаты труда. Рассмотрим ОС с двумя агентами, имеющими функции затрат ci (yi) = yi2 / 2ri, где ri – тип i-го + агента, yi Ai = 1, i = 1, 2. Целевая функция i-го агента представляет собой разность между стимулированием i (y1, y2), получаемым от центра, и затратами, то есть:

fi (y) = i (y) – ci (yi), i = 1, 2.

Пусть центр использует систему стимулирования Ci, y1 + y2 w i (y1, y2) = 0, y1 + y2 < w, i = 1, 2. (10) Содержательно центр выплачивает каждому агенту фиксированное вознаграждение при условии, что сумма их действий оказывается не меньше, чем некоторое плановое значение w > 0. Обозначим:

yi+ = 2riCi, i = 1, 2, Y = {(y1, y2) | yi yi+, i = 1, 2, y1 + y2 w} Базовые математические модели стимулирования – множество индивидуально-рациональных действий агентов. Рассмотрим четыре возможных комбинации переменных (см. рис. 2.9–2.12).

y+ yw N* yY yN+ 0 * w y1 yРис. 2.В первом случае (рис. 2.9) множество равновесий Нэша составляет отрезок: EN () = [N1; N2]. Фиксируем произ* * вольное равновесие y* = ( y1, y2 ) EN (). Наличие «большого» равновесия Нэша (отрезка, содержащего континуум точек) имеет несколько минусов с точки зрения эффективности стимулирования. Поясним это утверждение.





Так как все точки отрезка [N1; N2] эффективны по Парето с точки зрения агентов, то целесообразно доплачивать агентам за выбор конкретных действий из этого отрезка малую, но строго положительную величину.

Построим систему индивидуального стимулирования в соответствии с результатами, приведенными выше (см.

(8) и (9)):

* C1, y1 y* * ~ 1 (y1) = 1(y1, y2 ) =, (11) * 0, y1 < yГлава * C2, y2 y* * ~ (y2) = 2( y1, y2) =.

* 0, y2 < y При использовании этой системы стимулирования * * точка y* = ( y1, y2 ) оказывается единственным равновесием Нэша, то есть, переходя от системы стимулирования (10) каждого агента, зависящей от действий всех агентов, к системе стимулирования (11), зависящей только от действий данного агента, центр декомпозирует игру агентов, реализуя при этом единственное действие. При этом эффективность стимулирования, очевидно, не только не понижается, а может оказаться более высокой, чем при использовании исходной системы стимулирования.

yw N+ y* yN2 y+ * w yyРис. 2.Базовые математические модели стимулирования y+ yw N* yNy0 * + w y1 yРис. 2.Во втором и третьем случаях равновесием Нэша являются отрезки [N1; N2], изображенные на рис. 2.10 и 2.11 соответственно.

И наконец, в четвертом случае (рис. 2.12) множество равновесий Нэша состоит из точки (0; 0) и отрезка [N1; N2], то есть EN () = (0; 0) [N1; N2], причем точки интервала (N1; N2) недоминируемы по Парето другими равновесиями.

yw N+ y* yNy* yy1 + w Рис. 2.Пусть в условиях рассматриваемого примера функции затрат агентов несепарабельны и имеют вид:

Глава (yi + l y3-i )ci (y) =.

2ri Определим множество Y индивидуально-рациональных действий агентов: Y = {(y1, y2) | ci (y) Ci, i = 1, 2}. Для того чтобы не рассматривать все возможные комбинации значений параметров {r1, r2, C1, C2, w}, возьмем случай, представленный на рис. 2.13.

y2r1C1 / l w 2r2CN* yNy* y2r1C1 w 2r2C2 / l Рис. 2.13. Множество равновесий Нэша [N1; N2] в случае несепарабельных затрат В рассматриваемом случае множество равновесий Нэша включает отрезок [N1; N2]. Система стимулирования * * c1( y1, y2 ), y1 = y* ~ 1 (y) = (12) * 0, y1 y * * c2( y1, y2 ), y2 = y * ~ (y) = * 0, y2 y реализует действие y* [N1; N2] как равновесие в доминантных стратегиях. • Базовые математические модели стимулирования Завершив рассмотрение механизмов стимулирования за индивидуальные результаты деятельности агентов, перейдем к описанию механизмов стимулирования за результаты совместной деятельности.

2.4. Механизмы стимулирования нескольких агентов В большинстве известных моделей стимулирования рассматриваются либо ОС, в которых управляющий орган – центр – наблюдает результат деятельности каждого из управляемых субъектов – агентов, находящийся в известном взаимно однозначном соответствии с выбранной последним стратегией (действием), либо ОС с неопределенностью, в которых наблюдаемый результат деятельности агентов зависит не только от его собственных действий, но и от неопределенных и/или случайных факторов [24].

Настоящий раздел содержит формулировку и решение задачи коллективного стимулирования в многоэлементной детерминированной ОС, в которой центр имеет агрегированную информацию о результатах деятельности агентов.

Пусть в рамках модели, рассмотренной в предыдущем разделе, результат деятельности z A0 = Q(A) ОС, состоящей из n агентов, является функцией (называемой функцией агрегирования) их действий: z = Q(y), где Q() – оператор агрегирования, отображающий вектор y A’ действий агентов в результат их деятельности z A0. Интересы и предпочтения участников ОС – центра и агентов – выражены их целевыми функциями. Целевая функция центра представляет собой разность между его доходом H(z) и суммарным вознаграждением (z), выплачиваемым агентам, где i (z) – i iN стимулирование i-го агента, (z) = (1(z), 2(z), …, n (z)), то есть Глава ( (), z) = H(z) – (z). (1) i iN Целевая функция i-го агента представляет собой разность между стимулированием, получаемым им от центра, и затратами ci (y), то есть:

fi (i (), y) = i (z) – ci (y), i N. (2) Примем следующий порядок функционирования ОС.

Центру и агентам на момент принятия решений о выбираемых стратегиях (соответственно – функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функция агрегирования.

Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования выбирают действия, максимизирующие их целевые функции.

В случае, когда индивидуальные действия агентов наблюдаемы для центра (или когда центр может однозначно восстановить их по наблюдаемому результату деятельности), последний может использовать систему стимулирования, зависящую непосредственно от действий агентов: i N ~ i (y) = i (Q(y)). Методы решения задачи стимулирования для этого случая описаны в предыдущем разделе. Поэтому рассмотрим случай, когда центр наблюдает только результат деятельности ОС, от которого зависит его доход, но не знает и не может восстановить индивидуальных действий агентов, то есть имеет место агрегирование информации – центр имеет не всю информацию о векторе y A действий агентов, а ему известен лишь некоторый их агрегат z A0 – параметр, характеризующий результаты совместных действий агентов.

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 11 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.