WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 11 |

P () = Arg max { (y) – c (y)}. (3) yA Зная, что агент выбирает действия из множества (3), центр должен найти систему стимулирования, которая максимизировала бы его собственную целевую функцию. Так как множество P() может содержать более одной точки, необходимо доопределить (с точки зрения предположений центра о поведении агента) выбор агента. Если выполнена гипотеза благожелательности1 (ГБ), которую будем считать имеющей место, если не оговорено особо, в ходе дальнейшего изложения, то агент выбирает из множества (3) наиболее благоприятное для центра действие. Альтернативой для центра является расчет на наихудший для него выбор агента из множества решений игры.

Следовательно, эффективность системы стимулирования M равна:

K() = max) (y), (4) yP( где (y) определяется (2).

Задача синтеза оптимальной системы стимулирования заключается в выборе допустимой системы стимулирования, имеющей максимальную эффективность:

K() max. (5) M Следует отметить, что введенные выше предположения согласованы в следующем смысле. Агент всегда может вы Напомним, что гипотеза благожелательности заключается в следующем: если агент безразличен между выбором нескольких действий (например, действий, на которых достигается глобальный максимум его целевой функции), то он выбирает из этих действий то, которое наиболее благоприятно для центра, то есть действие, доставляющее максимум целевой функции центра.

Глава брать нулевое действие, не требующее от него затрат (второе предположение). В то же время центр имеет возможность ничего не платить ему за выбор этого действия.

Во всех содержательных интерпретациях теоретикоигровых моделей стимулирования предполагается, что у агента имеется альтернатива – сохранить статус-кво, то есть не вступать во взаимоотношения с центром (не заключать трудового контракта). Отказываясь от участия в данной ОС, агент не получает вознаграждения от центра и всегда имеет возможность выбрать нулевое действие, обеспечив себе неотрицательное (точнее – нулевое) значение целевой функции.

Сделав маленькое отступление, обсудим более подробно модель процесса принятия решений агентом. Предположим, что некоторый агент предполагает устроиться на работу на некоторое предприятие. Ему предлагается контракт { (y), x*}, в котором оговаривается зависимость () вознаграждения от результатов y его деятельности, а также то, какие конкретные результаты x* от него ожидаются. При каких условиях агент подпишет контракт, если обе стороны – и агент, и предприятие (центр) принимают решение о подписании контракта самостоятельно и добровольно Рассмотрим сначала принципы, которыми может руководствоваться агент.

Первое условие – условие согласованности стимулирования (incentive compatibility constraint), которое заключается в том, что при участии в контракте выбор именно действия y* (а не какого-либо другого допустимого действия) доставляет максимум его целевой функции. Другими словами, это условие того, что система стимулирования согласована с интересами и предпочтениями агента.

Второе условие – условие участия в контракте (иногда его называют условием индивидуальной рациональности – individual rationality constraint), которое заключается в том, Базовые математические модели стимулирования что, заключая данный контракт, агент ожидает получить полезность, бльшую, чем он мог бы получить, заключив другой контракт с другой организацией (с другим центром).

Представления агента о своих возможных доходах на рынке труда отражает такая величина, как резервная заработная плата, то есть частным случаем условия индивидуальной рациональности является ограничение резервной заработной платы.

Аналогичные приведенным выше для агента условия согласованности и индивидуальной рациональности можно сформулировать и для центра. Если имеется единственный агент – претендент на заключение контракта, то контракт будет выгоден для центра при выполнении двух условий.

Первое условие (аналогичное условию согласованности стимулирования) отражает согласованность системы стимулирования с интересами и предпочтениями центра, то есть применение именно фигурирующей в контракте системы стимулирования должно доставлять максимум целевой функции (функции полезности) центра (по сравнению с использованием любой другой допустимой системы стимулирования) (см. (4)).

Второе условие для центра аналогично условию участия для агента, а именно – заключение контракта с данным агентом выгодно для центра по сравнению с сохранением статус-кво, то есть отказом от заключения контракта вообще.

Например, если считать, что прибыль предприятия (значение целевой функции центра) без заключения контракта равна нулю, то при заключении контракта прибыль должна быть неотрицательна.

Качественно обсудив условия заключения взаимовыгодного трудового контракта, вернемся к формальному анализу, то есть решению задачи стимулирования (5). Отметим, что решение данной задачи «в лоб» достаточно трудоемко.

Но, к счастью, можно угадать оптимальную систему стимуГлава лирования исходя из содержательных соображений, а затем корректно обосновать ее оптимальность.

Предположим, что использовалась некоторая система стимулирования (), при которой агент выбирал действие x P( ()). Утверждается, что если взять другую систему ~() стимулирования, которая будет равна нулю всюду, кроме точки x, и будет равна старой системе стимулирования в точке x:



~(y) (x), y = x, = 0, y x ~() то и при новой системе стимулирования это же действие агента y = x будет доставлять максимум его целевой функции.

Приведем формальное доказательство этого утверждения. Условие того, что выбор действия x доставляет максимум целевой функции агента при использовании системы стимулирования (), можно записать в следующем виде:

разность между стимулированием и затратами будет не меньше, чем при выборе любого другого действия:

y A (x) - c(x) ( y) - c(y).

Заменим систему стимулирования () на систему сти~() мулирования, тогда получим следующее: в точке x сис~() тема стимулирования по-прежнему равна системе стимулирования (). В правой части будет тогда записана ~() система стимулирования :

~(y) y A (x) - c(x) - c(y).

Если выполнялась первая система неравенств, то выполняет~()) ся и новая система неравенств. Следовательно, x P(.

На рис. 2.1 изображены графики функций: H(y) и c(y). С точки зрения центра стимулирование не может превышать доход, получаемый им от деятельности агента (так как, отказавшись от взаимодействия с агентом, центр всегда может Базовые математические модели стимулирования получить нулевую полезность). Следовательно, допустимое решение лежит ниже функции H(y). С точки зрения агента стимулирование не может быть меньше, чем сумма затрат и резервная полезность (которую агент всегда может получить, выбирая нулевое действие). Следовательно, допустимое решение лежит выше функции c(y).

Множество действий агента и соответствующих значений целевых функций, удовлетворяющих одновременно всем перечисленным выше ограничениям (согласования и индивидуальной рациональности, как для центра, так и для агента), – «область компромисса» заштрихована на рис. 2.1. Множество действий агента, при которых область компромисса не пуста, называется множеством согласованных планов:

S = {x A | H(x) c(x) 0}. (9) c(y) H(y) A B y x* S Рис. 2.1. Оптимальное решение задачи стимулирования Так как центр стремится минимизировать выплаты агенту при условии, что последний выбирает требуемое действие, то оптимальная точка в рамках гипотезы благожелательности должна лежать на нижней границе области комГлава промисса, то есть стимулирование в точности должно равняться затратам агента. Этот важный вывод получил название «принцип компенсации затрат». В соответствии с этим принципом, для того чтобы побудить агента выбрать определенное действие, центру достаточно компенсировать затраты агента.

Кроме компенсации затрат, центр может устанавливать также мотивирующую надбавку1 0. Следовательно, для того чтобы агент выбрал действие x A, стимулирование со стороны центра за выбор этого действия должно быть не меньше (x) = c(x) +. (6) Легко видеть, что если в случае выбора агентом других действий (отличных от x) вознаграждение равно нулю, то выполнены как условия согласованности стимулирования, так и условие индивидуальной рациональности агента. При этом стимулирование (10) со стороны центра является минимально возможным. Следовательно, мы доказали, что параметрическим (с параметром x S) решением задачи (5) является следующая система стимулирования:

c(x) +, y = x K(x, y) =, (7) 0, y x которая называется компенсаторной (K-типа).

Параметр x A, фигурирующий в компенсаторной системе стимулирования, в теории управления называется пла Если гипотеза благожелательности (ГБ) не выполнена, и при определении эффективности стимулирования центр использует максимальный гарантированный результат (МГР) по множеству максимумов целевой функции агента, то с формальной точки зрения мотивирующая надбавка должна быть строго положительна (но может быть выбрана сколь угодно малой). Если гипотеза благожелательности выполнена, то с формальной точки зрения мотивирующая надбавка может быть выбрана равной нулю. С неформальной точки зрения мотивирующая надбавка отражает аспект нематериального стимулирования.

Базовые математические модели стимулирования ном – желательным с точки зрения центра действием агента.

План является согласованным, если его выполнение (выбор действия, совпадающего с планом) выгодно агенту, то есть принадлежит множеству реализуемых действий (тех действий, на которых достигается максимум целевой функции агента). Принцип компенсации затрат является достаточным условием реализации требуемого действия.

Рассмотрим теперь, какое действие следует реализовывать центру, то есть каково оптимальное значение согласованного плана x S.

Так как в силу (6)–(7) стимулирование равно затратам агента, то оптимальным реализуемым действием x* является действие, максимизирующее на множестве S разность между доходом центра и затратами агента. Следовательно, оптимальный согласованный план может быть найден из решения следующей стандартной оптимизационной задачи:

x* = arg max {H(x) – c(x)}, (8) xS которая получила название задачи оптимального согласованного планирования [3]. Действительно, то действие, которое центр собирается побуждать выбирать агента, может интерпретироваться как план – желательное с точки зрения центра действие агента. В силу принципа компенсации затрат план является согласованным (напомним, что согласованным называется план, выполнение которого выгодно агенту), значит центру в силу (8) остается найти оптимальный согласованный план.





Значение целевой функции центра при использовании оптимальной компенсаторной системы стимулирования в рамках гипотезы благожелательности равно:

= max {H(x) – c(x)}.

xS Условие оптимальности плана x* в рассматриваемой модели (в предположении дифференцируемости функций дохода и затрат, а также вогнутости функции дохода центра и Глава выпуклости функции затрат агента) имеет вид:

dH (x*) dc(x*) dH ( y) =. Величина в экономике называется dy dy dy предельной производительностью (MRP – marginal rate of dc( y) production), а величина – предельными затратами (MC dy – marginal costs). Условие оптимума (MRP = MC) определяет действие x* и так называемую эффективную заработную плату c (x* ).

Отметим еще одну важную содержательную интерпретацию условия (9). Оптимальный согласованный план x* максимизирует разность между доходом центра и затратами агента, то есть доставляет максимум суммы целевых функций (1) и (2) участников ОС, и, следовательно, является эффективным по Парето1.

Подчеркнем, что компенсаторная система стимулирования (7) не является единственной оптимальной системой стимулирования – легко показать, что в рамках гипотезы благожелательности решением задачи (5) является любая система стимулирования (), удовлетворяющая следующему условию: (x*) = c(x* ), y y* (y) c(y) (см. рис. 2.2, на котором приведены эскизы двух оптимальных систем * * стимулирования – 1 и 2 ).

Область компромисса является чрезвычайно важным с методологической точки зрения понятием. Ее непустота отражает наличие возможности согласования интересов центра и агента в существующих условиях. Поясним последнее утверждение.

То есть, таким, что не существует другого плана, при выполнении агентом которого, все участники ОС (и центр, и агент) получат не меньший выигрыш, а кто-то из них – строго больший.

Базовые математические модели стимулирования c(y) * * y x* Рис. 2.2. Оптимальные системы стимулирования В формальной модели стратегии участников ограничены соответствующими допустимыми множествами. Учет ограничений индивидуальной рациональности агента и центра (условно можно считать, что неотрицательность целевой функции центра отражает ограничения финансовой эффективности деятельности центра – затраты на стимулирование агента не должны превышать доход от результатов его деятельности), а также условий согласования приводит к тому, что множество «рациональных» стратегий – область компромисса – оказывается достаточно узкой.

Фактически компромисс между центром и агентом заключается в дележе полезности, равной разности полезностей в точках А и В на рис. 2.1. Делая первый ход (предлагая контракт), центр «забирает» эту разность себе, вынуждая агента согласиться с резервным значением полезности. Легко проверить, что в противоположной ситуации, когда первый ход делает агент, предлагая контракт центру, нулевую полезность получает центр, а агент «забирает» разность между полезностями в точках А и В себе. Возможны и промежуточные варианты, когда принцип дележа прибыли между ценГлава тром и агентом оговаривается заранее в соответствии с некоторым механизмом компромисса [16].

Из проведенного выше анализа следует, что решение задачи стимулирования может быть разделено на два этапа.

На первом этапе решается задача согласования – определяется множество реализуемых при заданных ограничениях действий – множество согласованных планов. На втором этапе решается задача оптимального согласованного планирования – ищется реализуемое действие, которое наиболее предпочтительно с точки зрения центра. Подобная идеология разбиения решения задачи управления ОС на два этапа широко используется в теории управления и при решении более сложных задач – см. [24, 28].

В рамках полученного выше оптимального решения задачи стимулирования (то есть при использовании центром компенсаторной системы стимулирования) значение целевой функции агента в случае выполнения плана равно нулю (или резервной полезности плюс мотивирующая надбавка). Поэтому особого внимания, в силу широкой распространенности на практике, заслуживает случай, когда в условиях трудового контракта (или договора между заказчиком-центром и исполнителем-агентом) производится фиксация норматива рентабельности 0 агента, то есть ситуация, когда размер вознаграждения агента зависит от его действия следующим образом:

(1+ ) c(x), y = x (x, y) =.

0, y x Данная система стимулирования называется системой стимулирования с нормативом рентабельности [16].

Предполагая, что резервная полезность исполнителя равна нулю, получаем, что задача оптимального согласованного планирования при этом имеет вид (ср. с (8)):

x*() = arg max {H(y) – (1 + ) c(y)}.

yA Базовые математические модели стимулирования Следовательно, максимальное значение целевой функции центра равно:

() = H(y*()) – (1 + ) c (y*()).

Легко видеть, что 0 ().

Рассмотрим иллюстративный пример. Пусть H(y) = y, c(y) = y2/2 r, где r – тип агента (параметр, отражающий эффективность его деятельности. Тогда x*() = r/(1 + ), () = r/[2(1 + )]. Из условий индивидуальной рациональности следует, что 0. В рассматриваемом примере прибыль агента c (x*()) достигает максимума при = 1, то есть агенту выгодно вдвое завысить стоимость выполняемых работ. С точки зрения центра наиболее предпочтителен нулевой норматив рентабельности.

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 11 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.