WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 21 | 22 || 24 | 25 |   ...   | 34 |

Справедливость утверждения 4.7 следует из непосредственного вычисления выражения (1) и последующей подстановки результата в (4). Пример 4.8 иллюстрирует утверждение 4.7 для случая (t) = t 2/2. Содержательная интерпретация целевой функции (8) такова: агент получает фиксированный доход и несет затраты, зависящие от его действия и его типа.

Таким образом, в настоящем разделе мы рассмотрели рефлексивную модель функционирования команды, в рамках которой устойчивость совместной деятельности коллектива агентов обусловлена «правильными» их взаимными представлениями о существенных характеристиках друг друга. Однако вне рассмотрения остался вопрос – а что произойдет, если взаимные представления агентов не удовлетворяют, например, (7). Для того чтобы ответить на этот вопрос, необходимо рассмотреть модель формирования команды, описывающую динамику взаимных представлений агентов на основании наблюдаемой ими информации о действиях оппонентов.

4.5.5. Формирование команды Впервые модели динамики представлений агентов в приложении к задаче формирования команд рассматривались в [159, 174].

Рассмотрим процесс формирования команды. Для этого введем множество Y(Q(x)) A’ таких векторов действий агентов, которые приводят к тому же результату деятельности, что и вектор x A’.

Обозначим (1) (x) = {r | x Arg maxx)) V(y, r)} yY (Q( – множество таких векторов r типов агентов, что вектор действий x A’ доставляет максимум суммарной полезности агентов, обладающих этими типами.

Обозначим (2) -i(x, s) = {r (x) | ri = s}, s i, x A’, i N, – множество типов оппонентов, которые i-ый агент, обладающий типом s, может восстановить, наблюдая выбранный агентами вектор действий x A’.

Пусть взаимодействие агентов происходит многократно. На шаге t = 0, 1, 2,.... агенты, имеющие представления { rti }i N, выбирают действия xi*(z, rti ), i N, и каждый агент наблюдает действия, выбранные всеми агентами. Агент i, зная свой тип ri, может «восстановить» следующее множество типов оппонентов:

-i({xi*(z, rti )}, ri).

Для завершения описания динамической модели осталось определить, как агенты будут изменять свои представления, то есть каковы станут представления rti+1 i-го агента на шаге t + 1, i N.

Здесь возможны различные варианты. Наиболее распространенной в моделях коллективного поведения процедурой динамики характеристик агентов является процедура индикаторного поведения [134]. В рассматриваемой модели гипотеза индикаторного поведения выглядит следующим образом. Вычислим (3) wtij (x, ri, rtij ) = arg min( x,ri ) |s – rtij |, i, j N, t = 1, 2,....

-1 -sPr -i j Если первоначально агенты имели представления r0i о типах оппонентов, i N, то динамика их представлений описывается следующим образом:

ij (4) rtij = rtij + [ wtij ({xk*(z, rtk )}k N, ri, rtij ) – rtij ], -1 t -1 -1 -где tij [0; 1] – константы, i, j N, t = 1, 2,....

Процедура (4) обладает тем свойством, что любой набор взаимных представлений, удовлетворяющий выражению (4) раздела 4.5.4, является ее стационарной точкой. Сходимость процедуры (4) и области притяжения ее стационарных точек требуют в каждом случае отдельного исследования.

Система (4) описывает динамику представлений агентов о типах оппонентов. Так как эти представления полностью определяют то, каких действий ожидает агент от оппонентов, следовательно, можно считать, что (4) описывает и динамику репутации. Так как выше командой было предложено считать множество агентов с «оправдываемой» репутацией, то стабильной команде соответствует стационарная точка процедуры (4), а динамика репутации, описываемая этой процедурой, отражает процесс формирования команды (команду можно считать сформировавшейся, если взаимные представления ее членов не изменяются со временем в процессе функционирования команды). Примеры динамики взаимных представлений (результаты имитационного моделирования) агентов в процессе формирования команды приведены в [89, 159, 174].

Таким образом, в настоящей главе рассмотрены теоретикоигровые модели репутации и норм деятельности, учитывающие рефлексию агентов. Под нормой деятельности агента понимается правило, предписывающее ему то или иное поведение в зависимости от ситуации. Если равновесий игры агентов несколько, норма деятельности определяет, какое равновесие выбирает агент. Репутация является, в некотором смысле, рефлексией над нормой деятельности – она определяет, каких действий от агента ожидают другие агенты в той или иной ситуации.

Теоретический анализ свидетельствует, что адекватным инструментом описания репутации и норм деятельности является рефлексивная игра. Зависимость образующих информационное равновесие действий реальных агентов от их представлений о существенных параметрах отражает нормы их деятельности. Зависимость образующих информационное равновесие действий фантомных агентов от их представлений о существенных параметрах отражает репутацию их прообразов. Репутация является оправданной, если информационное равновесие стабильно – когда ожидания агентов относительно поведения других агентов оправдываются.

Рассмотренные прикладные модели показывают, что предложенный подход может успешно применяться при изучении роли репутации в конкуренции фирм на рынке, а также при исследовании процессов формирования и функционирования команд.

ГЛАВА 5. МОДЕЛИ И МЕТОДЫ МОТИВАЦИИ ПЕРСОНАЛА В соответствии с системой классификаций задач управления инновационным развитием фирмы (см. раздел 1.5) важной составляющей является разработка и внедрение системы мотивации персонала, побуждающей последнего к инновационной активности. Реализация инноваций нередко происходит «параллельно» с рутинной деятельностью организации, поэтому необходимо использование методов мотивации, учитывающих различные аспекты деятельности сотрудников. Поэтому настоящая глава посвящена рассмотрению многокритериальных систем стимулирования – в которых деятельность каждого управляемого субъекта (агента) описывается несколькими показателями, значения которых определяют размер вознаграждения, выплачиваемого управляющим органом (центром).



Стимулированием называется побуждение (осуществляемое посредством воздействия центра на предпочтения – целевую функцию – агента) к совершению определенных действий [163]. Исследование формальных моделей стимулирования в рамках теории управления началось практически одновременно и независимо как в бывшем СССР, так и за рубежом, примерно в конце 60-х годов прошлого века. Основными научными школами по этому направлению исследований являются теория активных систем [44, 163165] (научный центр – Институт проблем управления РАН), теория иерархических игр [72] (научный центр – Вычислительный центр РАН) и теория контрактов, развиваемая, в основном, зарубежными учеными [247, 279, 280]. Кроме того, проблемы стимулирования (спроса на труд, предложения труда и т.д.) традиционно находятся в центре внимания экономики труда [4, 5, 245, 302].

Прикладные задачи стимулирования рассматриваются и используются, в том числе, в управлении персоналом [87, 208].

Структура изложения материала настоящей главы следующая.

В первом разделе вводится классификация задач стимулирования, позволяющая в дальнейшем систематически описать результаты исследования механизмов многокритериального стимулирования.

В том числе: компенсаторные (раздел 5.2), линейные (раздел 5.3), «бригадные» (раздел 5.4) и ранговые (раздел 5.5) системы многокритериального стимулирования. Раздел 5.6 посвящен краткому обсуждению роли систем оценки деятельности.

5.1. КЛАССИФИКАЦИЯ ЗАДАЧ СТИМУЛИРОВАНИЯ Рассмотрим двухуровневую организационную систему (ОС), состоящую из одного центра на верхнем уровне иерархии и n агентов на нижнем – см. Рис. 47.

ЦЕНТР Агент1 Агент2 Агентn … Рис. 47. Двухуровневая ОС Стратегией i-го агента является выбор действия yi Ai, i N = {1, 2,..., n} – множеству агентов; стратегией центра – выбор системы стимулирования {i(z)}iN, где zi = Qi(y) Bi – наблюдаемый центром результат деятельности i-го агента, y = (y1, y2,..., yn) – вектор действий агентов, z = (z1, z2,..., zn) – вектор результатов деятельности агентов, Qi: A Bi – оператор агрегирования, i: B 1, i N, A = Ai, B =.

Bi iN iN Предпочтения центра отражены его целевой функцией (1) (z, (z)) = H(z) – (z), i iN где H(): B 1 – функция дохода центра.

Предпочтения i-го агента отражены его целевой функцией:

(2) fi(y, i(z)) = i(z) – ci(y), где ci(): A 1 – функция затрат i-го агента, i N.

Последовательность функционирования ОС такова: центр выбирает и сообщает агентам систему стимулирования (зависимость вознаграждения, выплачиваемого каждому из агентов, от вектора результатов их деятельности), затем агенты однократно, одновременно и независимо выбирают свои действия, которые приводят к соответствующим результатам деятельности. Целевые функции и допустимые множества, а также операторы агрегирования, являются общим знанием [175] среди всех участников ОС (центра и агентов); агенты на момент принятия решений знают выбранную центром систему стимулирования; центр наблюдает результаты деятельности агентов, но может не знать их действий.

Обозначим:

P(()) A – множество действий, выбираемых агентами при системе стимулирования (): обычно считается, что агенты выбирают действия, являющиеся равновесием их игры [83];

Q(P) = {(Q1(y1), Q2(y2),..., Qn(yn))} – множество результаyP тов деятельности агентов, которые могут реализоваться при выборе ими действий из множества P.

Эффективность стимулирования K() определяется как гарантированное значение целевой функции центра:

(3) K() = min )) [H(z) – (z) ].

i zQ( P( iN В общем виде задача стимулирования формулируется следующим образом – найти допустимую систему стимулирования, обладающую максимальной эффективностью:

(4) K() max.

Введем систему классификаций задач стимулирования, в которой основаниями классификации являются размерности соответствующих множеств.

1. Первым основанием системы классификаций является число агентов n. Возможные значения признаков классификации: n = (одноэлементная ОС) и n 2 (многоэлементная ОС).

2. Вторым основанием является размерность k множества допустимых действий агентов (здесь и всюду ниже будем считать, что для всех агентов множества допустимых действий являются подмножествами k). Возможные значения признаков классификации: k = 1 (скалярная система стимулирования) и k 2 (многокритериальная система стимулирования).

3. Третьим основанием является размерность m множества допустимых результатов деятельности агентов (здесь и всюду ниже будем считать, что для всех агентов множества допустимых результатов деятельности являются подмножествами m). Возможные значения признаков классификации: m = 1 и m 2. Частным случаем (отсутствие агрегирования) является тождественный оператор агрегирования, тогда m = k и B = A.

4. Четвертым основанием является размерность предпочтений агентов и системы стимулирования. В настоящей главе предполагается, что областью значений функции стимулирования является множество неотрицательных действительных чисел, а предпочтения агентов скалярны (область значений целевой функции любого агента – множество действительных чисел). Содержательно, целевая функция агента при этом отражает его «экономические» интересы, а аддитивно входящее в целевую функцию стимулирование может интерпретироваться как материальное стимулирование.





Возможно использование векторных предпочтений агентов (см.

[73, 172]) и так называемых векторных систем стимулирования [117], в которых одна из компонент соответствует материальному стимулированию, а другая компонента (или другие компоненты) – различным аспектам морального стимулирования. Исследование векторных систем стимулирования выходит за рамки настоящей работы и представляется перспективным направлением будущих исследований.

5. Пятым основанием системы классификаций задач стимулирования являются те априорные требования, которые накладываются на класс допустимых систем стимулирования – различают системы стимулирования различных типов: компенсаторные (которые в большинстве случаев оптимальны), скачкообразные (аккордные), линейные (пропорциональные, сдельные), «бригадные», ранговые и др. [117, 163].

6. Шестым основанием системы классификаций является наличие или отсутствие единообразности определения размера вознаграждения агента в зависимости от результатов его деятельно сти. Системы стимулирования, в которых вознаграждение зависит от характеристик конкретного агента, называются персонифицированными. В отличие от персонифицированных, в унифицированных системах стимулирования зависимость размера вознаграждения от результатов деятельности одинакова для всех агентов. Унифицированные системы стимулирования являются более «демократичными» («справедливыми») и требуют от центра обладания меньшей информацией об агентах. С другой стороны, являясь частным случаем персонифицированных, они обладают не большей эффективностью. В настоящей главе мы ограничимся рассмотрением унифицированных систем стимулирования.

Введенная система классификаций обусловливает структуру изложения материала настоящей главы.

Базовой моделью стимулирования, которая исследована на сегодняшний день наиболее подробно, является модель, в которой n = m = k = 1 и отсутствует агрегирование – см. [44, 72, 117, 163].

Поэтому ниже обсуждается обобщение этой модели на случай n = 1, m 2, k 2. Разделы 5.2 и 5.3 посвящены обобщению полученных в [171] результатов исследования, соответственно, индивидуального стимулирования и стимулирования за результаты коллективной деятельности, на случай n 2, k 2, m = многокритериального стимулирования. Далее, в разделах 5.3-5.5 на случай многокритериального стимулирования обобщаются результаты исследования линейных [117], бригадных [85, 163, 242] и ранговых [170, 238] скалярных систем стимулирования.

5.2. КОМПЕНСАТОРНЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ В настоящем разделе изучаются компенсаторные системы многокритериального стимулирования, в рамках которых центр компенсирует агентам затраты только при условии выполнения плана. Сначала рассматриваются одноэлементные (подраздел 5.2.1), а затем – многоэлементные ОС (подразделы 5.2.2 и 5.2.3).

5.2.1. Базовая модель стимулирования Основным аппаратом моделирования задач стимулирования в теории управления является теория игр – раздел прикладной математики, исследующий модели принятия решений в условиях несовпадения интересов сторон (игроков), когда каждая сторона стремится воздействовать на развитие ситуации в собственных интересах [83]. Простейшей игровой моделью является взаимодействие двух игроков – центра (principal) и подчиненного ему агента (agent), то есть n = 1. Такая организационная система (ОС) имеет следующую структуру: на верхнем уровне иерархии находится центр, на нижнем – подчиненный ему агент. В качестве центра может выступать работодатель, непосредственный руководитель агента или организация, заключившая трудовой (или какой-либо иной – страховой, подрядный и т.д.) договор с агентом. В качестве агента может выступать наемный работник, подчиненный, или организация, являющаяся второй стороной по соответствующему договору.

Стратегией агента является выбор действия y A k, k 2, принадлежащего компактному множеству допустимых действий A.

Содержательно, действием агента может быть количество отрабатываемых часов, объем произведенной продукции, ее качество и иные характеристики. Пока будем считать, что агрегирование отсутствует, то есть z y (Q() – тождественное отображение, m = k, B = A).

Стратегией центра является выбор функции стимулирования (), ставящей в соответствие действию агента некоторое неотрицательное вознаграждение, выплачиваемое ему центром, то есть : A +1.

Выбор действия y A требует от агента затрат c(y), с : A 1, и приносит центру доход H(y), H : A 1. Функцию затрат агента c(y) и функцию дохода центра H(y) будем считать известными (см. обсуждение проблем и результатов их идентификации в [117, 163]).

Интересы участников организационной системы (центра и агента) отражены их скалярными целевыми функциями, (функциями выигрыша, полезности и т.д., в записи которых зависимость от стратегии центра будет опускаться), которые обозначим, соответственно: (y) и f(y).

Целевые функции представляют собой: для агента – разность между стимулированием и затратами:

(1) f(y) = (y) – c(y), а для центра – разность между доходом и затратами центра на стимулирование – вознаграждением, выплачиваемым агенту:

(2) (y) = H(y) – (y).

Определим yLCA = arg min c(y) – действие агента, минимизиyA рующее его затраты.

Pages:     | 1 |   ...   | 21 | 22 || 24 | 25 |   ...   | 34 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.