WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 16 | 17 || 19 | 20 |   ...   | 34 |

Перечисленные выше классы моделей трактовали репутацию агента (индивидуальную) или группы агентов (коллективную) как мнение остальных агентов (или центра) о том, что данный субъект ведет (и вел в прошлом) себя добросовестно и корректно – не стремится получить дополнительный доход (например, взятку), нарушить взятые на себя обязательства и т.д. При этом, как правило, считалось, что репутация может быть хорошей или плохой, и агент может вести себя «хорошо» или «плохо». Тогда задача заключается в построении моделей, которые на основании наблюдаемых характеристик позволяют определять истинную репутацию агентов и побуждать их вести себя «хорошо». Однако в жизни все гораздо более разнообразно – не всегда можно любое действие однозначно классифицировать как «хорошее» или «плохое», да и приведенное выше определение репутации (создавшееся общее мнение о достоинствах или недостатках кого-либо) гораздо шире.

Существует класс моделей, трактующих репутацию как ожидаемое оппонентами поведение субъектов (их краткий обзор приведен в настоящем разделе ниже). И именно этому подходу следуют оригинальные модели, описываемые в настоящей главе.

Модель институционального управления. В работе [159], посвященной институциональному управлению организационными системами (ОС), предложена следующая модель управления нормами деятельности.

Пусть ОС состоит из n агентов, выбирающих действия yi Ai из компактных множеств Ai и имеющих непрерывные целевые функции fi(, y), где – состояние природы, y = (y1, y2, …, yn) A’ = Ai, i N, где N = {1, 2, …, n} – множество аген iN тов.

Нормой деятельности будем называть отображение : A’ множества возможных состояний природы (множества существенных параметров) во множество допустимых векторов действий агентов A’. Содержательно i-ая компонента векторфункции () определяет, какое действие i-ый агент выбирает в зависимости от состояния природы.

Пусть предпочтения центра заданы на множестве состояний природы, норм деятельности и действий агентов: (, (), y).

Предполагая, что агенты следуют установленным нормам, обозначим K(()) = F((, (), ())) – эффективность институционального управления (), где F() – оператор устранения неопределенности. В качестве оператора устранения неопределенности (в зависимости от информированности центра) может использоваться гарантированный результат (вычисление минимума по множеству ), или математическое ожидание (при известном распределении вероятностей p() на множестве ) и т.д.

Тогда задачей институционального управления при ограничениях M на нормы деятельности будет выбор допустимой нормы *() M, имеющей максимальную эффективность:

(1) *() = arg max K(()), ()M при условии, что агенты следуют установленным нормам деятельности.

Последнее условие требует пояснений. Так как агенты активны и выбирают свои действия самостоятельно, то выбор агента будет совпадать с выбором, предписываемым нормой, только в том случае, если агенту это выгодно. Детализируем, что можно понимать под «выгодностью».

Определим параметрическое равновесие Нэша [83]:

(2) EN ( ) = {x A' | i N, yi Ai fi(, x) fi(, x-i, yi)}, Будем называть норму () согласованной (с предпочтениями агентов), если (3) EN() ().

Условие (3) можно интерпретировать следующим образом:

норма деятельности реализует то или иное равновесие, если для любого состояния природы выбор, предписываемый нормой, не противоречит рациональности поведения агентов (обеспечивает им соответствующий выигрыш и/или делает невыгодным одностороннее отклонение от нормы). Если () – однозначное отображение, то «навязывание» центром согласованной нормы деятельности может рассматриваться как сужение множества равновесий (подсказка о существовании фокальной точки и т.д. – см. обсуждение проблемы множественности равновесий в [295]). С этой точки зрения управление нормами деятельности можно рассматривать как задачу поиска конвенции (см. выше) или как задачу реализации соответствия группового выбора (см. обзор результатов теории реализуемости в [37, 185, 292]), в которой является вектором индивидуальных характеристик агентов. Такой аспект рассмотрения представляется перспективным направлением дальнейших исследований, но выходит за рамки настоящей работы.

Условия (2) и (3) совместно можно записать в следующем виде: норма () является согласованной тогда и только тогда, когда (4), i N, yi Ai fi(, ()) fi(, -i(), yi).

Условие (4) означает, что норма согласована с интересами агентов, если при любом состоянии природы каждому агенту выгодно следовать норме деятельности при условии, что остальные агенты также следуют этой норме.

Рассмотрим, какой информированностью должны обладать агенты для того, чтобы существовала согласованная норма. Легко видеть, что условия игры – множество агентов, целевые функции, допустимые множества, а также норма деятельности и состояние природы должны быть общим знанием. Напомним, что общим знанием в теории игр [175] называется факт, о котором:

а) известно всем игрокам;

б) всем игрокам известно а);

в) всем игрокам известно б), и так далее до бесконечности.

Действительно, для вычисления параметрического равновесия Нэша в рамках действующих норм деятельности каждый агент должен быть уверен, что и остальные агенты вычислят то же равновесие, что и он. Для этого он должен поставить себя на место остальных агентов, моделирующих его поведение, и т.д. Одним из способов создания общего знания является публичное сообщение соответствующего факта всем агентам, собранным вместе. Наверное, в том числе, этим объясняется то, что для формирования корпоративной культуры, корпоративных стандартов поведения и т.д. в современных фирмах так много внимания уделяется неформальному общению сотрудников, лояльности фирме и т.д., то есть созданию у работников впечатления (убежденности в) принадлежности общему делу, разделения общих ценностей и т.д. – все это нужно для существования общего знания.



Таким образом, под задачей институционального управления, как управления нормами деятельности, понимают задачу (1), (4) – поиска нормы, обладающей максимальной эффективностью на множестве допустимых и согласованных норм.

Как отмечалось выше, равновесие Нэша требует наличия общего знания. Отказ от общего знания приводит к концепции рефлексивной игры, поэтому приведем краткий обзор результатов, полученных в области рефлексивных моделей норм деятельности Рефлексивные модели. Процесс и результат размышлений агента о принципах принятия решений оппонентами и о выбираемых ими действиях называется стратегической рефлексией [175].

В отличие от стратегической рефлексии, в рамках информационной рефлексии субъект анализирует свои представления об информированности субъектов, представления об их представлениях и т.д.

Общее знание является частным случаем, а в общем случае представления агентов, представления о представлениях и т.д.

могут различаться. Например, возможно асимметричное общее знание, при котором игроки понимают игру по-разному, но само это различное понимание является общим знанием. Возможно также субъективное общее знание, когда игрок считает, что имеет место общее знание (а на самом деле его может не быть).

В общем случае иерархия представлений агентов называется структурой информированности. Моделью принятия агентами решений на основании иерархии их представлений является рефлексивная игра [175], в которой каждый агент моделирует в рамках своих представлений поведение оппонентов (тем самым порождаются фантомные агенты первого уровня, то есть агенты, существующие в сознании реальных агентов). Фантомные агенты первого уровня моделируют поведение своих оппонентов – фантомных агентов второго уровня и т.д. Другими словами, каждый агент выбирает свои действия, моделируя свое взаимодействие с фантомными агентами, ожидая от оппонентов выбора определенных действий. Устойчивый исход такого взаимодействия называется информационным равновесием [175].

Но, после выбора реальными агентами своих действий, они получают информацию, по которой можно явно или косвенно судить о том, какие действия выбрали оппоненты. Поэтому информационное равновесие может быть как стабильным (когда все агенты – реальные и фантомные – получают подтверждение своих ожиданий), так и нестабильным (когда чьи-то ожидания не оправдываются). Кроме того, стабильные равновесия можно, в свою очередь, подразделить на истинные (те стабильные информационные равновесия, которые остаются равновесиями, если агенты оказываются адекватно и полностью информированными) и ложные [174, 239].

Перейдем к рассмотрению собственно влияния информированности агентов на управление нормами деятельности. Выше норма для i-го агента была определена как отображение его информированности во множество его действий, а информированностью являлось знание о значении неопределенного параметра – состояния природы. В случае, когда каждый агент обладает иерархией представлений, его информированность описывается структурой Ii его информированности. Поэтому нормой для i-го агента можно считать i(Ii) Ai, i N, а нормой деятельности коллектива агентов – отображение информационной структуры I = (I1, I2, …, In) во множество действий всех агентов:

(I) = (1(I1), 2(I2), …, n(In)). Различные варианты информированности агентов, а также общие результаты решения задачи управления нормами деятельности приведены в [159].

Общие результаты позволяют рассматривать прикладные модели управления нормами деятельности. Перечислим исследованные в [159, 174] модели.

Модель «Аккордная оплата труда» отражает ситуацию, в которой вознаграждение коллектива агентов за работу имеет следующий вид: каждый агент получает фиксированное вознаграждение, если агрегированный результат деятельности агентов (например, сумма их действий) превышает заданный норматив;

вознаграждение равно нулю, если норматив не выполнен.

Агенты имеют иерархию представлений о нормативе. Помимо общего знания рассматриваются следующие варианты:

- представления агентов о нормативе попарно различны; тогда либо никто из агентов не работает, либо один агент выполняет весь объем работ;

- если структура информированности имеет глубину два, и каждый из агентов субъективно считает, что играет в игру с асимметричным общим знанием, то множество возможных равновесных ситуаций максимально и совпадает со множеством индивидуально рациональных действий;

- если структура информированности имеет глубину два, и на ее нижнем уровне имеет место симметричное общее знание, то и в этом случае множество информационных равновесий является максимально возможным;

- для любого индивидуально-рационального вектора действий существует такая структура информированности глубины два с симметричным общим знанием на нижнем уровне, что данный вектор является единственным равновесием.

Полученные результаты полностью подтверждают интуитивно правдоподобный качественный вывод: в коллективе работников совместная работа возможна (является равновесием) лишь в том случае, когда имеется общее знание о том, какой объем работ необходимо выполнить для получения вознаграждения. Кроме того, незначительное изменение информационной структуры приводит к существенному изменению информационного равновесия.





Интересно, что возможно следующее стабильное информационное равновесие: каждый агент считает, что именно за счет его усилий выполнен весь объем работ, и это всем известно (и даже является общим знанием).

Таким образом, игра «аккордная оплата труда», помимо эффектов сложной зависимости структуры информационных равновесий от вида структур информированности, интересна тем, что она иллюстрирует роль управления нормами деятельности в случаях, когда множество равновесий игры агентов состоит более чем из одной точки.

В модели «Олигополия Курно» агенты выбирают объемы производства. Рыночная цена на продукцию убывает с ростом суммарного объема производства и зависит от спроса.

Если неопределенным параметром является спрос, и относительно него каждый из агентов имеет собственную иерархию представлений, то информационное равновесие существенным образом зависит от взаимных представлений агентов. Если неопределенным параметром являются затраты агентов, то оказывается, что, наблюдая выбираемые действия, агенты могут в динамике придти к истинному информационному равновесию.

Для модели «Олигополия Курно» в [159] построено множество согласованных норм деятельности агентов, имеющих в общем случае различные иерархии взаимных представлений о существенных параметрах.

В модели «Формирование команды» неопределенными параметрами являются эффективности деятельности агентов. В рамках существующей иерархии взаимных представлений агентов об эффективности деятельности оппонентов каждый агент может предсказать, какие действия выберут другие агенты, какие они понесут индивидуальные «затраты» и каковы будут суммарные затраты. Если выбор действий производится многократно, и наблюдаемая некоторым агентом реальность оказывается отличной от его представлений, то он вынужден корректировать свои представления и при очередном своем выборе использовать «новые» представления.

Кроме того, можно сделать интересный вывод, что стабильность команды и слаженность ее работы может достигаться, в том числе, и при ложных представлениях членах команды друг о друге [159]. Выход из ложного равновесия требует получения агентами дополнительной информации друг о друге.

Проведенный анализ позволяет сделать вывод, что модели формирования команд и их деятельности, описываемые в терминах рефлексивных игр, не только отражают автономность и согласованность деятельности команды, но и позволяют ставить и решать задачи управления процессом формирования команды. Управленческие возможности заключаются в создании, во-первых, разнообразных ситуаций деятельности (обеспечивающих выявление существенных характеристик агентов – получаем модель научения) и, во-вторых, обеспечения максимальных коммуникаций и доступа членов команды ко всей существенной информации.

В заключение отметим, что модели формирования команд исследовались не только в [89, 159]: в [307] рассмотрен случай байесовской модели, в которой у каждого агента есть свои представления о вероятностном распределении результатов деятельности в зависимости от действий. Эти распределения корректируются с учетом наблюдаемых действий и/или результатов, что приводит к формированию так называемых shared beliefs – согласованных представлений агентов. Какая-либо рефлексия при этом, правда, отсутствует. То же относится и к модели, рассмотренной в [310], где конвенция определялось как «строгое равновесие Нэша» в повторяющейся игре, в которой набор агентов, участвующих в игре, на каждом шаге определялся случайной выборкой из фиксированной конечной популяции агентов.

Завершив обзор известных моделей репутации и норм деятельности, перейдем к описанию общей, связывающей два этих понятия, модели.

4.2. НОРМЫ ДЕЯТЕЛЬНОСТИ И РЕПУТАЦИЯ Рассмотрим организационную систему, состоящую из одного агента и одного центра (описываемая ниже модель допускает непосредственное обобщение на случай нескольких агентов и/или нескольких центров), например – исполнителя и заказчика.

Предпочтения агента описываются его целевой функцией f(y, ), где y A – действие агента, – состояние природы.

Предпочтения центра описываются его целевой функцией F(y, ) также зависящей от действия агента и состояния природы.

Модель рационального поведения. Нормой деятельности агента будем считать отображение : A, ставящее каждому состоянию природы в соответствие множество (или точку) () A. То есть, норма деятельности предписывает агенту при состоянии природы выбирать действия из множества ().

Репутацией агента (с точки зрения центра) будем считать отображение : A, ставящее каждому состоянию природы в соответствие множество (или точку) () A. Репутация отражает, каких действий ожидает центр от агента в зависимости от состояния природы.

Норма () деятельности агента согласована с его предпочтениями, если (1) () Pf(), где Pf () = Arg max f(y, ) – множество рационального выбора.

yA Репутация () агента согласована с предпочтениями центра, если (2) () PF(), где PF() = Arg max F(y, ) – множество наиболее предпочтительyA ных с точки зрения центра выборов агента. Будем считать, что поведение агента подтверждает его репутацию у центра, если выбираемые им в рамках гипотезы рационального поведения действия соответствуют ожиданиям центра:

(3) Pf() ().

Если ввести гипотезу благожелательного отношения агента к центру [48], то условие (3) можно ослабить, записав его в виде:

(3') Pf() ().

Норма деятельности агента согласована с его репутацией, если:

Pages:     | 1 |   ...   | 16 | 17 || 19 | 20 |   ...   | 34 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.