WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 19 | 20 || 22 | 23 |   ...   | 34 |

Величина si может интерпретироваться как выигрыш агента от невыполнения обязательств перед потребителями, допустимого снижения качества и т.д., или как инвестиции в рекламу.

Пусть известна монотонная функция q(s), отражающая зависимость репутации от затрат на нее: ri = q(si), i N. Для простоты эта функция будет считаться одинаковой для всех агентов.

Тогда целевая функция i-го агента примет вид:

(2) fi(s) = ( – i) i(r(s), D) – ci0 – si, i N.

Итак, имеем игру агентов, обладающих целевыми функциями (2), каждый из которых выбирает неотрицательные инвестиции в свою репутацию.

Утверждение 4.4. Если функция q() непрерывна, а функции i() непрерывны по совокупности переменных и вогнуты по ri, то при фиксированном суммарном спросе, удовлетворяющем (1) существует равновесие Нэша игры агентов.

Справедливость утверждения 4.4 следует из того, что в рамках введенных в нем предположений целевые функции агентов удовлетворяют известным достаточным условиям существования равновесия Нэша [83].

Пример 4.3. Пусть q(s) = s и ri (3) di = D, i N.

r j jN Обозначим S =, =. Подставляя (3) в (2) и si - iN iN i дифференцируя, получим:

Ssi = S –, i N.

D( - ) i Суммируя по всем агентам, получим выражения для суммарных инвестиций и равновесных по Нэшу инвестиций агентов в свою репутацию:

S = (n – 1) D /, (n -1)D n -si* = [1 – ], i N. • ( - ) i Отметим, что выше рассматривалась статическая модель. В то же время, интуитивно понятно, что репутация является существенно динамической характеристикой – она изменяется во времени, причем инерционно, то есть, требуется время, чтобы при приложении соответствующих усилий фирма улучшила свою репутацию, а при отсутствии стремления фирмы к поддержанию своей репутации, последняя начнет также снижаться с некоторой задержкой.

Поэтому рассмотрим динамическую модель конкуренции фирм с изменяющейся во времени репутацией.

Будем обозначать номер периода времени верхним индексом «t» и считать, что зависимость спроса от репутации имеет вид:

(rit ) (4) dit = D, i N, t = 0, 1, 2, …, t ) (rj jN где dit – спрос на продукцию i-ой фирмы в периоде t, rit – ее репутация в этом периоде, а показатель степени 1 может интерпретироваться как характеристика конкурентности (степени влияния различий репутации фирм на спрос на их продукцию со стороны потребителей) – при больших почти все потребители обратятся фирме с максимальной репутацией.

Предположим, что в условиях фиксированного суммарного спроса D и заданной рыночной цены, единственным параметром, который выбирает i-ый агент, является объем инвестиций si в свою репутацию. Отметим, что считается, что каждый агент выбирает постоянный (не зависящий от времени) объем инвестиций. Возможные обобщения рассматриваемой модели на случай, когда каждый агент выбирает траекторию инвестиций, качественно обсуждается ниже.

Динамику репутации будем описывать логистической кривой с управляемой скоростью роста [156, 178]:

(5) rit = rit -1 + Q( si0, si) rit -1 (1 – rit -1 ), i N, t = 1, 2, …,.

Пусть начальные значения репутации ri0 [0; 1] агентов известны, а Q() – одинаковая для всех агентов монотонно возрастающая функция, принимающая значения из интервала [-1; 1].

Величина si0, которая такова, что Q( si0, si0 ), может интерпретироваться как значение инвестиций, необходимое для поддержания репутации i-го агента на постоянном уровне.

В рамках введенных предположений rit [0; 1], i N, t = 1, 2, …,.

Эскиз графика зависимости скорости динамики репутации от времени для (6) Q( si0, si) = th ((si – si0 )), где th() – гиперболический тангенс, 0 – размерная константа, приведен на Рис. 32 при s0 = 1, = 1.

Примеры динамики репутации агента для случая = 10, s0 = 0,1 приведены на Рис. 33. Непрерывная линия соответствует r0 = 0,2, s = 0,11 (то есть агент вкладывает в свою репутацию больше минимально необходимой величины и она растет со временем), пунктирная – r0 = 0,95, s = 0,09 (то есть агент вкладывает в свою репутацию меньше минимально необходимой величины и она убывает со временем).

Q(s) 0.0.0.0.0.5 1 1.5 2 2.5 -0.-0.-0.-0.-Рис. 32. Зависимость скорости динамики репутации от времени r(t) 0,0,0,0,0,0,0,0,0,t 13 17 21 25 29 33 37 41 45 49 53 57 61 65 1 5 Рис. 33. Примеры динамики репутации В качестве обоснования введенных предположений можно привести следующие рассуждения.

Возможность наличия отрицательных значений функции Q() – см. Рис. 32 – обусловлена тем, что поддержание репутации на постоянном уровне, отличном от нуля или единицы, как правило, требует определенных затрат. Если эти затраты недостаточны, то репутация снижается. Вогнутость (и асимптотичность) функции Q() объясняется тем, что предельный эффект от увеличения инве стиций снижается с ростом размера этих инвестиций (см. закон убывающей предельной полезности в экономике [290]).

Логистический вид кривой динамики репутации – см. Рис. 33 – может интерпретироваться следующим образом. Сначала изменение репутации происходит медленно (изменить сложившиеся стереотипы потребителей тяжело). Далее скорость увеличивается, но по мере приближения к максимально (или минимально) возможному значению опять уменьшается – всегда имеется часть потребителей, заставить которых изменить своим привычкам (отказаться от потребления некоторого товара, заменив его другим, и т.д.) достаточно трудно.

Конечно, выбранные выше зависимости (5) и (6) не являются единственно возможными, и в каждом конкретном случае необходимо решать задачу идентификации – поиска тех зависимостей, которые наилучшим образом приближают или объясняют наблюдаемые эффекты. Однако они позволяют промоделировать многие эффекты и вполне соответствуют здравому смыслу и практическому опыту.



Запишем прибыль i-го агента в периоде t:

(7) fit (s) = ( – i) i(r(st), D) – ci0 – si, i N, t = 1, 2, …,, где s = (s1, s2,.., sn) – вектор инвестиций агентов. Будем считать, что, если прибыль агента стала равна нулю или отрицательному числу, то он выбывает с рынка и, начиная с этого момента, не несет затрат на поддержание своей репутации.

В качестве целевой функции выберем среднюю за T периодов прибыль:

T (8) Fi(s) = fit(s), i N.

T t =Подставляя (4)-(7) в (8), получим игру в нормальной форме, в которой каждый агент выбирает объем своих инвестиций. Для данной игры можно искать равновесие Нэша, исследовать его свойства, анализировать выигрыши агентов в зависимости от их стратегий. Приведем пример.

Пример 4.4. Рассмотрим взаимодействие двух агентов. Пусть 0 = 1, = 10, d = 1, s1 = 0,1, s2 = 0,2, – 1 = 1, – 2 = 1,3, ci1 = ci2 = 0.

Проанализируем несколько типичных вариантов.

1. Пусть r10 = r20 1, s1 = s2 = 0, то есть оба агента первоначально имеют одинаковую очень высокую репутацию и делят рынок пополам. Но они не инвестируют в свою репутацию. Так как в силу выбранного соотношения параметров репутация второго агента падает быстрее, чем у первого, в результате первый агент с нулевой репутацией оказывается монополистом на рынке.

Графики динамики репутации, доли рынка и прибыли для рассматриваемого случая приведены на Рис. 34, Рис. 35 и Рис. соответственно (здесь и далее в рассматриваемом примере пунктирная линия соответствует первому агенту, а непрерывная линия – второму).

Аналогичная ситуация (первый агент становится монополистом) имеет место в случае любых одинаковых первоначальных репутаций агентов и отсутствии инвестиции. Объясняется это тем, что первый агент априори находится в более выгодном положении, так как он теряет репутацию медленнее второго.

1 r (t), r (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 34. Динамика репутации при r10 = r20 1, s1 = s2 = 1 d (t), d (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 35. Динамика доли рынка при r10 = r20 1, s1 = s2 = 1 f (t), f (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 36. Динамика прибылей при r10 = r20 1, s1 = s2 = Чтобы исправить ситуацию (стать в итоге монополистом) второму агенту достаточно выбрать размер инвестиций s2 таким, 0 чтобы s2 – s2 > s1 – s1 = 0,1, то есть, ему следует выбирать s2 > 0,1. Приведем пример.

2. Пусть r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,11. В результате второй агент с нулевой репутацией оказывается монополистом на рынке. Соответствующие графики приведены на Рис. 37, Рис. 38 и Рис. 39.

1 r (t), r (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 37. Динамика репутации при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,1 d (t), d (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 38. Динамика доли рынка при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0, f1(t), f2(t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 39. Динамика прибылей при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,3. В рамках рассматриваемой модели возможно решение задач оптимизации. Например, наилучшим ответом первого агента на рассмотренное выше поведение второго агента ( r10 = 0,5, r20 = 0,3, s2 = 0,11) является выбор s1 0,019, что приводит к тому, что монополистом в итоге оказывается первый агент. Соответствующие графики приведены на Рис. 40, Рис. 41 и Рис. 42.

1 r (t), r (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 40. Динамика репутации при r10 = 0,5, r20 = 0,3, s1 0,019, s2 = 0,1 d (t), d (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 41. Динамика доли рынка при r10 = 0,5, r20 = 0,3, s1 0,019, s2 = 0,1 f (t), f (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 42. Динамика прибылей при r10 = 0,5, r20 = 0,3, s1 0,019, s2 = 0,Отметим, что с точки зрения максимизации суммы целевых функций обоих агентов оптимален вектор инвестиций s1 = 0, s2 0,117, то есть в итоге монополистом выгодно сделать второго агента (объясняется это тем, что у него выше рентабельность).

4. В рамках рассматриваемой модели возможен поиск равновесия игры агентов. Например, при начальных условиях r10 = 0,5, r20 = 0,3 равновесием Нэша является вектор s1 0,1143; s2 0,2226, при котором оба агента в итоге делят рынок поровну. Соответствующие графики приведены на Рис. 43, Рис. 44 и Рис. 45.

1 r (t), r (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 43. Динамика репутации при r10 = 0,5, r20 = 0,3, s1 0,1143; s2 0,1 d (t), d (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 44. Динамика доли рынка при r10 = 0,5, r20 = 0,3, s1 0,1143; s2 0,1 f (t), f (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 45. Динамика прибылей при r10 = 0,5, r20 = 0,3, s1 0,1143; s2 0,Для того чтобы проиллюстрировать роль параметра (до сих пор он равнялся единице) выберем в условиях предыдущего случая = 4. В силу более высокой начальной репутации первого агента он в итоге становится монополистом (см. Рис. 46 в сравнении с Рис. 43).

1 r (t), r (t) 0,0,0,0,0,0,0,0,0,t 13 19 25 31 37 43 49 55 61 67 73 79 85 91 1 Рис. 46. Динамика репутации в условиях Рис. 43 при = 4 • В заключение настоящего раздела отметим, что выше рассматривалась модель динамики репутации при постоянном во времени уровне инвестиций каждого агента в свою репутацию.





Возможно обобщение полученной модели на случай, когда каждый агент выбирает траекторию si, si2, …, sit, … инвестиций. Тогда задача принятия решений каждым агентом заключается в выборе оптимальной (например, максимизирующей его дисконтированную полезность) траектории. С учетом взаимосвязи агентов, получаем повторяющуюся игру [160]. Аналитический поиск решения такой игры может оказаться достаточно сложной задачей. Тем не менее, имитационное моделирование вполне возможно. При этом, однако, следует принимать во внимание, что моделирование динамических систем при помощи систем нелинейных итерированных отображений следует осуществлять с учетом неустойчивости решений по начальным данным [133, 204].

Можно надеяться, что сложные динамические модели репутации позволят имитировать такие распространенные на практике эффекты, как создание ложной репутации, использование инерционности репутации (прекратив инвестиции в свою репутацию, агент может пользоваться тем, что ее снижение происходит не сразу) и др. Кроме того, выше мы не учитывали, что, наверное, у потребителей существуют определенные пороги различения изменений репутации. Разработка соответствующих теоретико-игровых моделей представляется перспективной задачей будущих исследований и выходит за рамки настоящей работы.

4.5. КОМАНДЫ В настоящем разделе рассматриваются модели репутации и норм деятельности, позволяющие описать и исследовать эффекты образования и функционирования команд. В том числе, в разделе 4.5.1 приводится общее описание модели и постановка задачи управления для случая, когда все существенные параметры являются общим знанием среди участников системы. Раздел 4.5.посвящен моделированию ситуации, в которой управляющий орган – центр – неполностью информирован о параметрах управляемых им субъектов – агентов. Раздел 4.5.3 содержит результаты решения задач управления в условиях общего знания, разделы 4.5.4 и 4.5.5 – модели формирования и функционирования команд, учитывающие эффекты рефлексии с точки зрения репутации и норм деятельности членов команд.

4.5.1. Описание модели Рассмотрим следующую модель организационной системы (ОС), состоящей из одного управляющего органа – центра – и множества N = {1, 2, …, n}, состоящего из n управляемых субъектов – агентов. Каждый агент выбирает свое действие. Действие i-го агента обозначим yi Ai, i N.

Целевая функция i-го агента fi(y, u, ri) зависит от вектора y = (y1, y2, …, yn) действий всех агентов, где y A' = Ai, от iN управления u U, выбираемого центром, и от параметра ri i – типа i-го агента, i N. Будем считать, что вектор типов агентов r = (r1, r2, …, rn) принадлежит множеству =.

i iN Игра (в нормальной форме) агентов описывается кортежем Г = (N, {Ai}i N, {fi()}i N, u U, r ). Предполагая, что Г является общим знанием среди агентов и центра, при фиксированных значениях управления u U со стороны центра и параметра r в качестве решения этой игры выберем множество равновесий Нэша:

(1) EN(u, r) = {x A' | i N, yi Ai fi(x, u, ri) fi(x-i, yi, u, ri)}, где x-i = (x1, x2, …, xi-1, xi+1, …, xn) A-i = Aj – обстановка игры ji для i-го агента.

Если центр разыгрывает игру Г2 [72], назначая управление u = w(y), где w(): A' U, то множество равновесий Нэша примет вид (2) EN(w(), r) = {x A' | i N, yi Ai fi(x, w(x), ri) fi(x-i, yi, w(x-i, yi), ri)}.

Обозначим ENi(u, r) = Proji EN(u, r), i N. Согласованной нормой деятельности i(u, r) i-го агента в рассматриваемой модели можно считать соответствие отбора равновесий:

i: ENi(u, r) ENi(u, r), которое предписывает i-му агенту выбирать одно из равновесных по Нэшу его действий. Нормы деятельности отдельных агентов должны быть согласованы с множеством равновесий, то есть вектор действий, выбираемых агентами в соответствии с нормами их деятельности, также должен быть равновесием Нэша:

(3) (1(u, r), 2(u, r), …, n(u, r)) EN(u, r).

Пусть задана целевая функция центра (y, u), : A' U 1.

Тогда задача управления примет вид (4) min,r) (y, u) max, yEN (u uU то есть, будет заключаться в выборе центром такого допустимого управления, которое максимизировало бы его целевую функцию при условии, что агенты при заданном управлении выбирают действия, являющиеся равновесием Нэша их игры при данном управлении.

В случае если u = w(y), то задача управления формулируется аналогично (4).

Постановке и решению задач управления вида (4) посвящено множество работ, как для одноэлементных, так и для многоэлементных организационных систем [48, 160]. Поэтому, для того, чтобы обобщить модель, ниже мы откажемся от ряда предположений – в частности, о том, что центр адекватно информирован о типах агентов, или о том, что вектор r типов агентов является общим знанием для агентов и центра.

4.5.2. Неполная информированность Предположим, что центр не имеет достоверной информации о векторе типов агентов, который по-прежнему является среди них общим знанием. Если у центра имеются представления 0 о множестве возможных значений вектора типов агентов, то он может устранить неопределенность относительно типов агентов вычислением гарантированного результата и решать следующую задачу управления:

(1) min min,r) (y, u) max.

r0 yEN (u uU Решение задачи (1) обозначим u*(0).

Возможно также использование других методов устранения неопределенности – см. монографию [164], посвященную задачам управления организационными системами, функционирующими в условиях неопределенности.

Pages:     | 1 |   ...   | 19 | 20 || 22 | 23 |   ...   | 34 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.