WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 17 | 18 || 20 | 21 |   ...   | 34 |

(4) () ().

Предпочтения агента и центра согласованы, если (5) PF() Pf().

Итак, имеем четыре подмножества множества A, зависящих от состояния природы:

PF() – «предпочтения» центра;

Pf() – «предпочтения» агента;

() – репутация агента у центра;

() – норма деятельности агента.

Возможны различные соотношения (в теоретикомножественном смысле – пересечения, вложенности и т.д.) между этими подмножествами:

- () Pf() отражает согласованность нормы деятельности агента с его предпочтениями;

- () PF() отражает согласованность репутации агента с предпочтениями центра;

- Pf() () отражает подтвержденность репутации агента;

- () () отражает согласованность нормы деятельности агента с его репутацией;

- PF() Pf() отражает согласованность предпочтений агента и центра.

Содержательно в рамках модели «заказчик – исполнитель», условие (2) означает, что данный заказчик может обратиться к исполнителю с данной репутацией, а (3) означает, что исполнителю выгодно подтвердить свою репутацию в глазах заказчика.

Свойства (1)-(5) не являются независимыми. Так, из (1), (2) и (4) следует (5); из (1) и (3') следует (4); из (1), (2) и (3) следует (4) и (5). Но из (1), (2) и (5) в общем случае не следует ни (3), ни (4).

В частном случае репутация агента полностью определяется (совпадает с) нормой его деятельности, то есть () = () и, следовательно, выполнено (4). Тогда из (1) и (2) следует (5), а из (4), (2) и (3) следует, что Pf() PF(), что является более сильным условием, чем (5).

Если и норма деятельности агента, и его репутация являются однозначными отображения, то из (4) следует, что они совпадают, из (3) – что множество рационального выбора агента состоит из одной точки, из (1) следует, что эта точка определяется нормой деятельности, а для выполнения условия (5) достаточно выполнения условий (1) и (2). В рассматриваемом случае для существования хотя бы одной согласованной с предпочтениями всех участни ков нормы деятельности (репутации) агента достаточно, чтобы предпочтения центра и агента были согласованы.

Модель ограниченной рациональности. Рассмотренные выше в настоящем разделе определения согласованности нормы деятельности агента с его предпочтениями и согласованности его репутации с предпочтениями центра основывались на гипотезе рационального поведения – предположении о том, что агент выбирает одно из действий, максимизирующих при данном состоянии природы его целевую функцию, а для центра наиболее предпочтительны такие действия агента, которые максимизируют целевую функцию центра. В случае если каждое из множеств PF() и Pf() состоит из одной точки, то, если выполнено (5), то эти точки совпадают, и согласованная норма совпадает с согласованной репутацией и определяется однозначно. Следовательно, для расширения «свободы для маневра» – расширения множества согласованных норм и множества согласованных репутаций – необходимо ослаблять требования к рациональности поведения соответственно агента и центра.

Для этого воспользуемся концепцией ограниченной рациональности [198, 199], в соответствии с которой субъекты выбирают не оптимальные (максимизирующие целевую функцию на допустимом множестве) альтернативы, а рациональные альтернативы, то есть, приводящие к удовлетворяющему субъекта значению его целевой функции. Ряд формальных моделей ограниченной рациональности рассматривался в [159, 166]. Ниже мы приведем две модели ограниченной рациональности. В первой субъект выбирает -оптимальные при заданном альтернативы, где 0 выступает в качестве параметра (при = 0 получаем модель классической рациональности). Во второй модели субъект выбирает альтернативы, обеспечивающие ему при заданном фиксированный уровень полезности u.

Определим множества рационального выбора центра и агента двумя способами:

(6) PF(, ) = {y A | F(y, ) max F(y, ) – }, yA (7) Pf(, ) = {y A | f(y, ) max f(y, ) – }, yA (8) pF(, u) = {y A | F(y, ) u}, (9) pf(, v) = {y A | f(y, ) v}.

Определения согласованности при этом будут иметь вид (1)(5) с соответствующей заменой множеств рационального выбора.

Дальше возможны различные постановки задач.

Рассмотрим сначала задачи (10) + min)P, {(, )| PF (, (, )} f (11) u + v max), {(u, v)| pF (,u p (,v)} f заключающиеся в поиске таких минимальных параметров «потерь» (, ) или максимальных уровней полезности (u, v) соответственно, что интересы центра и агента согласованы. Решения этих задач могут интерпретироваться как стоимость компромисса [129] между центром и агентом (сумма в целевых функциях используется для получения одного из Парето-эффективных решений).

Обозначим:

y0() = arg max [F(y, ) + f(y, )], yA yf() = arg max f(y, ), yF() = arg max F(y, ), yA yA Утверждение 4.1. Пусть либо функции F() и f() непрерывны по совокупности переменных, а множества A и компактны, либо множества A и конечны. Тогда решение задачи (10) имеет вид:

(12) * = max [F(yF(), ) – F(y0(), )], * = max [f(yf(), ) – f(y0(), )], а решение задачи (11) имеет вид (13) u* = min F(y0(), ), v* = min f(y0(), ).

Имея решения задач (10) и (11), можно ставить и решать задачу поиска согласованных нормы деятельности () и репутации ():

(14) () Pf(, *), () PF(, *), () ().

или (15) () pf(, v*), () pF(, u*), () ().

Решения задач (14) и (15) существуют (так как в силу утверждения 4.1 интересы центра и агента согласованы) и обеспечивают Парето-эффективные значения выигрышей центра и агента.

Рефлексивная модель. В рассмотренной выше модели с двумя участниками – центром и агентом – фактически, имелся один активный субъект – агент, выбирающий собственные действия.



Поэтому рассмотрим модель, в которой имеется множество N = {1, 2, …, n} агентов. Агент i N выбирает действие yi Ai, а его целевая функция fi(y, ) зависит от вектора y = (y1, y2, …, yn) действий всех агентов и от состояния природы, то есть f: A' 1, где A' = Ai.

iN Предположим, что информированность агентов описывается информационной структурой I = (I1, I2, …, In), где Ii = (i, ij, ijk, …), i, j, k N, – структура информированности i-го агента, i N, i – его представления о состоянии природы, ij – его представления о представлениях j-го агента, ijk – представления iго агента о том, что j-ый агент думает о представлениях k-го агента и т.д. в общем случае до бесконечности [175].

Если задана структура информированности I, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных – то есть существующих в сознании других реальных и фантомных агентов). Выбор -агентом, где – некоторая последовательность индексов из множества N, своего действия x в рамках гипотезы рационального поведения определяется его структурой информированности I, поэтому, имея эту структуру, можно смоделировать его рассуждения и определить его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Обозначим + – множество всевозможных конечных последовательностей индексов из N, – объединение + с пустой последовательностью, || – количество индексов в последовательности (для пустой последовательности принимается равным нулю).

Набор действий x*, +, называется информационным равновесием [175], если выполнены следующие условия:

1. структура информированности I имеет конечную сложность, то есть, дерево I содержит конечный набор попарно различных поддеревьев;

2., µ + I = Iµ x* = xµ*;

3. i N, * * * * * (16) xi Arg max fi(i, xi1,..., xi,i-1, yi, xi,i +1,..., xi,n ).

yi Ai Структура информированности является бесконечным деревом, отражающим иерархию представлений агентов в рефлексивной игре [175]. Информационное равновесие (16) (как решение рефлексивной игры) существует в случае, если структура информированности конечна. Конечность информационной структуры по своему определению означает не конечность ее дерева, а существование конечного базиса (то есть, конечного числа попарно различных поддеревьев), в рамках которого рассмотрение фантомных агентов, имеющих ту же информированность, что и другие реальные или фантомные агенты, не дает новой информации и поэтому нецелесообразно.

Действия, выбираемые реальными и фантомными агентами в рамках информационного равновесия, зависят от структуры их информированности, то есть * * x = x (I), +.

Обозначим – множество всевозможных n-деревьев, элементы которых принадлежат множеству.

Согласованной нормой деятельности i-го агента (реального) i: Ai будем называть отображение i(Ii) его информационной структуры Ii во множество допустимых действий Ai, i N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знанием) совпадает с * отображением xi (Ii), i N. Другими словами, нормой деятельно сти реального агента будем считать соответствующую компоненту информационного равновесия (эта норма будет согласованной в силу определений согласованной нормы и информационного равновесия – см. выше). То есть, норма деятельности определяет, какие действия выбирает агент в зависимости от своей информированности (в зависимости от той ситуации, в которой он принимает решения).

Репутацией j-агента (фантомного, то есть +, || 1) в глазах реального (при || = 1) или фантомного (при || 2) агента будем называть отображение j: Aj его информационной структуры Ij во множество допустимых действий Aj, +, j N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знанием) * совпадает с отображением xj (Ij), +, j N. То есть, репутация определяет, выбора каких действий ожидают от агента другие агенты в зависимости от той информированности, которую они ему приписывают (в зависимости от той ситуации, в которой он с их точки зрения принимает решения). Например, репутация ij j-го * агента в глазах i-го отражает, каких действий xij ожидает i-ый агент от j-го.

Таким образом, зависимости действий, образующих информационное равновесие (16), реальных агентов от структур их информированности определяют нормы их деятельности. А зависимости действий фантомных агентов от структур их информированности определяют репутацию реальных и фантомных агентов.

Приведенное выше определение отражает индивидуальную репутацию агентов. Рассмотрим группу S N агентов и предположим, что другие агенты наблюдают агрегированный результат wS = wS(yS), где ys = (yi)i S – вектор действий агентов из группы S, yS AS = Ai. То есть wS: AS WS, где WS – множество возмож iS ных агрегированных результатов деятельности группы.

Коллективной репутацией группы S в глазах реального (при || = 1) или фантомного (при || 2) -агента будем называть отображение S: ()|S| WS совокупности информационных структур (Ij)j S во множество WS допустимых агрегированных результатов деятельности группы S, +, S N.

Согласованность репутации с поведением агентов («оправдываемость» репутации) тесно связана с понятием стабильности информационного равновесия (см. качественное обсуждение выше) [239]. Приведем формальные определения.





Напомним, что рефлексивная игра задается кортежем {N, (Ai)i N, fi()i N, I}, где N = {1, 2, …, n} – множество участников игры (игроков, агентов), Ai – множество допустимых действий i-го агента, fi(): A’ 1 – его целевая функция, i N, I – структура информированности. Дополним эту конструкцию набором функций wi(): A’ Wi, i N, каждая из которых отображает вектор (, x) в элемент wi некоторого множества Wi. Этот элемент wi и есть то, что i-ый агент наблюдает в результате разыгрывания игры.

Функцию wi() будем называть функцией наблюдения i-го агента [239]. Предположим, что функции наблюдения являются общим знанием среди агентов. Если wi(, y) = (, y), т. е. Wi = A’, то iый агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество Wi состоит из одного элемента, то i-ый агент ничего не наблюдает.

Пусть в рефлексивной игре существует информационное равновесие x, + (напомним, что – непустая конечная последовательность индексов из N). Зафиксируем i N и рассмотрим i-го агента. Он ожидает в результате игры пронаблюдать величину wi (i, xi1, …, xi,i-1, xi, xi,i+1, …, xin). На самом же деле он наблюдает величину wi (, x1, …, xi-1, xi, xi+1, …, xn). Поэтому требование стабильности для i-агента означает совпадение этих величин, являющихся элементами некоторого множества Wi.

Другими словами, для стабильности репутации необходимо, чтобы каждый реальный агент наблюдал ту величину, которую он и ожидал увидеть в силу приписываемой им оппонентам репутации. Но этого мало – для стабильности равновесия (репутации) необходимо чтобы и ij-агент, i, j N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать wj (ij, xij1, …, xij,j-1, xij, xij,j+1, …, xijn).

На самом же деле (т. е. i-субъективно, ведь ij-агент существует в сознании i-агента) он наблюдает величину wj (i, xi1, …, xi,j-1, xij, xi,j+1, …, xin).

Поэтому требование стабильности для ij-агента означает совпадение этих величин.

В общем случае, т. е. для i-агента, i +, условие стабильности определяется следующим образом [174, 239]: информационное равновесие xi, i +, называют стабильным при заданной структуре информированности I, если для любого i + выполняется (17) wi (i, xi1, …, xi,i-1, xi, xi,i+1, …, xin) = = wi (, x1, …, x,i-1, xi, x,i+1, …, xn).

В частном случае, когда функцией наблюдения является вектор действий всех агентов: wi (, x1,…, xn) = (x1,…, xn), стабильным * является информационное равновесие x* = ( xi )i N,, удовлетво* * ряющее следующему соотношению: i N, xi = xi, которое означает, что действие любого реального агента совпадает с действием, ожидаемым от него любым другим (реальным или фантомным) агентом.

Информационное равновесие, не являющееся стабильным, называют нестабильным. Соответственно, репутацию будем называть оправданной, если она определяется стабильным информационным равновесием.

Стабильные информационные равновесия разделяют на два класса – истинные и ложные равновесия. Пусть набор действий xi, i +, является стабильным информационным равновесием.

Будем называть его истинным равновесием, если набор (x1, …, xn) является равновесием в условиях общего знания о состоянии природы. Из этого определения, в частности, следует, что в условиях общего знания любое информационное равновесие является истинным.

Стабильное информационное равновесие, не являющееся истинным, называют ложным. Таким образом, ложное равновесие – это такое стабильное информационное равновесие, которое не является равновесием в случае одинаковой информированности агентов (в условиях общего знания).

Соответственно, оправданную репутацию назовем истинной, если она определяется истинным информационным равновесием.

Оправданную репутацию, определяемую ложным информационным равновесием, назовем ложной. Таким образом, оправданная репутация может быть как истинной, так и ложной.

Результаты исследований свойств стабильности и истинности информационных равновесий можно найти в [239]. Их использование при построении моделей норм деятельности и репутации представляется целесообразным и многообещающим. Некоторые примеры приведены в настоящей работе ниже.

Завершая описание рефлексивной модели, рассмотрим следующий вариант взаимной информированности агентов. Пусть с точки зрения i-го агента состояние природы i является общим знанием. Тогда определения репутации и норм деятельности (с учетом условия (16)) примут вид:

(18) i N i(i) Arg max fi(i, i1(i), … yi Ai …, i,i-1(i), yi, i,i+1(i), …, in(i)).

(19) i, j N ij(i) Arg max fj(i, i1(i), … y Aj j …, i,j-1(i), yj, i,j+1(i), …, in(i)).

Если, в частном случае, репутации агентов {i()} являются общим знанием, то условия (18)-(19) примут вид:

(20) i N i(i) Arg max fi(i, 1(i), … yi Ai …, i-1(i), yi, i+1(i), …, n(i)).

(21) i, j N j(i) Arg max fj(i, 1(i), … y Aj j …, j-1(i), yj, j+1(i), …, n(i)).

В заключение настоящего раздела рассмотрим ряд модельных примеров.

Пример 4.1. Пусть f(y, ) = y – y2 / 2 r, F(y, ) = y – y2 / 2 R, y 0, [1/2; 1]. Тогда yf() = r, yF() = R, Pf() = {yf()}, PF() = {yF()}. Норма деятельности () = r является единственной, удовлетворяющей (1), а репутация () = R – единственной, удовлетворяющей (2). При этом (3), (4) и (5) выполнено толь ко при r = R. Видно, что согласование в данном случае (когда множество рациональных действий состоит из одной точки) возможно только при полном совпадении интересов центра и агента – получили в некотором смысле вырожденный случай.

Pages:     | 1 |   ...   | 17 | 18 || 20 | 21 |   ...   | 34 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.