WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 15 |

общение достоверной информации (оно является равновесием Будем считать, что интересы центра задаются его целевой игры агентов), называются неманипулируемыми.

функцией f0(x, r), где r = (r1, r2, …, rn) – неизвестный ему вектор типов агентов, r – множеству возможных типов, Под задачей экспертизы понимают задачу оценки некоторой x = (x1, x2, …, xn) – вектор планов. Тогда задачей центра является величины группой экспертов – специалистов в определенной обвыбор такой процедуры планирования, чтобы в точке равновесия ласти. Пусть ri – собственное мнение i-го агента-эксперта (его значение его целевой функции было максимально.

тип), ri [d, D] 1, i N, - < d < D < +, и пусть Обозначим множество равновесий при фиксированной проr1 r2... rn, то есть ri упорядочены по возрастанию. Экспертам цедуре планирования P(r), r. Отображение, ставящее в соотизвестна процедура :[d, D]n [d, D] принятия итогового ветствие множеству равновесий P(r) конкретное равновесие s*(r) P(r), называется соответствием отбора равновесий. Бу- решения на основе сообщаемых оценок si [d, D], i N:

дем считать, что конкретный выбор агентов из этого множества x = (s).

удовлетворяет гипотезе благожелательности, в соответствии с Будем считать, что функции полезности агентов однопикокоторой, в том числе, при прочих равных, агенты предпочтут совые26 с точками пика ri, i N, а процедура (s) – механизм акобщать достоверную информацию. Для фиксированного равноветивной экспертизы – удовлетворяет следующим свойствам:

сия s*(r) P(r), определяемого принятым соответствием отбора равновесий, вычисляя, например, гарантированный результат по множеству, можно ввести гарантированную эффективность K () механизма планирования = (S, ) :

~ В механизмах с сообщением информации обозначение «r » для векK () = min f0 ( (s (r)), r).

тора сообщений агентов в прямом механизме вводится для того, чтоr бы подчеркнуть, что в общем случае сообщения о типах r могут отМеханизм : S X, в котором агенты сообщают оценки из ~ личаться от истинных, то есть может иметь место: i I : ri ri.

множеств {Si}, называется непрямым механизмом (содержательТо есть каждый из экспертов заинтересован в том, чтобы итоговое но, в нем сообщение может нести косвенную информацию о типе решение было как можно ближе к его собственному мнению.

29 1. (s) строго монотонна по всем переменным при функция стимулирования агента i-ым центром в зависимости от выбираемого действия.

s [d, D]n ;

Предпочтения агента представлены функцией полезности 2. (s) непрерывна по всем переменным при s [d, D]n ;

f ( y) = ( y) - c( y), где c(y) – положительная выпуклая возрасi 3. если обозначить sa = (a,..., a), a [d, D], то (sa ) = a (ус- iN тающая по y A функция затрат агента в зависимости от выбиловие единогласия).

раемого действия y, причем существует непрерывная третья проПримером механизма активной экспертизы является линейный изводная функции затрат. Также предполагается, что механизм экспертизы: x = si, где i > 0, = 1. Частным i i c(0) = c'(0) = 0.

iN iN случаем линейного механизма является вычисление среднего Все центры и агент имеют полную информацию о функциях арифметического мнений экспертов (i = 1/n, i N).

Hi(y) и c(y), а также о множестве A.

Задачей управления для рассматриваемой модели ОС является Порядок функционирования системы следующий:

синтез неманипулируемого механизма экспертизы. Решение этой - центры одновременно сообщают агенту функции стимулизадачи приводится в четвертой главе. • рования i(y);

Пример 3 [25, 57]. «Задача распределенного контроля». - если существует действие y, для которого f (y) 0, то агент выбирает действие y* P( ) = Arg max[ ( y) - c( y)], где i yA iN Центр 1 Центр i Центр n … … = ( ( y))iN – вектор функций стимулирования всех центров, и i несет затраты c(y*), иначе он отказывается от игры, и все ее y* y* y* участники получают нулевые выигрыши;

1(y) i(y) n(y) - центры получают доходы Hi(y*) и выплачивают агенту суммы i(y*).

Для функций стимулирования центров должно выполняться АГЕНТ балансовое ограничение: i ( y*) Hi (y*), i N, то есть центры Рис. 4. Модель ОС с несколькими центрами должны иметь достаточно средств, чтобы оплатить агенту обещанную сумму.

Рассмотрим организационную систему со структурой, изоДолжно также выполняться условие «обоснованности угроз», браженной на рисунке 4. Центры представляют собой менеджеров или «условие запрета блефа»: y A, i N i ( y) Hi ( y), гопроектов и руководителей функциональных подразделений ворящее о том, что обещания любого центра не превышают его некоторой проектно-ориентированной организации, а агент – содохода.

трудника подразделения или подразделение в целом.

Для завершения описания модели необходимо указать, какое Предпочтения n центров описываются их функциями полездействие выберет агент, если множество P() состоит более чем из ности f0i( y) = Hi( y) - i( y), i N = {1, 2,..., n} – множество ценодной точки, и агент должен выбрать одно действие из множества тров, где Hi(y) – кусочно-непрерывная функция дохода i-го центра равнозначных для него действий. Для описания процесса выбора от выбора агентом действия y A = 1, i(y) – неотрицательная + агентом действия из множества «оптимальных» действий P() 31 введем функцию ( ), известную всем центрам, которая каждому 2.1. Отношения предпочтения Как отмечалось в первой главе, в основе теории принятия вектору функций стимулирования ставит в соответствие точку из решений лежит предположение, что человек, поставленный перед соответствующего множества P().



проблемой выбора, в процессе выработки решения (выбора альБудем считать, что для функции ( ) выполняется свойство тернативы) руководствуется своими предпочтениями, то есть вынезависимости от посторонних альтернатив: для любых векбирает действие, которое, по его мнению, приведет к наиболее 2 2 торов стратегий 1, из (1) P( ) P( ) следует предпочтительному для него результату деятельности (исходу).

2 ( ) = (1), то есть если агент выбрал действие ( ) из Формальное описание процесса сравнения альтернатив может быть дано через отношения предпочтения и неразличимости более широкого множества P( ), то и из более узкого множества [44, 69, 70, 77].

он выберет действие (1) (если оно содержится в P( ) Бинарное отношение на множестве A0 – это подмножество P( ) ).

A0 A0, где A0 A0 – множество всех упорядоченных пар Задача управления, заключающаяся в анализе поведения (a,b), a, b A0. Если (a, b), говорят, что отношение выцентров, предсказании их рациональных стратегий и исследовании полнено (или имеет место) для (a, b) и пишут ab.

возможностей их совместных действий решается в пятой главе. • Если бинарное отношение не имеет места для a, b, этот факт обозначается acb.

Решение сформулированных в примерах 1-3 задач управления Отношение предпочтения – это бинарное отношение, опорганизационными системами дается ниже после описании соотределяемое свойством: a b тогда и только тогда, когда a предветствующих результатов теории игр.

почтительнее (лучше) для лица, принимающего решение (ЛПР), Таким образом, в настоящей главе рассмотрены модели причем b.

нятия решений и управления, что позволяет перейти к систематиОтношение неразличимости имеет место для пары a, b ческому изложению результатов теории игр, необходимых для с с постановки и решения задач управления организационными сис- тогда и только тогда, когда a b и b a.

темами. Для этого, в первую очередь, необходимо рассмотреть Отношение называется рефлексивным, если для всех различные способы представления предпочтений участников ОС a A0 выполнено aa, антирефлексивным, если для всех a A(отношения предпочтения и функции полезности, а также связь выполнено aca.

между ними – см. разделы 2.1 и 2.2) и провести классификацию Отношение называется антисимметричым, если из ab и игровых моделей (см. раздел 2.3).

ba следует a = b, асимметричным, если из ab следует bca.

Далее рассматривается отношение строгого предпочтения, ГЛАВА 2. ПРОБЛЕМАТИКА ТЕОРИИ ИГР для которого выполнено условие асимметричности.

Отношение называется транзитивным, если для всех В настоящей главе рассматривается аппарат описания предa, b, c A0 из ab и bc следует ac.

почтений участников организационных систем – отношения Отношение называется полным, если для всех a, b Aпредпочтения и функции полезности, а также приводятся классификация игр и примеры игровых моделей. выполнено ab или ba.

33 Пусть на множестве исходов A0 задано предпочтение ЛПР, то предпочтения ЛПР результату из A0. Чтобы решить эту задачу, есть отношение типа, которое для пары a, b исходов из A0 вы- необходимо тем или иным образом из отношения предпочтения на полняется, если a лучше b с точки зрения лица, принимающего множестве исходов A0 вывести отношение предпочтения на мнорешение. Определим также множество действий A. Это множество жестве действий A, а затем выбрать наиболее предпочтительное содержит все возможные действия ЛПР и состоит из элементов действие.

вида «Сделать то-то», «Приказать то-то», «Купить то-то…» и пр.

Пусть имеется некоторая функция w: A A0 – детерминироРассмотрим пример, который иллюстрирует, во-первых, опи- ванное (однозначное) соответствие между выбранным действием и его результатом. В этом случае выбор действия равнозначен сание предпочтений агента бинарными отношениями, а, вовыбору результата. Задача, таким образом, состоит лишь в наховторых, приведенные в разделе 1.1 модель принятия решений и ждении реализуемого исхода (то есть исхода, для которого есть способы устранения неопределенности действие, его реализующее), предпочтительного по отношению ко Пусть контрабандист, готовясь переправить морем груз через всем остальным реализуемым исходам. Выбранное действие будет границу, выбирает пункт назначения из двух вариантов, А и Б. До принадлежать множеству:

пункта А путь короче, до Б – длиннее. Однако в случае шторма первый маршрут гораздо опаснее, чем второй. На любом из этих {a A | b A : w(b) w(a)}.

маршрутов его могут задержать пограничники.

Все действия, принадлежащие решению, приводят к исходам, Множество исходов A0 для этого примера будет состоять из равнозначным с точки зрения отношения.

следующих элементов:

Если в рассматриваемом примере с контрабандистом функция z1. Контрабандист успешно добрался до пункта А.

w() задана следующим образом:

z2. Контрабандист успешно добрался до пункта Б.

1. w(«Плыть в А») = z4, z3. Судно было задержано пограничниками.

2. w(«Плыть в Б») = z2, z4. Судно разбилось во время шторма.

3. w(«Сидеть дома») = z5, В этот список с полным основанием можно добавить и исход то, очевидно, решением задачи принятия решения будет действие z5. Контрабандист никуда не поплыл.

y2 - «Плыть в Б», то есть действие, приводящее к наилучшему Отношение предпочтения между этими исходами можно опреализуемому результату z2.

ределить, например, так: z1 z2 z5 z3 z4.

Такая задача, в соответствии с терминологией, введенной в Множество A действий для данного примера будет включать первой главе, называется детерминированной задачей принятия элементы:





решения.

y1 – «Плыть в А», Сложнее дело обстоит, если результат z действия y зависит не y2 – «Плыть в Б», только от самого действия ЛПР, но и от некоторых внешних по y3 – «Сидеть дома».

отношению к ЛПР факторов, то есть зависимость результата от Однако определением множеств A0, A и отношения предпочдействия имеет вид z = w(y,, u), где и u – факторы, не завитения на A0 формулировка задачи принятия решения не исчерпысящие от ЛПР. Множества возможных значений этих параметров вается. Необходимо определить еще связь между принятым реобозначим и U соответственно. Если эти факторы известны на шением и реализующимся результатом, то есть отображение w() момент принятия решения, задача сводится к предыдущему слу(см. раздел 1.1).

чаю. Если же они не известны, возникает неопределенность.

Задача принятия решения – это задача выбора ЛПР действия из множества A, которое приводит к наилучшему с точки зрения 35 P(«Судно контрабандиста разбилось в шторме»|«Плыть в Б») = 10%.

Например, может быть совокупностью погодных факторов, P(«Судно было задержано пограничниками»|«Плыть в Б») = 45%.

например, «Погода хорошая» и приводить к исходам: «Судно разP(«Контрабандист никуда не поплыл»|«Сидеть дома») = 100%.

билось во время шторма на маршруте в А», «Судно не разбилось Остальные исходы имеют нулевую вероятность.

во время шторма на маршруте А», «Судно разбилось во время В соответствии с терминологией, введенной в первой главе, шторма на маршруте в Б», «Судно не разбилось во время шторма описанная выше задача – это задача принятия решения в условиях на маршруте Б». Множество U описывает неопределенность вероятностной неопределенности.

действий других лиц и может иметь, например, вид: {«ПоНемногим отличается случай, когда ЛПР не имеет информаграничники выбрали для патрулирования маршрут в А», «Пограции о вероятностях некоторых значимых событий, но имеет предничники выбрали для патрулирования маршрут в Б»}. Считаем, положения о них. В этом случае объективные вероятности замечто если пограничники патрулируют маршрут, то они задержиняются на субъективные и реализуется та же схема решения.

вают все плывущие по нему суда с контрабандой.

Таким образом, в данном примере каждое решение (действие) Теперь уже выбор ЛПР некоторого действия y* не приводит к ЛПР приводит к лотерее, случайному процессу, в котором исходы единственному возможному результату. В зависимости от реалимогут реализовываться с некоторыми вероятностями. Для того, зации не зависящих от ЛПР факторов и u может реализоваться чтобы от предпочтения на множестве исходов перейти к любой результат из множества R(y*) = {w(y*,, u) |, u U}.

предпочтениям на множестве действий, ЛПР должен уметь сравЧтобы сделать выбор, ЛПР необходимо научиться сравнивать эти нивать свои предпочтения на множестве подобных лотерей, то множества. Однако отношение предпочтения на системе множеств есть определять, какая из лотерей для него лучше или хуже. Тогда R() не задано условиями задачи. Его необходимо получать оптимальным решением будет действие, приводящее к наилучшей (возможно, используя некоторые дополнительные предположения) лотерее. Каким образом осуществляется этот переход, описывается из отношения предпочтения на множестве результатов A0.

в следующем разделе.

Так, если известно распределение вероятностей реализации событий из и U, то можно определить вероятности появления различных результатов при выборе определенного действия.

2.2. Полезность и функция полезности Например, пусть вероятность При решении задач принятия решений для описания интереP («Погода хорошая») = 80%, сов ЛПР редко используется непосредственно отношение предP(«Судно разбилось в шторме на маршруте в А»|«Плыть в А»)=0%, P(«Судно не разбилось в шторме на маршруте А»|«Плыть в А»)=100%, почтения. Это связано с тем, что бинарные отношения довольно P(«Судно разбилось в шторме на маршруте в Б»|«Плыть в Б») = 50%, неудобны для моделирования реальных систем и анализа этих P(«Судно не разбилось в шторме на маршруте Б»|«Плыть в Б»)=50%.

моделей. Гораздо чаще используются функции полезности.

Предположим также, что вероятности патрулирования поСоответствие между отношением предпочтения и функцией граничниками обоих маршрутов равны 50%.

полезности f : A0 1 определяется условием Тогда, если судно отправляется в А:

(1) a,b A0 f(a) > f(b) a b.

P(«Контрабандист успешно добрался до пункта А»|«Плыть в А») = 50%.

P(«Судно было задержано пограничниками»|«Плыть в А») = 50%. Рассмотрим, каким ограничениям должно удовлетворять отСоответственно, для других действий вероятности различных ношение предпочтения, чтобы можно было рассматривать вместо исходов будут следующими: него функцию полезности. Эта задача является предметом изучеP(«Контрабандист успешно добрался до пункта Б»|«Плыть в Б») = 45%. ния математической теории полезности [48, 68] (впервые во 37 прос о представимости отношения предпочтения функцией полез- 3. Если x y, y z, то x z. Это – условие транзитивноности – см. (1) – рассматривался Г. Кантором (1895 г.) – см. под- сти отношения неразличимости, оно уже не столь очевидно.

робности в [77]). Существуют примеры достаточно логичных с точки здравого Как отмечалось выше, отношение предпочтения – бинарное смысла предпочтений, когда эта аксиома не выполняется [2, 31, отношение на множестве исходов A0, удовлетворяющее, как ми- 38, 39, 44, 73].

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.