WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 || 3 | 4 |   ...   | 15 |

9 определенность (неполную информированность о принципах поI АГЕНТ ведения других субъектов). Неопределенность относительно пара0 метров, описывающих участников ОС, называется внутренней не- {A, A,, w( ), v( ), I} определенностью, относительно внешних параметров – внешней неопределенностью. Внешняя объективная неопределенность называется неопределенностью природы (или неопределенностью y A состояния природы), внутренняя субъективная неопределенностьназывается игровой неопределенностью.

Ниже будет использоваться следующая модель предпочтений и информированности агента. Пусть предпочтения агента на мноz AУПРАВЛЯЕМЫЙ ОБЪЕКТ жестве возможных результатов деятельности заданы его функцией w(): A Aполезности v(), а результат деятельности z A0 зависит от дейст вия y A и обстановки известным образом8: z = w(y, ). Тогда закон WI() определяется функцией9 w(), отражающей структуру пассивного управляемого объекта, и той информацией I, Рис. 1. Структура модели принятия решений агентом.

которой обладает агент на момент принятия решений о выбираемом действии.

Рассмотрим сначала объективную неопределенностьСтруктура модели принятия решений агентом изображена на (внешнюю или внутреннюю). Тогда существенной для агента яврисунке 1.

ляется информация относительно обстановки. В качестве такой Детализируем, что понимается под информацией и каким информации (различных видов неопределенности) могут выстуобразом устраняется неопределенность того или иного типа.

пать11:

- множество возможных значений обстановки ’. Соответствующая неопределенность называется интервальной неопределенностью и устраняется использованием макси7 Внешняя субъективная неопределенность, как правило, не рассматри- Традиционно под «неопределенностью» понимают объективную невается, так как она может быть исключена путем включения субъек- определенность и большинство исследований ОС с неопределенностью тов, о принципах поведения которых у ЛПР имеется неполная инфор- учитывает именно ее [6, 21, 55]. В то же время, например, для динамированность, в ОС. мических ОС характерна не только текущая объективная неопределен Использование такого описания не снижает общности, так как в ность, но и неопределенность будущего, которая заключается в том, многоэлементных системах партнеры каждого агента могут рас- что, принимая решение, ЛПР, с одной стороны, «влияет» на будущее сматриваться как внешняя для него среда, и их стратегии будут обра- (это влияние может проявляться в изменении множеств его будущих зовывать «состояние природы» (которое, правда, будет для каждого допустимых действий, выигрышей и т.д.), а, с другой стороны, возиз агентов свое) – см. описание игровой неопределенности ниже. можности его анализа этого влияния ограничены незнанием будущих Отображение, связывающее действия и обстановку с результатами значений существенных параметров. Многочисленные примеры проявдеятельности, может рассматриваться как «технология» функциони- лений неопределенности будущего приведены в [58].

рования некоторого объекта, управление которым осуществляет Всюду, где встречаются максимумы и минимумы, предполагается, агент (см. рисунок 1). что они достигаются.

11 мального гарантированного результата (МГР): ков (участников некоторой системы), в котором полезность каждоf(y) = min v(w(y, )), использованием гипотезы благоже- го игрока зависит как от его собственного действия (стратегии), ' так и от действий других игроков. Если, в силу гипотезы рациолательности (ГБ): f(y)= max v(w( y, )), их комбинаций и нального поведения, каждый из игроков стремится выбором стра' тегии максимизировать свою целевую функцию, то понятно, что в т.д. [13, 18, 21];

случае нескольких игроков индивидуально рациональная стратегия - распределение вероятностей p() на множестве. Соответкаждого из них зависит от стратегий других игроков. Набор таких ствующая неопределенность называется вероятностной нерациональных стратегий называется решением игры (равновесиопределенностью и устраняется использованием ожидаемых ем). В теории игр на сегодняшний день не существует единого позначений (EUA – expected utility analysis):

нятия равновесия. Введение различных предположений о рациоf ( y) = v(w(y, )) p( )d, быть может, с учетом риска нальном поведении игроков порождает различные концепции рав' новесия (см. главы 3–6), причем в одной и той же игре равновесия (дисперсии полезности) и моментов более высоких порядодного типа могут существовать, а другого – нет.

ков;

Каждому из n игроков (агентов) поставим в соответствие - функция принадлежности µ’() нечеткого множества функцию выигрыша vi(y), где y = (y1,..., yn ) A'= – вектор Ai ’. Соответствующая неопределенность называется iN нечеткой неопределенностью и обычно устраняется выдедействий всех игроков, N = {1, 2,..., n} – множество игроков.

лением множества максимально недоминируемых действий Следуя сложившейся терминологии теории игр, будем называть [53, 55, 61].

действия yi стратегиями, а вектор y – ситуацией игры. СовокупДо сих пор мы рассматривали индивидуальное принятие реность стратегий y-i = (y1,..., yi-1, yi+1,..., yn ) называется обсташений. Рассмотрим теперь игровую (внутреннюю субъективную) новкой игры для i-го игрока.

неопределенность, в рамках которой существенными являются предположения агента о множестве возможных значений обста- Таким образом, рациональному коллективному поведению новки (действий других агентов, выбираемых ими в рамках тех соответствует выбор игроками равновесных стратегий (тип равили иных неточно известных рассматриваемому агенту принципов новесия – см. ниже – должен оговариваться в каждом конкретном случае). Отметим, что любые концепции равновесия должны быть поведения) в зависимости от его действий, то есть ’ = ’(y).



согласованы (при n = 1) с введенными выше принципами Для описания коллективного поведения агентов, входящих в индивидуального рационального выбора.

некоторую многоэлементную ОС (включающую центр и нескольБолее того, в теоретико-игровых моделях можно считать, что ких агентов), недостаточно определить их предпочтения и соответобстановка игры определяет состояние природы для рассматриствия рационального индивидуального выбора по отдельности, так как следует описать модель их совместного поведения. Как отме- ваемого игрока (агента), то есть i = y-i, i N, а результат деячалось выше, в случае, когда в системе имеется единственный тельности будет один для всех игроков – ситуация игры, то есть агент, гипотеза его рационального (индивидуального) поведения zi = y, i N. Информация игрока и те предположения, которые он предполагает, что агент ведет себя таким образом, чтобы выбором использует о поведении других игроков [13, 21, 35, 56, 76, 82], отдействия максимизировать значение своей целевой функции. В ражают его принцип устранения неопределенности. Совокупность случае, когда агентов несколько, необходимо учитывать их взаим- принципов устранения неопределенности, используемых игроками, ное влияние. В этом случае возникает игра – взаимодействие игро- порождает тип равновесия игры (принципу максимального гаран 13 тированного результата соответствует максиминное равновесие, теза рационального поведения проявляется в том, что агент выбипринципу усреднения – равновесие Байеса, предположению о фик- рает действия, наилучшие с точки зрения его индуцированных сированной обстановке y*-i – равновесие Нэша и т.д. – см. ниже) – предпочтений (стремится выбором действия максимизировать устойчивой в том или ином (оговариваемом в каждом конкретном свою целевую функцию, в качестве которой может выступать гаслучае) смысле совокупности действий участников системы. рантированная полезность, ожидаемая полезность и т.д. – см. выДругими словами, субъективная (игровая) неопределенность, ше).

как правило, устраняется введением тех или иных предположений Описав модель принятия индивидуальных и коллективных о принципах поведения участников системы, позволяющих одно- решений, перейдем к рассмотрению модели управления.

значно доопределить выбираемые ими стратегии. То есть устра- нение субъективной неопределенности производится в два этапа – 1.2. Управление и его типы на первом этапе определяется концепция равновесия, на втором В общем случае управлением называется воздействие на этапе определяется принцип выбора игроками конкретных равноуправляемую систему (управляемый субъект или объект управлевесных стратегий в случае, если последних несколько – гипотеза ния), нацеленное на обеспечение требуемого ее поведения12.

благожелательности, принцип гарантированного результата и т.д.

Классификация управлений может строиться на основании тех [13, 21, 55, 57].

компонентов управляемой системы13 (точнее, ее модели) – агента, «Предельным» для всех перечисленных выше типов и видов на которые оказывается воздействие при использовании управленеопределенности является случай детерминированного изменений тех или иных типов [14, 49, 55].

ния результата деятельности – когда он не зависит от обстановки В рамках представления предпочтений агента в терминах (или, что то же самое, когда множество ’ состоит из единственфункции полезности, модель принятия им решений описывается ного элемента), то есть когда каждому действию y A соответстследующим кортежем: = {A, A0,, v(), w(), I}, то есть множевует единственный результат деятельности z = w(y) A0. При этом ствами: допустимых действий A, допустимых результатов деяможно сразу считать, что предпочтения агента заданы на тельности A0, возможных значений обстановок (неопределенности) множестве его действий. Если v() - функция полезности агента, то ; функциями: полезности v() и «технологии» w() между его целевая функция f() в детерминированном случае определяется действиями, обстановкой и результатом деятельности; а также как f(y) = v(w(y)).

информацией I, которой обладает агент на момент принятия реПравило индивидуального рационального выбора в детермишений.

нированном случае заключается в выборе агентом действий, досБудем считать, что закон w() известен всем участникам ОС и тавляющих максимум его целевой функции, то есть не может быть изменен. Содержательно это предположение соотI PW (, A, I) = Arg max f(y).

AyA Принятие решений агентом также может рассматриваться как Таким образом, гипотеза детерминизма проявляется в том, выработка управляющих воздействий (см. рисунок 1). Агент, осущестчто агент, устраняя неопределенность (то есть используя МГР, мавляющий управление активным субъектом, должен рассматриваться тематическое ожидание, отношение недоминирования, предполокак центр.

жения о поведении других агентов и т.д. – в зависимости от типа и Примером может служить стимулирование – «побуждение к совервида неопределенности), переходит от предпочтений, зависящих от шению действий; комплексное целенаправленное внешнее воздействие неопределенных факторов, к предпочтениям, зависящим от его на процессуальные компоненты деятельности управляемой системы и собственных действий – к индуцированным предпочтениям. Гипо- процессы их формирования» [55, С.13].





15 ветствует фиксированной технологии деятельности агента (или Институциональное управление, которое обозначим uA UA, фиксированной технологии функционирования управляемого агенявляется наиболее жестким и заключается в том, что центр целетом объекта) и не является критическим, так как практически люнаправленно ограничивает множества возможных действий и ребое изменение связи между действием и результатом может быть зультатов деятельности агента. Такое ограничение может осущестотражено зависимостью этой связи от обстановки.

вляться явными или неявными воздействиями16 – правовыми акТакже без ограничения общности можно считать, что множетами, морально-этическими нормами и т.д.

ство обстановок известно всем участникам ОС и фиксировано Мотивационное управление, которое обозначим uv Uv, яв(для выполнения этого предположения всегда можно выбрать это ляется более «мягким», чем институциональное, и заключается в множество достаточно широким, ограничивая в каждом конкретцеленаправленном изменении функции полезности агента. Такое ном случае возможные значения обстановок имеющейся у агента изменение может осуществляться введением системы штрафов информацией).

и/или поощрений за выбор тех или иных действий и/или достиВ соответствии с приведенным выше определением, управжение определенных результатов деятельности. Широкий класс ление – это воздействие на управляемую систему. Так как управпримеров моделей мотивационного управления составляют задачи ляемая система (точнее, управляемый субъект – агент) описыва- планирования и стимулирования [10, 11, 13, 56, 64, 79]. В случае, ется кортежем, то внешнее воздействие в общем случае может например, задачи стимулирования, мотивационное управление быть направлено на каждый из элементов этого кортежа. Выделим заключается в непосредственном (входящем в функцию потри группы переменных (элементов кортежа, которые могут лезности аддитивно) вознаграждении агента за выбор определенных действий.

изменяться) – допустимые множества A и A0, функция полезности v() и информация I. Этим трем группам переменных соотНаиболее «мягким» (косвенным), по сравнению с институветствуют три типа управлений (основание классификации – циональным и мотивационным, и, в то же время, наименее исслегруппа переменных, описывающих модель принятия решений, на дованным (с точки зрения формальных моделей) является инфоризменение которых направлено управление)14:

мационное управление. В соответствии с введенной в [49] классификацией, частными случаями информационного управления яв- институциональное управление (изменение ограничений ляются: рефлексивное управление [27, 40], при котором центр вози норм деятельности, в том числе, допустимых множеств);

действует на представления агента о параметрах других участни- мотивационное управление (изменение функции полезноков ОС («передает ему основания для принятия решений» [40]);

сти);

активный прогноз, при котором центр сообщает агентам инфор- информационное управление (изменение информации, мацию о будущих результатах (осуществляет прогноз) их деятелькоторую агент использует при принятии решений).

Обсудим кратко специфику каждого из введенных типов управлений15.

Достаточно ярко институциональное управление проявляется в моделях управления многоэлементными организационными системами, в которых центр может запрещать или разрешать совместный выбор Управление составом и структурой мы не рассматриваем, считая агентами определенных комбинаций действий (примеры – производстсостав и структуру ОС заданными. венные цепочки [56], управление проектами [12] и др.) или достижение определенных результатов совместной деятельности (примеры – агреЕстественно, на практике иногда трудно выделить в явном виде управление того или иного типа, так как они используются (и долж- гирование информации в системах управления [56], управление многоны(!) использоваться) одновременно. уровневыми системами [51, 57] и др.).

17 ности; информационное регулирование [23], при котором центр (управляющей) стороны, то есть центра [15, 21, 45, 57]. Следовасообщает агентам информацию о внешней обстановке, влияя тем тельно, необходимо описать предпочтения центра и рассмотреть самым на их равновесные стратегии. Подробный анализ такого модель принятия им решений по выбору управлений.

эффекта информационного регулирования как манипулирование Модель принятия решений центром в целом аналогична17 распосредством СМИ и другими способами, проведен в [36]. смотренной выше модели принятия решений агентом и описывается кортежем18 0 = {UA, Uv, UI, A0,, w(), v0(), I0}. Поясним Iэлементы модели (см. рисунок 2).

ЦЕНТР «Действиями» центра (выбираемыми им стратегиями) явля0 = {UA, Uv, UI, A0,, w(), v0(), I0} ются управления uA UA, uv Uv, uI UI. Обозначим u u = (uA, uv, uI) U = UA Uv UI – вектор управлений.

В большинстве моделей управления организационными системами считается, что единственная роль центра заключается в АГЕНТ осуществлении управления, то есть у него отсутствует собственный I {A, A0,, w(), v(), I} (не опосредованный агентом) результат деятельности, поэтому результатом деятельности центра обычно считают результат деятельности агента.

Таким образом, структура системы управления агентом имеет y A вид, приведенный на рисунке 2 (ср. со структурой модели принятия решений агентом, приведенной на рисунке 1).

Так как предпочтения центра v0() определены, в том числе, на z A УПРАВЛЯЕМЫЙ ОБЪЕКТ множестве A0 возможных результатов деятельности агента, а поw(): A A Рис. 2. Структура системы управления.

Pages:     | 1 || 3 | 4 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.