WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 | 2 || 4 | 5 |   ...   | 15 |

В соответствии с данным выше определением, управление – воздействие на управляемую систему, нацеленное на обеспечение требуемого ее поведения. Введенные типы управлений характеНижний индекс «0» в настоящей главе обозначает переменные, выбиризуют объекты воздействия (компоненты управляемой системы, раемые центром. Использование обозначения A0 для множества рена которые направлено управляющее воздействие), поэтому обсу- зультатов деятельности агента следует признать неудачным, но дим, что следует понимать под требуемым поведением управляе- сложившимся исторически.

В силу единообразия описания моделей принятия решений, в сложных мой системы, и, в первую очередь – «требуемым» с чьей точки (многоуровневых иерархических) системах центр может рассматризрения.

ваться как субъект, управляемый центром более высокого уровня, а Исследователь операций, занимающийся построением и анаагент – как центр, управляющий агентом более низкого уровня (ср. рилизом модели, как правило, находится на позициях оперирующей сунки 1 и 2) [49, 51].

19 следние зависят от действий агента и обстановки19, то качественно означает, что агент выбирает из множества рационального выбора управление заключается в побуждении центром агента к выбору действие, наиболее благоприятное для центра.

определенных действий. Обсудим, какие действия следует центру Величина K(u), u U, называется эффективностью управпобуждать выбирать агента.

ления. Следовательно, задача управления организационной Предпочтения центра v0(), определенные на множестве системой формально может быть сформулирована следующим A0 U, с учетом имеющейся у него информации I0 индуцируют образом: найти допустимое управление, имеющее максимальную (устранение неопределенности центром производится по той же эффективность (такое управление называется оптимальным схеме, которая описана выше для агента) на множестве A U управлением), то есть K(u) max.

uU предпочтения (целевую функцию центра) f0().

Рассмотренная модель управления является базовой моделью Рациональный выбор P() агента (см. выше) зависит от управления организационными системами, так как она позволяет управляющих воздействий u() U, используемых центром, то унифицированно описывать процессы принятия решений участниесть множество рационального выбора агента есть ками организационных систем. Действительно, в многоуровневых I P(u) = PW ( (uv), A(uA), I(uI)) A.

системах взаимодействие между участниками различных уровней A0 (uA ) управления20 может описываться наращиванием структур, Итак, центр может предсказать, что, если он использует некоприведенных на рисунках 1 и 2, по «вертикали». Введение торое управление u U, то агент выбирает одно из действий из нескольких управляющих органов (центров) или нескольких множества P(u) A. Если это множество содержит более одного управляемых субъектов (агентов) соответствует «горизонтальноэлемента, то у центра остается неопределенность относительно выму» расширению этих структур.

бора агента, которая может устраняться одним из описанных выше Игровая неопределенность в принятии решений отражает для интервальной неопределенности методов. Будем использовать взаимодействие субъектов, в результате которого выигрыши (подалее гипотезу благожелательности (или принцип оптимистичелезности и т.п.) каждого из них в общем случае зависят от дейстских оценок), в соответствии с которой значение целевой функции вий всех участников системы. Предположение о рациональном их центра при использовании управления u U равно поведении, в зависимости от используемого способа устранения K(u) = max f0(y, u). Содержательно гипотеза благожелательности yP(u) игровой неопределенности, приводит к той или иной концепции равновесия игры. Равновесие игры управляемых субъектов зависит от используемых центрами управляющих воздействий, поэтому 19 можно считать, что решение задачи управления ОС заключается в Обстановка центра (и та информация об обстановке, которой обисследовании, во-первых, равновесия игры управляющих органов ладает центр), естественно, может отличаться от обстановки агени, во-вторых, – управляемого равновесия игры агентов. В зависита. Более того, вне рассматриваемой модели управления (но легко впимости от уровней иерархии, которым принадлежат участники рассываемой в нее) остается неполная информированность центра об сматриваемого игрового взаимодействия, можно выделять игры агенте (например, о его типе, правилах устранения неопределенности и принятия решений и т.д.). Неполная информированность центра о ти- между агентами (см. пример 2), игры между центрами (см.

пе агента учитывается в механизмах управления с сообщением инфор- мации, которые полностью укладываются в рассматриваемую модель Напомним, что принадлежность к определенному уровню иерархии управления – см. пример 2 (механизм экспертизы). Неполная информи- определяется последовательностью принятия решений и возможнорованность центра о принципах принятия решений агентом на сего- стью выбирать стратегии, являющиеся «функциями» от стратегий дняшний день исследована недостаточно полно – см. [21, 49]. участников, принадлежащих более низким уровням иерархии [21, 57].

21 пример 3) и игры между центрами и агентами (последний класс Реальная ОС игр называется иерархическими играми) – см. пример 1 и главу 6.

Примеры задач управления, в которых используются игры пеОписание системы и Т И речисленных типов, приводятся ниже (см., в частности, разделы Е С построение модели О С 1.5 и 2.3).

Р Л Анализ модели Е Е Т Д 1.3. Технология управления И О организационными системами Задача синтеза Ч В Е А Как отмечалось выше, теория игр изучает игровую неопреде- управлений С Н ленность в принятии решений. Рассмотрим, на каких этапах поК И становки и решения задач управления (см. раздел 1.2) возникает О Е Исследование Е эта неопределенность. Для этого опишем технологию управления устойчивости решений организационными системами.



Под технологией понимается совокупность методов, операИдентификация ОС ций, приемов и т.д., последовательное осуществление которых НАСТРОЙКА обеспечивает решение поставленной задачи. Отметим, что рассматриваемая ниже технология управления охватывает все этапы, МОДЕЛИ Имитационное начиная с построения модели ОС и заканчивая анализом эффекмоделирование тивности внедрения результатов моделирования на практике (см.

рисунок 3, на котором в целях наглядности опущены обратные Обучение связи между этапами).

управленческого Первый этап – построение теоретико-игровой модели – заперсонала, внедрение, ВНЕДРЕНИЕ ключается в описании реальной ОС в формальных терминах, то анализ эффективности есть задании целевых функций и множеств допустимых стратегий практического участников системы, их информированности21, порядка использования и т.д.

функционирования22, гипотез о поведении и т.д. На этом этапе существенно используется аппарат теории игр, в терминах котоРис. 3. Технология управления ОС.

рой, собственно, и формулируется модель.

Второй этап – анализ модели – исследование поведения участников при тех или иных механизмах управления23. Решение теоретико-игровой задачи анализа заключается в следующем: для Информированностью участников называется та информация, которой они обладают на момент принятия решений (см. раздел 1.1) Механизмом управления ОС называется совокупность правил, зако[55]. нов и процедур, регламентирующих взаимодействие ее участников. В узком смысле механизм управления – совокупность правил и процедур Порядком функционирования называется последовательность получения информации и принятия решений участниками ОС [55]. принятия управленческих решений центром [14, 55].

23 фиксированного механизма управления определяются стратегии идентифицировать моделируемую систему [54] и провести серию агентов, которые являются равновесными при этом управлении. имитационных экспериментов [4, 9] – соответственно пятый и Решив задачу анализа, то есть зная поведение управляемых шестой этапы. Исходными данными для идентификации системы субъектов при различных управлениях, можно переходить к треть- служат обобщенные решения, которые ограничиваются информаему этапу – решению, во-первых, прямой задачи управления, то цией, имеющейся о реальной системе. Этап имитационного модеесть задачи синтеза оптимальных управляющих воздействий, лирования во многих случаях необходим по нескольким причинам.

заключающейся в поиске допустимых управлений, имеющих Во-первых, далеко не всегда удается получить аналитическое ремаксимальную эффективность, и, во-вторых, обратной задачи шение задачи синтеза оптимальных управлений и исследовать его управления – поиска множества допустимых управлений, перево- зависимость от параметров модели. При этом имитационное модедящих ОС в заданное состояние. Критерием эффективности лирование может служить инструментом получения и оценки реуправления является значение (максимальное или гарантирован- шений. Во-вторых, имитационное моделирование позволяет проное) целевой функции управляющего органа на множестве реше- верить справедливость гипотез (в первую очередь, относительно ний игры агентов. Следует отметить, что, как правило, именно принципов поведения участников системы – используемых ими этот этап решения задачи управления вызывает наибольшие тео- процедур устранения неопределенности, правил рационального ретические трудности и наиболее трудоемок с точки зрения ис- выбора и т.д.), принятых при построении и анализе модели, то следователя операций. есть дает дополнительную информацию об адекватности модели без проведения натурного эксперимента. И, наконец, в-третьих, Имея набор решений задачи управления, необходимо перейти использование деловых игр и имитационных моделей в учебных к четвертому этапу, то есть исследовать их устойчивость. Исцелях позволяет управленческому персоналу освоить и апробироследование устойчивости подразумевает решение, как минимум, вать предлагаемые механизмы управления.

двух задач. Первая задача заключается в изучении зависимости Завершающим является седьмой этап – этап внедрения, на оптимальных решений от параметров модели, то есть является котором производится обучение управленческого персонала, внезадачей анализа устойчивости решений (корректности оптимизадрение в реальной ОС разработанных и исследованных на преционной задачи, чувствительности, устойчивости принципов опдыдущих этапах механизмов управления с последующей оценкой тимальности и т.д.) в классическом понимании. Вторая задача эффективности их практического использования, коррекцией моспецифична для математического моделирования. Она заключадели и т.д.

ется в теоретическом исследовании адекватности модели реальной Таким образом, аппарат теории игр используется на всех системе, которое подразумевает изучение эффективности решений, этапах технологии управления (так как сама модель ОС является оптимальных в модели, при их использовании в реальных ОС, теоретико-игровой моделью). В явном виде игровое взаимодейсткоторые могут в силу ошибок моделирования отличаться от вие участников ОС наиболее отчетливо проявляется на этапах модели. Результатом решения задачи адекватности является построения модели, анализа и синтеза управлений, а также имиобобщенное решение задачи управления – параметрическое сетационного моделирования.





мейство решений, обладающих некоторой гарантированной эффективностью в определенном множестве реальных ОС [54, 84]. Приведем примеры постановок задач управления, соответствующие первому этапу приведенной на рисунке 3 технологии.

Итак, перечисленные выше четыре этапа заключаются в общем теоретическом изучении модели ОС. Для того, чтобы использовать результаты теоретического исследования при управлении реальной ОС, необходимо произвести настройку модели, то есть 25 1.4. Примеры задач управления fi(, y) = (y) - ci(y), i N, f0(, y) = H (y) - (y).

i i i В разделе 1.2 было определено понятие управления в рамках iN принятой в настоящей работе модели принятия решений, в разделе Отметим, что и индивидуальное вознаграждение, и индиви1.3 описана технология управления организационными системами, дуальные затраты i-го агента по выбору действия yi в общем слуиз содержания этапов которой видны роль и место теории игр. В чае зависят от действий всех агентов.

настоящем разделе приводится ряд примеров постановки задач Примем следующий порядок функционирования ОС. Центру управления организационными системами (задача стимуи агентам на момент принятия решения о выбираемых стратегиях лирования, задача экспертизы и задача распределенного контро(функциях стимулирования и действиях соответственно) известны ля), которые иллюстрируют использование теоретико-игрового целевые функции и допустимые множества всех участников ОС.

описания взаимодействия участников организационных систем.

Центр, обладая правом первого хода, выбирает функции стимулиРешения поставленных задач приводятся после изложения соотрования и сообщает их агентам, после чего агенты при известных ветствующих (используемых в них) разделов теории игр.

функциях стимулирования выбирают действия, максимизирующие их целевые функции.

Пример 1. [56] «Задача стимулирования».

Рассмотрим многоэлементную детерминированную двухОбозначим M – множество допустимых систем стимулироуровневую ОС, состоящую из центра и n агентов. Стратегией кавания, P( ) – множество равновесных при системе стимулирождого агента является выбор действия, стратегией центра – выбор вания стратегий агентов – множество решений игры (тип равфункции стимулирования, то есть зависимости вознаграждения новесия пока не оговаривается; пока предположим лишь, что каждого агента от его действия и, быть может, действий других агенты выбирают свои стратегии одновременно и независимо друг агентов.

от друга, не имея возможности обмениваться дополнительной Обозначим yi Ai – действие i-го агента, i N = информацией и полезностью).

{1, 2, …, n} – множество агентов, y = (y1,y2,…,yn ) A' = Aj – Эффективностью стимулирования (эффективностью управ jN ления) является максимальное значение целевой функции центра на соответствующем множестве решений игры:

вектор действий агентов, y-i = (y1,y2,…,yi-1,yi+1,…,yn) A-i = Aj ji K ( ) = max f0(, y).

yP( ) – обстановка игры для i-го агента.

Задача синтеза оптимальной функции стимулирования заПредпочтения участников ОС – центра и агентов – выражены ключается в поиске допустимой системы стимулирования *, их целевыми функциями. Целевая функция центра f0(, y) имеющей максимальную эффективность: * Arg max K(). Репредставляет собой разность между его доходом H(y) и суммар M ным вознаграждением (y), выплачиваемым агентам:

шение этой задачи приводится в третьей главе. •Пример 2 [10, 55, 64]. «Задача экспертизы».

(y) = (y), где i(y) – стимулирование i-го агента, i В многоэлементных ОС план (желательное с точки зрения iN центра состояние – действие или результат деятельности агента), (y) = (1(y), 2(y), …, n(y)) – механизм стимулирования. Целеназначаемый i-му агенту, обозначим xi Xi, где Xi – множество вая функция i-го агента fi(i, y) представляет собой разность между стимулированием, получаемым от центра, и затратами ci(y), то есть:

Символ «•» здесь и далее обозначает окончание примера, доказательства и т.д.

27 допустимых планов, сообщение i-го агента (его действие) обозна- агента). При фиксированном соответствии отбора равновесий для непрямого механизма () можно построить соответствующий чим si Si, i N = {1, 2, …, n} – множество агентов. Будем считать, что центр определяет планы (на основании предоставляемой ему прямой механизм25: h(~) = (s*(~)), в котором агенты сообr r агентами информации) по процедуре планирования : S X, где ~ щают непосредственно (прямо) оценки r своих типов (поэтому S =, X =. Тогда план, назначаемый i-му агенту, будет этот механизм и называется прямым). Если в соответствующем Si Xi iN iN прямом механизме сообщение достоверной информации является определяться выражением: xi = i (s), i N, s = (s1, s2, …, sn) S.

доминантной стратегией (см. раздел 3.7), то он называется эквивалентным прямым механизмом.

Совокупность = (S, ()) множеств возможных сообщений агенОчевидно, в механизмах с сообщением информации агенты тов и процедуры планирования называется механизмом планиробудут руководствоваться своей полезностью и не обязательно бувания. Так как план каждого агента зависит в общем случае от содут сообщать достоверную информацию. Явление сообщения общений всех агентов, то возникает игра агентов, поэтому в качеагентами недостоверной информации называется манипулировастве моделей поведения агентов можно использовать ту или иную нием информацией, а механизмы, в которых агентам выгодно соконцепцию равновесия (см. ниже).

Pages:     | 1 | 2 || 4 | 5 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.