Статьи

Версия для печати

Все статьи | Статьи за 2002 год | Статьи из номера N2 / 2002

Обобщенный критерий Гурвица оптимальности смешанных стратегий относительно выигрышей

Лабскер Л.Г.,

профессор кафедры математического моделирования
экономических процессов Финансовой академии при Правительстве РФ

1. Введение

Во многих задачах финансово-экономической области приходится принимать решения в условиях неопределенности, заключающейся в недостаточной информации об объективном состоянии окружающей эти задачи среды (см., например, [1—5, 11]). Неопределенность такого типа порождается различными причинами: нестабильностью экономической ситуации, покупательным спросом на товар определенного вида, меняющимся объемом перевозок, рыночной конъюнктурой, политикой правительства, надежностью партнера, выходом из строя технического оборудования, курсом валюты, уровнем инфляции, налоговой политикой, биржевой ситуацией, экологической обстановкой, стихийными бедствиями и др.

Выбор решения в задачах подобного родазависит от объективной действительности,называемой в математической модели природой.Сама же математическая модель таких ситуацийназывается игрой с природой ([1, 10]).

Таким образом, в игре с природойучаствуют два игрока: один из них, обозначимего через A, — лицо, принимающее решение;другой, обозначим его через П, — природа.Игрок A действует осознанно, стремясь принятьнаиболее выгодное для себя решение. В отличие отнего природа П принимает то или иное своесостояние неопределенным образом, непротиводействуя злонамеренно игроку A, непреследуя конкретной цели и безразлично крезультату игры, т.е. природа П, являясьигроком в игре, не является ни противником, нисоюзником игрока A.

Пусть игрок A располагает m возможными стратегиями A1,...,Am, а природа П может находиться в одном из n своих состояний П1,...,Пn, которые определяются на основании имеющегося опыта анализа состояний природы либо на основании мнений экспертов. Предполагается обычно, что известны результаты выбора игроком A каждой из своих стратегий A1, i = 1,...,m, при каждом состоянии природы Пj, j = 1,...,n, численные значения которых обозначим через aij. Из этих чисел, называемых выигрышами игрока A, формируется матрица его выигрышей размером m x n, строки которой соответствуют стратегиям игрока A, а столбцы — состояниям природы П.

Задача игрока A состоит в выборе оптимальной стратегии с использованием по возможности всей информации, содержащейся в матрице A.

Если m = 1, то в распоряжении игрока A всего одна стратегия A1 и проблема выбора оптимальной стратегии отпадает. Поэтому в дальнейшем будем считать m >= 2.

Если n = 1, то природа П пребывает только в одном состоянии П1. В этом случае проблема выбора игроком A оптимальной стратегии хотя и остается, но превращается в тривиальную: игрок A должен выбрать стратегию, соответствующую строке матрицы A, в которой стоит наибольший из m выигрышей первого (и единственного) столбца матрицы A. Поэтому далее будем предполагать >= 2.

Целесообразно также по возможности упростить матрицу A , уменьшив число ее строк применением принципа доминирования стратегий игрока A (см., например, [10]). Речь идет о следующем.

Если k-я строка матрицы A меньше s-й строки, т.е. , или в координатной форме:

Вероятности, с которыми природа Пможет находиться в том или ином из своихсостояний, неизвестны, и отсутствует возможностьполучения о них какой-либо статистическойинформации. В такой ситуации говорят о принятиирешения в условиях неопределенности.

Понятие оптимальности стратегии можетопределяться различными соображениями,составляющими содержание соответствующихкритериев оптимальности.

Автором был предложен критерий оптимальности, названный обобщенным критерием пессимизма-оптимизма Гурвица с коэффициентами

, (1.1)

относительно выигрышей ([7], см. также [6,10]) и относительно рисков ([8, 9], см. также [10]). Этикритерии были определены лишь для стратегий A1,..., Am , называемых чистыми, т.е. средичистых стратегий можно найти оптимальную всмысле каждого из этих критериев. Однако еслиигроку A необходимо выбирать стратегиюмногократно, то известно, что привлечение крассмотрению не только чистых, но и всехсмешанных стратегий может привести к лучшемурезультату.

Действие игрока A, состоящее в случайном выборе с определенной вероятностью одной из своих чистых стратегий, называется смешанной стратегией. Смешанная стратегия P определяется, таким образом, упорядоченным набором вероятностей p1, .., pm, с которыми игрок A выбирает соответствующие чистые стратегии   A1, .., Am. Так как события, состоящие в выборе игроком A чистой стратегии, несовместные и образуют полную группу, то сумма вероятностей этих событий равна 1. Поэтому смешанную стратегию P геометрически можно отождествить с m-мерным вектором P=( p1, .., pm), координаты которого удовлетворяют условиям

, (1.2)

Каждая чистая стратегия Ai является смешанной с координатами , i =1,.., m. Обратное, разумеется, неверно. Множество SA всех смешанных стратегий игрока A геометрически представляет собой фундаментальный (m-1)-мерный симплекс с m вершинами в точках представляющих чистые стратегии (см., например, [10]).

Цель настоящей статьи —распространить определение обобщенногокритерия Гурвица относительно выигрышей,данного в [7] (см. также [6, 10]) для чистых стратегий,на стратегии произвольного подмножествамножества смешанных стратегий ипроанализировать сравнение этих определений.

2. Определение обобщенного критерия пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами для смешанных стратегий

Пусть числа удовлетворяют условиям (1.1).

Если игрок A придерживается смешанной стратегии  P=( p1, .., pm), то при состоянии природы Пj вероятность выигрыша aij совпадает с вероятностью pi выбора чистой стратегии Ai в этой смешанной стратегии. Таким образом, выигрыш игрока A при выборе им смешанной стратегии  P=( p1, .., pm) и при состоянии природы Пj представляет собой дискретную случайную величину, принимающую значения aij соответственно с вероятностями pi, i=1,.., m, Тогда средневзвешенные выигрыши игрока A при смешанной стратегии  P=( p1, .., pm) и при каждом состоянии природы Пj , j=1,.., n  , вычисляемые как математические ожидания соответствующих случайных величин, образуют следующую строку:

(2.1)

Переставляя выигрыши строки (2.1) внеубывающем порядке, получим строку

(2.2)

где — перестановка чисел 1,2,...,n, зависящая, очевидно, от смешанной стратегии  P=( p1, .., pm). Вообще говоря, для некоторых номеров j{1,..,n} возможно равенство , т.е.

Поставив каждой смешанной стратегии P=( p1, .., pm) в соответствие (единственное) число

(2.3)

мы получим числовую функцию векторного аргумента, определенную формулой (2.3) на множестве SA всех смешанных стратегий игрока A. Числа в формуле (2.3) являются параметрами. Функцию (2.3) назовем функцией эффективности смешанных стратегий G(P), а значение этой функции на смешанной стратегии Pпоказателем эффективности смешанной стратегии P .

Рассмотрим сужение G | функции G на множество ={A1, A2,...Am} чистых стратегий игрока A. Для чистой стратегии

имеем

и строка (2.1) превращается в k-юстроку матрицы A

,

строка (2.2) — в неубывающуюперестановку k-й строки матрицы A

,

а (2.3) — в показатель эффективности стратегии Ak по обобщенному критерию Гурвица с коэффициентами ([7], см. также [6, 10]). Таким образом, сужение G | функции G на множество

Пусть S — произвольное непустое подмножество множества SA смешанных стратегий игрока A.

Функция G(P) ограничена сверху намножестве SA. Действительно, если

— наибольший элемент матрицы A, то для любого PSA, в силу (2.3), (2.2), (1.2) и (1.1), будем иметь

Аналогичным образом устанавливаетсяограниченность функции G(P) и снизу намножестве  SA наименьшим элементомматрицы A.

Поскольку функция G(P) ограниченасверху на всем множестве SA , то онаограничена сверху и на любом его подмножестве S.Следовательно, на каждом подмножестве Sсуществует конечный супремум

(2.4)

который мы назовем ценой игры в стратегиях множества S . В частности, если множество S есть множество чистых стратегий игрока A , то GS представляет собой цену игры в чистых стратегиях. Если S совпадает с множеством SA всех смешанных стратегий, то GS есть цена игры в смешанных стратегиях.

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами назовем критерий, по которому оптимальной стратегией в множестве S считается стратегия PО, обладающая следующими двумя свойствами:

1) стратегия PО принадлежит множеству S : PО S;

2) показатель эффективности G(PО) стратегии PО  совпадает с ценой игры GS в стратегиях множества S:

G(PО)=GS (2.5)

При S = это определение превращается в определение обобщенного критерия Гурвица, данного автором в [7] (см. также [6, 10]) для чистых стратегий.

Решением игры в стратегиях множества S назовемдвухэлементное множество {S0,GS} , вкотором элемент S0 — множество всехоптимальных стратегий в множестве S , а GS— цена игры в стратегиях множества S (см. (2.4)).

Частным решением игры в стратегияхмножества S назовем двухэлементное множество {P0,GS},элементами которого являются какая-нибудьоптимальная стратегия P0 в множестве S ицена игры GS в стратегиях множества S.

Если функция эффективности G(P) (см. (2.3)) достигает своего супремума GS на множестве S (см. (2.4)), т.е. если найдется стратегия P0S, удовлетворяющая равенству (2.5), то в этом случае в (2.4) вместо sup можно писать max:GS=max{G(P):PS}. Эта стратегия P0 является оптимальной в множестве S, и, следовательно, существует решение игры. Если множество S конечно, в частности если S есть множество   чистых стратегий, то в нем всегда существует стратегия P0, удовлетворяющая равенству (2.5), т.е. стратегия, на которой функция эффективности G(P) достигает своего супремума GS на множестве S(см. (2.4)). Таким образом, в конечном множестве S всегда существует оптимальная стратегия.

Если же множество S бесконечно, тосуществование в нем оптимальной стратегиитребует доказательства.

3. Выбор коэффициентов

Коэффициенты определенного в предыдущем пункте обобщенного критерия Гурвица предназначены для приближенного количественного выражения представления лица, принимающего решение, — игрока A о различной степени опасности, благоприятности или нейтральности обстановки, в которой он должен выбрать оптимальную стратегию.

Показателем пессимизма игрока Aпри выборе им оптимальной стратегии назовемчисло

(3.1)

где [n/2] — целая часть числа n/2.

Показателем оптимизма игроканазовем число

(3.2)

Очевидно, что

Коэффициенты , удовлетворяющие условиям (1.1), выбираются игроком A субъективно из следующих соображений. Если он оценивает ситуацию, в которой предстоит принять решение, как опасную, то его поведение при выборе стратегии должно быть осторожным, осмотрительным, не претендующим на большие выигрыши. В этой ситуации игрок A проявляет больше пессимизма, чем оптимизма. Поэтому коэффициенты естественно выбирать таким образом, чтобы показатель пессимизма был больше показателя оптимизма . Если же игрок A считает ситуацию благоприятной, то целесообразный выбор коэффициентов должен быть таким, чтобы показатель оптимизма был больше показателя пессимизма . В случае, если игрок A не может определенно отдать предпочтение ни опасности, ни благоприятности ситуации, т.е. считает ее нейтральной, то естественно выбрать коэффициенты так, чтобы показатели пессимизма и оптимизма были бы равными, т.е. = = 0,5 .

Таким образом, показатели пессимизма и оптимизма можно трактовать как количественные меры соответственно пессимизма и оптимизма игрока A при выборе им оптимальной стратегии, а общее значение = = 0,5 указывает как бы на его нейтральность.

В [7] (см. также [6, 10]) был предложен некоторый формализованный прием выбора коэффициентов , состоящий в следующем.

Как уже отмечалось в пункте 2, если P есть чистая стратегия, то строка (2.1) представляет собой строку матрицы A выигрышей игрока A при этой чистой стратегии, а строка (2.2) есть неубывающая перестановка этой строки матрицы A. Таким образом, выигрыши каждой строки матрицы A переставлены в неубывающем порядке. Обозначим элементы полученной матрицы через bij, а саму матрицу — через B:

Пусть

, (3.3)

— сумма выигрышей, стоящих в j-мстолбце матрицы B;

, (3.4)

— арифметическое среднее выигрышей bij, стоящих в j-м столбце матрицы B;

(3.5)

— сумма всех выигрышей матрицы B,или, что то же, сумма всех выигрышей матрицы A.

Поскольку каждая строка матрицы Bявляется неубывающей последовательностью, то(см. (3.3))

и следовательно, см. (3.4))

(3.6)

В случае, когда игрок A оценивает ситуацию, в которой он выбирает стратегию, как опасную, то коэффициенты должны быть выбраны, как отмечалось выше, так, чтобы показатель пессимизма был больше показателя оптимизма . Это может быть достигнуто, например, выбором невозрастающей последовательности коэффициентов — в частности, по принципу невозрастания средних выигрышей, т.е. обратно пропорциональных средним выигрышам (3.4) (см. (3.6)):

(см. [7], а также [6, 10]). В этом случае можнодоказать (см. [7], а также [6, 10]), что

, (3.7)

где bn-j+1 и bопределяются соответственно по формулам (3.3) и(3.5).

Если же игрок A при выборе стратегии преисполнен оптимизма  был больше показателя оптимизма , то показатель оптимизма должен быть больше показателя пессимизма , что может быть реализовано выбором неубывающей последовательности коэффициентов — например, по принципу неубывания средних выигрышей (см. [7], а также [6, 10]), т. е. прямо пропорционально средним выигрышам (3.4):

В этом случае (см. [7], а также [6, 10])справедлива формула

 ,

где bj и b определяютсясоответственно по формулам (3.3) и (3.5).

4. Пример

В [7] (см. также [6, 10]) был рассмотренпример об инвестировании средств инвестора Aв приобретение акций одной из трех компаний K1,K2, K3. При этом онруководствуется доходностью акций, данные одинамике которых (в годовых процентах)представлены в каждом из четырех месяцев вследующей таблице:

(4.1)

Предположим, что операциюприобретения акций инвестор A совершаетмногократно, задаваясь каждый раз в условияхнеопределенности вопросом: акции какой изкомпаний выгоднее приобрести?

В качестве математической моделиописанной ситуации можно рассмотреть игру сприродой, в которой роль сознательного игрокаиграет инвестор A, имеющий в своемраспоряжении три чистых стратегии Ai —  приобрести акции компании Ki, i = 1,2, 3, а роль природы П исполняет ситуация нафондовом рынке, влияющая на доходность акцийкомпаний случайным образом, объективно непротиводействуя осознанно интересам инвестора A,и абсолютно безразличная к результатам игры.Природа П может находиться в одном из своихчетырех состояний П1, П2,П3, П4. Инвесторукаждый раз надлежит прини-мать решение вусловиях неопределенности, какой компанииотдать предпочтение?

Расположив доходности в каждой строкематрицы (4.1) в неубывающем порядке, получимматрицу

(4.2)

в первом столбце которой стоятнаименьшие доходности, в последнем, четвертом,столбце — наибольшие доходности, а в последнейстроке bj— сумма доходностей j-гостолбца матрицы (4.2) (см. (3.3)). Просуммировавэлементы последней строки матрицы (4.2), получимсумму всех элементов этой матрицы (или, что то же,матрицы (4.1)): b = 102 (см. (3.5)).

Оптимальные стратегии будем пониматьв смысле обобщенного критерия Гурвица,коэффициенты которого выбираются в зависимостиот того, как оценивает инвестор A ситуацию, вкоторой надо принимать решение.

Предположим, что инвестор A оценивает ситуацию пессимистически. Тогда, выбирая коэффициенты по формулам (3.7), получим

, , , , (4.3)

и, значит (см. (3.1) и (3.2)), показатель пессимизма и показатель оптимизма соответственно равны , .

Показатели эффективности стратегий Ai, i = 1, 2, 3, по обобщенному критерию Гурвица с коэффициентами (4.3) (см. (2.3)), равны (см. [7]): G(A1) = 7,98; G(A2) = 7; G(A3) = 8,31. Поэтому цена игры в чистых стратегиях (см. (2.4)) равна

Рассмотрим смешанную P=( p1=0,5; p2= 0; p3= 0,5) стратегию и вычислимпо формулам (2.1) выигрыши игрока A при этойсмешанной стратегии и при каждом состоянииприроды П:

 

Расположим эти выигрыши в неубывающемпорядке:

Таким образом, для смешанной стратегии P=( 0,5; 0; 0,5) номера ljj = 1, 2, 3, 4 (см. (2.2)), имеют значения , l1 = 1, l2 = 3, l3 = 2, l4 = 4.

Теперь мы можем вычислить по формуле (2.3) показатель эффективности стратегии P=(0,5; 0; 0,5):

Таким образом, показатель эффективности смешанной стратегии P=(0,5; 0; 0,5), равный 8,54, выше показателя эффективности оптимальной в множестве чистых стратегий стратегии A3, равного 8,31. Поэтому если рассмотреть множество S = U{P}, получающееся присоединением к множеству чистых стратегий

В предметных терминах это означает,что, многократно приобретая акции, инвестору A нецелесообразнокаждый раз придерживаться стратегии A3,т.е. приобретать акции компании K3, ацелесообразнее использовать смешаннуюстратегию P=(0,5; 0; 0,5), т.е.приобретать акции случайно выбранной компаниииз двух компаний K1 и K3 свероятностью 0,5 для каждой и не покупать акциикомпании K2.

Приведенный пример показывает, чтоесли оптимальность стратегий понимать в смыслепредлагаемого обобщенного критерия Гурвица скоэффициентами, вычисляемыми в опасной ситуациипо принципу невозрастания средних выигрышей, тоиспользование не только чистых, но и смешанныхстратегий может увеличить выигрыш игрока A .Таким образом, рассмотренный пример оправдываетраспространение обобщенного критерия Гурвицаотносительно выигрышей для чистых стратегий насмешанные стратегии.

 

Литература

  1. Вентцель Е.С. Исследование операций. — М.: Советское радио, 1972.
  2. Дубров А.М., Лагоша Б.А., Хрусталев Е.Ю., Барановская Т.П. Моделирование рисковых ситуаций в экономике и бизнесе. — М.: Финансы и статистика, 2001. — 224 с.
  3. Капитаненко В.В. Финансовая математика и ее приложения. — М.: ПРИОР, 1999. — 144 с.
  4. Князевская Н.В., Князевский В.С. Принятие рискованных решений в экономике и бизнесе. — М.: Издательско-книготорговое объединение ЭБМ-Контур, 1998. — 160 с.
  5. Ковалев В.В. Методы оценки инвестиционных проектов. — М.: Финансы и статистика, 1999. — 144 с.
  6. Лабскер Л.Г. Обобщенный критерий пессимизма-оптимизма Гурвица // Сб. научн. трудов “Качество информационных услуг”. Вып. III. — Тамбов: ТГТУ, 2000. — с. 34—43.
  7. Лабскер Л.Г. Обобщенный критерий пессимизма-оптимизма Гурвица // Финансовая математика. — М.: МГУ им. М.В. Ломоносова, 2001. — С. 401—414.
  8. Лабскер Л.Г. Обобщенный критерий пессимизма-оптимизма Гурвица относительно рисков. Часть I // Управление риском. 2001. № 2. — с. 35—37.
  9. Лабскер Л.Г. Обобщенный критерий пессимизма-оптимизма Гурвица относительно рисков, Часть 2 // Управление риском. 2001. № 3.
  10. Лабскер Л.Г., Бабешко Л.О. Игровые методы в управлении экономикой и бизнесом. — М.: ДЕЛО, 2001. — 464 с.
  11. Чернов В.А. Анализ коммерческого риска. — М.: Финансы и статистика, 1998. — 128 с.

Отдельные номера журналов Вы можете купить на сайте www.5B.ru
Оформление подписки на журнал: http://dis.ru/e-store/subscription/



Все права принадлежат Издательству «Финпресс» Полное или частичное воспроизведение или размножение каким-либо способом материалов допускается только с письменного разрешения Издательства «Финпресс».