Теория игр классические примеры. Теория игр в экономике

3.4.1. Основные понятия теории игр

В настоящее время многие решения проблем в производственной,экономической или коммерческой деятельности зависят от субъективных качеств лица, принимающего решение. При выборе решений в условиях неопределенности всегда неизбежен элемент произвола, а следовательно, и риска.

Задачами о принятии решений в условиях полной или частичной неопределенности занимается теория игр и статистических решений. Неопределенность может принимать форму противодействия другой стороны, которая преследует противоположные цели, препятствует теми или другими действиями или состояниями внешней среды. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны.

Возможные варианты поведения обеих сторон и их исходов для каждого сочетания альтернатив и состояний можно представить в виде математической модели, которая называется игрой. Обе стороны конфликта не могут точно предсказать взаимные действия. Несмотря на такую неопределенность, принимать решения приходится каждой стороне конфликта.

Теория игр - это математическая теория конфликтных ситуаций. Основными ограничениями этой теории являются предположение о полной ("идеальной") разумности противника и принятие при разрешении конфликта наиболее осторожного " перестраховочного" решения.

Конфликтующие стороны называются игроками , одна реализация игры – партией, исход игры – выигрышем или проигрышем.

Ходом в теории игр называется выбор одного из предусмотренных правилами действия и его реализацию.

Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление.

Случайным ходом называют выбор игроком, осуществляемый не волевым решением игрока, а каким либо механизмом случайного выбора (бросание монеты, сдача карт и т.п.) одного из возможных вариантов действия и его осуществление.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действия при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).

В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:

- Комбинаторные игры, в которых правила в принципе дают возможность каждому игроку проанализировать все разнообразные варианты поведения и, сравнив эти варианты выбрать из них наилучший. Неопределенность здесь состоит в слишком большом количестве вариантов, которые надо проанализировать.

- Азартные игры, в которых исход оказывается неопределенным в силу влияния случайных факторов.

- Стратегические игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение, не знает, какой стратегии будут придерживаться другие участники игры, так как отсутствует информация о последующих действиях противника (партнера).

- Игра называется парной , если в игре участвуют два игрока.

- Игра называется множественной , если в игре участвуют больше двух игроков.

- Игра называется с нулевой суммой , если каждый игрок выигрывает за счет других, а сумма выигрыша и проигрыша одной стороны равны другой.

- Парная игра с нулевой суммой называется антагонистической игрой.

- Игра называется конечной , если у каждого игрока имеется только конечное число стратегий. В противном случае - игра бесконечная.

- Одношаговые игры, когда игрок выбирает одну из стратегий и делает один ход.

- В многошаговых играх игроки для достижения своих целей делают ряд ходов, которые могут ограничиваться правилами игры или могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.

- Деловые игры имитируют организационно-экономические взаимодействия в различных организациях и предприятиях. Преимущества игровой имитации перед реальным объектом таковы:

Наглядность последействий принимаемых решений;

Переменный масштаб времени;

Повторение имеющегося опыта с изменением установок;

Переменный охват явлений и объектов.

Элементами игровой модели являются:

- Участники игры.

- Правила игры.

- Информационный массив, отражающий состояние и движение моделируемой системы.

Проведение классификации и группировки игр позволяет для однотипных игр найти общие методы поиска альтернатив в принятии решения, выработать рекомендации по наиболее рациональному образу действий в ходе развития конфликтных ситуаций в различных сферах деятельности.

3.4.2. Постановка игровых задач

Рассмотрим конечную парную игру с нулевой суммой. Игрок А имеет m стратегий (А 1 А 2 А m), а игрок В – n стратегий (В 1 , В 2 Вn). Такая игра называется игрой размерностью m х n. Пусть а ij - выигрыш игрока А в ситуации, когда игрок А выбрал стратегию А i , а игрок В выбрал стратегию В j . Выигрыш игрока в данной ситуации обозначим b ij . Игра с нулевой суммой, следовательно, а ij = - b ij . Для проведения анализа достаточно знать выигрыш только одного из игроков, допустим А.

Если игра состоит только из личных ходов, то выбор стратегии (А i , В j),однозначно определяет исход игры. Если игра содержит также случайные ходы, то ожидаемый выигрыш – это среднее значение (математическое ожидание).

Предположим, что значения а ij известны для каждой пары стратегий(А i , В j). Составим прямоугольную таблицу, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В. Эта таблица называется платежной матрицей .

Цель игрока А максимизировать свой выигрыш, а цель игрока В минимизировать свой проигрыш.

Таким образом, платежная матрица имеет вид:

Задача состоит в определении:

1) Наилучшей (оптимальной) стратегии игрока А из стратегий А 1 А 2 А m ;

2) Наилучшей (оптимальной) стратегии игрока В из стратегий В 1 , В 2 Вn.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

3.4.3. Методы решения игровых задач

Принцип минимакса

Проанализируем последовательно каждую стратегию игрока А. Если игрок А выбирает стратегию А 1 , то игрок В может выбрать такую стратегию В j , при которой выигрыш игрока А будет равен наименьшему из чисел a 1j . Обозначим его a 1:

то есть a 1 – минимальное значение из всех чисел первой строки.

Это можно распространить на все строки. Поэтому игрок А должен выбрать ту стратегию, для которой число a i - максимально.

Величина a - гарантированный выигрыш, который может обеспечить себе игрок а при любом поведении игрока В. Величина a называется нижней ценой игры.

Игрок В заинтересован в том, чтобы уменьшить свой проигрыш, то есть обратить выигрыш игрока А в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце и среди них выбрать наименьшее.

Обозначим через b j максимальное значение в каждом столбце:

Наименьшее значение b j обозначим b.

b = min max a ij

b называется верхней границей игры. Принцип, диктующий игрокам выбор игрокам соответствующих стратегий, называется принципом минимакса.

Существуют матричные игры, для которых нижняя цена игры равна верхней, такие игры называются играми с седловой точкой. В этом случае g=a=b называется чистой ценой игры, а стратегии А * i , В * j , позволяющие достичь этого значения - оптимальными. Пара (А * i , В * j)называется седловой точкой матрицы, так как элемент a ij .= g одновременно является минимальным в i-строке и максимальным в j- столбце. Оптимальные стратегии А * i , В * j , и чистая цена являются решением игры в чистых стратегиях, т. е. без привлечения механизма случайного выбора.

Пример 1.

Пусть дана платежная матрица. Найти решение игры, т. е. определить нижнюю и верхнюю цены игры и минимаксные стратегии.

Здесь a 1 =min a 1 j =min(5,3,8,2) =2

a =max min a ij = max(2,1,4) =4

b = min max a ij =min(9,6,8,7) =6

таким образом, нижней цене игры (a=4) соответствует стратегия А 3 .Выбирая эту стратегию, игрок А достигнет выигрыша не менее 4 при любом поведении игрока В. Верхней цене игры (b=6) соответствует стратегия игрока В. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен 4 (a 33).

Пример 2.

Дана платежная матрица. Найти нижнюю и верхнюю цены игры.

a =max min a ij = max(1,2,3) =3

b = min max a ij =min(5,6,3) =3

Следовательно, a =b=g=3. Седловой точкой является пара (А * 3 , В * 3). Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса.

Решение игр в смешанных стратегиях

Если платежная матрица не содержит седловой точки (aсмешанной стратегией .

Для применения смешанных стратегий требуются следующие условия:

1) В игре отсутствует седловая точка.

2) Игроками используется случайная смесь чистых стратегий с соответствующими вероятностями.

3) Игра многократно повторяется в одних и тех же условиях.

4) При каждом из ходов игрок не информирован о выборе стратегии другим игроком.

5) Допускается усреднение результатов игр.

В теории игр доказано, что любая парная игра с нулевой суммой имеет по крайней мере одно решение в смешанных стратегиях, отсюда следует, что каждая конечная игра имеет цену g. g - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию a<=g<=b . Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии.

Стратегии игроков в их оптимальных смешанных стратегиях называются активными.

Теорема об активных стратегиях.

Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш(или минимальный средний проигрыш), равный цене игры g, независимо от того, какие действия предпринимает другой игрок, если он только не выходит за пределы своих активных стратегий.

Введем обозначения:

Р 1 Р 2 … Р m - вероятности использования игроком А стратегий А 1 А 2 ….. А m ;

Q 1 Q 2 …Q n вероятности использования игроком В стратегий В 1 , В 2….. Вn

Смешанную стратегию игрока А запишем в виде:

А 1 А 2 …. А m

Р 1 Р 2 … Р m

Смешанную стратегию игрока B запишем в виде:

B 1 B 2 …. B n

Зная платежную матрицу А, можно определить средний выигрыш (математическое ожидание) М(А,P,Q):

М(А,P,Q)=S Sa ij Р i Q j

Средний выигрыш игрока А:

a =max minМ(А,P,Q)

Средний проигрыш игрока В:

b = min maxМ(А,P,Q)

Обозначим через Р А * и Q В * векторы, соответствующие оптимальным смешанным стратегиям, при которых выполняется:

max minМ(А,P,Q) = min maxМ(А,P,Q)= М(А,P А * ,Q В *)

При этом выполняется условие:

maxМ(А,P,Q В *) <=maxМ(А,P А * ,Q В *)<= maxМ(А,P А * ,Q)

Решить игру – это означает найти цену игры и оптимальные стратегии.

Геометрический метод определения цены игры и оптимальных стратегий

(Для игры 2Х2)

На оси абсцисс откладывается отрезок длиной 1.Левый конец этого отрезка соответствует стратегии А 1 , правый – стратегии А 2 .

По оси ординат откладываются выигрыши а 11 и а 12 .

По линии, параллельной оси ординат из точки 1 откладываются выигрыши а 21 и а 22 .

Если игрок В применяет стратегию В 1 , то соединяем точки а 11 и а 21 , если – В 2, то – а 12 и а 22 .

Средний выигрыш изображается точкой N, точка пересечения прямых В 1 В 1 и В 2 В 2 .Абсцисса этой точки равна Р 2 , а ордината цене игры - g.

По сравнению с прежней технологией выигрыш составляет 55%.

Для человека, не являющегося экспертом в политике, Брюс Буэно де Мескита из Университета Нью-Йорка делает удивительно точные событий. Ему удалось с точностью до нескольких месяцев предсказать уход со своих постов и Переверза Мушарафа. Он точно назвал приемника Аятоллы Хомейни на посту лидера Ирана за 5 лет до его смерти. На вопрос о том, в чем секрет, он отвечает, что ответа не знает - его знает игра. Под игрой здесь имеется в виду математический метод, который изначально был создан для формирования и анализа стратегий различных игр, а именно - теория игр. В экономике она используется наиболее часто. Хотя изначально она была разроботана для построения и анализа стратегий в играх, использующихся для развлечений.

Теория игры - это численный аппарат, позволяющий рассчитать сценарий, или, точнее, вероятность различных сценариев поведения системы или "игры", контролируемой различными факторами. Эти факторы, в свою очередь, определяются некоторым числом "игроков".

Таким образом, теория игр, в экономике получившая главный толчок к развитию, может применятся в самых разных областях человеческой деятельности. Пока рано говорить о том, чтобы эти программы применялись для разрешения военных конфлмктов, но в будущем это вполне реально.

В результате изучения данной главы студент должен:

знать

Концепции игр, основанные на принципе доминирования, равновесие по Нэшу, что такое обратная индукция и т. д.; концептуальные подходы решения игры, значение понятия рациональности и равновесия в рамках стратегии взаимодействия;

уметь

Различать игры в стратегической и развернутой формах, строить "дерево игры"; формулировать игровые модели конкуренции для различных типов рынков;

владеть

Методами определения исходов игры.

Игры: основные понятия и принципы

Первую попытку создать математическую теорию игр предпринял в 1921 г. Э. Борель. Как самостоятельная область науки впервые теория игр была систематизированно изложена в монографии Дж. фон Неймана и О. Моргенштерна "Теория игр и экономическое поведение" в 1944 г. C тех пор многие разделы экономической теории (например, теория несовершенной конкуренции, теория экономического стимулирования и др.) развивались в тесном контакте с теорией игр . Теория игр с успехом применяется и в социальных науках (например, анализ процедур голосования, поиск равновесных концепций, определяющих кооперативные и некооперативные поведения лиц). Как правило, избиратели отводят кандидатов, представляющих крайние точки зрения, но при избрании одного из двух кандидатов, предлагающих различные компромиссные решения, возникает борьба. Даже идея Руссо об эволюции от "естественной свободы" к "гражданской свободе" формально соответствует с позиций теории игр точке зрения на кооперацию.

Игра – это идеализированная математическая модель коллективного поведения нескольких лиц (игроков), интересы которых различны, что и порождает конфликт. Конфликт необязательно предполагает наличие антагонистических противоречий сторон, но всегда связан с определенного рода разногласиями. Конфликтная ситуация будет антагонистической, если увеличение выигрыша одной из сторон на некоторую величину приводит к уменьшению выигрыша другой стороны на такую же величину и наоборот. Антагонизм интересов порождает конфликт, а совпадение интересов сводит игру к координации действий (кооперации).

Примерами конфликтной ситуации являются ситуации, складывающиеся во взаимоотношениях покупателя и продавца; в условиях конкуренции различных фирм; в ходе боевых действий и др. Примерами игр являются и обычные игры: шахматы, шашки, карточные, салонные и др. (отсюда и название "теория игр", и ее терминология).

В большинстве игр, возникающих из анализа финансово- экономических, управленческих ситуаций, интересы игроков (сторон) не являются строго антагонистическими ни абсолютно совпадающими. Покупатель и продавец согласны, что в их общих интересах договориться о купле-продаже, однако они энергично торгуются при выборе конкретной цены в пределах взаимной выгодности.

Теория игр – это математическая теория конфликтных ситуаций.

От реального конфликта игра отличается тем, что ведется по определенным правилам. Эти правила устанавливают последовательность ходов, объем информации каждой стороны о поведении другой и результат игры в зависимости от сложившейся ситуации. Правилами устанавливаются также конец игры, когда некоторая последовательность ходов уже сделана, и больше ходов делать не разрешается.

Теория игр, как и всякая математическая модель, имеет свои ограничения. Одним из них является предположение о полной (идеальной) разумности противников. В реальном конфликте зачастую оптимальная стратегия состоит в том, чтобы угадать, в чем противник глуп, и воспользоваться этой глупостью в свою пользу .

Еще одним недостатком теории игр является то, что каждому из игроков должны быть известны все возможные действия (стратегии) противника, неизвестно лишь то, каким именно из них он воспользуется в данной партии. В реальном конфликте это обычно не так: перечень всех возможных стратегий противника как раз и неизвестен, а наилучшим решением в конфликтной ситуации нередко будет именно выход за пределы известных противнику стратегий, "ошарашивание" его чем-то совершенно новым, непредвиденным.

Теория игр не включает элементов риска, неизбежно сопровождающего разумные решения в реальных конфликтах. Она определяет наиболее осторожное, перестраховочное поведение участников конфликта.

Кроме того, в теории игр находятся оптимальные стратегии по одному показателю (критерию). В практических ситуациях часто приходится принимать во внимание не один, а несколько числовых критериев. Стратегия, оптимальная по одному показателю, может быть неоптимальной по другим.

Сознавая эти ограничения и потому не придерживаясь слепо рекомендаций даваемых теорий игр, можно все же выработать вполне приемлемую стратегию для многих реальных конфликтных ситуаций.

В настоящее время ведутся научные исследования, направленные на расширение областей применения теории игр.

В литературе встречаются следующие определения элементов, составляющих игру.

Игроки – это субъекты, вовлеченные во взаимодействие, представимое в форме игры. В нашем случае это домохозяйства, фирмы, правительство. Однако в случае неопределенности внешних обстоятельств достаточно удобно представлять случайные составляющие игры, не зависящие от поведения игроков, как действия "природы".

Правила игры. Под правилами игры подразумеваются наборы действий или ходов, доступные игрокам. При этом действия могут быть самые разнообразные: решения покупателей об объемах покупаемых товаров или услуг; фирмы – об объемах выпуска продукции; уровень налогов, назначаемый правительством.

Определение исхода (результата) игры. Для каждой комбинации действий игроков исход игры устанавливается почти механически. Результатом может быть: состав потребительской корзины, вектор выпусков фирмы или набор других количественных показателей.

Выигрыши. Смысл, вкладываемый в понятие выигрыша, может различаться для разных видов игр. При этом надо четко различать выигрыши, измеренные на порядковой шкале (например, уровень полезности), и величины, для которых имеет смысл и интервальное сравнение (например, прибыль, уровень благосостояния).

Информация и ожидания. Неопределенность и постоянное изменение информации могут чрезвычайно серьезно влиять на возможные исходы взаимодействия. Именно поэтому необходимо учесть роль информации в развитии игры. В связи с этим на первый план выходит понятие информационного множества игрока, т.е. совокупности всех сведений о состоянии игры, которыми он обладает в ключевые моменты времени.

При рассмотрении доступа игроков к информации очень полезна интуитивно понятная идея общего знания, или общеизвестности, означающая следующее: какой-либо факт является общеизвестным, если все игроки осведомлены о нем и все игроки знают, что другие игроки также знают об этом.

Для случаев, в которых применения концепции общеизвестности недостаточно, вводится понятие индивидуальных ожиданий участников – представлений о том, как обстоит игровая ситуации на данном этапе.

В теории игр предполагается, что игра состоит из ходов, выполняемых игроками одновременно или последовательно.

Ходы бывают личными и случайными. Ход называется личным, если игрок сознательно выбирает его из совокупности возможных вариантов действий и осуществляет его (например, любой ход в шахматной игре). Ход называется случайным, если его выбор производится не игроком, а каким-либо механизмом случайного выбора (например, по результатам бросания монеты).

Совокупность ходов, предпринятых игроками от начала до окончания игры, называется партией.

Одним из основных понятий теории игр является понятие стратегии. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от ситуации, сложившейся в процессе игры. В простых (одноходовых) играх, когда в каждой партии игрок может сделать лишь по одному ходу, понятие стратегии и возможного варианта действий совпадают. В этом случае совокупность стратегий игрока охватывает все возможные его действия, а любое возможное для игрока i действие является его стратегией. В сложных (многоходовых играх) понятия "вариант возможных действий" и "стратегия" могут отличаться друг от друга.

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш, независимо от того, какие стратегии применяет противник. Могут быть использованы и другие критерии оптимальности.

Возможно, что стратегия, обеспечивающая максимальный выигрыш, не обладает другим важным представлением оптимальности, как устойчивостью (равновесностью) решения. Решение игры является устойчивым (равновесным), если соответствующие этому решению стратегии образуют ситуацию, которую ни один из игроков не заинтересован изменить.

Повторим, что задача теории игр – нахождение оптимальных стратегий.

Классификация игр представлена на рис. 8.1.

1. В зависимости от видов ходов игры подразделяются на стратегические и азартные. Азартные игры состоят только из случайных ходов, которыми теория игр не занимается. Если наряду со случайными ходами есть личные ходы или все ходы личные, то такие игры называются стратегическими.
2. В зависимости от числа игроков игры подразделяются на парные и множественные. В парной игре число участников равно двум, в множественной – более двух.
3. Участники множественной игры могут образовывать коалиции, как постоянные, так и временные. По характеру взаимоотношений игроков игры делятся на бескоалиционные, коалиционные и кооперативные.

Бескоалиционными называются игры, в которых игроки не имеют право вступать в соглашения, образовывать коалиции, и целью каждого игрока является получение по возможности наибольшего индивидуального выигрыша.

Игры, в которых действия игроков направлены на максимизацию выигрышей коллективов (коалиций) без последующего их разделения между игроками, называются коалиционными.

Рис. 8.1.

Исходом кооперативной игры является дележ выигрыша коалиции, который возникает не как следствие тех или иных действий игроков, а как результат их наперед определенных соглашений.

В соответствии с этим в кооперативных играх сравниваются по предпочтительности не ситуации, как это имеет место в бескоалиционных играх, а дележи; и сравнение это не ограничивается рассмотрением индивидуальных выигрышей, а носит более сложный характер.

4. По количеству стратегий каждого игрока игры подразделяются на конечные (число стратегий каждого игрока конечно) и бесконечные (множество стратегий каждого игрока бесконечно).
5. По количеству информации, имеющейся у игроков относительно прошлых ходов, игры подразделяются на игры с полной информацией (имеется вся информация о предыдущих ходах) и неполной информацией. Примерами игр с полной информацией могут быть шахматы, шашки и т.п.
6. По виду описания игры подразделяются на позиционные игры (или игры в развернутой форме) и игры в нормальной форме. Позиционные игры задаются в виде дерева игры. Но любая позиционная игра может быть сведена к нормальной форме, в которой каждый из игроков делает только по одному независимому ходу. В позиционных играх ходы делаются в дискретные моменты времени. Существуют дифференциальные игры, в которых ходы делаются непрерывно. Эти игры изучают задачи преследования управляемого объекта другим управляемым объектом с учетом динамики их поведения, которая описывается дифференциальными уравнениями.

Существуют также рефлексивные игры, которые рассматривают ситуации с учетом мысленного воспроизведения возможного образа действий и поведения противника.

7. Если любая возможная партия некоторой игры имеет нулевую сумму выигрышей всех N игроков (), то говорят об игре с нулевой суммой. В противном случае игры называются играми с ненулевой суммой.

Очевидно, что парная игра с нулевой суммой является антагонистической, так как выигрыш одного игрока равен проигрышу второго, а следовательно, цели этих игроков прямо противоположны.

Конечная парная игра с нулевой суммой называется матричной игрой. Такая игра описывается платежной матрицей, в которой задаются выигрыши первого игрока. Номер строки матрицы соответствует номеру применяемой стратегии первого игрока, столбец – номеру применяемой стратегии второго игрока; на пересечении строки и столбца находится соответствующий выигрыш первого игрока (проигрыш второго игрока).

Конечная парная игра с ненулевой суммой называется биматричной игрой. Такая игра описывается двумя платежными матрицами, каждая для соответствующего игрока.

Приведем следующий пример. Игра "Зачет". Пусть игрок 1 – студент, готовящийся к зачету, а игрок 2 – преподаватель, принимающий зачет. Будем считать, что у студента две стратегии: A1 – хорошо подготовиться к зачету; A 2 – не подготовиться. У преподавателя имеется тоже две стратегии: B1 – поставить зачет; B 2 – не поставить зачет. В основу оценки значений выигрышей игроков можно положить, например, следующие соображения, отраженные в матрицах выигрышей:

Данная игра в соответствии с приведенной выше классификацией является стратегической, парной, бескоалиционной, конечной, описана в нормальной форме, с ненулевой суммой. Более кратко данную игру можно назвать биматричной.

Задача состоит в определении оптимальных стратегий для студента и для преподавателя.

Еще один пример хорошо известной биматричной игры "Дилемма заключенного".

Каждый из двух игроков располагает двумя стратегиями: A 2 и B 2 – стратегии агрессивного поведения, a A i и B i – миролюбивое поведение. Предположим, что "мир" (оба игрока миролюбивы) лучше для обоих игроков, чем "война". Случай, когда один игрок агрессивный, а другой миролюбивый, выгоднее агрессору. Пусть матрицы выигрышей игроков 1 и 2 в данной биматричной игре имеют вид

Для обоих игроков агрессивные стратегии A2 и B2 доминируют мирные стратегии Ах и B v Таким образом, единственное равновесие в доминирующих стратегиях имеет вид (А2, B 2), т.е. постулируется, что результатом некооперативного поведения является война. В то же время исход (A1, B1) (мир) дает больший выигрыш для обоих игроков. Таким образом, некооперативное эгоистическое поведение вступает в противоречие с коллективными интересами. Коллективные интересы диктуют выбор мирных стратегий. В то же время, если игроки не обмениваются информацией, война является наиболее вероятным исходом.

В данном случае ситуация (A1, B1) является оптимальной по Парето. Однако эта ситуация неустойчива, что ведет к возможности нарушения игроками установленного соглашения. Действительно, если первый игрок нарушит соглашение, а второй не нарушит, то выигрыш первого игрока увеличится до трех, а второго упадет до нуля и, наоборот. Причем каждый игрок, не нарушающий соглашение, теряет больше при нарушении соглашения вторым игроком, нежели в том случае, когда они оба нарушают соглашение.

Существует две основные формы игры. Игра в экстенсивной форме представляется как диаграмма типа "дерево" принятия решений, при этом "корень" соответствует точке начала игры, а начало каждой новой "ветки", называемое узлом, – состоянию, достигнутому на данном этапе при данных действиях, уже предпринятых игроками. Каждому конечному узлу – каждой точке окончания игры – ставится в соответствие вектор выигрышей, по одной компоненте для каждого игрока.

Стратегическая, иначе называемая нормальной, форма представления игры соответствует многомерной матрице, при этом каждое измерение (в двумерном случае строки и столбцы) включает набор возможных действий для одного агента.

Отдельная ячейка матрицы содержит вектор выигрышей, соответствующих данному сочетанию стратегий игроков.

На рис. 8.2 представлена экстенсивная форма игры, а в табл. 8.1 – стратегическая форма.

Рис. 8.2.

Таблица 8.1. Игра с одновременным принятием решений в стратегической форме

Существует достаточно подробная классификация составных частей теории игр. Одним из самых общих критериев такой классификации является деление теории игр на теорию некооперативных игр, в которых субъектами принятия решений являются собственно индивиды, и теорию кооперативных игр, в которых субъектами принятия решений являются группы, или коалиции индивидов.

Некооперативные игры обычно представляются в нормальной (стратегической) и развернутой (экстенсивной) формах.

Воробьев Η. Н. Теория игр для экоиомистов-кибериетиков. М.: Наука, 1985.
Вентцель Е. С. Исследование операций. М.: Наука, 1980.

В практической деятельности часто приходится принимать решения в условиях противодействия другой стороны, которая может преследовать противоположные или иные цели, препятствовать теми или иными действиями или состояниями внешней среды достижению намеченной цели. Причем, эти воздействия противоположной стороны могут носить пассивный или активный характер. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны, ответные действия и их возможные последствия.

Возможные варианты поведения обеих сторон и их исходов для каждого сочетания вариантов и состояний часто представляют в видематематической модели,которую называют игрой .

Если в качестве противодействующей стороны выступает неактивная, пассивная сторона, которая сознательно не противодействует достижению намеченной цели, то такую игру называют игрой с «природой». Под природой понимают обычно совокупность обстоятельств, в которых приходится принимать решения (неясность погодных условий, неизвестность поведения клиентов в коммерческой деятельности, неопределенность реакции населения на новые виды товаров и услуг и т. д.)

В других ситуациях противоположная сторона активно, сознательно противостоит достижению намеченной цели. В подобных случаях происходит столкновение противоположных интересов, мнений, идей. Такие ситуации называются конфликтными , а принятие решений в конфликтной ситуации затрудняется из-за неопределенности поведения противника. Известно, что противник сознательно стремится предпринять наименее выгодные для вас действия, чтобы обеспечить себе наибольший успех. Неизвестно, в какой мере противник умеет оценить обстановку и возможные последствия, как он оценивает ваши возможности и намерения. Обе стороны не могут предсказать взаимные действия. Несмотря на такую неопределенность, принимать решение приходится каждой стороне конфликта

В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом и т. д. Во всех этих примерах конфликтная ситуация порождается различием интересов партнеров и стремлением каждого из них принимать оптимальные решения. При этом каждому приходится считаться не только со своими целями, но и с целями партнера и учитывать неизвестные заранее его возможные действия.

Необходимость обоснования оптимальных решений в конфликтных ситуациях привела к возникновению теории игр.

Теория игр - это математическая теория конфликтных ситуаций . Исходными положениями этой теории являются предположение о полной «идеальной» разумности противника и принятие при разрешении конфликта наиболее осторожного решения.

Конфликтующие стороны называются игроками , одна реализация игры – партией , исход игры – выигрышем или проигрышем . Любое возможное для игрока действие (в рамках заданных правил игры) называется его стратегией .

Смысл игры состоит в том, что каждый из игроков в рамках заданных правил игры стремится применить оптимальную для него стратегию, то есть стратегию, которая приведет к наилучшему для него исходу. Одним из принципов оптимального (целесообразного) поведения является достижение равновесной ситуации, в нарушении которой не заинтересован ни один из игроков.

Именно ситуация равновесия может быть предметом устойчивых договоров между игроками. Кроме того, ситуации равновесия являются выгодными для каждого игрока: в равновесной ситуации каждый игрок получает наибольший выигрыш, в той мере, в какой это от него зависит.

Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, называются игроками.

Для каждой формализованной игры вводятся правила. В общем случае правилами игры устанавливаются варианты действий игроков; объем информации каждого игрока о поведении партнеров; выигрыш, к которому приводит каждая совокупность действий.

Развитие игры во времени происходит последовательно, по этапам или ходам. Ходом в теории игр называют выбор одного из предусмотренных правилами игры действия и его реализацию. Ходы бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление. Случайным ходом называют выбор, осуществляемый не волевым решением игрока, а каким-либо механизмом случайного выбора (бросание монеты, пасовка, сдача карт и т. д.).

Комбинированные игры, в которых правила дают в принципе возможность каждому игроку проанализировать все разнообразные варианты своего поведения и, сравнив эти варианты, избрать тот из них, который ведет к наилучшему для этого игрока исходу. Неопределенность исхода связана обычно с тем, что количество возможных вариантов поведения (ходов) слишком велико и игрок практически не в состоянии их всех перебрать и проанализировать.

Азартные игры , в которых исход оказывается неопределенным в силу влияния различных случайных факторов. Азартные игры состоят только из случайных ходов, при анализе которых применяется теория вероятностей. Азартными играми математическая теория игр не занимается.

Стратегические игры , в которых полная неопределенность выбора обоснована тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры, причем незнание игрока о поведении и намерениях партнеров носит принципиальный характер, так как отсутствует информация о последующих действиях противника (партнера).

Существуют игры, сочетающие в себе свойства комбинированных и азартных игр, стратегичность игр может сочетаться с комбинаторностью и т. д.

В зависимости от числа участников игры подразделяются на парные и множественные. В парной игре число участников равно двум, во множественной игре число участников более двух. Участники множественной игры могут образовывать коалиции. В этом случае игры называют коалиционными . Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.

Одним из основных понятий теории игр является стратегия. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш или минимально возможный проигрыш независимо от поведения противника.

Игра называется конечной , если число стратегий игроков конечно, и бесконечной , если хотя бы у одного из игроков число стратегий является бесконечным.

В многоходовых задачах теории игр понятия «стратегия» и «вариант возможных действий» существенно отличаются друг от друга. В простых (одноходовых) игровых задачах, когда в каждой партии игры каждый игрок может сделать по одному ходу, эти понятия совпадают, а, следовательно, совокупность стратегий игрока охватывает все возможные действия, которые он может предпринять в любой возможной ситуации и при любой возможной фактической информации.

Различают игры и по сумме выигрыша. Игра называется игрой с нулевой суммо й , если каждый игрок выигрывает за счет других, а сумма выигрыша одной стороны равна сумме проигрыша другой. В парной игре с нулевой суммой интересы игроков прямо противоположны. Парная игра с нулевой суммой называется антагонистической игрой .

Игры, в которых выигрыш одного игрока и проигрыш другого не равны между собой, называются играми с ненулевой суммой .

Существует два способа описания игр: позиционный и нормальный . Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функции . Платежная функция в игре определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон.

В качестве примеров применения теории игр в экономике можно назвать решения по поводу проведения принципиальной ценовой политики, вступления на новые рынки, кооперации и создания совместных предприятий, определения лидеров и исполнителей в области инноваций, вертикальной интеграции и т.д.

Рассмотрим двух гигантов, конкурирующих на рынке производства пассажирских самолетов: «Боинг» и «Эйрбас». Предельные издержки производства самолетов одинаковы у каждой компании и равны 10 млн. долларов за штуку.

Рыночный спрос на самолёты показан в таблице 1.

Таблица 1 – Рыночный спрос на самолёты

В таблице 2 приведена прибыль конкурентов, если они договорятся о разделе рынка пополам.

Таблица 2 – Прибыль компаний «Боинг» и «Эйрбас» в случае раздела рынка

Продолжение таблицы 2

Прибыль участников будет максимальна, если они оба произведут по 45 самолетов (вместе 90) и равна в этом случае 2025 млн. долл. Эта точка является Парето-оптимумом, то есть в ней состояние одного участника нельзя улучшить без ухудшения состояния другого.

Каждый из участников может думать следующим образом:

Если я произвожу 45 самолетов и мой конкурент производит 45 самолетов, то наша общая прибыль будет максимальной, и я получу половину от максимальной общей прибыли. Однако что мешает мне произвести не 45, а 55 самолетов? В этом случае, если мой конкурент не предпримет ответных действий, общий объем продаж вырастет до 100, цена упадет до 50, а получу выручку 55∙50=2750 и прибыль 2750-550=2200. Тогда прибыль моего конкурента составит 50∙45-10∙45=1800.

Точно также может думать и другой участник, и в таком случае они оба произведут по 55 самолетов. В этом случае общий объём продаж вырастет до 110, цена упадет до 45, общая прибыль будет равна 1925, и каждый из участников получит прибыль 1925.

Игра этой ситуации описывается следующей матрицей выигрышей рисунок 4.

	Боинг
Произвести 45	Произвести 55
Эйрбас	Произвести 45	(2025;2025)	(2200;1800)
Произвести 55	(1800;2200)	(1925;1925)

Рисунок 4 – Матрица выигрышей для компаний «Боинг» и «Эйрбас»

Первое значение в скобках означает прибыль Боинга, второе – прибыль Эйрбаса.

Если между участниками не заключено договоренностей, то каждый из них имеет стимулы произвести 55, а не 45 штук, чтобы увеличить свою прибыль. В этом случае производство 55 штук является доминирующей стратегий для каждого участника. Нэш-равновесие устанавливается в ситуации, когда они оба производят по 55 штук и получают прибыль в размере 1925 млн. долл. Это равновесие не является Парето-оптимальным.

Данная ситуация показывает, как эгоистические интересы каждого из участников мешают им достигнуть оптимального значения прибыли.

Рассмотрим пример «доминирующей стратегии», в котором одним из участников принимается решение относительно проникновения на новый рынок. Возьмем предприятие, которое выступает в качестве монополиста на каком-либо рынке. Другое предприятие обдумывает вопрос о проникновении на рынок. Компания-аутсайдер может принять решение о вступлении или невступлении на рынок. Компания-монополист может отреагировать на появление нового конкурента агрессивно или дружественно. Оба предприятия вступают в двухэтапную игру, в которой первый ход делает компания-аутсайдер. Игровая ситуация с указанием платежей показана в виде дерева на рисунке 3.

Рисунок 3 – Решение о проникновении на рынок

Та же самая игровая ситуация может быть представлена и в нормальной форме (рисунок 4). Здесь обозначены два состояния – «вступление – дружественная реакция» и «невступление – агрессивная реакция». Очевидно, что второе равновесие несостоятельно. Из развернутой формы следует, что для уже закрепившейся на рынке компании нецелесообразно реагировать агрессивно на появление нового конкурента: при агрессивном поведении теперешний монополист получает 1(платеж), а при дружественном – 3. Компания-аутсайдер к тому же знает, что для монополиста не рационально начинать действия по ее вытеснению, и поэтому она принимает решение о вступлении на рынок. Грозившие потери в размере (-1) компания-аутсайдер не понесет.

Рисунок 4 – Нормальная форма игры, предметом которой является проникновение на рынок

Первое значение в скобках означает прибыль компании-монополиста, второе – прибыль компании-аутсайдера.

Подобное рациональное равновесие характерно для «частично усовершенствованной» игры, которая заведомо исключает абсурдные ходы. Такие равновесные состояния на практике в принципе довольно просто найти. Равновесные конфигурации могут быть выявлены с помощью специального алгоритма из области исследования операций для любой конечной игры. Игрок, принимающий решение, поступает следующим образом: вначале делается выбор «лучшего» хода на последнем этапе игры, затем выбирается «лучший» ход на предшествующем этапе с учетом выбора на последнем этапе и так далее, до тех пор пока не будет достигнут начальный узел дерева игры.

Компаниям полезно в эксплицитном виде обдумывать возможные реакции партнеров по игре. Изолированные хозяйственные расчеты, даже опирающиеся на теорию принятия решений, часто носят, как в изложенной ситуации, ограниченный характер. Так, компания-аутсайдер могла бы и выбрать ход «невступление», если бы предварительный анализ убедил ее в том, что проникновение на рынок вызовет агрессивную реакцию монополиста. В этом случае в соответствии с критерием ожидаемой стоимости разумно выбрать ход «невступление» при вероятности агрессивного ответа 0,5.

Эти знания можно использовать в практике предприятий, чтобы помочь двум фирмам достичь ситуации «выигрыш – выигрыш». Сегодня консультанты с подготовкой в области игр быстро и однозначно выявляют возможности, которыми предприятия могут воспользоваться для заключения стабильных и долгосрочных договоров с клиентами, субпоставщиками, партнерами по разработкам и т.п.

Практическая часть

Швейное предприятие реализуется свою продукцию через магазин. Сбыт зависит от состояния погоды. В условиях теплой погоды предприятие реализует a костюмов и b платьев, а при прохладной погоде - c костюмов и d платьев. Затраты на изготовление одного костюма равны α 0 , а платья – β 0 рублям, цена реализации соответственно равна α 1 рублей и β 1 рублей. Определить оптимальную стратегию предприятия.

a=1000, b=2300, c=1400, d=700,

α 0 =20, β 0 =5, α 1 =40, β 1 =12.

Составим математическую модель задачи. В связи с возможными состояниями спроса фирма располагает двумя стратегиями.

1. F 1 = (1000, 2300) – произвести 1000 костюмов и 2300 платьев,

2. F 2 = (1400, 700) – произвести 1400 костюмов и 700 платьев.

Природа (рынок) располагает также двумя стратегиями:

1. D 1 = погода теплая,

2. D 2 = погода прохладная.

Если фирма примет стратегию F 1 и спрос действительно будет находиться в первом состоянии, то есть погода будет теплой (D 1), то выпущенная продукция будет полностью реализована и доход составит w 11 =1000∙(40-20) + 2300∙(12-5) = 36100.

Если фирма примет стратегию F 1 , а спрос будет находиться в состоянии D 2 (погода прохладная), то платья будут реализованы лишь частично, и доход составит: w 12 = 1000∙(40-20) + 700∙(12-5) – (2300-700)∙5= 16900.

Аналогично, если фирма выберет стратегию F 2 , а природа – стратегию D 1 (погода теплая), то доход составит (будут недораспроданы костюмы):

w 21 =1000∙(40-20) + 700∙(12-5) – (1400-1000)∙20= 16900, а если природа выберет стратегию D 2 , то

w 22 = 1400∙(40-20) + 700∙(12-5) = 32900.

Рассматривая фирму и природу в качестве двух игроков, получим платежную матрицу игры

которая будет служить игровой моделью задачи.

Поскольку максиминная стратегия игры составляет a = max (16900, 16900) = =16900, а минимаксная b = min (36100, 3290) = 32900, то цена игры лежит в диапазоне

16900 ден. ед. < ν < 32900 ден. ед.

Решим данную игру аналитическим методом. Средний выигрыш первого игрока, если он использует оптимальную смешанную стратегию xʹ=(x 1 ʹ,x 2 ʹ), а второй игрок – чистую стратегию, соответствующую первому столбцу платежной матрицы, равен цене игры ν:

36100∙x 1 ʹ+16900∙x 2 ʹ= ν.

Тот же средний выигрыш получает первый игрок, если второй игрок применяет стратегию, соответствующую второму столбцу платежной матрицы, то есть

16900∙x 1 ʹ+32900∙x 2 ʹ=ν.

Учитывая, что x 1 ʹ+x 2 ʹ=1, получаем систему уравнений для определения оптимальной стратегии первого игрока и цены игры:

Решаем эту систему и находим:

Оптимальная стратегия фирмы:

Таким образом, фирме оптимально произвести 1218 костюмов и 1427 платьев.

Количество возможных стратегий Получателя - 5, Плательщика - 4. Величины платежа образуют таблицу.

Требуется найти наиболее выгодную чистую стратегию первого игрока, выбирающего строку (Получателя).

1. В каждой строке найдем минимальное значение

2. Из полученных значений возьмем максимальное, то есть вычислим максимин

Найденное значение реализуется при выборе последней (пятой) стратегии А5 Получателя.

Ответ: наиболее выгодной для Получателя (при однократной игре) является стратегия А5, так как при любом выборе Плательщиком его стратегии величина платежа составит а = 3 или больше.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Интрилигатор, М. Математические методы оптимизации и экономическая теория: Учебное пособие/ М. Интрилигатор. – М.: Айрис - пресс, 2002. – 576 с.

2. Баканов, М.И. Теория экономического анализа: Учебное пособие/ М.И. Баканов, М.В. Мельник, А.Д. Шеремет. – 5-е изд., доп. и перераб. – М: Финансы и статистика, 2008. – 536 с.

3. Моргенштерн, О. Теория игр и экономическое поведение / О. Моргенштерн, Дж. фон Нейман. – М.: Книга по Требованию, 2012. – 708 с.

4. Замков, О.О. Математические методы в экономике: Учебное пособие/ О.О. Замков, А.В. Толстопятенко, Ю.Н. Черемных; под общ. ред. А.В. Сидоровича. – 3-е изд., перераб. – М.: Издательство «Дело и Сервис», 2001. – 368 с.

5. Васин, А.А. Введение в теорию игр с приложениями к экономике: Учебное пособие/ А.А. Васин, В.В. Морозов. − М.: 2003. − 278 с.

6. Волков, И.К. Исследование операций: Учебник для вузов / И.К. Волков, Е.А. Загоруйко; под ред. B.C. Зарубина, А.П. Крищенко. − М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. – 436 с.

7. Писарук, Н. Н. Введение в теорию игр: Учебное пособие / Н.Н. Писарук. − Минск: БГУ, 2015. – 256 c.

©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-20