Wheatley Labs: 2012

Постановка проблемы
Существует наивная догадка, проверка которой могла бы стать интересным занятием.
Состоит она в том, что в играх с полной информацией наилучшей стратегией является поступать так, как будто все игроки уже заранее договорились о совместных действиях. Источником вдохновения послужила попытка двух студентов встретится "в центре, после пар" при севшем у одного из них мобильнике.

Анализ последних исследований и публикаций

Результаты моей работы в некоторой степени схожи с результатами применения концепции суперрациональности Хофштадтера. Тем не менее мою работу отличает то, что в ней использована исключительно традиционная концепция рациональности.

Цель статьи
Цель этой статьи - рассмотреть некоторые вопросы сотрудничества с привлечением математического аппарата теории игр

Материалы и результаты
исследования

Основная гипотеза моей работы:
В любой игре с полной информацией и ненулевым исходом двух и более игроков для каждого из игроков существует и являются доминирующей такая стратегия, что её использование каждым из игроков приводит к Парето-оптимальному набору выигрышей и равновесному по Нэшу исходу игры.

Для удобства я называю её условно-сотрудничающей.

Доказательство

Я предположил, что:
Для всякой некоалиционной игры с полной информацией и ненулевой суммой для двух и более лиц возможно нахождение для каждого из игроков такой условной стратегии S_x[c], что удовлетворяет следующим условиям:
а) Состояние, когда она используется каждым игроком является равновесным по Нэшу состоянием игры
б) Итоговый набор выигрышей при использовании стратегии S_x[c] каждым из игроков оптимален по Парэто
в) Она является домининирующей стратегией среди всего набора стратегий S_x

Зададим стратегию S_x[c]:
S_y[c] >= S_y[i] → S_x[ca]
{
!(S_y[c] >= S_y[i]) → S_x[cb]

Зададим стратегию S_x[ca]:
S_x[ca] это такая стратегия, что совершает ход так, что если она используется всеми игроками, то результирующий исход совпадает с таковым, если бы все игроки входили в одну коалицию действия. Стратегия S_x[ca] может быть смешанной.

Определим S_x[cb] как доминирующую стратегию среди множества стратегий S_x/(S_x[c])

Поскольку для любого из игроков исход от всеобщего использования стратегии S_x[c] предпочтительнее или равноценен матожиданию исхода в противном случае,а стратегия S_x[cb], исползуемая в случае, если не все игроки используют аналогичню стратегию, по определению доминирует все остальные стратегии, не считая включающей её S_x[c] я могу утверждать, что стратегия S_x[c] является доминирующей среди набора стратегий S_x.

Поскольку стратегия S_x[c] является доминирующей для любого x — её использование всеми игроками является равновесным по Нэшу.

Поскольку в случае её использования каждым игроком она приводит к Парето-оптимальному исходу и она доминирует для каждого игрока, а её использование каждым игроком является равновесным по Нэшу, то итоговый набор выигрышей будет Парето-оптимальным.

Легенда
x – некий игрок
y – любой другой игрок
S_x – набор стратегий игрока x
S_x[a] – стратегия a игрока x
S_x[c] – условно-сотрудничающая стратегия игрока x
S_x[ca] – сотрудничающая подстратегия стратегии S_x[c] игрока x
S_x[cb] – несотрудничающая подстратегия стратегии S_x[c] игрока x
[i] – любая другая стратегия, кроме [c], [ca] и [cb]

Эксперементальная проверка
Стратегия «око за око», примененная Анатолием Рапопортом на чемпионате по Повторяющейся Дилемме Заключенных является практической реализацией в конкретном случае идеи об условно-сотрудничающей стратегии. Эта стратегия в различных вариациях является наиболее эффективной стратегией на чемпионате по ПДЗ не требующей участия более чем одним игроком.

В реальности
Можно предположить, что вне зависимости от осознания этого факта условно-сотрудничающей стратегией пользуются и обычные люди. Результаты исследования Гронингенского университета говорят, что некоторая доля населения в вопросе поддержания общественного порядка склонна соблюдать порядок лишь до тех пор, пока так делают другие. То есть использовать не альтруистическую и не безусловно-эгоистическую, а условно-сотрудничающую стратегию.

Например
Бонни и Клайд снова попали к следователю. В этот раз их подозревают предумышленном шатании государственной галеры на деньги иностранной разведки. Прошлая отсидка повлияла на них благотворно и теперь они заранее провели исследования в области теории игр. Следователь, изучив опыт своего коллеги, ведшего их предыдущее дело, решил поступить так-же. Он рассадил их в камеры разные камеры, без возможности переговорить друг с другом, и рассказал каждому из них, что каждый может сдать своего подельника, причем если подельник промолчит, то сдавшего выпустят на свободу, а подельник получит десять лет трудового лагеря. Если они оба признаются, то получат по пять лет лагерей, а если оба промолчат, то выпустят.

Следователь думал, что каждому из заключенных выгодно будет сдать своего подельника, но сидя в тюрьме каждый из них рассуждал так: «Я помню, что я выиграю больше всего, если буду следовать условно-сотрудничающей стратегии. Окей, если верить стратегии, то мне нужно сейчас узнать, наиболее ли выгодна эта стратегия для моего товарища. Она оптимальна для нас обоих, а значит, я, как и он, теперь должны молчать».
Время шло, ни Бонни, ни Клайд не проронили ни слова и следователю пришлось их выпустить.

А всё потому, что Бонни и Клайд придумывали новый способ уйти от ответственности, следователь всего-лишь перечитывал старые отчеты :)
Перспективы
Доказательство теоремы об условно-сотрудничающей стратегиии может стать теоретическим обоснованием для стратегии «око за око» на чемпионате по повторяющейся дилемме заключенных.
В экономике она может найти обширнейшее применение во всех «теория разбития окон»-подобных ситуациях.
С точки зрения философии она является математической формулировкой золотого правила нравственности: «Поступайте по отношению к другим так, как вы хотели бы, чтобы другие поступали по отношению к вам».

Выводы
Я в своей работе выдвинул и доказал теорему об условно-сотрудничающей стратегии.

Ссылки
Douglas Hofstadter – Metamagical Themas
http://www.nhoj.info/library/Hofstadter%20-%20Metamagical%20Themas.pdf

Kees Keizer, Siegwart Lindenberg, Linda Steg - The Spreading of Disorder
http://www.sciencemag.org/content/322/5908/1681.abstract

Wheatley Labs

понеділок, 12 березня 2012 р.

Условно-сотрудничающая стратегя

неділя, 11 березня 2012 р.

понеділок, 12 березня 2012 р.

Условно-сотрудничающая стратегя

неділя, 11 березня 2012 р.

понеділок, 12 березня 2012 р.

неділя, 11 березня 2012 р.