Non-fiction

Теория игр и все-все-все0

Евгений Майбурд, Семь искусств, №7 • 31.07.2012

Однажды Винни Пух с Пятачком пошли вместе охотиться на Слонопотама. Вырыли яму-ловушку, а в качестве приманки положили на дно горшок с медом. Ночью, однако, медвежонок почувствовал, что ему чего-то очень не хватает. Уговорив себя, что он только оближет немного меда, он пошел к яме и... съел всю приманку. Естественно, Слонопотам не явился к ловушке. В терминах теории игр, Винни Пух выбрал стратегию предать свою команду ради собственной выгоды и этим лишил всех игроков коллективного блага.

В 1944 г. вышла книга «Теория игр и экономическое поведение».[1] Ее написали двое: математик Джон фон Нейман и экономист Оскар Моргенштерн. Истоки идей фон Неймана прослеживаются еще в его статье «К теории салонных игр» (1928, на немецком). Однако задним числом историки науки находят элементы теоретико-игрового подхода уже в теории дуополии Огюстена Курно[2].

Идею подсказала фон Нейману игра в покер, которой он иногда отдавал свое время отдыха. Сообщают, что он не был особо хорошим игроком. Как видим, однако, никому из тех, кто его обыгрывал, идея в голову не пришла.

Покер отличается от многих других игр тем, что игроку приходится делать догадки о том, как другие игроки реагируют на его поведение, а также блефовать – стараться обмануть соперников относительно своих намерений в игре. То же самое относится и к каждому из соперников.

Книга была предназначена для математиков и экономистов. «Большинство экономистов ее не читали (и никогда не прочитают), - пишет Паундстоун. – Ее даже нет в библиотеках многих экономических вузов. В одном рекламном объявлении было сказано, что несколько экземпляров купили профессиональные игроки».[3] Интересно, пригодилась ли им такая «теория игр»?..

Книга эта – больше полутысячи (в английском издании, а в русском – почти тысяча) страниц, заполненных математическими формулами. Читать ее непросто. Но ведь нынешних экономистов математикой не удивишь, почему же данная теория экономического поведения не стала элементом стандартного экономического анализа?

Об этом потом. Начнем с того, что теория игр не учит, как выигрывать и даже как играть в реальные игры. Игра в теории игр – это конфликт рациональных индивидов, не доверяющих друг другу. Вернее, это схема конфликта с набором заданных «очков». Очки зависят от того, какие ходы делает игрок (примерно, как у боксеров). Возможные ходы известны наперед и называются они стратегиями. Если игра многоходовая, то стратегией называют набор последовательных ходов. Так что иногда говорят о теории стратегических игр.

Фактически, эта теория есть анализ конфликтных ситуаций различного рода. Теория игр есть, в определенном смысле, раздел математической логики.

Ходы известны наперед? Где же конфликт?

У каждого участника есть выбор из нескольких возможных стратегий, каждая из которых приносит ему какие-то очки. Здесь и заложен конфликт, потому что участники, зная наперед все доступные другим стратегии, не знают заранее, кто из соперников какую именно стратегию выберет.

Выигрыш одного из участников зависит от выбора других. А выбор каждого из них зависит от выбранной им стратегии. Он строит предположения о выбранных партнерами стратегиях, но может ошибиться. Более рискованная для него стратегия обещает больше очков в случае успеха, но зато в случае неуспеха он теряет очки. И так – для всех участников игры. Ее результат определяется всеми сделанными выборами.

Известно, что фон Нейман считал свою теорию неприложимой к шахматам. Потому что теоретически, для каждой позиции в шахматной игре у каждого из игроков не только существует одна наилучшая стратегия, но она в принципе может быть просчитана обоими. Здесь нет места гаданию о том, каков будет ход противника, и нет места обману и блефу.

Общий итог выигрышей и проигрышей называется суммой игры. Если выигрыш одной стороны в точности равен проигрышу другой, имеем игру с нулевой суммой. Примеры салонных игр с нулевой суммой в реальной жизни - преферанс, покер, бридж. Когда выигрыш превышает проигрыш, имеем игру с ненулевой (положительной) суммой. В реальной жизни примером такой игры выступает взаимовыгодный обмен между лицами или странами.

Игроков может быть двое или больше. При этом, игроком (лицом) считаться может и группа, если она выступает как команда. Игра двух лиц с нулевой суммой называется антагонистической. При числе участников больше двух есть два класса игр. В одном допускаются стратегии вступать в коалицию. Это есть кооперативная игра (такие вещи допускаются, например, в преферансе, когда двое спасовавших открывают карты и объединяются против того, кто взял игру на себя). Во втором случае перед нами некооперативная игра (каждый только за себя, как обычно, хотя и не всегда, в покере[4]).

В спортивных командных играх (футбол, хоккей...) обычно важны многие показатели (соотношение мячей, число только забитых...) – ввиду прицела на конечные результаты турнира. Но если взять изолированно один матч (что почти нереально), то важен здесь только выигрыш или проигрыш. Один выигрывает, другой проигрывает – игра с нулевой суммой. Если учитывать очки, тогда это игра с положительной суммой (1 + 0 или ½ + ½). Турнир (чемпионат) – игра с положительной суммой.

Джон фон Нейман смолоду был признан математическим гением.[5] Его называют одним из величайших математиков. Теория игр поначалу, скорее, была его хобби. Но в итоге он увидел в ней возможность анализа реальных конфликтов жизни и мира – таких, как гонка вооружений или варианты внезапной ядерной атаки.

Джон фон Нейман

Он скоро понял, что теория игр дает возможность анализировать реальные дилеммы (в том числе, этического порядка), выявлять их логическую структуру и пытаться найти наилучшее решение.

В дальнейшем фон Нейман основное внимание посвятил изучению кооперативных игр (с числом игроков больше двух). Когда, например, кооперация является лучшей стратегией, чем стратегии «каждый за себя»?

Смысл кооперативных игр, которыми занимался фон Нейман, в предположении, что рациональные игроки будут стремиться вступать в групповые коалиции, если только увидят в этом свою выгоду. В таком подходе есть большой смысл, как показывает экономическая практика. Примерами служат торги, предшествующие заключению коллективного договора, сговоры фирм той или иной отрасли с целью поддержать цены, а также коалиции организованных интересов. Разнообразные, свободно формируемые самими людьми, коалиции – непременный атрибут свободного предпринимательства и, шире, свободного общества. Единственный тип некооперативных игр, рассматривавшийся фон Нейманом, это антагонистические игры, где один непременно выигрывает, а другой столько же проигрывает. Именно для такого случая он доказал теорему о минимаксе.

Минимакс есть наилучшее решение антагонистической игры. Это такое решение, когда максимальный проигрыш одного из игроков – минимален из всех возможных, а минимальный выигрыш другого – максимален из всех возможных.

Напомним, что выигрыш одного равен проигрышу другого.

Поскольку каждый из игроков стремится максимизировать свою выгоду или минимизировать потерю, равновесие достигается в точке минимакса, или, что то же самое, в седловой точке. Преследование свой выгоды каждым игроком, не доверяющим партнеру, ведет обоих к равновесию минимакса.

Джон Нэш и его Равновесие

Он признан второй звездой после фон Неймана. Родился в 1928 г., изучал математику в Принстоне и скоро проявил интерес к теории игр. В своей диссертации (1950) двадцатидвухлетний Нэш сформулировал понятие, которому суждено было изменить теорию игр.

Говорят, что если бы Нэш получал по доллару за каждое, где бы то ни было, упоминание о «равновесии Нэша», он бы стал миллионером. Так или иначе, он скоро стал профессором в Массачусетском Технологическом Институте и одновременно консультантом в РЭНД.[6]

Предметом исследований Нэш сделал сначала игру двух лиц с ненулевой суммой, а затем некооперативные игры с числом участников больше двух. Нэш не только выдвинул понятие о равновесии в подобных ситуациях, он тогда же доказал, что оно существует для всех конечных игр с любым числом игроков. До того существование равновесия было доказано (фон Нейманом) только для игры двух лиц с нулевой суммой.

В 1994 г. Джон Нэш получил Нобелевскую премию по экономике. Вместе с ним удостоены были Джон Харсаньи и Райнхард Селтен. Интересно звучит объяснение Нобелевского комитета, кому за какие достижения дана награда. Харсаньи – за распространение Равновесия Нэша на широкий класс игр с неполной информацией, когда игроки не обязательно знают предпочтения своих партнеров и лучшие варианты их выбора. Селтену награда дана за обогащение этого равновесия. Чтобы советовать совершенно рациональным игрокам наилучшие стратегии, требования Равновесия Нэша необходимы, но не достаточны - могут существовать дополнительные равновесия, которые, однако, можно изъять из рассмотрения путем предложенной Селтеном процедуры усовершенствования.

Как видим, все трое получили премию за работы, связанные с Равновесием Нэша! Что же это такое?

Равновесие Нэша есть ситуация, в которой ни один из игроков не может улучшить свое положение, изменив свою стратегию односторонне, без изменения стратегий другими игроками.

Предполагается, что каждый игрок знает, какие стратегии доступны другим. Говоря иначе, Равновесие Нэша – это ситуация, когда каждый выбирает лучшую для себя стратегию (принимает решение) с учетом решений, принимаемых другими игроками. Эта совокупность стратегий может выдержать «тест оглашения»: если все игроки огласят свои стратегии одновременно, наверняка ни один не захочет пересмотреть свою стратегию. Тогда и выходит, что любая попытка какого-то игрока изменить свою стратегию в одностороннем порядке (когда никто больше не меняет свою) может только ухудшить его результат. В этом – залог устойчивости Равновесия Нэша.

Джон Форбс Нэш

Равновесие Нэша есть самовыполняющееся соглашение. То есть, явное или неявное соглашение, которое - будучи достигнуто игроками, - не нуждается во внешних силах, чтобы провести его в жизнь и поддерживать. Ибо в лучших интересах каждого следовать ему, когда ему следуют все другие. И в этом находят объяснение различия между играми кооперативными и некооперативными. Первые – это такие, которые могут нуждаться во внешнем инфорсменте (например, через суд). Вторые такого не требуют, так как устойчивым является только соглашение, отвечающее равновесию.

Одним из случаев равновесия Нэша является ситуация, когда «всем плохо». Положение каждого игрока могло бы стать лучше, и для всех игроков было бы выгоднее, если бы все изменили свои стратегии. Но для этого необходимо сотрудничество, недостижимое оттого, что игроки не хотят кооперироваться - не доверяют друг другу или по иным причинам. Понятно, что односторонняя попытка одного из игроков изменить свое положение либо невозможна, либо лишь еще ухудшит его.

Хорошим примером такой ситуации может служить один американский фильм.[7] Двое подонков терроризируют пассажиров в вагоне метро. И никто не осмеливается выступить против них. Если кто-то начинает протестовать, все кончается его унижением, и он бессильно замолкает при всеобщем молчании. Совместным выступлением всех или большинства пассажиров можно бы обуздать хулиганов и даже выгнать их из вагона на ближайшей станции, но взаимное недоверие предотвращало кооперацию.

Равновесие Нэша нашло, говорят, много применений в экономике, социологии, экологии, биологии – отчасти потому, что оно может быть истолковано множеством различных способов.

Понятие Равновесия Нэша обладает еще одним интересным свойством. Оно позволяет понять ситуации, когда для игроков оказывается «выгоднее», то есть, предпочтительнее, не вступать в коалиции, или когда мотивации одного какого-то игрока вступают друг с другом в противоречие, подчас непримиримое. Ситуации последнего рода образуют класс, который называют социальными дилеммами. Самой известной из таких ситуаций является «дилемма заключенного».

Дилеммы

Ты, твоя мать и твоя жена захвачены сумасшедшим изобретателем. Вас троих развели по комнатам и каждого наглухо привязали к креслу. Перед тобой какая-то несусветная машина и кнопка, которую ты можешь достать. Злодей объявляет тебе, что на твою мать и на твою жену направлены дула пулеметов. Если ты нажмешь кнопку, твоя мать будет убита. Если не нажмешь в течение минуты, убита будет твоя жена. Что делать?

Сцена напоминает какой-нибудь голливудский фильм. Невольно ожидаешь, что вот-вот появится великолепный детектив, который давно охотится за этим маньяком. Но избавление не есть решение моральной проблемы.

Мы знаем, что похожие дилеммы нередко возникали перед евреями, которые скрывались от нацистов. Кого спасти, кем пожертвовать? Здесь нет наилучшей стратегии, есть только личный выбор трагедии.

Можно представить более сложную дилемму. Вас только двое – ты и близкий человек (жена, мать, сын или дочь...). Вас обоих тоже захватили, развели по комнатам и связали. Но теперь перед каждым есть кнопка. Объявляют, что если никто из вас не нажмет кнопку, убиты будете оба. Если же один из вас нажмет, то будет убит, но спасет другого. Времени на размышление – минута, связь между комнатами отсутствует, и перед каждым – синхронные часы. Ну, и что делать?

Дилемма разрешается просто, если оба решат одинаково (или когда-то заранее решили), кому умереть и кому жить. Тогда один нажимает кнопку, жертвуя собой и спасая другого. Второй вариант – каждый решит спасти другого. Тогда все решается тем, кто первым успеет нажать кнопку. Третий вариант – если каждый хочет остаться в живых. И вот, часы отсчитывают минуты, но кнопку никто не нажимает...

Ты сидишь, ты пытаешься представить, что творится в душе твоей матери (жены, дочери) Может, она собирается с силами, чтобы решиться нажать кнопку... Но минуты бегут, ничего не происходит... А самому ох как трудно отважиться на подвиг... Но ты размышляешь... Может, мать (жена, дочь...) там в полуобмороке? Себя не спасти в любом случае, так не лучше ли нажать самому?.. Но можно хотя бы подождать до последней минуты... секунды... И если нет, тогда...

Тот тип сказал, что часы синхронизированы с машиной, но мало ли, что скажет маньяк... Так что, если ты решился, тогда нажать кнопку нужно не на самой последней секунде, а на... предпоследней, что ли? Но если вдруг близкое существо тоже ждет до последних секунд?

Тут все решит реакция человека и... реальная точность часов... Может произойти одновременное нажатие обеих кнопок – и никто не выживет... Или оба могут не успеть на последней секунде, и тогда тоже никто не выживет. Или же кто-то успевает нажать первым... Рационального решения дилеммы не существует, все решает случай.

Искусственно сконструированная ситуация? Да как сказать. Довольно схожая ситуация была в начале 50-х годов между США и СССР, когда обе страны обзавелись ядерным оружием. Понятно, о взаимной любви речи нет. Зато есть стопроцентное взаимное недоверие и полная неопределенность относительно реальных планов противной стороны. Особенно, с началом Корейской войны... Что делать? Ждать удара, чтобы затем отомстить? Или ударить первым с риском получить симметричный ответ?..

Известно, что в США прорабатывались всевозможные варианты и оценки, в том числе на моделях теории игр. Этим плотно занимались математики в РЭНД-корпорации. Наверняка и в СССР пытались что-то рассчитать и предугадать, хотя подробностей мы не знаем. Зато известно, что нанесения превентивного ядерного удара по СССР активно и шумно требовал тогда Бертран Рассел, будущий «борец за мир». Такого же мнения были и иные политики в Америке. А также Джон фон Нейман, часто бывавший в РЭНД.

К счастью, было отличие от описанной выше условной дилеммы. Состояло оно в том, что при взаимном «ничего-не-делаю» обе стороны оставались гарантированно невредимыми. Однако, рассчитать вероятность такой стратегии со стороны противника было практически невозможно.

Хотя какой-то шанс на взаимную сдержанность был. Равновесие страха. Можно ли назвать его Равновесием Нэша? Похоже, но не совсем, потому что каждой стороне не известно, какую стратегию выбирает другая. В той ситуации решающее, по-видимому, значение имела интуиция президента Трумэна, не согласного на превентивный удар. А Сталин? Может, у него была какая-то информация о настроении Трумэна? Вообще-то последнее и не составляло особого секрета...

Подобные дилеммы изучаются в теории игр. Одна из моделей игры двух лиц, придуманная в РЭНД, приобрела широчайшую известность. Получившая название дилемма заключенного, она гораздо больше подходила к ситуации гонки вооружений и оценки целесообразности превентивной войны, чем описанные выше дилеммы.

Дилемма заключенного

Совершен грабеж. Арестованы двое уголовников, Том и Джерри. Имеются сильные основания их подозревать, но свидетельств и улик недостаточно для обвинения.

Полиция предлагает им подумать о ситуации и сделать выбор. Если оба признаются, то им грозит по 2 года тюрьмы. Если оба не признаются, тогда есть основания, чтобы посадить каждого на год (например, за сопротивление при аресте). Но если признается только один, он уходит на свободу, зато партнер его получает 3 года. Пояснение: тот, кто признается, закладывает также и подельника.

Обоих содержат в изоляции, никакая связь, никакие переговоры между ними не возможны. Каждому дается день на размышления, и каждый может узнать о том, что выбрал подельник, только тогда, когда уже сделает свой выбор. Оба озабочены только собой, оба – рациональны.

Как обычно в теории игр, весь расклад изображается в виде матрицы – в данном случае, это матрица 2 х 2. Итак (срока в клетках указаны сперва для Тома, потом для Джерри):

Джерри не признается

Джерри признается

Том не признается

1 год / 1 год

3 года / 0 лет

Том признается

0 лет / 3 года

2 года / 2 года

Ситуации для обоих абсолютно идентичны. Но решение принимать каждому на свой страх и риск. И никому из них не ведомо, что выберет другой.

Рассуждает Том. Я признаюсь, что тогда? Джерри либо тоже признается, тогда я получаю 2 года, либо не признается, тогда я получаю свободу. Теперь скажем, я не признаюсь. Если Джерри признается, я получаю 3 года. Если не признается, я получаю год.

Что же получается? Если признаемся оба, мне садиться на 2 года. Но если мы оба не признаемся, то мне грозит лишь 1 год. Да... откажись тут, а он возьмет да признается – и я хватаю три года.

Точно так же - абсолютно так же - рассуждает и Джерри. Что же лучше выбрать? Ведь потом можно и пожалеть о своем выборе. Но так или иначе, выбор Тома не влияет на выбор Джерри – и наоборот.

Наилучшей стратегией для обоих выглядит обоюдная «несознанка». Или обоюдное признание. То есть, кооперативное поведение. Но сговориться невозможно. Остается логика и свой шкурный интерес.

Здравый смысл подсказывает: повлиять на подельника я не могу, поэтому лучше не сознаваться, а там уж как получится - или 1 год, или 3. Но тут здравый же смысл подсказывает прямо противоположное: повлиять на подельника я не могу, поэтому лучше сознаться, а там опять как получится. Или свобода, или 2 года.

Так все же, что лучше выбрать? Кажется, что есть более предпочтительный вариант для Тома (Джерри): сознаться. Но если сознается и подельник тоже, ты получаешь 2 года и весь срок будешь мучиться – зачем сознался. Могли бы оба не сознаваться и получить только год.

Эту игру разыгрывали экспериментально РЭНДовцы, между собой и с участием нематематиков. Больше чем в половине случаев выбиралось признание, притом обоими. Поскольку сговор исключен, получалось, что люди чаще склонны предавать партнеров, если рассчитывают получить выгоду для себя (иногда это называют оппортунизмом). Наконец, разыгрывали целые серии, повторяя раз за разом знакомую нам задачу. Хотели понять, влияет ли прошлый опыт игры на выбор стратегии. Частота выбора была примерно такая же, как в одноразовой игре.

Пора уже упомянуть, что «дилемму заключенного» не смогли решить (в смысле отыскания единственной оптимальной стратегии) ни Джон фон Нейман, ни Джон Нэш, ни кто-либо еще. Она так и остается нерешенной. А ведь эта дилемма – одна из распространенных жизненных ситуаций. Тому свидетельство – философия, литература, искусство...

Скажем, «золотое правило» морали (Гилель Великий, Евангелие от Матфея, Сенека, Конфуций...): не делай другому, чего не пожелал бы себе. Хотя этот принцип не буквально идентичен дилемме заключенного, если присмотреться, он содержит похожую дилемму. Каждому свойственно преследовать свой интерес, и подчас это вступает в противоречие с благом «ближнего». Золотое Правило призывает нас поступать «кооперативно», то есть согласно с благом «ближнего», в противовес «отказу от сотрудничества».

Если бы каждый из двоих заключенных знал, что его подельник всегда поступит согласно Золотому Правилу, они бы выбрали оба одно из двух: обоим отпираться или обоим признаться.

В рассказе Эдгара По «Тайна Мари Роже» есть такой эпизод. Детектив Огюст Дюпен предлагает тому из шайки преступников, кто сознается первым, деньги и свободу. Дальше он замечает, что для каждого них не так важны деньги и освобождение, как страшно предательство. Поэтому каждый стремится предать первым, чтобы не предали его.

Еще ближе к «дилемме заключенного» интрига оперы Пуччини «Тоска» на сюжет пьесы В. Сарду. В застенке у шефа полиции Скарпиа ждет казни близкий к карбонариям художник Марио Каварадосси, любовник певицы Флории Тоска. Скарпиа, давно неравнодушный к женщине, предлагает ей сделку: она ему отдается, а в обмен он приказывает расстрельной команде заменить боевые патроны холостыми, чтобы вышла только инсценировка казни.

Что делать женщине? Она выбирает согласие - с условием, что свое обязательство выполнит после того, как будет отдан приказ о патронах. Скарпиа отдает приказ, после чего Тоска, оставшись с ним наедине, убивает его ножом. Она бежит на площадку крепости. И там, у нее на глазах, происходит реальный расстрел Каварадосси. Скарпиа ее обманул. Участники сделки согласились сотрудничать, но оба предали друг друга.

Основной момент «дилеммы заключенного» в том, что действующее лицо испытывает искушение добиться своего интереса таким путем, который был бы для него дурным или даже убийственным, если бы другой сделал это по отношению к нему. В мире такие ситуации возникают сплошь и рядом. Поэтому иные говорят, что «дилемма заключенного» представляет фундаментальную проблему общества – проблему зла. Фактически, все трагедии истории порождаются только людьми – индивидами или группами, - которые преследуют свой интерес в ущерб общему благу.

Проблема «безбилетника»

Так принято передавать по-русски то, что по-английски называется free rider problem. Конечно, это не «вольный наездник», и перевод правильный: проехать за чужой счет. Как говорится, на халяву.

Когда я подростком подчас ездил «зайцем» в автобусе, я знал, что обманываю государство, и не считал это грехом. Что такое «государство» для пассажира советского автобуса? Пустая абстракция.

Но что, если все пассажиры начнут ездить «зайцем»? – Все? Это невозможно! – Ладно, большинство. – И это невозможно. Во-первых, контролеры и штрафы. Во-вторых, всегда есть «сознательные» люди. – Хорошо, возьмем правдоподобную цифру 20%. Транспортная система станет регулярно терять пятую часть доходов. Что последует? Скорее всего, повышение цен на проезд. Какая-то часть пассажиров ездит бесплатно, потому что их долю расходов на транспорт вносят остальные.

Но это лишь одна сторона проблемы «зайца». Если людям нужно автобусное сообщение, они не перестанут ездить из-за повышения платы за проезд. Представим другую ситуацию. Группа фермеров из довольно отдаленного уголка предложила всем соседствующим фермерам числом, скажем, 10 скинуться, чтобы проложить хорошую дорогу в район их расположения. Ясно, что это будет экономически выгодно для всех, кто там хозяйствует. Именно поэтому один из фермеров участвовать отказался. Зачем тратиться ему лично, если дорогу и так построят? Узнав об этом, отказались еще двое, и проект не состоялся.

Таков смысл проблемы безбилетника в теории коллективных благ. Дело здесь даже не в этичности (или неэтичности) его поведения. Проблема в том, что сама возможность такого поведения часто приводит к тому, что коллективное действие может не состояться. Одни выбирают «проехать зайцем» и получить коллективное благо «задарма». Другие, наблюдая или предполагая такое поведение со стороны каких-то членов группы, выбирают вообще не участвовать в коллективном действии.

Проблема «зайца» есть та же «дилемма заключенного», только приложенная к числу участников больше двух. Такая ситуация встречается в самых различных областях жизни. К примеру, ситуация похищения людей с целью выкупа. Обычно родня готова уплатить выкуп (если только она уверена, что похищенный жив). Однако выплата выкупа поощряет других на подобные преступления.

Если бы никто и никогда не платил выкуп, похищения очень вероятно прекратились бы. Но в каждом конкретном случае родственники похищенного заинтересованы только в его освобождении, и им дела нет до других потенциальных жертв будущих похищений.

Можно сказать так: когда дело идет о жизни и смерти дорогого человека (чаще всего – ребенка), никому уже дела нет до борьбы с преступностью. И здесь, в отличие от предыдущих примеров, стратегия «безбилетника» (точнее, неучастие в коллективном действии) морально оправдана.

Другой пример. Почему миллионы потребителей, скажем, молока (или бензина) не могут скооперироваться, чтобы противостоять немногочисленному лобби, пробивающему повышение цен на этот товар? Если бы они самоорганизовались, они собрали бы огромную сумму, достаточную и для шумной рекламной кампании, и для покупки услуг лучших юристов. Главной причиной того, что такая кооперация не получается, является распространенное подозрение (достаточно обоснованное, заметим) о том, что найдется немало «безбилетников».

Можно сказать, пожалуй, что проблема безбилетника еще более безнадежна, чем дилемма заключенного для двух лиц. Здесь бывает, что личный эгоизм одного лица вредит интересам великого множества, даже миллионов людей. И этот один может успешно, так сказать, раствориться в толпе. Эта проблема является ключевой в реальных ситуациях, когда кооперация жизненно необходима для выживания сообщества, не говоря уже о ситуациях менее критических, но просто потенциально облегчающих жизнь.

Один из самых простых (и самых невинных) примеров описывает У. Паундстоун.[8] В Новой Зеландии (или в каких-то ее районах) принято распространять газеты посредством открытых и не охраняемых ящиков. Газету можно унести, не платя, но мало кто так делает, потому что большинство осознаёт: если все станут воровать газеты, их доставка прекратится. Налицо кооперативное поведение, обусловленное отсутствием «безбилетников». В Америке, добавляет Паундстоун, газеты были бы разворованы в первый же день.

Долларовый аукцион

В РЭНД постоянно думали о моделях игр для новых и разных ситуаций. И подчас придумывали интересные вещи. Джон Нэш, Мартин Шубик и группа коллег желали придумывать игры, в которые можно играть не на бумаге, а реально.

Однажды они придумали довольно жестокую групповую игру (с использованием покерных фишек), которую назвали «Прощай, лох!» (so long sucker). Игроки должны были формировать коалиции внутри группы (допустим, играть трое на трое), но часто индивиду, ради личной пользы, оказывалось выгодно поступить оппортунистически - предать свою команду.

Последнее и в жизни случается нередко, что нашло отражение в литературе. Не только Винни Пух с опилками в голове, но вполне нормальные люди с мозгами подчас склонны поддаться искушению предать свою команду ради собственной пользы. Вспомним, хотя бы, «Боливару не снести двоих».

Позднее была придумана игра «долларовый аукцион». В 1971 г. Шубик опубликовал ее в статье, и ему обычно приписывают ее авторство. Это – аукцион на приобретение обычной долларовой купюры. Игра очень простая, но, как говорится, заводная. Ее правила таковы:

1. Как в обычных аукционах. Выигрывает тот, кто предложит наивысшую цену. Каждая следующая цена должна быть выше предыдущей, и игра кончается, когда больше никто не предлагает надбавки.

2. Не как в обычных аукционах. Второй участник, чью цену перебил выигравший, тоже должен уплатить – ту последнюю цену, которую он предлагал. Но взамен он не получает ничего.

Вот и все правила. Заметим кстати, что в начале 70-х один доллар, по покупательной способности, был не меньше (если не больше) 10 сегодняшних. Поэтому игра могла идти всерьез. Второе правило вносило в игру изрядный азарт.

Вот как мог проходить такой аукцион. Некто предлагает 1 цент. Но кто же откажется получить доллар за 2 цента? Это уже выгоднее, чем банковский процент по обычным вкладам. Поэтому второй объявляет 2 цента. Если первый остановится, ему придется отдать ни за что 1 цент. Но зачем же? Лучше он скажет: 3 цента. Теперь второй в таком же положении. Отдать 2 цента и ничего взамен, когда есть шанс получить доллар всего за несколько центов? Лучше скажу: 4 цента! Так оно и идет...

И к чему приходит игра? Наверное, она кончается, когда цена доходит до 1 доллара?.. Как бы не так! Если второй остановится сейчас, тогда он должен отдать 99 центов. Впустую.

Очень не хочется. Ему представляется, что лучше объявить 1 доллар и 1 цент. Если выиграет, он потеряет всего цент, но зато избежит потери в 99 центов.

«Когда игра доходит до барьера в 1 доллар, - писал Шубик, - наступает нерешительная пауза. Но затем дуэль вспыхивает и идет с нарастающей скоростью, напряжение нарастает, пока наконец не иссякает». Уже давно победивший имеет шанс купить свой доллар за сумму, большую, чем доллар, и плата проигравшего также растет, да еще за просто так. По воспоминаниям Шубика, доходило до того, что победитель покупал свой доллар за 3, или 5, или еще больше долларов. А второй, конечно, просто терял чуть поменьше.

Шубик замечает, что, когда надбавки намного превышают 1 доллар, под вопросом оказывается рациональность игроков (одно из главных допущений во всей теории игр). Возможно, только кто скажет, на каком уровне аукциона рациональность кончается и начинается иррациональность? 1 доллар ровно? 1 доллар 1 цент? Или где?

Нужно также принять во внимание, что сам Шубик считал наиболее подходящей ситуацией для такого аукциона вечеринку (party), «когда у всех приподнятое настроение, а склонность к расчетливости не очень высока», пока участники не оказываются втянутыми в торг. Подходящая ли ситуация, чтобы делать выводы о человеческой рациональности?

Так или иначе, только ситуация аукциона Шубика возникает в жизни гораздо чаще, чем может показаться по описанию игры. Известны такие выражения, как «иначе вообще все было зря», «все усилия и жертвы были впустую, что ли?», или «вложено уже слишком много, чтобы бросить это дело», или «нет возможности остановиться, сохранив лицо».

Забастовка, приносящая ущерб как предпринимателям, так и профсоюзам, может длиться и длиться потому, что каждая сторона рассчитывает: «еще немного, и они уступят». Притом, с каждым днем все больше сожаление об уже понесенных убытках, и сильнее желание оправдать их конечной победой.

Чем больше денег мы вкладываем в ремонт старой машины, тем меньше желание избавиться от нее, «пока ездит». Чем больше мы проигрываем в карты, тем сильнее желание продолжать игру в надежде отыграться. Чем дольше ждем автобуса, тем меньше желания пойти пешком или взять такси, если идти далеко. И так далее.

Некоторые полагают, что война во Вьетнаме стала для США «долларовым аукционом» - по крайней мере, с того времени, когда поняли, что не предвидится победа в привычном смысле слова.

Гонка вооружений есть чистый аукцион Шубика. «Побеждающий» - страна, обгоняющая другую по количеству и качеству ракет и боеголовок, - выигрывает бóльшую степень безопасности. «Проигрывающий» же остается не просто в меньшей безопасности. Практически, он оказывается перед фактом, что все огромные затраты на оборону не дали ему ничего. Выброшенные деньги. Поэтому он хочет «потратить еще немного, чтобы ликвидировать отставание в вооружениях».

И все же, какова рациональная стратегия в такой игре? Таковой не существует. Конечно, лучше выйти из игры, когда цена доходит до 1 доллара. Или вообще - как можно раньше. Но так мы придем к тому, что лучшая стратегия – вообще не вступать в аукцион. Игроки не знают заранее, например, насколько соперник дорожит каждым центом, каково его терпение, насколько он азартен и т.д. Все решают такие факторы, как психология, личные качества, везение... Теория игр здесь бессильна.

***

Итак, насколько можно понять, теория игр и экономического поведения обернулась со временем, скорее, теорией человеческого поведения. Хотя конечно, теоретико-игровыми моделями хорошо описываются определенные экономические ситуации (тот же пример теории дуополии Курно).

Но вот что интересно. Как мы смогли увидеть, чем ближе к жизни подходят игровые модели, тем труднее оказывается отыскание оптимальных стратегий. Для таких моделей, которые охватывают самый широкий спектр жизненных дилемм, не только не найдены оптимальные стратегии, но и существование таковых не доказано.

И все это, тем не менее, – огромное достижение теории игр. Ибо без нее мы гораздо меньше могли понимать самих себя. Когда мы говорим, например, «равновесие Нэша нашло много применений в экономике, социологии, экологии, биологии», это не обязательно значит, что мы имеем инструмент для анализа в обычном смысле слова. Однако, это – бесценное средство структуризации проблем, их более отчетливого понимания. Последнее же есть необходимая предпосылка их решения.

Государство Израиль

Израиль сейчас стоит перед дилеммой в отношении Ирана. Ее можно изложить так: ждать решительных действий о стороны США или ударить самому?

Что может подсказать здесь теория игр? Иран в игре не участвует. Есть два «игрока»: США и Израиль. У каждого в распоряжении, по меньшей мере, две стратегии: действовать совместно или ударить по Ирану в одностороннем порядке. Несмотря на то, что в данном случае возможны коммуникация и согласование стратегий, полного доверия к партнеру нет ни у одной, ни у другой стороны. Недоверие только укрепилось после недавней утечки секретной информации, организованной администрацией США в своих политических целях. Все это равносильно препятствию к согласованию стратегий и сильно снижает вероятность такого выбора.

Ситуация определенно смахивает на дилемму заключенного. Если оба «подельника» выберут стратегию скооперироваться, наиболее вероятен положительный исход игры. Но у Израиля нет уверенности в кооперативном поведении США. При этом, насколько коммуникация имеет место, от США не поступает определенного сигнала. Ни да, ни нет. Риск США - как в случае сотрудничества, так и в случае отказа от него - неизмеримо меньше и качественно слабее.

В отличие от классической дилеммы заключенного, здесь матрица наказаний и наград в зависимости от выбора стратегии - не симметрична. Однако, в той модели каждому из заключенных приходится принимать решение на свой страх и риск. И положение Израиля почти точно эквивалентно положению одного из них в классической модели, безотносительно к положению США.

Теоретически, для каждого существует третья стратегия: ничего не предпринимать вообще. Для Америки это самая выгодная стратегия. Во-первых, перед ними не стоит вопрос о выживании в случае «ничего не делать вообще». А во-вторых, у Израиля такой стратегии практически нет, ему рано или поздно придется действовать самому, сняв ответственность с правительства США.

Выбрав третью стратегию, правительство США может даже помочь тому, чтобы Израиль выбрал стратегию одностороннего удара. Это и есть оппортунистическая стратегия, которая в общем случае дилеммы заключенного называется предательством.

Итак, для Израиля оптимальной стратегией является кооперация. Для США наилучший выбор – избежать совместных действий, то есть, оппортунизм.

Односторонние действия Израиля ради «шкурного интереса» (выражение приобретает в данной ситуации буквальный смысл) формально могли бы попасть в категорию «предательства», но здесь нет соответствия с классической моделью. Это далеко не лучшая стратегия. Однако кооперация от него никак не зависит. Поэтому при односторонних действиях предательства интересов партнера не будет. Для последнего это не обернется большой бедой, а может обернуться и выигрышем.

Конечно, мы опускаем здесь многие политические детали и нюансы - давление на правительство США со стороны Конгресса и пр. Мы не рассматриваем политических игр, особенно закулисных. Мы не занимаемся вычислением вероятностей того или иного исхода. Цель наша здесь – структурировать дилемму.

Как мы знаем, дилемма заключенного не имеет единственного и оптимального решения.

Примечания

[1] Theory of Games and Economic Behavior. В тексте название дается по русскому изданию 1970 г. Если бы авторы хотели назвать книгу, как передано в русском переводе, они бы написали, скорее, The Game Theory and Economic Behavior. Поэтому более адекватным выглядит перевод: «Теория игр и экономического поведения».

[2] «Математические основы теории богатства». 1838

[3] William Poundstone. Prisoner's Dilemma. Anchor Books. 1992. Известный в США автор увлекательных научно-популярных книг, физик по образованию.

[4] Реальные игры упоминаются только для иллюстрации.

[5] Джон фон Нейман – John von Neumann (1903-1957). Его главные достижения, как сообщают, относятся к области чистой математики и математической физики. В теории игр, помимо многого другого, он доказал важнейшую теорему о минимаксе. Причиной его преждевременной смерти был рак.

[6] РЭНД (RAND – Research and Development). Бесприбыльная частная корпорация, основанная в 1948 г. Во время войны в разных научных центрах велись работы, позже получившие общее название «исследование операций». После окончания войны группа энергичных людей из ВВС и корпорации «Дуглас» выступила с инициативой собрать под одной крышей тех, кто занимался исследованием операций, да и не только, – для продолжения и развития исследований. В РЭНД работали выдающиеся математики и ученые иных специальностей. Многие из них, как фон Нейман и Нэш, совмещали это с работой в университетах.

[7] В прокате в СССР он назывался, кажется, «Инцидент». Поставлен по сценарию Белл Кауфман.

[8] См. прим. 2.

Рейтинг:

Отдав голос за данное произведение, Вы оказываете влияние на его общий рейтинг, а также на рейтинг автора и журнала опубликовавшего этот текст.

Только зарегистрированные пользователи могут голосовать