ナッシュ均衡：『ビューティフル・マインド』の背後にある発想

二人のドライバーが、狭い橋に両端から近づいてくる場面を思い浮かべてみてください。一度に通れるのは一台分の幅しかありません。両方が前に進めば衝突します。両方が遠慮して待てば、誰も動けず、後ろの列はどんどん長くなります。理にかなった結末は、一方が進み、もう一方が控えることです。そしてそのパターンがいったん落ち着けば、どちらのドライバーにも今の行動を変える理由はありません。待っているドライバーは、急に前に飛び出しても得をしませんし、進んでいるドライバーも、止まったところで得をしません。そうした凍りついたような、自己強化的な配置、つまり他の全員がそのままでいる限り、誰も別の行動をとることでより良くなれない状態こそ、ノーベル賞を受賞し、映画『ビューティフル・マインド』に着想を与えた発想の核心です。

この発想はナッシュ均衡と呼ばれ、アメリカの数学者ジョン・フォーブス・ナッシュ・ジュニアにちなんで名付けられました。専門的に聞こえますが、それはあなたが名前をつけることなく一日に何十回もうまく切り抜けている何かを言い表しています。交通、行列、価格、交渉、半分空いた電車のどこに座るかという選択でさえそうです。いったんそれが見えるようになると、もう見えないふりはできなくなります。

ジョン・ナッシュが実際に発見したこと

ジョン・ナッシュは1940年代後半、プリンストン大学の大学院生でした。そのとき彼が書いた短い博士論文が、やがて1994年のノーベル経済学賞をもたらすことになります。この賞はジョン・ハーサニとラインハルト・ゼルテンとの共同受賞でした。ゲーム理論はすでに一つの分野として存在していました。その大部分は、数学者ジョン・フォン・ノイマンと経済学者オスカー・モルゲンシュテルンのおかげであり、彼らの1944年の著書『ゲームの理論と経済行動』がその基礎を築きました。しかし彼らの研究は、主にゼロサムゲームと呼ばれる狭い種類の状況に焦点を当てていました。これは、一人のプレイヤーの利得がそのまま別のプレイヤーの損失になる状況で、決まった大きさのパイを分け合うようなものです。

ナッシュの貢献は、より雑然とした、より現実的なケースを扱ったことでした。すなわち、プレイヤーが両方とも勝つこともあれば、両方とも負けることもあり、その中間のどんな結果にもなりうる状況です。彼は注目すべき数学的結果を証明しました。プレイヤーの数が有限で、選択肢の数も有限であるどんなゲームにも、少なくとも一つの均衡点が存在するというのです。それは、どのプレイヤー一人も自分だけが戦略を変えることでは自分の結果を改善できない、という戦略の組み合わせです。数学者たちが称賛したのは、その存在の保証でした。一方、経済学者、生物学者、政治学者がその後七十年にわたって走り続けたのは、その日常的な有用性でした。

平易な言葉での均衡

数学を取り払えば、ナッシュ均衡とは単に、他の全員がしていることを前提として、誰もが自分にできる最善を尽くしている安定した状況のことです。この最後の一句にすべての仕掛けがあります。誰も真空の中で行動しているわけではありません。各人の最善手は他者の手に左右され、均衡とはそうした最善の応答がすべて一度にかみ合う点なのです。

役に立つ判定法が、「後悔なし」のチェックです。ほこりが落ち着き、全員が他の全員の選択を見られる状況を想像してください。自分自身の決定を見て、「他の人たちがしたことを知った上でも、私は何一つ変えたくない」と思うなら、あなたは均衡の中にいます。たとえ一人でも振り返って「違うことをすべきだった」と思うなら、その状況は均衡ではありませんでした。なぜなら、その人にはやり方を変える理由があったからです。

決定的に重要なのは、均衡が必ずしも集団にとって最良の結果ではないということです。均衡はあくまで安定しているだけです。人々は、本来到達できるよりも全員を悪い状態に留めるナッシュ均衡から抜け出せなくなることがあります。それはただ、どの個人も一人ではそれを直せないからです。安定していることと良いことの間にあるこの溝こそ、現実世界の興味深い、ときに悲劇的な帰結の多くが宿る場所なのです。

囚人のジレンマ：有名な罠

ゲーム理論全体で最も有名な例が囚人のジレンマであり、これは均衡がいかにして全員をより悪い状態に留めうるかを正確に示しています。二人の容疑者が逮捕され、別々の部屋に勾留され、連絡を取り合うことができません。それぞれが同じ取引を持ちかけられます。もしあなたが相棒を裏切り、相手が黙秘すれば、あなたは無罪放免となり、相手は重い刑を受けます。もし二人とも黙秘すれば、それぞれ軽い容疑で短い刑を受けます。もし二人とも互いを裏切れば、二人とも中程度の刑を受けます。

さて、一人の容疑者の立場でじっくり考えてみましょう。相棒が黙秘するなら、相手を裏切れば短い刑に服する代わりに無罪放免になれるので、裏切るほうが良いことになります。相棒があなたを裏切るなら、相手を裏切れば最も重い刑の代わりに中程度の刑で済むので、やはり裏切るほうが良いことになります。相手が何をしようとも、裏切りがあなたの最善手です。同じ論理が相棒にも当てはまります。だから二人とも裏切り、二人とも中程度の刑に終わります。たとえ互いの黙秘によって二人ともはるかに良い結果になれたとしてもです。

その相互の裏切りがナッシュ均衡です。それは安定しています。いったん二人とも自白すれば、どちらも自分だけ黙秘に切り替えても改善できません。なぜなら、そうすることは相手にただで切符を渡すだけだからです。それでいて、集団としては悲惨です。囚人のジレンマは、国家間の軍拡競争から、両者がかろうじて損益分岐点に達するまで値下げを続ける二つの競合店まで、数えきれないほどの現実の状況をとらえています。誰もが自分自身の合理的な利己心に従い、まっすぐにより悪い結果へと向かっていくのです。

あなたがすでに生きている日常の均衡

ナッシュ均衡が働いている様子を見るのに、手錠は必要ありません。いったん探し始めれば、それはどこにでもあります。

道路のどちら側を走るか： 世界の大部分では、誰もが右側を走ります。イギリスや日本のような場所では、誰もが左側を走ります。どちらの慣習も安定した均衡です。もしあなたの周りの全員が右側を走るなら、あなたの最善手もまた右側を走ることであり、左側についても同じです。一人のドライバーが切り替えても何も得をしません。それこそが、この仕組みが崩れずに保たれている理由です。普遍的に「正しい」側というものはなく、あるのは自己強化的な取り決めだけです。

待ち合わせ場所を選ぶ： あなたと友人が、電話も持たずに混雑した街ではぐれてしまったとしましょう。もし二人がそれぞれ独立に最もわかりやすい目印、つまり中央駅や中央広場へ向かえば、お互いを見つけられます。その明白な場所は、経済学者がフォーカルポイント（焦点）と呼ぶものです。これはノーベル賞受賞者トーマス・シェリングが発展させた発想です。これが均衡であるのは、どこへ行くべきかというあなたの最善の予測が、相手がどこへ行くと思うかに左右され、その有名な目印が二人を調整してくれるからです。

スタジアムで立つこと： 前列の人々がよく見ようと立ち上がると、その後ろの全員も立たなければ、何も見えなくなります。やがてスタジアム全体が立ち上がり、座っていたときと同じ眺めを得るのですが、今度は脚が痛みます。誰も一人だけ座っても改善できないので、全員が座りたいと思っていても、立つという均衡は続いていきます。

レジの列を選ぶ： 混雑したスーパーマーケットでは、買い物客が一番短く見える列へと移り続けるので、列は均等になりがちです。どの列もほぼ同じになると、誰も移動しても時間を節約できなくなり、システムは落ち着きます。その釣り合いこそ、レジで繰り広げられる、絶えず再形成される小さなナッシュ均衡なのです。

答えが一つより多いとき

よくある誤解は、どんなゲームにも単一の、きちんとした均衡があるというものです。実際には複数あることが多く、それが本物の調整問題を生み出します。道路の例はすでにこれを示唆していました。右側通行と左側通行はどちらも完全に安定しており、ある国がどちらに落ち着くかという問いは、部分的には歴史的な偶然です。

コンサートとスポーツイベントのどちらにするか決めようとしている二人の友人を考えてみましょう。二人とも離れているより一緒にいたいと思っていますが、一方はコンサートをやや好み、もう一方は試合をやや好みます。ここには二つの均衡があります。二人ともコンサートに行くか、二人とも試合に行くかであり、いったん計画が決まれば、どちらの友人にも一人だけ離れる動機はありません。難しいのは安定性ではなく選択です。二人はどの均衡に調整して合わせるのでしょうか。これこそ、現実の生活で慣習、伝統、契約、そして明確なコミュニケーションがこれほど重要である理由です。それらは、複数の均衡がありうるときに、集団を一つの均衡へとそっと導く助けになります。

ナッシュはまた、均衡が混合戦略と呼ばれるものを必要とする場合があることも示しました。これはプレイヤーが選択をランダム化することを意味します。サッカーのペナルティーキックを思い浮かべてください。もしストライカーが常に左を狙うなら、ゴールキーパーは毎回左に飛ぶことを学習するでしょう。予測されないために、ストライカーは狙いを混ぜ合わせ、キーパーもまたそうします。均衡とは、どちらももっと予測可能になることでは得をしない、確率の特定の配合です。ナッシュの証明は、たとえ単一の固定された選択では安定になりえない場合でも、そうした均衡が常に存在することを保証しました。

なぜこの発想がこれほど多くの分野を変えたのか

ナッシュ均衡は、結果が多くの行為者の絡み合った選択に左右されるあらゆる状況を分析するための、精密な道具を研究者に与えました。経済学者はそれを用いて、企業がどのように価格を設定するか、オークションをどう設計すべきか、市場がどのように効率的な結果に達する（あるいは達しそこなう）かを研究します。政府が無線周波数を数十億で電話会社に売る現代の周波数オークションの設計は、まさにこのゲーム理論の一分野から直接導かれています。

その射程は経済学をはるかに超えて広がります。進化生物学者はこの概念を「進化的に安定な戦略」へと応用し、ある種の動物の行動がなぜ世代を超えて持続するのかを説明するために用いました。すなわち、ある行動は、まれな変異株の戦略がそこに侵入してより良い結果を出せないとき、生き残るのです。政治学者は均衡分析を用いて、投票、連立、そして軍拡競争の陰惨な論理を研究します。コンピュータ科学者は、ネットワーク、オンライン広告オークション、競合するアルゴリズムの振る舞いについて推論するためにそれに頼ります。共通の糸はどこでも同じです。合理的な当事者たちが相互作用し、それぞれの最善手が他者に左右されるところならどこでも、ナッシュ均衡こそ、ほこりが落ち着く場所なのです。

その数学の背後にある人間の物語を思い出す価値があります。ナッシュは何十年もの間、統合失調症と闘いました。その時期は『ビューティフル・マインド』で描かれています。やがて十分に回復し、1994年にノーベル賞で称えられ、そして2015年の死の少し前には、数学における最高の栄誉の一つであるアーベル賞で称えられました。彼の発想の脆くも美しいところは、それが対立の中に秩序を見出したことです。最も敵対的なにらみ合いの内側にさえ隠れている、安定した点を見つけたのです。

重要なポイント

ナッシュ均衡とは、他の全員が下した選択を前提として、すべての参加者が自分にできる最善の選択をしており、その結果、誰も自分だけが戦略を変えることでは自分の結果を改善できない、という状況です。それは安定の点であって、必ずしも公平さや効率の点ではありません。だからこそ囚人のジレンマは、協力すれば到達できたはずの結果よりも悪い結果に、合理的な人々を閉じ込めてしまうのです。あなたは絶えずナッシュ均衡の内側で生きています。道路のどちら側を走るか、どのレジの列に並ぶか、スタジアムで立つかどうか、といったことです。ジョン・ナッシュの不朽の功績は、そうした均衡点が常に存在することを証明したこと、そして経済学者、生物学者、政治学者に、戦略、対立、協力を理解するための単一の鋭いレンズを与えたことです。いったん均衡を見抜けるようになると、群衆、企業、国家の絡み合った選択は、少しばかり混沌さを減じ、隠れた規則を持つゲームのようにずっと見えてくるのです。

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free