ツェペリさんも喜ぶゲーム理論 - マトリョーシカ的日常

f:id:kyokucho1989:20111020055644j:plain:w400

　一週間ほど何も考えることがなかった。仕事が忙しいわけではないが、頭がよく動かなかった。ブログを書いていない間は潜水しているような感覚があり、自分の内側で言語化できないもやを抱いている。かといって何かを書くことで思考はまったく明確にならないし、私がそれを望んでいるのかは疑問だ。

　暗号を勉強しようと思ったが、そのまえにゲーム理論について書き散らそうと思う。昨年古本屋で日経文庫の『ゲーム理論入門』を105円で購入していて、最近までそのことを忘れていた。彼は帰省用のキャリーケースの中でひっそりと眠っていた。ゲーム理論とはフォン・ノイマンとモルゲンシュテルンによる本を起点とした意思決定に関する理論である。選択肢のうちからどれを選択するのか、という問題について数値的に解を与えてくれる。なぜその必要があるのか、ただ「なんとなく好き」みたいな理由で選べばいいのではないか。本当にそう思う。しかし、彼らのすごいところは人間の「なんとなく」を定量的に評価し、判断の方法を体系立てたことである。数値で分けることが出来るなら、人間だけはなくコンピュータにも適用することが可能になる。さいきん巷で流行のAIにもゲーム理論の考えが搭載されるかもしれない。

　ゲーム理論が扱われるような場をゲーム的状況というが、それにもいくつか種類がある。プレイヤーが二人かそれより多いか、判断が同時になされるか非同時か、プレイヤーが協力するかしないか、情報が完全に分かっているのかいないのか、判断を下す知能が合理的か否か。これらのパターンを組み合わせる。

　本書の構成は、はじめにゲーム理論の興りと有名な人物に対する言及があり、次に非協力＋同時ゲームが解説される。その次に非協力+非同時があり、情報不完備ゲーム、二人協力ゲーム、多人数協力ゲーム、進化学習を利用したゲーム理論と続く。例題が多く、自分で手を動かしながら学ぶことができる。実に楽しそうな本である。

　本の内容に入る。はじめにプレイヤーが二人で互いの利得が全く異なる状況を考える。二人のプレイヤーは互いにいくつかの選択肢（戦略）を持ち、それぞれの選択の組み合わせによって獲得するポイントが異なる。それについては利得関数という関数で表現される。彼らは多くポイントを得ることが目的であるから、各自が自分の関数を最大化させたいと願っている。さて、彼らの戦略のうち明らかにこっちの方がいいだろうという戦略があったりする。相手がどうあがいても自分のポイントが多くなる場合はその戦略は他の戦略を「支配している」と表現する。支配戦略が手にあるのなら話ははやい。それを選べばいいだけである。しかし、実際はそんな最高の選択なんてものは存在しない。大体これがいいだろうな、という適当さがある。どうやって判断するのか。

これは大事な物の考え方じゃぞ！
｢もし自分が敵なら｣と相手の立場に身をおく思考！
(ウィル・Ａ・ツェペリ)

　そう。相手が最適だと考えそうな戦略を想定し、それをふまえた上で自分の利得を最大化する戦略を選べば良い。これを最適反応戦略という。この考えを互いが採用すると、ゲームの運命は次第に偏る。そしてどこかでストップする。そこがナッシュ均衡である。ナッシュ均衡が存在しないゲーム的状況もある。しかし、「適当な確率で戦略を採用する」という混合戦略を用いれば、必ずナッシュ均衡は存在する。

　続くかもしれないし、続かないかもしれない。