囚人のジレンマ

徐 丙鉄(近畿大学工学部)1996.12.25

 ミシガン大学の政治学者 Robert Axelrod は、利己主義的な集団で如何にして 利他的な行動が生じるかを理解しようとして囚人のジレンマと呼ばれていたゲームを研究した。 このゲームは1950年代に、RAND 社の Merrill Flood とMelvin Dresher によって考案され、 A. W. Tucker によって定式化された。

 ある犯罪を犯し、二人の容疑者が警察に捕らえられた。二人は共犯であると疑われるが、 証拠が足りない。検事は自白を得ようとして、各々の囚人に次のような取引を提案する。
 もし、二人とも自白をしなければ、腕によりをかけ有罪に持ち込む。2年の懲役が課せられるだろう。 しかし、もしおまえが自白すれば、おまえは無罪放免してやろう。共犯者は、 黙秘により裁判を遅らせた罰を加え5年の豚箱入りだ。 ただし、二人とも自白すれば、4年の刑が課せられるだろう。

ペイオフ・マトリクス(利得行列)

 囚人2 協調囚人2 裏切る
囚人1 協調相互協調
懲役(2年、2年)
囚人1は裏切られる
懲役(5年、0年)
囚人1 裏切る囚人2は裏切られる
懲役(0年、5年)
両囚人共に裏切り合う
懲役(4年、4年)

 相手が自白しないのであれば、自分が自白し裏切ると無罪放免である。 相手が自白するならば、自分も自白しなければ5年の刑を受けて損であるし、自分も自白すると4年の刑で済む。つまり、相手の出方によらずいつも裏切った方が刑が軽くなる。合理的に振る舞うのならば自白するに限る。しかし、両者が協調した場合には、両者が裏切った場合より利益がある。

この様な状況下で最良の戦略とは何か?もし、相手がいつも裏切るのならば、 こちらも裏切り続けるのが最善の戦略である。しかし、あらゆる場合に最善となる戦略はあるのか? それを調べるために、 Axelrod は1979年にこのような問題に興味を示すであろう人々に手紙を書き、 囚人のジレンマに対する戦略を募集した。集まった14の戦略に乱数ででたらめに行動を決定する戦略を加え、これらの戦略間で囚人のジレンマを繰り返し闘わせた。最も高得点をあげた戦略は、トロント大学の心理学者 Anatol Rapoport のもので、しっぺ返し(TIT-FOR-TAT)といものであった。

しっぺ返し戦略(TIT-FOR-TAT)

  1. 1回目は協調する。
  2. 2回目以降は相手の前回の行動をまねる。

この結果から、 Axelrod は次のような教訓を導いた。

  1. 礼儀正しさ:自分からは相手を裏切らない。
  2. 短気ではあるが寛容:相手に裏切られてたら即座に裏切り返すほど短気であれ。しかし、一度だけ裏切って、後は根を持たない程度に寛大であれ。

このようなジレンマは各種の状況で起こりうる。 Axelrod は次のような例を挙げている。


参考文献

  1. D.R.ホフスタッター「メタマジック・ゲーム」第29章、白揚社(1990年9月)
  2. ロバート・アクセルロッド「つきあい方の科学」HBJ出版局(1987年2月)

Home Page