↓おぉっと!! ここで露骨な広告攻撃だ!! 悪しからず(笑)

ゲーム理論の<裏口>入門 おすすめ書籍

その他
全てのゲームに勝つ方法を知りたいか?

解:そんなものは無い

~完~

……

………これで終わったら、怒られそうだ(笑)

かくいうブログ主も、ポケモン対戦や麻雀やMTGにハマりにハマり、相手とのスリリングな駆け引きを存分に楽しみつつも、「必勝法はあるか?」という幻想に魅了されたことがある。

てなわけで本記事では、ゲーム理論を勉強するためにボードゲームをプレイしてみたい人や、ゲーム理論に興味があるボードゲーマーを想定した、ゲーム理論導入書を紹介しよう。

先に注意点をば。

・ゲームと聞いて、格闘ゲームやシューティングゲームのような、操作技術や処理速度がものいう電源系ゲームや、勝ち負けを目的とせず、コミュニケーションなどを楽しむゲームなどをイメージした方もいると思うが、これらはゲーム理論の直接的な分析対象ではない。

・おすすめ書籍の目的はゲーム理論の導入であり、ボードゲームのプレイ技術を極めることではない。よって、本書を読むことでボードゲームが強くなるかどうかは怪しい(笑)。ただし、プレイング向上に役立つようなゲーム理論の概念が盛り込まれている。そのため、特にゲーム理論家が得意とするような、ルールを見てゲームの帰結を予測する技術、つまり…

初見のゲームの構造を、
説明書を読むだけで看破し、
速やかに中級者になる技術

に関しては有益な情報を提供してくれている。

それでは、早速おすすめ書籍のポイントを3つ語っていこう。

↓おぉっと!! ここで露骨な広告攻撃だ!! 悪しからず(笑)

そもそもゲーム理論とは?

ここにきて、お堅い話かよ!! さっさとテクニックを教えてくれよ!!

……そんな声が聞こえてきそうだが、まぁ待たれよ。

さっきから「ゲーム理論」という言葉が頻用されて空回りしてそうなので、ここでいったん言葉の定義を説明させていただきたい。

ゲーム理論とは、
複数の主体が各々の目的をもって意思決定をする状況を分析する学問である。

マッチング・メカニズムの設計や仮想通貨システムの分析のように、
今日の社会科学では必要不可欠なツールとなっている。

ゲーム理論が「ゲーム」という名前を冠しているのは、
複数の主体(つまりプレイヤー)が別々の目的を持ち、
各々が自己の利益を最大化するべく行動を取るという状況が、
あたかもボードゲームのようであるからだ。

自然科学などで考えられている多くの最適化問題は、「1人の意思決定者がどうすれば自身の目的を達成できるか」を考える。

例えば、天気予報をする際、予報士は地球との駆け引きを考える必要はない。ボードゲーム的にいえば、パズル、あるいは1人プレイ用のゲームのプレイに取り組んでいるわけだ。

一方、利害関係者がたくさんいる問題では、自分の利益を最大化するためには、相手がどのような目的に沿って行動を決めているのかをよくよく考えなければならない。

このように、相手プレイヤーの手を読み、それに対する応手を考えるという構造は、ちょうど多人数のボードゲームでプレイヤーたちが直面する問題とそっくりなので、ゲーム理論は「ゲーム」の理論と呼ばれている。(そのまんまやんけ!!(笑))

社会科学で分析される問題のほとんどは、パズル的な問題ではなく、ゲーム的な問題である。社会は常にたくさんの人々で構成されており、そして人々は時に共通し、時に対立する独自の目的をもって行動する。問題から行動の読み合い・戦略的な駆け引きを排除できるケースは珍しい。

このような実践的な必要性から、ゲーム理論は経済学をはじめとする社会科学者たちの研究トピックとしても人気と重要性が高く、1994年にジョン・ナッシュ達がノーベル経済学賞を受賞して以降、2020年までに20人近いゲーム理論研究者らが受賞者に選ばれている。

勝つためのテクニック:後ろ向き帰納法、選択肢の多さ、ブラフ、etc.

それでは、やっとこさプレイング向上のテクニックを語っていこう♪

ここでは、本書からブログ主チョイスのトピックを紹介する。

[後ろ向き帰納法]
プレイヤーの仕事は各局面(選択を行う時点でプレイヤーが直面している状況:ゲームの盤面の様子)で、最終的に利得を最大化するような選択肢を選ぶことだ。
最適なプレイングを行うということは、利得を最大化するような戦略を選ぶということに他ならない。

局面の評価値とは、その局面から最適な戦略を取ったときにどのぐらいの期待利得(利得の期待値)が得られるかという情報を記録したものだ。

「すでに終了条件を満たしている」局面の評価値は、ゲームのルールとして定められている利得と一致するということを足掛かりに、その一歩前、さらにその一歩前……と、評価値の計算ができている局面をどんどん増やしていけば、理屈の上からいえばすべての局面の評価値を計算することができ、しかもどういう戦略が最適なのかがわかる。
これが動的計画法、あるいは後ろ向き帰納法と呼ばれる考え方だ。

もちろん、現実には後ろ向き帰納法による求解は計算上難しいので、より単純化した問題を考えたり、最善手とはいえないがそれなりに性能が良さそうな手を「ヒューリスティクス」(簡単に計算できるが最適な答えが返ってくるとは限らない手法)を用いて見つけたりしている。
[選択肢の多さは基本的には有利、ただし例外あり] その①
必勝法や有効なヒューリスティクスの内容は、考えているパズルやゲームの具体的な構造に強く依存する。
例えば、チェスで勝つための基本的なコツである、
「コマの価値を基にコマの交換の損得を評価する」
「コマが効いているマスが多いと有利」
「盤の中央にコマが展開されていると有利」
…というようなセオリーは、ルールが似ている将棋でもある程度有効だ。
他方で、これらのセオリーは、ルールがまったく異なる囲碁やオセロに対しては何の役にも立たない。

裏を返せば、ボードゲーム間の類似度を適切に評価することで、セオリーは流用できる場合があるということだ。
今プレイしているボードゲームのどういう特徴が、別のボードゲームではどのようなセオリーが有効とされているかを適切に把握できれば、初見のボードゲームに対しても即興で有効なヒューリスティクスを構築できる。
本書で解説している、ボードゲームの特徴を抽象化・単純化してモデルで捉え、考察する方法は、このような類似性の発見に対して強みを発揮する。

「取れる選択肢が多いことは常に有利に働く」という特徴は、すべてのパズル(1人プレイヤーの最適化問題)に共通する普遍的な真理だ。
増えた選択肢が損であるなら、単にそれを取らなければよいだけなので、パズルの場合には選択肢が増えることでプレイヤーが不利になることは絶対にない。
選択肢の広さを意識しつつプレイすることは、多くのパズルにおいて実務的に有効なヒューリスティクスである。
[選択肢の多さは基本的には有利、ただし例外あり] その②
しかしながら面白いことに、「手が広いほど有利」というすべてのパズルに通ずる超強力なヒューリスティクスは、ゲームに対しては常に有効とは限らない。
この点は、パズル(1人)とゲーム(複数人)を対比するよいポイントになっている。

具体的な例は本書を読んでいただきたいが、相手が存在するゲームでは、先手で何らかの手を選んでしまったり、あるいは意図的に自分が取れる選択肢を狭めたりすることによって、相手の選択を誘導し、結果として得になる場合がある。
このような(利益を高めることを目的として)相手に分かる形で手を狭める行為を「コミットメント」と呼ぶ。

コミットメントは、チェスや囲碁や将棋といった2人プレイのゼロサムゲームでは効果がない。
これらのゲームでは、自分の得は相手の損と一対一なので、選択肢を狭めることで相手の行動を自分に有利になるように誘導することはできないのだ。
しかし、プレイヤーが3人以上でプレイする場合や、2人プレイであってもゼロサムでない場合(そんな設計のボードゲームはあまり存在しないが(笑))には、コミットメントが有効なケースが生じうる。

コミットメントを行う上で重要なのは、自分が手を狭めたことを相手にしっかり周知することだ。
自分が手を狭めたことが他のプレイヤーに知られていなければ、他のプレイヤーは行動を変えることはなく、それではパズル同様に利益は全く生じない。
利益を得られるのが、常に相手の行動を誘導し、変化させられる場合のみであることは、ボードゲームをプレイする上で実務的に役に立つ知見だ。
[ブラフの隠れた効果]
不完備情報ゲームとは、プレイヤーによって見られたり見られなかったりする私的情報(≒手札)が存在するゲームのことだ。
その最たる例は、ご存知、ポーカーだろう。

こうしたゲームの基本戦略として、「相手の選択肢」から「相手の手札」を予想し、「自分の選択肢」から「自分の手札」を相手がどう予想するかも考え、「相手がこういう戦略を取ってくる」と想定することが挙げられる。

そんな中で、ブラフには一見見落とされがちな隠れた効果がある。

「ブラフは相手を降ろすためのもの」という直接的な効果はわかりやすい。
相手がフォールドしてくれるなら、自分の手が真に強いかどうかは関係がなく、チップをせしめることができる。
自分の手が悪いにもかかわらず、賭け金を奪うことができたという事実関係は、プレイヤーの目から見ても明らかなので、これがブラフの唯一の効能だと理解しているプレイヤーも多いだろう。

ブラフの隠れた効果とは、相手にブラフを疑わせて勝負させる頻度を高め、いい手を引いたときに奪えるチップを増やすことだ。
こちらの効果は、ブラフを行うのが悪い手を引いたときなのに対し、収益を得るのはいい手を引いたときなので、一見見落とされがちだ。
細かなパターン分けは本書を参考にされたしだが、一定以上の確率でブラフによるレイズを行うなら、対戦相手はブラフの可能性を疑い、勝負手のときにもコールを選んでくれるようになる。
この効果により、いい手を持っているときの収益性が高まってくるのだ。

ブラフを行う確率を考える際には、単純な目の前の損得だけではなく、相手のプレイングに与える長期的な影響を考慮する必要がある。

シンプルにしてディープな前提:相手を信じる

さて、前項でゲーム理論におけるテクニックを挙げてきたわけだが、ここで最強最大の前提を一言述べておこう。

こうしてテクニックの多くは、対戦相手の反応に介した効果を狙っている。
つまり、相手が自分の戦略に応じて機敏に戦略を調整することを前提としている。

したがって、コミットメントのところでも述べたが、対戦相手がこちらの戦略をきちんと観察していない場合には、意図的なプレイングは有効に働かないのだ。

対戦するなら、思考の読み合いや駆け引きができる相手達とやりましょうということで。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

ここで紹介したのはおすすめ書籍で語られているトピックのほんの一部である。

もっと知りたいと思ったら、是非とも本書を手にとって欲しい。

ちなみに、本書を読了してから、ブログ主は麻雀をやりたくてしょうがなくなった(笑)

これぞ愚者への道程? いやいや、これぞ賢者への道程!!(言い切る(笑))

コメント

タイトルとURLをコピーしました