テキサスホールデムポーカーとAIについて

こんにちは。

中学生の藤井4段が将棋の公式試合での連勝記録を塗り替えたことで将棋への注目が集まっていますが、5月にAIが佐藤天彦名人に圧勝したことも僕にとっては衝撃的でした。ちょっと棋譜を見た感じでも佐藤名人とAI(PONANZA)の差はだいぶあったと思います。だいぶ前にdeepblueがチェスで、最近はグーグルのAlphaGoが囲碁で人間を破り、人間とAIの勝負もそろそろ終わりが近づいてきているように思えます。では次にAIが人間を打ち負かすのはどのゲームなのか。多くの研究者が注目しているのがポーカーです。

 

ポーカーには多くの種類がありますが一番プレイされているのはノーリミットテキサスホールデムです。簡単にルールを説明しておくと、すべてのプレイヤーに2枚づつカードが配られ、場に5枚のカードが出され、手札の2枚と場の5枚のカードの7枚のうち最強になる5枚の強さを競うゲームです。なぜポーカーがAI研究で注目されるかというと、囲碁や将棋と違ってポーカーは相手の手札や次に場に出るカード(場の5枚のカードは0枚、3枚、4枚、5枚の順で明らかになり、プレイヤーはそのたびにゲームに参加するかどうか、掛け金をいくらにするかどうかを決める。)が見えない「不完全情報ゲーム」だからです。比較的早い段階で人間が敗れたチェスと違って、将棋や囲碁は考えられる手の数が多かったこともAIに敗れるのが遅くなった原因ですが、ポーカーはすべての情報が明らかになっていない、掛け金が無限に存在する(ノーリミットテキサスホールデムの場合)、相手がゲームに参加しなかった場合及び、一人を除くすべてのプレイヤーがゲームに参加しなかった場合は手札が公開されない(AIが学習できない)、人間は時として相手の癖や自分の直感で判断する(ちなみにこの”直感”の模倣は囲碁ソフトAlphaGoに組み込まれている。)、考える時間が少ないなどの理由から計算量や時間的制約の関係で、人間に勝利するおよび最適解を見つけ出すことが極めて難しいと考えられていました。

しかし最近になって、やはりAIが最強のプレイヤーたちに勝利したようです。

 

世界のトップ選手に勝利したのはカーネギーメロン大学で開発されたLibratus。カジノで行われるような対面の対決ではなく、4人のプレイヤーとAIがオンラインで勝負し、合計12万回勝負をして最終的にAIがすべてのプレイヤーに勝利したということです。このAIとプレイヤーの勝負は実は以前にも行われていましたがその時はAIの惨敗でした。ここ数年のAIの進歩はやっぱり目を見張るものがあると思います。

 

AIが不完全情報ゲームで人間に勝利し始めたというのは大変なことだと思います。

というのも、投資や戦争、個人間のオークションや国際間の条約などあらゆる交渉も不完全情報ゲームだからです。ウォールストリートジャーナルで10年後にApple製品がこれから何をするのかさえ忘れている人をカフェに連れていき、交渉相手と自分の台本を読ませるという大胆な予想がされていましたが、あながちありえないとも言い切れないですね。これからAIがどんなイノベーションを起こすのか非常に楽しみです。

 

まあ、AIが将棋や囲碁、ポーカーで人間を負かしたところでそれぞれのゲームの面白さは変わらない、むしろ様々な可能性や思いもよらないような手の発見はゲームをさらに面白いものにすると個人的には思っています。人間vs人間の戦いももっとハイレベルになるでしょう。

ポーカーの話をしてポーカーがしたくなってきました。

今月中くらいに久しぶりにカジノでポーカーしてこようかな。

 

では。