今やAIは6人制ポーカーに習熟する (AI now masters six-player poker)
コンピューター・プログラムは、例えばチェス、碁、そしてヘッズアップ(一対一)で行う無制限のテキサス・ホールデム・ポーカーのような2人プレイヤーのゲームにおいて人間に対して優位性を示している。しかしながら、ポーカー・ゲームは通常、6人のプレイヤーが参加するが、このことは人工知能にとってよく知られた変形である2人プレイヤーよりも遥かに取り扱いを困難にする。BrownとSandholmは、AIプログラム「dubbed Pluribus」を開発したが、そのプログラムはPluribus自身の5つのコピーに対してプレイすることで6人プレイヤーの無制限のテキサス・ホールデムをプレイする方法を学習した(BlairとSaffidineによる展望記事参照)。5人の熟練のプロのポーカー・プレイヤーと戦った時、もしくは一人のプロのプレイヤーに対してプレイするPluribusの5つのコピーと一緒に戦った時、いずれにおいても、このコンピューター・プログラムは明らかにポーカーの10.000回の戦において人間よりもよい成績をおさめた。(Uc,KU,ok,nk,kh)
【訳注】
- テキサス・ホールデム(Texas hold 'em)ポーカー:各プレイヤーごとに配られる2枚の手札と、コミュニティ・カードと呼ばれる全プレイヤー共通のカード(最大5枚)を組み合わせてプレーする。アメリカ合衆国のカジノにおいては最もポピュラーなゲームのひとつである。通常は2人から10人で行われる。
- ヘッズアップ(heads-up)・ポーカー :二人のプレーヤによるポーカー
Science, this issue p. 885; see also p. 864