人工知能がポーカーの達人になる (Artificial intelligence masters poker)
コンピュータは、チェスや碁のような複雑なゲームで人間を打ち負かすことが可能である。これらやそれに類似のゲームでは、情報が盤面に表示されるので,両方のプレーヤーが同じ情報にアクセスする。コンピュータは究極のポーカー・フェイスではあるが、プレーヤーが相手のカードを見ることができないポーカーで、コンピュータに上手になるように教えこむことは、一筋縄ではなかった。Moravčíkたちは、DeepStackというアルゴリズムを開発した。これは、ヘッドアップ・ノーリミット・テキサス・ホールデムと呼ばれる変形二人ポーカーにおいて、ポーカーを職業とするプレーヤーをなんとか打ち負かすことができた。DeepStackは戦略を事前に計画するのではなく、ゲームの現在の状態を考慮してステップ毎に戦略を再決定した。DeepStackの原理は、情報の非対称性を伴う現実世界の問題解決を進展させる可能性がある。(Wt,MY,kj,kh)