IA ポーカー – 誰が勝ちますか?

0のコメント

It is now twenty years on since the notorious match between Chess world champion Garry Kasparov and Deep Blue – IBM’s super-computer.  Kasparov 失われた Deep Blue は、コンピュータが実際の人間のチェスの名人によって制御されていると非難し続けました。 本質的に、カスパロフは詐欺行為と呼んだ。 チェスの名人は、冷酷で計算高い機械が、論理的で思考力のある人間に勝つことができるとは信じませんでした。 実際のところ、マシンが人間の相手に勝つことができたのは、おそらくまさにディープ ブルーの厳格で計算高い性質のおかげでした。

Deep Blue did not have the capacity to be creative or apply any form of “enlightened” reasoning – the very things that often end up interfering with sound judgement.  Deep Blue was all about applying the rules of the game of Chess in the most optimum way possible in order to achieve a certain outcome.   Deep Blue’s performance and subsequent victory announced the dawn of a new age:  the age of artificial intelligence and its capacity to outsmart, outwit and out-think humanity.

Deep Blue はビッグデータの時代に集結しました。

無敵の定義

Despite Deep Blue’s astounding success – there are games that have caused the proverbial scratching of the head; even machine-like heads.  One of these are StarCraft – a real-time strategy game involving the development of a player’s own military base and the subsequent attack on those belonging to other players.  StarCraft was the very first eSports game ever – and researchers working for giants like Facebook and Microsoft have published papers relating to StarCraft and AI’s inability to crack the bulletproof inner workings of the game, mainly due to the seemingly endless number of variables posed by the game.

参照  カジノゲームをフィーチャーしたベストビデオゲーム

マシンはホールデムのタイミングを知っていますか?

どうやら答えは「はい」です。 AI 開発者 DeepStack は、(人間の) ポーカー ビジネスで最高のプレイヤーと競争できる人工知能を開発しました。 DeepStack の成功の秘密は何ですか? 深層機械学習。 DML は、基本的な思考プロセスにおいて人間の脳を模倣しており、本質的には機械に新しいトリックを学習させることができます。

テキサス ホールデム ポーカーの本質は、人間の直感という特質に依存しています。 直感の機械的なバージョンは、ゲームの残りのすべてのステップを計算しようとする AI システムによって採用されていた以前の戦略から離れ、その代わりに、一度に数ステップだけ開発に遅れをとらないようにすることで発見されたようです。

(DeepStack で採用されている) 新しい AI のやり方には、新しい情報が利用可能になるたびにアルゴリズムと将来の戦略を常に再計算することが含まれます。 DeepStack はどのようにしてこの特別なスキルをその謙虚な弟子に教えたのでしょうか? 10 を超えるランダムなポーカー ゲームの状況を投げることによって。

火の洗礼

2016 年、国際ポーカー連盟は 10 人のプロ ポーカー プレーヤーを厳選し、DeepStack の戦略と対戦させました。 運が勝利につながったケースと戦略のケースを分離した結果、DeepStack の勝率はプロ プレイヤーが妥当な差であると考える勝率の XNUMX 倍以上であるという結論に達しました。

この結論と調査結果は、ピッツバーグのカーネギー メロン大学の研究者が考案したポーカー プレイ AI である Libratus が享受した最近の成功と一致しています。 Libratus は、120,000 ハンドという驚異的なポーカーの中で、世界最高のテキサス ホールデム ポーカーのプロの何人かと対戦しました。 Libratus はそのうち XNUMX 人をブラフで打ち破りました。

参照  クレイジー クラップスの事実

ドン・キムはマシンに出し抜かれたプレイヤーの一人で、試合の半分の時点で実際にリブラタスが自分のカードを見ているのではないかと疑い始めたと後で報告した。 同氏は続けて、Libratusの不正行為自体を非難しているのではなく、AIは単純に優れていたと述べた。

私たちはたくさんいます

Carnegie Mellon’s merry men did not seem to eager to divulge much about Libratus or the inner workings of its decision-making during the stand-off, but it was revealed later that Libratus wasn’t a singular AI – but instead relied on a three-prong system working together towards a common goal.

基本的に試行錯誤の方法である強化学習に依存して、Libratus はそれ自体に対して次から次へとゲームをプレイすることで成功しました。 当初、それは特別なポーカー戦略などについて何も知りませんでした。単にゲームのルールが何であるかを認識しただけでした。 三重のネットワークの枠内で繰り返し対戦することで、あらゆる可能な手段と組み合わせを探求し、目の前の任務にうまく備えることができました。

公平を期して言うと、Libratus は、その日のラウンドの後、いわば毎晩状況を把握できるという恩恵を享受したことを言及しておかなければなりません。

それでも、すべての条件が同じであれば、Libratus は人間の作成者の期待をも上回るパフォーマンスを発揮しました。

スピンパレスデポジットなしカジノボーナス>>


情報源: spinpalace.com
IA ポーカー – 誰が勝ちますか? 更新しました: 2019 年 6 月 18 日 著者: デイモン