Deva
@davelin
說
Fri, Feb 3, 2017 7:18 AM
1
REF
人工智慧 Libratus 是如何擊敗德州撲克高手的?
「我們只是向 AI 描述了這個遊戲,但沒有告訴它怎麼玩。它完全是獨立於人的玩法形成自己的策略的,而且它的玩法跟人的玩法會非常不一樣。」
通過一種名為反事實遺憾最小化(counterfactual regret minimization)的算法,它先是隨機地玩,然後最終在經過幾個月的訓練以及玩了上萬億手撲克之後,它也達到了能挑戰最好人類玩家的高度。不僅如此,它的玩法還是人類所不能的—— 它下注的範圍要大得多,而且會對這些賭注隨機化,這樣對手就更難猜自己手上都有什麼牌了
Deva
@davelin
說
Fri, Feb 3, 2017 7:36 AM
「撲克曾經是 AI 最難攻克的遊戲之一,因為關於遊戲狀態你只能看到部分資訊。撲克並沒有單一的最優下法。相反,AI 玩家必須讓自己的行動隨機化,這樣它詐唬時才能讓對方無法確定真假。」
轉順~
@leo54879888
Fri, Feb 3, 2017 8:20 AM
載入新的回覆
「我們只是向 AI 描述了這個遊戲,但沒有告訴它怎麼玩。它完全是獨立於人的玩法形成自己的策略的,而且它的玩法跟人的玩法會非常不一樣。」
通過一種名為反事實遺憾最小化(counterfactual regret minimization)的算法,它先是隨機地玩,然後最終在經過幾個月的訓練以及玩了上萬億手撲克之後,它也達到了能挑戰最好人類玩家的高度。不僅如此,它的玩法還是人類所不能的—— 它下注的範圍要大得多,而且會對這些賭注隨機化,這樣對手就更難猜自己手上都有什麼牌了