大公產品

首页 > 新闻 > 正文

多人得州撲克賽 美AI擊敗頂級玩家

時間:2019-07-13 03:03:32來源:大公報

  圖:合作研發Pluribus的圖奧馬斯.桑德霍爾姆(左)和諾亞姆.布朗\網絡圖片

  【大公報訊】綜合法新社、英國廣播公司及新華社報道:美國卡內基梅隆大學11日宣布,該校研究人員和科技公司Facebook人員合作開發的人工智能(AI)程式在一場六人得州撲克比賽中,擊敗多名世界頂尖選手,成為AI在多人比賽中戰勝人類的里程碑。AI此前已成功在西洋跳棋、國際象棋、圍棋和雙人撲克比賽中擊敗人類,如今在多人撲克比賽中,AI又贏了。

  這一AI程式名叫「Pluribus」,由卡內基梅隆大學計算機科學教授圖奧馬斯.桑德霍爾姆和Fb人工智能部門的諾亞姆.布朗合作研發。在一次六人無限注得州撲克比賽中,Pluribus擊敗了一群頂級職業玩家。該成果11日發表在美國《科學》期刊上。

  通過萬億次自我對戰學習

  Pluribus首先在兩場比賽中,分別擊敗了兩名撲克牌冠軍達倫.埃利亞斯和克里斯.弗格森,兩人在對戰Pluribus的比賽中各自出了5000手牌。隨後,Pluribus又和13名得州撲克高手進行了總數為1萬手牌的不限注六人對戰,每次比賽中由AI對戰5名人類選手,結果AI取得勝利。

  在多人遊戲中,AI必須不斷爭取先手才能最終獲勝。研究人員為此設計了一種新的「有限前瞻搜索」算法,讓AI能做出平衡的整體決策。在研究人員開發的模型中,AI會通過數萬億次的自我對戰,一點一點學習如何利用出牌順序獲得優勢。

  布朗表示,Pluribus的一個優點是訓練所需成本相對較低,僅需要價值150美元的雲計算資源支撐。此外,Pluribus僅通過20小時的學習,就可以擁有擊敗世界頂級撲克手的能力。平均來說,這個AI程式在和5個人對戰時,每小時可贏得1000美元。

  會運用綜合策略

  令人驚訝的是,Pluribus在比賽中會讓自己變得難以預測。例如,它比高級玩家使用「領先下注」(donk bet)的次數更多,因為傳統上這種方式被認為不佔優勢。一般來說,上一輪的跟注者會過牌給上一輪的加注者,好讓對方連續下注。如果跟注者沒有過牌,而是率先下注,則稱為「領先下注」。

  被AI擊敗的埃利亞斯說:「它(Pluribus)的主要優勢是運用綜合策略的能力。這和人類嘗試做的事情一樣,關乎執行力─以完美的隨機方式和一貫性出牌,而大多數人都無法做到。」

  研究人員指,與國際象棋和圍棋比賽相比,得州撲克的挑戰更大,比賽中每方都不知道對手的牌,對手還可能在押注時虛張聲勢,因此決策只能基於不完全信息,這與真實世界中的問題更接近。

  桑德霍爾姆表示,Pluribus的成就「堪稱是人工智能和博弈論的里程碑」。他說,今次勝利將為AI解決真實世界問題提供新的可能性。

最新要聞

最受歡迎