和機器人打撲克,4名人類頂尖選手20天輸了176萬美元
經過長達20天的角逐,人機對決撲克錦標賽(Brains vs AI poker tournament)日前在美國匹茲堡 Rivers 賭場落下帷幕,卡內基梅隆大學(CMU)人工智能(AI)程式 Libratus 一路高歌猛進,從4位人類頂尖撲克玩家處總共贏取約176萬美元籌碼。這代表在「不完全資訊」博弈中, AI 同樣技高一籌。
以『不完全資訊』進行戰略推理方面,最好的人工智能已經超越了最好的人類。
美國卡內基梅隆大學(CMU)計算機科學學院教授 Tuomas Sandholm
雖然迄今為止,被命名為 Libratus 的人工智能程式還只適用於撲克,但開發團隊希望在更多領域嘗試其能力,CMU 計算機科學學院的 Frank Pfenning 聲稱:「開發能夠玩好撲克的 AI 是科學的巨大進步,它的原理可以被用於許多方面。想像一下,未來您的智能手機將在您購買新車時幫你砍價……現在只是個開始。」
Libratus 基於匹茲堡超級計算機中心(PSC)的超級電腦 Bridges 運行。據 CMU 透露,Bridges 的每秒浮點運算次數達1.35千萬億次(1.35 Petaflops),約等於高端筆記本電腦的7250倍;其內存達274 TB(Terabyte,萬億字節,1TB = 1024GB),約等於1萬7500台普通筆記本電腦的總和。
在比賽過程中,由於 Libratus 能夠將其前一天所犯戰略錯誤在之後一天修正,所以有職業撲克玩家推測,CMU 研究人員會在比賽間隙的晚上手動修正程式。但 CMU 團隊的賽後新聞稿澄清了相關猜測:「每天比賽結束後,一個元算法會分析人類玩家在 Libratus 的戰略中發現與利用了什麼戰略漏洞,然後 AI 算法自主優先考慮修補位列前三的可被利用漏洞。」
不過目前大多數在線撲克玩家並不用擔憂 Libratus,因為該程式僅適用於「一對一無限注德州撲克」(Heads-up No-limit Texas Hold'em Poker)玩法,具有三位或更多玩家的玩法顯然會更為複雜,需要採用完全不同的策略與算法。
雖然經過20天的掙扎後,參與賽事的人類玩家輸給了 Libratus,但他們還是可以根據各自表現瓜分20萬美元的「獎金」。參與玩家之一 Jason Les 表示:「通常,為了獲取類似經驗你可能會損失掉很多錢,但在這裏,我至少沒有真正輸掉任何錢。」
1月12日報導:人機對決撲克錦標賽美國開幕,「不完全資訊」博弈人類能否技高一籌
2017年初,Google 人工智能系統 AlphaGo 橫掃人類頂級圍棋高手後,在喧囂中宣布「結束網絡測試」飄然而去。但人工智能與人類大腦的對決顯然不會就此結束,美國當地時間1月11日,人機對決撲克錦標賽(Brains vs AI poker tournament)在匹茲堡的 Rivers 賭場正式拉開帷幕,四位全球頂級職業撲克玩家與人工智能程式 Libratus 在為期20天的賽程裏,將以「一對一無限注德州撲克」(Heads-up No-limit Texas Hold'em Poker)玩法一決雌雄,並已在線上平台 Twitch 直播比賽進程。
但無論勝負結果如何,參與錦標賽的 Dong Kim、Jason Les、Jimmy Chou 和 Daniel McAulay 這四位人類職業玩家,將根據各自表現瓜分20萬美元的「獎金」;而被命名為 Liberatus 的人工智能程式如果能夠獲勝,則將像「深藍」(Deep Blue)與 AlphaGo 一樣青史留名。
自人工智能開始研發以來,能否擊敗頂級人類玩家一直是驗證該領域進步程度的有效方式……但與其他遊戲相比,撲克是一種更困難的挑戰,因為它需要機器基於不完全資訊(Imperfect Information)做出極其複雜的決定。
美國卡內基梅隆大學(CMU)計算機科學學院教授 Tuomas Sandholm
「在擁有完全資訊的遊戲裏,人工智能可以在諸多可能性中選定一組進行推演,」卡內基梅隆大學教授 Tuomas Sandholm 說,他與其博士生 Noam Brown 共同開發了 Libratus 系統,「然而用不完全的資訊進行遊戲博弈時,形勢要更加困難,因為人工智能不知道其他玩家擁有什麼牌,這意味着程式無法在決策樹(Decision tree)的架構下選擇確定的下一步。此外,人工智能也不知道接下來會是那些牌出現在桌面上。」所以人工智能無法像在玩國際象棋或圍棋時那樣,通過計算所有步驟的勝率做出最優選擇。
這是卡內基梅隆大學推出的第二場類似比賽,2015年時該校開發的人工智能程式 Claudico 在與 Dong Kim 等4位職業玩家的8萬手較量中最終告負。曾參與2015年賽事的 Dong Kim 表示,他在與人工智能的對戰中獲益良多,他確信這些經驗令他在面對其他人類玩家時擁有優勢。
而在此次比賽開幕之前的1月6日,由加拿大和捷克研究人員組成的一個團隊,搶先向學術論文預印本(Preprint)線上展示平台 arXiv 提交未定稿論文,稱在一項涉及到數十位參與者和4.4萬手撲克的研究中,他們開發的 DeepStack 成為世界上首個在「一對一無限注德州撲克」玩法中擊敗職業撲克玩家的電腦程式。但該論文尚未經過同行評審及正式發表,而 Tuomas Sandholm 教授認為他的這些同行們的人工智能系統「並沒有跟頂級的人類玩家對抗,所以不能說已經擊敗了人類」。