德州撲克人機大戰開打,激戰 5 天獎金 200 萬元人民幣

德州撲克人機大戰開打,激戰 5 天獎金 200 萬元人民幣
德州撲克人機大戰開打,激戰 5 天獎金 200 萬元人民幣

由李開復創辦的創業孵化機構創新工場在 2017 年 4 月 6 日發起中國首次德州撲克人機大戰,此次比拚由中國頂尖德撲高手對戰人工智慧程式冷撲大師,比賽為期 5 天,全程估計長達 45 小時達到 36,000 手牌,勝者將獲得 200 萬元人民幣獎金,創新工場董事長李開復表示,冷撲大師是全球最大的撲克人工智慧,但中國選手也不是毫無勝算。

談起人機大戰,很多人都會想到 2016 年 3 月 Google DeepMind 開發的人工智慧 AlphaGo 和南韓九段圍棋大師李世乭的五番棋大戰,最終 AlphaGo 以 4 比 1 戰勝了代表人類出賽的李世乭,AlphaGo 的勝利吸引了全球媒體的關注,也讓普通大眾了解和認識人工智慧的發展水平。

創新工場將在 AlphaGo 和李世乭的人機大戰決勝一年後,邀請東西方兩大德州撲克高手進行人機對決,比賽在 2017 年 4 月 6 日至 10 日舉行,為期 5 天,雙方將在長達 45 個小時的對決中一別高下,獲勝一方可以得到高達 200 萬元人民幣的獎金。為了降低發牌中的偶然因素,機器人採用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,6 位人類牌手分別在兩個房間與冷撲大師對陣,配對的牌手不能在比賽過程中碰面。

參賽的一方是由卡內基美隆大學 Tuomas Sandholm 教授和他的學生 Noam Brown 博士開發的德州撲克人工智慧程式 Libratus,中文名是冷撲大師,據創新工場博士李開復透露,冷撲大師和我們以往了解的博弈類人工智慧程式不同,這不是基於巨量資料、深度學習和超高性能搜尋演算法的人工智慧程式,而是基於博弈類的模型,加入大概數學和概率論的理念,能在比賽過程中不斷優化演算法模型提升勝率,冷撲大師是撲克類博弈程式中最強的人工智慧程式。Bridges 超級電腦是冷撲大師的幕後支援,每天賽事結束後,位於美國匹茲堡的資料中心會分析對決的資料,優化冷撲大師的策略。

李開復本人也和博弈類程式有很深淵源,他還在卡內基美隆大學就讀時就開發了全球第一個黑白棋對決中戰勝人類世界冠軍的人機對弈系統。如果說 AlphaGo 是一個智商非常高的程式,那冷撲大師就擁有超高的情商,這一人工智慧程式採用的邏輯形式,能應用到日常生活的談判、戰略規劃,未來生活中很多邏輯推演、談判過程都會被人工智慧取代。

此次與冷撲大師對戰的是 6 名中國頂尖德州撲克大師,其中領隊杜悅曾獲得 2016 年世界德州撲克大賽 WSOP 無限注德州撲克冠軍,他認為人類選手的勝率大約有 10%。人機大戰勝負並不是最重要的,而是讓更多人關注德州撲克和人工智慧。