Google 為何選擇圍棋?

Google 為何選擇圍棋?

1 為什麼是圍棋? 由Google(谷歌)旗下的DeepMind開發的圍棋軟體AlphaGo,在二○一六年三月打敗世界一流棋手李世乭,為世界帶來衝擊與驚嘆,其後AlphaGo的進階版Master,則於二○一六年底跨年與世界高手們,在網路展開快棋測試車輪戰,取得六十連勝的壓倒性勝利,可說是已經對「電腦人腦誰強」的問題,下了一個論斷。 然而,圍棋AI並未因打敗人類而中止對它的研究,不只AlphaGo繼續在嘗試其他版本,二○一七年五月繼續舉行與世界排名第一柯潔的頂尖大賽,其他圍棋軟體也急起直追,現在已經達到AlphaGo打敗李世乭時的水準。為什麼AI鎖定圍棋為征服的目標,而勝利之後還戀眷這個戰場呢? 電腦下棋,一直被當成AI的能力的指標;一九九七年IBM電腦程式「深藍(Deep Blue)」擊敗世界西洋棋冠軍卡斯帕洛夫,給世界帶來很大的震撼;直到二○一五年,電腦在圍棋這方面還一直無法與人較量。這次Google以深層學習技術為主題,大力進軍圍棋,達成打敗人類的目標,顯示圍棋具有象徵性的意義。 圍棋的變化數是十的三百六十次方,是西洋棋十的一百二十次方無法相比;圍棋艱難之處不僅變化多,它的形式也不同於其他主要棋類,皆以擒王為目的,例如象棋、西洋棋等。而圍棋的目的在棋盤中占據大於對方的領域,是比較特別的。 擒王形式的遊戲因為目標明確,至今的電腦比較擅長,而圍棋這種全局統計性的目的,反而是人類的直覺比較管用,也因此圍棋軟體的開發被認為有助於分析人類的直覺。 這次達成打敗人類的主要技術的深層學習,正是讓電腦獲得直覺能力的方法,也證明了由深層學習所獲得的能力,能有高於人類的表現。 2 圍棋最像現實社會 對人而言,棋類一直具有模擬的意義,象棋可以說是傳統戰場的模擬;但是現代社會分散化,特定人物的重要性相對減低,沒有誰是那麼重要的,擒王就死的假定,逐漸不符合現實,反觀圍棋「占據領域勝過對方」這樣的目標設定就很普遍,像市場占有率等在現實社會比比皆是。 尤其圍棋是比黑白棋子最後哪一邊多,正如兩大陣營選一人的選舉模擬,曾有國內政界大老再三要我教他政治戰略,認為跟圍棋戰術非常類似;選舉策略的「接地氣」、「空中戰」與圍棋的戰略術語不謀而合,「活棋」、「死棋」、「棄子」、「下指導棋」等圍棋術語也不時被拿來作政治評論。 過去有人對AI的應用範圍,抱著質疑的態度;因為圍棋被歸類於「完美信息遊戲」,亦即所有的資訊完完全全地攤開在遊戲人的前面,都都在棋盤上看的見,沒有任何黑箱,這種情況在現實裡並不多見,一般狀況人們都是藏著各自的王牌在喊價,像「不完美信息博弈」的撲克(梭哈)遊戲,需要觀察別人反應來調整自己戰術,懷疑這類的模式AI無法適應。 但二○一七年的費城德州撲克賽紓解了這個疑問,卡內基美隆大學開發的撲克AI的Libratus徹底打敗世界四名頂尖職業高手;Libratus是大學的研究成果,所有動用的資源遠遠不如AlphaGo,更令人吃驚的是,Libratus甚至不用深層學習,是用AI內部的自我對戰學習打造的技術。 圍棋看起來是單純的「完美信息遊戲」,可是因為它的變化數對當今的AI來說,還是多到無法掌握;因此對遊戲人來說,不管人腦電腦,圍棋還有「不完美信息博弈」的面相。 因此我不認為圍棋AI的技術與機制,和不完美信息博弈無關,德州撲克AI的開發者表示,德州撲克AI是做到「不管對手如何行動,自己都不會吃虧」;這個話一字不改,也是圍棋的基本目標,圍棋一流棋手真正厲害的地方,並非一般想像的「對特定的著手有精準的對策」而是「把局面控制成不怕對手的任何手段」。 圍棋可謂是已知與未知之間的朦朧區(Twilight Zone),一方面有客觀棋力標準,讓AI在擊敗人類之後還有提昇技術的空間,一方面有隨機性,具有對各類AI技術模擬測試的功能。 3 圍棋是溝通人類與的最佳語言 圍棋自古別名為「手談」,對局者可以借著下一局棋得到濃密的交流,勝於一般會話;和語言不通的外國人,只要對方會下圍棋,一局下來保證一見如故,圍棋也可以看成是一套另類的語言,溝通對局者,乃至觀棋人。 AlphaGo與李世乭之戰,有人說AlphaGo下的棋看不懂,所以需要懂AI的人來翻譯AlphaGo下的棋,比賽那幾天的情形確實如此,此後情形可能會不一樣;人類與AI在棋盤上追求的東西是一致的,也就是說,是共有同樣的圍棋語言,圍棋其實是一個翻譯者,可以用它的語言溝通人類與AI,成為相互理解的橋梁。 圍棋不僅是人工智慧的第一個實驗平台,也提供新技術的方向,Google不斷強調AlphaGo的架構並非特別為圍棋打造,圍棋的職業水平,因為有足夠的市場規模與長遠的歷史,應該不會比其他領域遜色。 AI在圍棋做得到的,在其他領域應該也做得到;除了前言介紹的節能省電、自動翻譯、自動駕駛、醫療診斷乃至投資諮詢、設計創作等,幾乎所有領域都可能成為技術轉換的對象。屆時,現在在圍棋發生的事情,與其呈現的意義,將遍及全人類社會。 何況深層學習的歷史是現在才要開始,二○一七年三月的圍棋AI間的國際比賽顯示,只要改善深層學習過程的一部分,其學習速度能加快很多;不僅深層學習的技術會不斷升級,配合其他技術後可能有意外的效果,而另類的新技術也隨時會出現。 AlphaGo在一年內達成了被認為是最少需要十年才能達到的目標,此後產業升級的速度與程度,不能用至今的感覺去衡量,任何產業甚至文化,都必須加緊研究AI。 4 不懂圍棋也能共享 有人認為圍棋是小眾的遊戲,這跟圍棋「不容易忘記」的特點,有很大的關係;圍棋只要你達到一個水平,就能一直保持同樣的棋力。 初段的棋友十年不碰圍棋,復出的時候還是初段,這可能跟前述圍棋最需要動用「直覺」很有關係,可說是圍棋的一個優點。 圍棋棋友的棋力只進不退,本來是件好事,不過也有副作用,就是讓棋友「很容易忘記」自己不會下棋的時代,導致對比自己弱的棋友失去同理心;在日本,比起其他休閒活動,圍棋是對初學、初級者最不客氣的。 圍棋技術不容易忘記的「優點」有時反而成為推廣的障礙;很多圍棋活動,自然偏向以高棋為主要對象,對不會下棋或是初學者的棋友來說,圍棋講解像是術語滿天飛的外語演講,聽半天不知所以然。然而圍棋若是與其他領域有所關聯,圍棋講解對不會下棋的朋友原本應是有意思的。我下了一輩子棋,對不熟悉圍棋的人欠缺同理心,不落任何人之後,但我一向提高意識,警惕自己,在講解圍棋的時候,不管棋力高低,盡量讓所有人能理解它的內容。日本名棋士藤澤秀行說「圍棋的內容若以一百計,我只懂其中之六而已」,這句話超越圍棋界,深獲日本各界支持。我的期待是就算不會下棋,也不妨礙讀這本書,因為圍棋絕大部分的94%,是「不懂」是與不會下棋的人所共有的,最怕的是誤以為自己什麼都懂,這樣大部分的東西就看不見了。 讓我們藉著圍棋AI,一起來探討人類什麼地方懂,什麼地方不懂吧! 本文取材自《迎接AI新時代:用圍棋理解人工智慧-序章》,感謝遠流出版授權刊登 作者/王銘琬 出版社/遠流