ChatGPT如同核彈!這局中國難贏美國?

美中科技戰,戰線從半導體拉到AI人工智慧,美國享有強大的先進者優勢,中國也快速跟進,夾縫之中的台灣,又該如何應對?

美國中國G2的角力爭鬥,戰場延伸滲透到愈來愈廣大,這波風起的AI人工智慧,再度成為勢力消長的交鋒點。

政治狂人、俄羅斯總統普丁(Vladimir Putin)曾說,「誰成為AI領域的領導者,誰就會成為世界的統治者」,加深人們對AI推動霸權的憂慮。

聚焦於國際關係的《哈佛國際評論》(Harvard International Review),四月份報導指出,美國和中國是全球人工智慧發展最前端的兩大國家,兩者將成為此革命性技術的全球巨頭。

現階段情勢判斷,美國可能繼續在AI領域領先,不僅是OpenAI的ChatGPT、Google的Bard發布,更因為從技術底層來看,相較於英文,中文更不利於訓練語言模型,以及美國在去年10月祭出的設備出口禁令,限制中國取得任何高階晶片、先進半導體設備,甚至軟體與人才,整體拖慢中國AI領域發展。

致使中國即便在本月由百度、商湯,推出「文心一言」、「日日新」等生成式AI服務,整體服務仍不夠犀利,甚至有些網友從答案之中,發現援引美國生成式AI的可能,例如輸入自由的想像,竟然飄著美國國旗。

但如果沒有直接援引美國產品,卻出現「美國」思維的答案,這更是可怕,因為答案與訓練AI模型的鉅量網路資料有關,其實網路內容語言文字,以英文為主,根據W3Techs 2019年數據,英文就佔據了54.5%之多,中文其實只佔1.6%,答案的「偏頗」可想而知。

百度在3月推出「文心一言」,但目前普遍不被看好。百度提供
百度在3月推出「文心一言」,但目前普遍不被看好。百度提供

「OpenAI就是必須open,才有AI」

生成式AI服務,需要三大要素:強大的運算能量、自我學習的演算法、大量的資料餵養,不然無法達成,前兩項中國還有機會快速追平美國,但在資料量體上,則很難一時半刻追上。

前Google台灣董事總經理簡立峰分析,美國在AI這一局到底做了什麼?其實也沒做什麼,ChatGPT是一個開源軟體(Open Source Software)不斷演化,最重要的是在「對話式介面」環節的精細調整,也就是「人為介入的監督式學習」。

簡立峰32年前、1991年博士其間做出第一個本土「語言模型」,與ChatGPT使用的語言模型已經大不相同,他直言「自己被顛覆掉了」,差異是以前人類加入知識的比重比較多,現在則是機器自行學習的資料比較多,「現在很像是人類用『教』的概念在訓練系統」,例如訓練家犬,命令握手時,牠若舉起前肢,就給答對的獎勵,牠若坐下,就給答錯的告誡,直到家犬可以將命令與動作,正確連結為止。

因此若要透過崛起中的生成式AI領域,贏下AI賽局,鉅量的訓練資料是勝出關鍵。

前Google台灣董事總經理簡立峰。陳之俊攝
前Google台灣董事總經理簡立峰。陳之俊攝

「OpenAI的啟發就是,必須open(開放),才有AI,因為它需要open user(使用者)、open answers(答案),只要constraint(約束)AI,它就無法進步,也就不準確了」,簡立峰直言。

生成式AI的一大特色是突破語言限制,它視各種語言的字詞都是獨立token(符號/象徵),透過前後文出現的其他字詞,生成可能的答案,例如輸入今天天氣很__?系統就會探索資料,根據相關字詞出現的數量,判定可能說的「很好」「很冷」等字詞,若是用英文問:How is the weather today?甚至是中英夾雜、不通順的句型,例如:How天氣今天很?都會得到相似的答案。

所以現階段的中文生成AI,可以說是奠基於英文資料,而且是在英文毫不費力的情況下,所做出來,中國這一局丟了面子。

「中國壓力非常大,因為中文是國族命脈。中國認為只有中國人才做得到的中文對話式AI,很不幸的,由完全不懂中國人的一群美國人,做出來了,而且它回答了所有中國不敢回答的問題, 」簡立峰表示,由英語資料主導的世界觀、價值觀,若是透過功能強大的生成式AI發散,簡直不敢想像帶來的影響,「對中國來說,ChatGPT簡直是動搖國本啊,可說是核子彈啊」。

而且生成式AI在長期的自我學習之下,透過一層層的神經網絡,其實人類最後並不知道自己訓練出什麼,因為它對資料無法溯源,就算都答對了,也不知道機器是經過「誰們」的對錯訓練,如何得到自我調適的最佳答案,這種無法掌握的不確定性,對中國來說,也是不擅長對付的賽局。

台灣得自有大型語言模型,「以備不時之需」

兩強之間的台灣,面對AI新賽局又該如何自處?

簡立峰認同台灣要有自己語言模型團隊,建立大型語言模型,「以備不時之需」。萬一美國生成式AI的繁體中文版做得很差,那台灣人該如何學習?萬一有一個英文版生成式AI,智商如同馬斯克(傳言高達155),結果繁體中文版智商只有90,而且英語模型還不在乎繁中版,不投入資源校準與學習,「那我們的孩子,愈學愈笨,怎麼辦?」

「就算最後台灣的語言模型,只能如同教育部國語辭典,或是如同每日一詞,也沒關係,也比什麼都沒有好」,簡立峰表示。

強大的AI將會帶來美中無形的競賽,從技術層面、資料數量來看,美國暫時領先,但AI領域既深又廣,還是有許多創新空間,創造中國彎道超車的可能。

手刀報名》5/9最強線上課程:「從ChatGPT到Midjourney: 打造AI腦,高效致勝工作法」

更多精采報導,歡迎加入《遠見》 Line官方帳號

更多精采報導,歡迎加入《遠見》 Line官方帳號!

看更多遠見雜誌文章:
生成式AI革命》ChatGPT會讓Google搜尋退流行?
ChatGPT升級了?Auto-GPT為何成最新AI神器?
ChatGPT-4進步太快引爭議!AI教父吳恩達、楊立昆現身:反對暫停開發的3大理由