2023 年度風雲人物:迎向危險迷人新世界 台灣 AI 造浪者

不畏通膨與升息,2023年生成式AI在全球經濟異軍突起。超級運算掀起滔天巨浪,加速產業變革,也重新定義人們慣習思考、學習與創作的場景。

在這波轉型浪潮中,台灣有一群人也站上浪頭。他們或是掌握供應鏈先機的科技業大老,或是突圍出海的創業者,甚至是敲響警鐘的創作人,以及守護台灣價值的工程師與律師。他們讓AI不只是矽谷巨頭、中美大國之間的權力遊戲,也帶台灣迎向新世界。

二○二三年被視為生成式AI元年,在這波浪潮中,台灣再度成為世界焦點。九月,Open AI創辦人山姆奧特曼(Sam Altman)、史丹佛大學AI大神吳恩達相繼來台演講。七月,有半導體女王之稱的超微董事長蘇姿丰和台廠供應鏈聚餐,AI軍火王輝達執行長黃仁勳今年更三度為台灣科技界友人站台。

代工之島升級 地緣政治助攻

時間拉回二○二二年,全球經歷烏俄戰爭、通膨衰退、中國封控,全球局勢詭譎不明,受半導體景氣低迷影響,台股墜入二○○八年金融海嘯後最大崩跌。十一月四日,當身價三千億美元的黃仁勳,意外在台北街頭亂入二位年輕女歌手的直播,造成一陣轟動,無論是他,或看熱鬧的台灣群眾可能都沒想到,輝達的股價隔年會從當時的谷底翻倍,台灣AI類股也水漲船高。因為那個月的最後一天,ChatGPT釋出了。

輝達執行長黃仁勳出席Computex。《彭博》形容,他每次旋風訪台有如搖滾巨星受到熱情歡迎。
輝達執行長黃仁勳出席Computex。《彭博》形容,他每次旋風訪台有如搖滾巨星受到熱情歡迎。

「這是人工智慧的iPhone 時刻,」二個月後,黃仁勳宣告。彼時,ChatGPT全球月均用戶數已達一億。這位以黑色皮衣聞名的CEO驚嘆,透過口語化的指令,就可以指揮它進行各種工作,它可以寫一首詩,編寫一段python代碼,或做一幅畫,串接整理複雜的電子表格。「(此前)人工智慧可以讀寫,但無法理解人們的意思,」微軟創辦人比爾蓋茲(Bill Gates)也預言,ChatGPT將改變世界,其所展示的AI技術與演算,就像瓦特發明蒸汽機後出現的第一次工業革命、電氣時代的發電機以及進入資訊時代的個人電腦及網路,或將引領人類進入人工智慧時代。

「超級運算不再只是特定公司的工具,各個國家、各個公司的運算,都需要台灣,台灣在全球AI硬體供應鏈中,有非常特別的地位,」早在二○○四年即布局AI的廣達董事長林百里說。事實上,生成式AI需要的高速運算,幾乎由台灣供應鏈包辦,從晶圓製造、伺服器、印刷電路板、光通訊元件、連接器,再到交換器組裝製造等,台廠幾乎全搭上這波的產業轉型。

代工之島能在這波AI浪潮成功升級,也和地緣政治有關。近年中國投資環境緊縮,中美貿易戰開打後,台廠衝擊更加劇烈。國發會主委龔明鑫在《時代如何轉了彎》受訪時提到,過去電子五哥(鴻海、華碩、宏基、廣達、仁寶)離開中國,生產線轉移,都非常低調,不願曝光,經濟部推動台商回台投資方案,對於台廠能否回台,也沒信心,直到二○一八年,林百里公開宣布買下林口華亞科技廠房,廣達將買下的土地開發成AI實驗室,他才確信台商回流是時勢所趨,也帶動上游供應鏈的新投資方案。財信傳媒集團董事長謝金河事後寫道:「這是今天台商回台投資逾一千三百家,金額逾二兆元的由來,而台灣也因為台商回流而壯大。」

傷著作權隱私 研修法律規範

台灣硬體業在這波AI革命成為贏家,一些軟體公司也試著突圍。像是全球擁有七億筆資料庫的Whoscall母公司Gogolook,以AI過濾警示來源外,還與各國警方攜手打詐。AI重新定義教育現場,當一派人憂慮學生學習被外包,早在二○一六年被AI顛覆的圍棋界,今年不僅有台灣棋士許皓鋐以AI為神隊友,在亞運驚喜奪牌,女子棋士最高段位的黑嘉嘉,也反向運用AI推動圍棋教育產業升級,進軍國際。

好萊塢大罷工,AI也是一大訴求。編劇擔心資方用AI生成劇本,演員擔心肖像被濫用。(東方IC)
好萊塢大罷工,AI也是一大訴求。編劇擔心資方用AI生成劇本,演員擔心肖像被濫用。(東方IC)

只是生成式AI多具生產力,對人類的威脅也多巨大。今年好萊塢演員與編劇工會大罷工,遲遲無法落幕,也是替全世界開第一槍,希望AI導入創作時,不會侵害表演者與創作者權益。在近百首以孫燕姿聲音為名的金曲上架之前,台灣金曲製作人陳珊妮,以自己的AI模型發表一首新曲,像是一場社會實驗。

生成式AI帶來著作權、隱私、倫理與風險的討論,監管勢在必行。今年最後一個月,歐盟各國在三天馬拉松的討論下,終於通過人工智慧法,台灣的AI基本法則預計二○二四年推出。政治大學法律兼任助理教授萬幼荺注意到,法國學者特別提出,AI應用,各領域產業本身存在規範,最大的挑戰反而是揭露大型語言模型的訓練資料與訓練過程,是否潛在危害,或不明、未經檢查的來源,這也是歐盟納管的重點。當年輕世代習慣使用像ChatGPT這樣以大型語言模型為基礎的聊天機器人理解世界、完成任務,大型語言模型的資料從何而來、台灣有多少話語權,可能是下階段不亞於抖音、假新聞認知作戰的迫切議題。國科會正推動可信任生成式AI對話引擎,台灣大學資工系博士生林彥廷也獨立開發Taiwan-LLM,希望讓模型說台灣人說的話。

12月,AI產品與系統評測中心成立,數位部長唐鳳(左2)與國科會主委吳政忠(右2)出席。(資安院提供)
12月,AI產品與系統評測中心成立,數位部長唐鳳(左2)與國科會主委吳政忠(右2)出席。(資安院提供)

白領創造工作 受到最大衝擊

ChatGPT問世一年,究竟為我們生活帶來什麼改變?或可從人工智慧學校基金會祕書長侯宜秀認識的一位英文作文老師學生銳減窺見端倪。過去不少上班族因職務需求,選擇補習精進英文寫作,而今只要有初步想法,AI便能將作文改得漂亮,學習的需求大減。麥肯錫顧問研究報告指出,與過去機器取代勞動人力的認知不同,生成式AI衝擊的是從事創造性工作的白領階級,乃至教育工作者。因為那些曾需專業知識和長時間學習才能完成的任務,如今都可由AI迅速完成。這時代我們需要什麼樣的人工智慧素養與規範?侯宜秀是台灣開源社群出身、少數懂人工智慧的法律人,分享了她的觀察。

二○二三年,歐美各大辭典的年度代表字幾乎都與AI相關:《韋氏字典》是「真實的」(authentic),《英國劍橋詞典》則是「產生幻覺」(Hallucinate),剛好是AI的一體二面。生成式AI掀起滔天巨浪的年末,我們訪問產業、創作、教育等各領域先行造浪者,看他們如何悠遊在危險迷人的新技術,創造屬於自己和台灣的時刻。

陳珊妮關注AI時代倫理與法益兩難。專訪結束後,她又告知我們近日一款AI圖片生成網站「krea.ai」使用名人影像生成不雅照,種種亂象令她憂心。
陳珊妮關注AI時代倫理與法益兩難。專訪結束後,她又告知我們近日一款AI圖片生成網站「krea.ai」使用名人影像生成不雅照,種種亂象令她憂心。

上個農曆年,陳珊妮「團圓」聊天的對象,是自己的AI。

「我和我的AI一起工作,從大年初一到初三,我都在跟她聊。」金曲製作人陳珊妮化身導師,替「陳珊妮二‧○」調細節、調口氣、調抑揚頓挫,還不能唱得太機械,「幫她配唱,像幫一般歌手配唱;我唱歌細節很多,要讓她唱這麼多技術,工程師們覺得:這真的很難。」

AI仿真唱腔 樂壇沒人發現

「我一直訓練她,一直debug(除錯),想辦法讓她update(更新),當她真的唱出來,我心想:『啊?她可以唱成這樣?』」陳珊妮忽然感到毛毛的,「我還活著耶…我還可能發專輯、有新作品。我當下就覺得,未來要慎重思考(聲音)授權機制、保障自己的人格權益。」

一首單曲,像一場行為藝術,更像一次社會實驗。三月十四日,陳珊妮單曲〈教我如何做你的愛人〉上線;三月二十二日,她和Taiwan AI Labs(台灣人工智慧實驗室)創辦人杜奕瑾舉行記者會、揭曉「原唱不是陳珊妮,而是陳珊妮的生成式AI」,此前,沒人懷疑這首歌不是她唱的。

「AI陳珊妮」瞞過所有音樂人,這不僅是台灣第一首由仍活躍於線上的歌手提供歌聲音源的AI歌曲,就連單曲封面也完全是AI生成。「我一邊教自己的AI唱歌,一邊做AI封面。其實vocal沒那麼難;我提供母帶,工程師只要拿到乾淨素材,就可以解決,比較惱人的是視覺部分,」唯美封面並非生成得理所當然,「我同事每天都在下Prompt(下提示指令),教AI算出陳珊妮的單曲封面。過程很惱人啊!跑出一堆大胸部圖片,對我來說,這就是素材被汙染嘛。」

陳珊妮3月推出〈教我如何做你的愛人〉單曲,封面影像與歌聲皆由生成式AI完成。她有感:「當AI真正學會唱歌之後,就是創作人與歌手,重新理解自身價值的時候了。」(翻攝陳珊妮粉絲團)
陳珊妮3月推出〈教我如何做你的愛人〉單曲,封面影像與歌聲皆由生成式AI完成。她有感:「當AI真正學會唱歌之後,就是創作人與歌手,重新理解自身價值的時候了。」(翻攝陳珊妮粉絲團)

半年以來,她收到各式回饋。歌曲剛上線時,她的歌迷留言:「好久沒這麼感動了!」上線一週,她開完記者會,歌迷們討論的風向大變:「我就覺得,這首歌聽起來沒有那麼感動!」「我就知道,這一定是AI!」

一名原住民音樂人找上陳珊妮,表示憂心原住民語種消失太快,來不及傳承,AI既然能從無到有生成一整首單曲,那麼,能否用以保存族語?有導演找她討論,一些人們熟知的台灣老播音員正在凋零,AI能否保存人們消失中的記憶—比如,保存國寶級老播音員們播新聞的聲音?

可能指貓為狗 法律保障單薄

又有歌手興奮傳訊:「好棒喔!有了AI,那就算我死掉,我(的AI模型)還可以一直唱下去耶!」陳珊妮答:「你覺得好棒,我沒有覺得好棒。事實上,我覺得,好恐怖。」「你永遠不知道,後世的人要你唱什麼?如果別人要你去歌頌一個…你其實並不認同的人呢?」

盛世即亂世,〈教我如何做你的愛人〉上線不到兩個月,「AI孫燕姿」在中國影音平台B站(bilibili)爆紅。動動手指,AI模型瞬間可讓孫燕姿完美演繹周杰倫 〈髮如雪〉;下一秒,周杰倫又能為您演唱中國網路童謠〈挖呀挖〉。

「你知道現在可以保障孫燕姿的是什麼嗎?只有人格權耶!」陳珊妮說,人工智慧確實讓人們生活便利,但法律非但沒跟上科技發展,還處於荒蕪階段,對創作者而言,現況非常不利。「難道孫燕姿要去告B站嗎?她告不贏。而且,她沒有法源依據。」「法律要如何update?你要去告,才有先例。所以,有人問我,如果我遇到這件事,怎麼辦?吿他們啊!吿他們,然後告訴這個世界,現實就是如此。」

「AI孫燕姿」令人分不出真偽,陳珊妮感嘆時代對創作者的法律保障實在太單薄。(翻攝自網路)
「AI孫燕姿」令人分不出真偽,陳珊妮感嘆時代對創作者的法律保障實在太單薄。(翻攝自網路)

陳珊妮極注重數位隱私,平日不使用ChatGPT、從不與iOS人工智慧助理軟體Siri對話;出國工作若需強制人臉辨識,她會嘗試規避:「如果要刷臉,我都叫宣傳或助理幫我刷。」她數度強調,工具本身沒問題,有問題的是法律保障太單薄。

「我想說的是:AI其實是非常危險的。大家都覺得,如果有問題,就每天去問ChatGPT,我看一堆人把ChatGPT當搜尋引擎用。」她難掩憂心,「可是你要知道,要汙染素材是非常容易的。所謂AI的資訊戰就是這樣啊,AI可以告訴你貓是狗耶!」

騰訊今年邀約陳珊妮前往成都,出席一場AI圓桌論壇閉門研討會,「一走進去,我很驚訝,那是一場很認真的論壇,與會者包括所有部門主管、產品開發者、創作者、文化人,還有律師。他們非常積極認真。回台灣之後,我感到有點害怕…」

陳珊妮目前擔任文策院董事,常提醒公部門注意人工智慧帶來的倫理與法益兩難,「政府不可能總是讓人們『遇到事情之後才去申冤』。除了法律,我們該如何保護所有的素材?如果你研發一個AI模型,需不需要替它註冊?如果某AI模型危害公眾利益、國家安全,政府有沒有辦法介入?這些東西,現在完全都是空的。我覺得,喔!為什麼大家可以這麼悠哉的過日子?」

「我覺得在台灣,大家對這話題(人工智慧)都蠻chill的,」話題最後繞回創作,我們問陳珊妮,是否害怕被AI取代?是否焦慮自己從此不再獨特?「不會,」答案很肯定,「創作者的自信,還是在的。我所在意的,從來都是法律與管理。」霸氣神態與口吻,AI暫時模仿不來。

近年更趨低調的廣達董事長林百里,今年三度為AI出席公開活動,上台不是笑自己是電腦工廠的工頭,就是老工程師。
近年更趨低調的廣達董事長林百里,今年三度為AI出席公開活動,上台不是笑自己是電腦工廠的工頭,就是老工程師。

二○二三年,如果有人一時興起,想要拜讀台灣新首富的碩士論文,流程如下:跑一趟台灣大學,自動化書庫服務中心位在綜合大樓一樓,進入玻璃門後,在左邊服務台的電腦搜尋「林百里」,點選申請,不到二分鐘,機器便將那本一九七二年訂裝、電機工程研究所的論文運來,翻開泛黃的淡綠色封面,清細的手寫題目:「小型數位計算機之設計」。

極早轉型布局 自嘲有新把戲

那是一本以英文打字機寫成的論文,總共五十二頁,在今日應稱為「謝誌」那頁,研究生開頭第一段就志氣高昂:「雖然,國外現已有大量設計製造的計算機,但我們還沒建立自己的數位電子產業。計算機被廣泛用於資料處理、系統控制,顯然,我們必須發展電子計算機的科技,符合我國的需求。」論文最後,還貼幾張這台名為「NTUEC1000」的電子計算機照片,完成時間僅比台灣第一部電子計算機原型晚一些些。

半世紀後,寫論文的人,還在製作計算機,但已是全世界AI運算的伺服器;他依然憂國憂民,只是口號換成「AI力即國力」。十一月底,他出席醫療科技展,發表今年最後一場公開演講,上台就用英文開自己玩笑:「我只是一個老工程師,有了新把戲。」台下包括前台大校長楊泮池、前中研院院長翁啟惠等科技醫療大老都笑了。

林百里在香港調景嶺長大,來台生根已超過半世紀。圖為他就讀台大電機系舊照。(林百里提供)
林百里在香港調景嶺長大,來台生根已超過半世紀。圖為他就讀台大電機系舊照。(林百里提供)

今年生成式AI大爆發,確立繪圖晶片輝達的霸主地位,而台南出身的輝達創辦人黃仁勳,不但榮登全美最受歡迎執行長,今年多次來台迺夜市,一身黑皮衣、親切的作風,所到之處猶如巨星,而他來台也被視為和科技業固樁,顯示台廠供應鏈在這波浪潮不得撼動的重要性。其中,七十四歲林百里的廣達,無疑是當中最早布局、收穫最豐的一家。年中,廣達股價衝破二百元,林百里的身價也逼近二九○○億元,一躍成為台灣新首富。「Barry(林百里英文名)幾次轉型布局很早、很準,從筆記型電腦、雲端到AI伺服器,輝達第一台AI超級電腦、今年最新超大規模AI伺服器,都與廣達相關,」一位資深科技線記者說。那第一台AI超級電腦,後來由黃仁勳贈予矽谷新創OpenAI,OpenAI六年後推出ChatGPT,開啟生成式AI新紀元。

競爭門檻變高 代工毛利更好

林百里的精準布局,來自台灣代工廠長年受制於人的危機感。一九八八年,桌上型電腦還蔚為主流,他看到筆記型電腦的需求;等廣達成為全球筆記型電腦製造之王,他又看到雲端運算的趨勢,他在二○○○年就說:「在不久的將來,整個科技界會發展出虛擬主機 (Virture PC)。」十年後,歷經台商西進、鴻海、仁寶左右夾攻以及代工毛利愈來愈薄,廣達在智慧型手機與應用程式普及後,迎來Google、臉書資料中心與雲端伺服器需求帶來的新一波增長;而二○一七年後,他幾乎三句不離AI,被前科技部長陳良基笑稱是「AI傳教士」,但林百里樂的是,AI之後,代工廠競爭的門檻變高,毛利更好,「代表廣達不用再打打殺殺跟人搶單,這個生意也就更好玩了。」

林百里很早布局AI與智慧醫療,2004年便與美國麻省理工學院合作。
林百里很早布局AI與智慧醫療,2004年便與美國麻省理工學院合作。

林百里扭轉代工宿命的關鍵是長期研發投資。廣達早在二○○○年就去美國麻省理工學院取經,二○○四年開設電腦實驗室,他在十二年前的媒體訪問形容,那像是上少林寺練功,讓他有機會跳脫,看到未來的運算是人工智慧,他如此描述他可能的AI時刻:「原來運算可運用到這麼多地方,譬如預防醫學,有些人羊癲瘋,戴著一個帽子在電擊,有一個小機器在監控他的腦部,一有不正常,就立刻傳到他的手機,透過雲端下載這些監控資料做分析。譬如心臟病,也可以先預警。」

當醫生是林百里最早的夢想。「但人生就是挫折跟選擇,」他在香港考試失利,發憤考上台大電機系,一頭栽入計算機的世界。而今,廣達推出的「QOCA醫療照護平台」與世界一流的醫學機構和全台十一家醫療院合作,也協助健保署將二十五年累積的六二三億筆資料,發展健保大數據AI應用。

「作為一個工程師,我永遠在想如何為智慧醫療打造好的機器,」林百里在今年醫療科技展的主題演講,二十多分鐘投影片,一張張展示生成式AI如何加速精準醫療探測、協助醫生看診、台灣能如何成為AI輸出國,他自顧自地講,時間卻到了,一如他五年前要成立AI實驗室說的:「這麼好玩的事情講不完的。」

因為疫情,海外比賽減少,黑嘉嘉與夥伴打造線上課程與AI復盤,希望讓更多人接觸圍棋。
因為疫情,海外比賽減少,黑嘉嘉與夥伴打造線上課程與AI復盤,希望讓更多人接觸圍棋。

二○一六年,AlphaGo與韓國九段棋士李世乭展開世紀對決時,黑嘉嘉完全不相信AI會打敗人類。彼時,職業棋士還要讓AI三、四子,沒有棋士想過,人類的世界第一可能敗陣。「最多一比四?或者,二比三?但,李世乭九段一定是贏的一方,」黑嘉嘉回憶,第一盤輸時,她還堅信,棋王只是在試探對方棋力。「但第二盤…」她倒抽一口氣:「那是(人工智慧)壓倒性的勝利。我非常、非常錯愕,想說:『喔,我過去二十年所學的圍棋,要全部重學一次了。』」

修正計算模型 線上課程檢定

七年過去,AI重定義圍棋這項古老的智力競技,二十九歲的黑嘉嘉也成為台灣段位最高的女子棋士。今年杭州亞運,她再度代表台灣參加女子團體賽,雖未能如十三年前奪得銅牌,但這二年,她參與投資圍棋人科技,並創辦「黑嘉嘉圍棋教室」品牌,無論線上課程或今年上線的「圍棋國際圍棋能力檢定」(IGQE),正帶領台灣圍棋教育產業轉型,而團隊背後核心技術正是AI,且是「弱化的AI」。

「現在AI太強了,但這麼強的AI,初學者或進階學習者只會感到挫折,」黑嘉嘉解釋,最好的學習情境是有輸有贏,但現行的AI計算超強,打遍人類無敵手。「好像數學,剛開始一定教一加一,AI卻在初學階段就教你微積分,」職業棋士九段、圍棋人科技負責人林至涵觀察,現行圍棋AI,普遍調弱的方式只是設定幾手沒邏輯的差棋,「很不自然。人的弱跟AI的弱不太一樣,人的弱有些邏輯問題,但不會隨意犯錯。」此外,一般高手用的圍棋AI,僅顯示變化圖與機率,初中階的學習者也缺乏解讀能力。

黑嘉嘉說,職業棋士溝通常常不需言語,但錄製線上課程,要講到初學者能夠理解,前期非常挫折。
黑嘉嘉說,職業棋士溝通常常不需言語,但錄製線上課程,要講到初學者能夠理解,前期非常挫折。

為了克服AI的門檻,黑嘉嘉背後的團隊靠累積多年代工的技術經驗,和國內三大棋院體系等二十多家圍棋教室合作,請老師與學員大量測試回饋,修正AI計算模型,從初學到業餘最高段,將學生程度細分成一千多個等級,並附上文字復盤解說。「很多人不知道,圍棋比賽雖是中日韓稱霸,但台灣圍棋兒童教育扎根最久,」參與合作的台灣圍棋協會祕書長馬衡立說,「中日韓的訓練,以競技圍棋、培養頂尖棋手為主,台灣因幾個愛好圍棋的企業家希望推廣,三十幾年前,兒童圍棋教室在台開枝散葉,現在中日韓每年都會派代表來取經,學習怎麼開圍棋教室。」

有大量評測的AI模型,過去棋力檢定靠比賽勝利升段的方式,才有標準化檢定的可能,也改變家長為了讓小孩升段,千里迢迢帶他們到偏遠縣市比賽的歪風。黑嘉嘉圍棋教室線上課程,現在有近三萬人付費使用,英文版的課程語音以AI生成,年底公開。而今年推出的國際圍棋能力檢定,上線三個月,已有一萬多人參與,包括香港、北美。「圍棋這個產業一直是靠喜好的人贊助或投入,沒預期得到回報,我們也是做下去才發現,欸,好像蠻有前景的,」本身是業餘二段的圍棋人科技行銷長王之佑笑說。

復盤看到希望 不要輕言放棄

黑嘉嘉更沒想過,七年前受到AI震撼教育,二十年學習框架打掉重來,而今竟以AI為核心,開啟一系列圍棋教育改革。她六歲學棋,十四歲定段。定段前,因一家搬到美國,她苦無學習環境,每天凌晨四、五點起床,上網練戰,「因為時差,我起床時,高手可能已經睡覺,當九段的帳號找不到對手,我就重新開一個帳號,從三段下到九段,最後累積二十多個九段的帳號。」她現在回憶,AI出現前,很多時候不太確定自己復盤的內容到底對不對、輸贏關鍵在哪一手,花很多時間摸索,仍茫然,「AI出來後,其實它可明確地告訴你答案,這手棋,勝率掉七、八成,就是你的敗兆。」

2016年,AlphaGo與韓國九段棋士李世乭展開世紀對決,AI從此改變圍棋。(翻攝自網路)
2016年,AlphaGo與韓國九段棋士李世乭展開世紀對決,AI從此改變圍棋。(翻攝自網路)

AI帶來陣痛,圍棋比賽變得更考驗年齡、體力,棋士的巔峰年齡不斷提前,但AI也提高學棋的效率,今年台灣棋士許皓鋐拿下圍棋金牌,或是AI弭平高手訓練門檻的結果。而AI打開的下棋思路,也讓人類對下棋依然興致昂昂,「有一次比賽,我以為下到某個地方已完全沒希望,後來確實也輸了,但輸入AI發現,原來下到某個地方,我還有機會可以翻盤,還有一手棋是好棋,只是我沒有看到,沒想到是AI看到希望,之後真的會讓自己更加小心,不要輕易地放棄。」

只不過,錄製線上課程時,她跟AI一樣,也經歷強者調弱的過程:「要完全放掉職業棋士的身分,講到初學者能夠理解,前期非常、非常挫折,常常三、五分鐘的課,要錄三個多小時。又是我熟悉的領域,挫折感更強。」但也因為錄製課程,需要示範,她才能重溫最初學圍棋的動力—吃子的樂趣,「吃子永遠是一個快樂的世界。(職業棋士)比賽,很難碰到這樣的情況了。」

問她對現在才要受到AI洗禮的產業,有沒有什麼建議?她側頭甜笑:「可能會需要一個適應的…過程?之後你會開始思考,怎麼從它身上獲得最大的利益、跟它合作的方式 ,我們不再想著打敗它,因為,我們也沒有辦法打敗它了。」

郭建甫說AI已經被談論了數十年,10年前Gogolook運用機器學習,而如今生成式AI已經被應用在工作中。
郭建甫說AI已經被談論了數十年,10年前Gogolook運用機器學習,而如今生成式AI已經被應用在工作中。

「香港賽馬會打電話來說我中獎,最後說要先繳一筆稅才給獎金,我差點要去匯款,上網Google才發現這是詐騙!」Gogolook共同創辦人、執行長郭建甫說起十多年前被詐騙經驗,說罷他熟練地接了個創業哏:「很多人接到詐騙電話第一件事是去找警察報案,我們不是,我們是創業、做一個APP,再去找警察合作。台灣十幾年前的詐騙已經領先全球。」

提供數位防詐 錄取左派員工

郭建甫說的APP,台灣人平均每三到四人就有下載,還活躍使用,那就是篩選可疑來電的Whoscall。二○一一年,郭建甫與大學時期認識、一起參加商業個案競賽的鄭勝丰、宋政桓合作創業,人工智慧學校的創辦人陳昇瑋寫信給他們,「我們還是很新的Startup(新創),這麼厲害的AI科學家怎麼會寫信我們?」原來,陳昇瑋注意到他們手中握有的資料可以AI優化,便協助導入機器學習,讓他們從一開始只仰賴Google搜尋、社群回報,進階到人機協作,慢慢堆疊出龐大資料庫。

十多年過去,Gogolook以AI核心技術開發的Whoscall、美玉姨等APP在防詐、查證假新聞領域成為熱門工具,今年七月在台灣IPO,Gogolook也成為第一家在創新板登板的軟體公司,股票上市開盤即直奔漲停,在台灣資本市場僅占○‧五%的軟體業中宛如奮力開出一朵花。今年十一月,Gogolook在台灣舉辦第一屆亞洲防詐峰會,泰國、馬來西亞、菲律賓的警政機構皆派出官方代表,台灣刑事局、警政署、檢察官也出席分享最新觀察。

亞洲防詐高峰會的參與者包括菲律賓犯罪調查中心(左1)、馬來西亞警政單位(左2)、右1為台灣刑事局副局長黃壬聰。(Gogolook提供)
亞洲防詐高峰會的參與者包括菲律賓犯罪調查中心(左1)、馬來西亞警政單位(左2)、右1為台灣刑事局副局長黃壬聰。(Gogolook提供)

二○一六年,Whoscall與警政署合作,分享犯罪情報、警示用戶。成功的公私合作也擴展到亞洲,韓國、香港、馬來西亞、日本,都複製同一套模式—累積當地資料庫、符合當地法規,時機成熟後與公部門合作。郭建甫解釋:「可複製代表信任,如果你的做法不符合世界共識標準,就沒有辦法推出去。」例如泰國政府在疫情期間,自己做數位轉型,造成個資外洩,詐騙案件飆漲,後來新進的數位疫苗計畫,選擇與台灣合作,進到鄉鎮宣導民眾使用Whoscall。「(泰國跟台灣的)時間差大概六、七年,我們的利基點是我們更懂詐騙一點,我們的技術、經驗可以提供適合的solution(解決方案)。它是一個免費的防詐工具,民眾滿樂於使用,也覺得台灣的產品蠻值得信任。」他也以香港為例,「協助市民做防詐跟政治沒有什麼關係,(香港)政治體系改變,但合作仍然持續。」

郭建甫認為,台灣在AI浪潮中扮演的角色是信任。「AI的核心是資料處理,一個國家要發展自己的AI願景時,它要不用中國大陸那一套,要不然用美國那一套,這是不同需求的價值觀。中國的價值觀就是全民監控,世界上的華文使用者選擇solution的時候,不太可能選中國開發的資料和大型語言模型,但美國本身也有很多種族偏見。相較之下,台灣這樣的中立小國反而有優勢。」

Whoscall會將來電號碼與資料庫對比,攔截可疑號碼,並標註分類與來源。(Gogolook提供)
Whoscall會將來電號碼與資料庫對比,攔截可疑號碼,並標註分類與來源。(Gogolook提供)

郭建甫表示,AI會學習人類所有善良與邪惡的行為,自己創辦Gogolook的出發點是為了人類社會好,才選擇防詐領域。他說公司面試員工傾向挑選有左派思想、利他精神與正義感的人,可能與自己從小性格有關,「小學的時候,隔壁桌同學因為字寫很醜被扣分,我成績很好,可是我的字也很醜,我就在全班面前對老師說:『我的字跟他一樣醜,為什麼我沒有被扣分?』我在挑戰老師有歧視這件事。」

詐騙訊息進化 期盼信任勝出

Whoscall剛上架時,許多人認為它很快會被取代。然而,Whoscall靠著客製化、在地化不同國家的詐騙情境,反而越發受到市場信任而茁壯。今年推出的袋鼠金融(Roo AI)以生成式AI回答使用者關於各種金融投資商品、信用卡、貸款相關資訊,辨識其中陷阱;Message Checker針對Line、Facebook、IG中的訊息進行分類和過濾。儘管仍不完美,郭建甫希望能解決大家因資訊落差而落入陷阱、受害的情境。

隨著AI演進,可以想像未來會有更多深偽、語音複製生成的詐騙訊息,「我們正在研發的就是去判斷這些語音、文字、圖像、影像是不是用AI做出來的?」但道高一尺魔高一丈,詐騙與假訊息的技術也不斷進化,充滿正義感的郭建甫仍然相信「信任」的力量終將勝出。

國科會推動可信任生成式AI對話引擎計畫(TAIDE),模型訓練組召集人是中央資工系教授蔡宗翰。(翁睿坤攝)
國科會推動可信任生成式AI對話引擎計畫(TAIDE),模型訓練組召集人是中央資工系教授蔡宗翰。(翁睿坤攝)

今年六月國科會公開「台版ChatGPT」第一階段測試,專案模型組召集人蔡宗翰和一群平均年齡不到二十五歲的工程師緊盯黑壓壓的對話模型框,當模型一字一句吐出中文,卻不見ChatGPT系統常出現、台灣人不會使用的「總的來說」「人工智能」等中國用語,蔡宗翰開心笑了,「很像在教一個從美國回台灣的ABC,我們說一句,他說一句,當他終於可以講得很流利,而不是怪裡怪氣的字句,那應該是我的AI時刻吧。」

餵養台灣素材 打造語言模型

ChatGPT問世一年,矽谷科技巨頭微軟、Google相互較勁,各國軍備戰也開打,中國推自產的「悟道」「文心一言」,法國有「Bloom」可理解四十六國語言。台灣產官學各單位也動起來,試圖打造台灣的大型語言模型,商用如聯發科的BLOOM-zh、台智雲的福爾摩沙,官方有如國科會的「可信任人工智慧對話引擎」(Trustworthy AI Dialogue Engine,簡稱TAIDE),另外,直接以台灣為名的「Taiwan-LLM」,由台大資工系博士生林彥廷與台大資工系指導教授陳縕儂獨立開發、開源釋出,十一月釋出的二‧○版,包括數位部已嵌入內部工作流程,台積電、聯發科也來探詢。

台大資工系博士生林彥廷,所開發說流利繁體中文的「Taiwan-LLM」,目前數位部已採用。
台大資工系博士生林彥廷,所開發說流利繁體中文的「Taiwan-LLM」,目前數位部已採用。

「去年看到ChatGPT出來,想說:哇,『這東西也太厲害了!』又支援中文,直覺那是美國、矽谷、大公司才能做的事,沒想過我們也能做,」大學念資管系的林彥廷,因大三修習機器學習的課,對自然語言產生興趣,改攻資工博士,今年五月到亞馬遜實習時,剛好也在相關開發小組,七月,當他看到海外一些社群運用Meta開源模型LLaMA2開發出落地版的大型語言模型,立刻向指導教授、台大資工系副教授陳縕儂提案並得到支持。

「每個時代都有科技的buzzword(流行語),但語言模型不一樣,之後會被大量應用,尤其在教育、法律與醫療領域…它可能變成私人家教,取代部分學習的功能,當它牽涉很多價值觀,卻滲透到小孩的學習,做底層模型的源頭管控很重要,」林彥廷說,Taiwan-LLM的初衷是讓語言模型能流暢說台灣人會說的繁體中文,下一步則是調教成能提供在地知識的對話機器人。然而,初步篩選資料就遇到困難。

ChatGPT等由大國、科技巨頭催生的大型語言模型,台灣資料占少數,容易出現簡體,用語也不台灣。
ChatGPT等由大國、科技巨頭催生的大型語言模型,台灣資料占少數,容易出現簡體,用語也不台灣。

第一版他們採用包含由國際非營利組織Common Crawl自動抓取的中文網站檔案,即便已排除簡體字來源,甚至要求網站只要有一個簡體字,整筆資料刪除,訓練出來的語言模型還是會給出「台灣是中國」的答案。「中國有大量的內容農場網站翻成繁體,因為廉價,又很好爬(程式自動抓取),即便篩選過,資料仍充斥大量中國大陸的文本。」林彥廷推估。

國家專案計畫 資料授權謹慎

第一版結束後,他們四處談合作,最終由日商優必達與亞馬遜協助提供算力;資料集的部分,他排除第一版的網路公開資料,選擇餵入台灣新聞、社群網站、維基百科、司法院、法典、法學資料庫等,約三百億繁體中文字,「很意外,第二版不用特別過濾,也不會產生國籍錯誤。」 他另外寫了一百多題問答訓練,確保語言模型在穩定情況下,不會在敏感的政治議題出錯,包括準確解釋戒嚴、避免政黨偏好,現在若問它「NTU」,答案也不再是通用大型語言模型會跑出的南洋理工大學(Nanyang Technological University),而是台大。

國科會TAIDE團隊在國網中心。開發大型語言模型需要算力,由國網中心支持。前排左四為蔡宗翰,左六為計畫主持人李育杰。(蔡宗翰提供)
國科會TAIDE團隊在國網中心。開發大型語言模型需要算力,由國網中心支持。前排左四為蔡宗翰,左六為計畫主持人李育杰。(蔡宗翰提供)

國科會的TAIDE計畫也建立在開源模型。同時是中央資工系教授、中研院人社中心研究員的蔡宗翰說,關於台灣是否要開發自己的大型語言模型,一直有爭論。畢竟從頭開發一個大型語言模型,除了需要一兆字元的基礎訓練,成本也過於高昂,但他認為,台灣已錯過一個世代的網路發展,「我們沒有自己的搜尋引擎、社群網站,人才沒辦法拿到最好的資料,也不能確保資料隱私。」二月,當國科會主委吳政忠宣布,台灣應該要有自己的ChatGPT,避免被大量簡體中文資料主導,他很快被計畫主持人、資通安全專題中心執行長李育杰找來負責模型訓練組。

因為是國家專案計畫,第二階段又希望商用,資料集的來源、授權,需比學界獨立試驗開發的計畫來得謹慎。蔡宗翰和團隊老師、三十多位工程師,除了蒐集包括中央社、維基、學術會議論文摘要等十多種資料,整理成一段一段乾淨的字條,餵入模型,展開文字接龍的中文基礎教育,科政中心也跨部門調取政府公開資訊與學術論文,同時與新聞媒體、出版社等機構洽談。「品質好的內容,才能訓練好的內容。」蔡宗翰也提到,當中資料屬性平衡、個資隱私訊息都要另外處理。

國科會推動可信任生成式AI對話引擎計畫(TAIDE)後台,對話語氣參數等都可以調整。(翁睿坤攝)
國科會推動可信任生成式AI對話引擎計畫(TAIDE)後台,對話語氣參數等都可以調整。(翁睿坤攝)

資料庫打地基 守住本土文化

TAIDE在六月中公開初代測試模型,截至十二月初,第二階段的模型在自動摘要、翻譯文本、寫信、寫文章等任務表現能力,已超過去年底的ChatGPT 3.5,但因安全性評測未建立完成,申請才能使用,目前有包括勞動部等三、四十個單位簽署合作備忘錄。

蔡宗翰笑說,短時間要完成這麼大的任務,除了三十多位工程師日夜趕工,他們也運用一些機巧,譬如LLaMA的模型說的是英文,他們先做一個翻譯機,訓練初始便問模型Meta當時怎麼訓練它,結果模型吐出三十多萬條提問,再讓模型自己回答達成訓練。TAIDE也利用做好的中文模型,發展台語、客語模型,已完備的台語模型,招呼語就是「你好!真歡喜看著你」,十二月初在新加坡,Meta主管和科學家都表示出興趣。只是少數語種的資料量,落差更明顯,英文一T,繁中一B,台語只有一M,原住民語言模型,其他團隊還在開發努力。

無論是Taiwan-LLM或TAIDE,未來如何擴大提升繁體中文語料、算力及法律,步步是挑戰。但就像吳政忠表明的,台灣不能萬事問ChatGPT,建置大型語言模型像「打地基」,未來除了提供公私部門加值應用,也是守住台灣珍貴的語料和文化。

侯宜秀說,人工智慧學校在數位部補助下,今年試辦5場AI共識協工作坊,彙集2千多個意見。
侯宜秀說,人工智慧學校在數位部補助下,今年試辦5場AI共識協工作坊,彙集2千多個意見。

「訓練大型語言模型,就像教小孩,包括它胡說八道,也跟小孩一樣。所以,如果要它學習某些知識,比起在網路上東學一點、西學一點,系統性的學習一定還是比較好的學法,」人工智慧學校基金會祕書長侯宜秀說,「但系統性的教科書,網路上爬不到,需要請別人分享,那就需要有一個機制。」

立法迫在眉睫 產官學需共識

生成式AI爆發這年,從好萊塢罷工、藝術家告科技公司、到韓國工廠機械手臂誤將工人辨識為辣椒而致死,生成式AI飛速成長,也為現行法律倫理帶來燙手難題。歐盟十二月十四日正式宣布通過人工智慧法案(AI Act),成為全球第一個規範人工智慧的綜合法律框架,確定將大型語言模型分級納管,確保人權民主、法治與環境永續性不會被高風險AI影響 。

台灣原定今年十月推出AI基本法,因技術發展太快,應用領域太廣,行政院決定延至明年,國科會仍在研擬。關於AI基本法暫緩,侯宜秀樂觀看待。九○年代從台大法律畢業、進入四大律師事務所,侯宜秀的人生,本來也是出國讀研、回台進外商的模範樣板。但出國前夕遇到一群資訊人,將她拉進強調透明、分享的開源社群,後來她在台灣早期網站蕃薯藤擔任法務顧問,也長期投入g0v台灣零時政府,推動公民與科技議題,二○一七年,人工智慧學校基金會在六家企業贊助下成立,她被中研院院士孔祥重、台灣AI推手陳昇瑋找來參與草創,去年展開風火輪計畫,促成逢甲大學與台中精密加工業合作建立開源平台,降低中小企業導入AI門檻,今年大大小小的AI論壇會議,都可以看到她同時懂法律、人工智慧又難得的女性身影。

「技術進展非常快,真的不要急著top down(由上而下)做一個決定。反而是資料治理,著作權什麼狀況、界線算合理使用,個人隱私怎麼保護,這是非常急迫的問題,尤其,台灣著作權涉及《刑法》,」侯宜秀說,法規應隨科技進步新增修訂,只是產官學還需要更多共識。現階段,智財局或能先給予原則性的解釋,避免二○○一年警方搜索學生宿舍的成大MP3事件重演。

二○二三年,侯宜秀和團隊一共舉辦十多場活動,從二十人到上千人不等,目的是讓不同領域的人快速了解AI,也讓開發者對齊產業實際需求。相較於中國大政府(Big Government)式大規模發展AI用於監控辨識,或矽谷科技巨頭(Big Tech)的資本碾壓,侯宜秀希望,台灣公民社會累積多年的審議民主、開源協作能成為優勢,「或許,我們應該再辦國是會議了。」

(首圖部分素材由 AI 生成。)

更多鏡週刊報導