專訪》下一座護國神山?陳縕儂剖析台灣AI發展3大困境:已處在落後階段

生成式人工智慧(AIGC)近年逐漸廣為使用,台灣能否憑藉AI狂潮,打造出新的護國神山備受矚目,但蓬勃發展的AIGC背後,其實埋藏著不少隱憂。對此,台大資訊工程學系副教授陳縕儂接受《風傳媒》訪問,從制定速度跟不上科技進程的監管法規、依舊不足的繁體中文資料集、只重硬體卻輕軟體的產業界,到還待翻轉的教育方式等面向,剖析台灣在AI時代下的困境與前景。

從聊天機器人ChatGPT、影像生成工具DALL-E,到Google Bard、Bing AI等,近年AIGC已取得突破性發展,並逐漸被大眾廣為使用。陳縕儂說,人類可以把AI視作一個很厲害的朋友,共同協作其實能夠帶動人類成長,如在創意上AI提供人類素材促進思考,人類或許就能藉此得到新的創意、提升能力,「不用AI能力在這,但是你用了,AI就會給你額外的輔助,然後你就成長了。」

監管AI兩難?陳縕儂:台灣已落後,保守恐失競爭力

不過,飛速發展的AIGC其實埋藏不少隱憂,英國已在去年舉辦全球首屆AI安全峰會,歐盟去年底也達成「人工智慧法案」政治協議,相關監管法規有望在今年夏季生效。陳縕儂分析,歐盟的個資保護相關法令本身就較為嚴格,目前的「人工智慧法案」也多與保護個人隱私有關,但對模型訓練可用的資料,或模型需可控到什麼程度,就尚無非常明確的規定,僅有簡易指引(guideline)。

陳縕儂指出,監管AI的相關法令制定,目前對各國而言都不容易,因為立法程序冗長,但AI的發展卻非常快速,法規制定要如何跟上AI發展腳步,以及立法者要如何了解AI技術,進而去制定適合的監管法規,這些都是非常困難的問題,「這畢竟是2個差異非常大的領域,這個產業又變得非常快,法規修改又非常的慢,而且到底要多嚴跟多鬆,其實每個國家的策略都不太一樣。」

事實上,訂定AI相關法令存在一體兩面,未必僅有監管作用,有時法令的指引反而能成為發展助力。陳縕儂提到,許多國家現正觀望美國對《紐約時報》提告OpenAI侵權的判決結果,但日本對AI訓練的著作權議題其實早有表態,只要產物不會侵權,在日本要訓練AI模型,可以取用任何網路上的公開資料,此項寬鬆政策也受到AI開發者青睞,有助於帶動日本的AI技術起飛與發展。

「監管的比較嚴,可能發展上就比較沒有競爭力,但監管的太鬆,的確也可能就不可控。」陳縕儂直指,有版權資料能否用作AI模型訓練,攸關各國在AI領域上的發展速度與競爭力;而我國究竟該如何立法監管?陳縕儂說,台灣過往立法常會參考歐美等國的法令,但目前台灣在AI的發展上已處落後,「你再制定那麼嚴格,其實就沒有競爭力了,大家可能就也不會來台灣發展AI。」

<cite>陳縕儂指出,訂定AI相關法令存在一體兩面,未必僅有監管作用,有時法令的指引反而能成為發展助力。(取自PIXABAY)</cite>
陳縕儂指出,訂定AI相關法令存在一體兩面,未必僅有監管作用,有時法令的指引反而能成為發展助力。(取自PIXABAY)

揭本土AI開發難點 陳縕儂:不在地化恐影響母語

攜手團隊開發本土系統「Taiwan Llama」模型的陳縕儂分享,開發在地模型的原因,是當初發現AI語言模型有半數都是英文,簡體中文比例又較繁體中文高出10倍,因此團隊決定要訓練更客製化、專屬台灣的語言模型;然而,團隊開發之初就碰上難題——台灣缺乏蒐集完整的資料集,擁有資料的著作權人又多數較為保守,「比如說書商,你要書商開放資料給你模型訓練,他就不能接受。」

「如果希望台灣的AI持續有環境去發展,比照日本這樣的法規,其實我覺得是比較好的。」陳縕儂認為,若台灣著作權人都固步保守,訓練本土AI模型就有困難,因為好用的AI模型一定要先讀過很多資料;舉例來說,若教科書商不願開放資料,台灣又如何能期待有品質優良的AI家教?「只讀一點書,就是跟沒讀差不多,一定要全部都讀在同一個腦子裡,才會具有這種比較強的效力。」

談及台灣是否有必要開發本土AI模型?陳縕儂解釋,台灣很小,許多AI巨頭會「懶得」幫小國寡民的台灣開發在地語言模型,唯有自己做才有主控權,「我們可能可以期待他佛心來的會去做這件事,但我們不能也無法控制。」且台灣不僅要具有開發能力,國人也應運用在地模型,若長期運用英文或簡中模型,習慣後久而久之恐影響母語,對多元文化兼容並蓄的台灣來說絕非好事。

然而,作為小國的台灣,能否承擔起開發本土AI模型的成本?陳縕儂說明,從頭訓練模型的成本當然非常高,但台灣目前以繁中為主的基礎AI模型,其實至少就有3個以上,這些基礎模型如同大學修過通識課程的學生,只要再施加專業資料集,就會成為該領域的AI模型;換言之,企業可以先共同訓練專業的模型,而後再各自回公司訓練、微調,「這其實是可行的,成本也不會那麼高。」

曝AI業界人才斷層 陳縕儂:先培育更多軟體產業

「AI這個領域可以應用在各個產業,所以其實跨領域結合非常重要。」談起AI人才,陳縕儂表示,無論是法律、金融界或各行各業,都能運用AI人機協作,但要運用在專業領域時,必定就需要有專業人士一同開發;而現行開發方式,主要分為企業自行開設AI部門研發,或由專業人士和軟體公司合作開發,「會軟體的人去學專業領域,還是專業領域去學AI技術,這2種模式都是可行。」

對於我國AI人才培育,陳縕儂不諱言,台灣的人才整體一定比歐美少,儘管大專院校具備AI能力的人才數量其實不低,但台灣的軟體公司數不多,願意開出的薪資條件也較國外低,造成許多人才都出走不願留下,「求學階段之後就斷了AI training(訓練)或是經驗,又怎麼可以期待有更多人才?」想要留住軟體人才,首先要有更多公司,讓學生覺得有出路後,才會有更多人願意投入發展。

<cite>對於我國AI人才培育,陳縕儂不諱言,台灣的人才整體一定比歐美少。(圖/新北市勞工局提供)</cite>
對於我國AI人才培育,陳縕儂不諱言,台灣的人才整體一定比歐美少。(圖/新北市勞工局提供)

「現在你要講出台灣自己本土的軟體公司,根本就屈指可數。」儘管將AI產業打造成下一座護國神山呼聲頻現,但陳縕儂感嘆,半導體業是政府當初願大力投資整個產業,但當國際將台灣看作硬體為主的國家後,來台投資軟體業的機會就不多,進而使得軟體業缺乏競爭力、難跟海外搶人才,「先培育更多軟體產業,讓他們有機會成長、有潛力,未來才有下一個軟體業的護國神山出現。」

至於AI時代下的教育,程式語言是否要從小學起?陳縕儂則說,與AI互動已可用自然語言,因此重點應放在思維訓練;台灣的教育,讓學生從小就不會質疑老師,但未來導入AI家教後,若對不可能百分之百正確的AI仍深信不疑,恐就此學歪,「在台灣最重要的其實是學生的思路,要讓他能夠知道,要對事情都保持懷疑態度、要確認資訊的正確性,不要老師說了什麼,就一昧的相信。」

更多風傳媒獨家內幕:

 【新新聞】金控股利活跳跳 2大亮點搶先掌握、今年獲利動能「這類型」最強

 幕後》民進黨內「大數據」早算出行政院長是他!賴清德挑中卓榮泰有最重要原因

 台灣綠能、SRF、長照全被插旗 「美國ISQ基金」何方神聖,背景有多硬?

更多風傳媒報導