🎧台版ChatGPT「TAIDE」為何重要?中央資工系教授蔡宗翰:AI就是國力,讓台灣不與他國產生數位落差

圖說:中央大學資訊工程系教授蔡宗翰接受國立教育廣播電台節目及Podcast節目《新聞真假掰》主持人黃兆徽專訪。

國科會今年4月推出台灣版ChatGPT「TAIDE」,用來解決因多數大型語言模型都以英文訓練,對繁體中文回覆較不精確的狀況。TAIDE具備哪些功能?未來發展空間在哪?TAIDE專案模型組召集人蔡宗翰中央大學資訊工程系教授蔡宗翰接受國立教育廣播電台節目Podcast節目《新聞真假掰》主持人黃兆徽專訪,表示TAIDE包含寫文章在內的五大基本功能已達商用標準,未來將著重在教育方面運用,並朝向讀取和理解圖片努力。

當全球都用同一個產品,本土文化將消失⋯⋯

自從OpenAI在2022年11月推出GhatGPT後,一年半的時間就改變全世界的學習習慣。蔡宗翰在教育現場觀察到現在老師出一道題,學生多半直接先問GPT,參考GPT所給的內容來撰寫答案。「這是我想到一個蠻細思極恐的地方。如果我們都只用GPT這個美國科技公司訓練出來的產品,那很多本土文化就會消失。」

ChatGPT雖號稱「讀完全網路上的資料」,但簡體中文資料量僅佔全部2%,繁體中文更是寥寥可數。在訓練資料絕大多數都是英文的情況下,「這也導致它產生的語言,本身沒有台灣味,也對台灣在地的情況不了解。」加上公部門的資料不能外洩,無法使用GPT帶來的好處來辦公,也讓國科會與蔡宗翰等AI領域專家們合作,僅花費四天就利用Meta的Llama 3訓練出TAIDE這個專屬台灣的大型語言模型。

目前TAIDE在中翻英、英翻中、寫信寫文章及摘要等五項能力已接近GPT3.5,具商用水準。蔡宗翰表示,AI就是國力的一環,如果我們長期使用國外所提供的模型,台灣將喪失自主研發的能力。此外,用英文向GPT提問可以得到很正確的答案,中文卻可能產生似是而非的回覆,誤導使用民眾。「這樣的話,其實會造成台美的數位落差。這些都是必須要自己一個大型語言模型很重要的因素。」

除了文書處理,還能作詞!一曲道出台版GPT發展歷程

節目中,蔡宗翰點播由TAIDE所創作的〈Trust in Taide〉,歌詞內容便是台版GPT的發展歷程。「某一天就突然有靈感,如果叫TAIDE描述自己的誕生歷程,搞不好我可以跟它一起做一首歌。」

蔡宗翰從TAIDE生成的七、八種英文歌詞中挑選出最好聽的版本,再利用Copilot等生成式AI畫一個主角來唱歌。「畫的時候有個秘訣,就是你要叫他正對鏡頭:因為側對鏡頭的話,生成的嘴型和動作非常怪。」

從蒐集多樣化資料,到培養多人對話能力,甚至讓TAIDE不僅能講話,而是講高品質的話,為期一年的專案歷經許多挑戰。透過讓TAIDE利用歌詞自我介紹,「希望大家相信TAIDE,歡迎來使用看看。」

下一步是「閱讀圖片」  提高工作生產力

蔡宗翰向大家預告,今年的下期計畫會是讓TAIDE讀懂圖片,具備理解圖片裡有哪些內容並將其轉成文字。未來也將因應現今學生學習自主性上升,而加重老師的教學負擔,提供大型語言模型幫助老師生成教材和測驗題,成為更值得信賴的學習工具。

「我們還是要去擁抱大型語言模型,避免你的競爭力慢慢被會用大型語言模型的人取代。學習掌握這樣的工具,嘗試為你的工作或生活提高生產力,帶來一些加速。」

【新聞真假掰|假訊息ByeBye!】由台灣事實查核教育基金會董事黃兆徽主持。節目中邀請各行各業的朋友暢談媒體議題,為聽眾提升媒體素養、增強對假訊息的抵抗力,希望達成「群體免疫」,讓大家都和假訊息說掰掰!

更多精彩內容請搜尋「新聞真假掰」,或上各大Podcast平台收聽,YouTube頻道則有訪談精華影片陸續上架。除了適合大眾收聽收看,也推薦各級學校老師在規劃媒體素養課程時可列入影音輔助教材。(撰文:紀泰永、張育騰)

 

【立即收聽】新聞真假掰 — 假訊息 Bye Bye|EP141|

Apple:https://tfc.pse.is/6293lu

Firstory:https://tfc.pse.is/6293nk

Spotify:https://tfc.pse.is/6293s5

KKBOX:https://tfc.pse.is/6293ux

【非聽不可的相關訪談】

AI時代的教育要先翻轉「家長」?數學滿分的關鍵是「閱讀素養」?

AI時代,人類如何勝出? 人之所以為人的五大優勢?

台積電如何成為「護國神山」?培育科技人才需重視「語言教育」?

【喜歡這集嗎?想對主持人或來賓提問嗎?】

🌟評分、留言這裡走|https://pse.is/4p9wyd

【好節目需要鼓勵~請給我們五星好評】

🌟訂閱、評分、留言這裡走|https://pse.is/4lblzz