【換日線科技】ChatGPT 可以成為你的台語老師嗎？

2023年6月2日上午12:59

作者：王善／阿善 Café 的世界分館

隨著 AI 技術發展，各種人工智慧能應用的領域，成為大家紛紛討論的議題──當然也包含校園課程。個人在國立臺灣大學修習的「臺灣語言與社會」課程中，授課的江文瑜教授，考量到語言復振需要不少科技協助，特別在學期中邀請廖元甫教授到課堂演講，分享 AI 在語言復振領域能有哪些助力。

目前領導國立陽明交通大學（下稱陽明交大）「人工智慧語音研發中心」的廖元甫教授，在這場演講中試圖回應幾個有趣的大哉問：ChatGPT 會不會講台語？此刻為何是發展本土語言復振的最佳時機？

本文正是個人在聽課後的演講筆記，經老師們同意後，以文字向讀者分享，期待能有更多讀者關心語言復振議題，以及 ChatGPT 等 AI 應用在語言領域的發展。

現今研究，AI 能做到什麼？

身為研究人員，廖元甫老師先分享了在學界對於 AI 進行的研究方向。對於學術機構來說，首要任務當然是研究人工智慧技術的模型，但「開發」亦是工作重點；在「人工智慧語音研發中心」裡，他們想像、想創造出的，是一個能跟人對話，甚至可能會講台、客語的機器人，正如同電影《鋼鐵人》中的智慧助理「賈維斯」。

此類產品，在學術上稱為「多模式基石模型」（Multi-Modal Foundation Models），亦即類似 ChatGPT 的進階版，是一個整合多種基礎模型，能夠聽、說、讀、寫的系統，不但了解人類語言，還可以產出語言。

為了達成此一目的，廖老師的研究團隊早就有了一套跨領域的「國台語資料庫建置技術」，已經能標準化地為臺灣的各種語言留下紀錄，擁有許多「語料庫」。同時，他們也積極研究國台語的 AI 語音科技，成熟的技術已經應用到許多政府單位活動中，包含總統府、立法院、衛福部等記者會的字幕產出，靠的就是這些基礎。

然而，有了這些基本的 AI 技術後，該如何讓 AI 成為我們的語言老師，讓我們學習未來可能失傳的本土語言呢？

ChatGPT 可以成為你的台語老師嗎？

在回答 ChatGPT 是不是能夠教我們台語前，老師先說明了它之所以爆紅，而且特別的原因。

相較於過往的產品，OpenAI 所開發的 ChatGPT 能夠和使用者聊天，有較強的人工反應，這是過去技術做不到的。因為在人類自然語言處理中，有很多很複雜的對話邏輯，過去的人工智慧技術，通常採用一條一條寫入規則、土法煉鋼的方式；但人類語言之複雜，規則根本多到寫不完，很容易像手機的 Siri 一樣「接不下去」，最後只能跳針回答「我聽不懂你在說什麼」。

ChatGPT 的特殊之處就在於，使用者可以對它隨便提問，它什麼都可以回答，雖然回答的內容可能有誤或不實，但回應的語言邏輯都是正確的。因此，這也讓廖老師的團隊開始思考，我們能夠問 ChatGPT 台語的問題嗎？

考量到 ChatGPT 蒐集到的台語原始資料不多，它對台語只是略懂，若想運用像 ChatGPT 這樣的現有 AI 語言模型練習台語，可能有兩種解決方法：第一是翻譯，第二是調適。

所謂翻譯法，其實就是暴力法，透過將現有的語言模型 ChatGPT，串接上目前廖老師團隊已經有的翻譯器、語音辨識、語音生成系統，幫它裝上耳朵跟嘴巴。目前陽明交大的研究團隊，已經成功用這種方式，製作出了一個 Beta 測試版的台客語 ChatGPT「鬥陣來開講」，能夠支援台語和客語的語音輸入、語音輸出；其中語音辨識的技術就和政府單位記者會的即時字幕相同，而語音合成技術則是同樣來自陽明交大的研發成果「台語語音合成」。

不過，畢竟目前研究計畫蒐集的語料有限，許多都是書面文，可能在回答上仍不夠自然、口語，仍是未來希望改善的部分；但有了這樣的台語對話 AI，我們已經能夠在和它對話的過程中，學習基礎的台語了。

至於前文所提的調適法，則是較為複雜但精準的方法，背後邏輯就如同我們學習第二外語一般，透過讓 ChatGPT 這樣的系統學習台語，用語言模型調適。

若透過調適法進行，就得注意語料的組成是否帶有偏見，舉例而言，若提供 AI 太多簡體中文的資料，就可能發生如過去新聞報導的，ChatGPT 在兩岸議題「語出驚人」的案例。

但就技術上而言，若要從零開始訓練一個像 ChatGPT 這樣的 AI 基礎模型，需要經過很長時間；以國外大型模型 BigScience 為例，就花上了 416 個 GPU、共 117 天才完成，背後成本非常高。因此，以現有模型來調適，也就是教它新語言，是較為實際的作法。

不過，就實務上而言，人類的語言習得機制其實相當複雜。若要以母語習得方式讓 AI 學語言，就要找到各種語言最底層的共同規則──普遍文法（Universal Grammar）讓 AI 學習，計算量較大；若要以學習第二語言的方式讓 AI 學習，建立在 AI 已經學會一種語言的強況下，就要考量到語言遷移、不同語言間的對照，理論上計算量較小，但以目前技術來說仍是難題。

總歸而言，AI 若要發展到人類的複雜語言，甚至還有手勢、眼神等等，沒有這麼快速、簡單，在短時間內仍無法達成。

此刻是本土語言復振的最好時機？

不過，演講尾聲，廖老師也試圖總結為何此刻就是復振本土語言的最好時機。

就技術面而言，目前的語音辨識、生成技術已經相當完善。廖老師曾參與 Meta 的英、台語音翻譯計畫，成功讓馬克祖克柏（Mark Zuckerberg）講出台語，就向世界展示了驚人技術。

人類從收到語言信號，轉化為語言的辨識，再轉化為腦中文字，是一個複雜的歷程；而人類產出語言聲音、音色，同樣是在腦部進行。在開發技術時，就是要讓電腦模擬這個過程，靠著聲學模型，仿造大腦產出語音。

隨著人工智慧技術發展，目前研究已經能在蒐集聲音後，運用類神經網路讓電腦計算、機器自行學習，創造出模型。遇到的最大障礙，就僅是外界噪音，或者是講話不清楚等辨識問題。

這樣的模型相當複雜，因為講話是用口型、聲帶變化出來的，電腦也要學習合成、辨認這些資訊的差異，理解語氣、聲線、行為，轉化為雙向解碼的過程。如今技術成熟，比起早期用統計方式，暴力找出規則給電腦，如今人工智慧已經能自己學習。

這些技術運用於台語，可以讓 AI 成為語言家教，也可以讓疫情記者會有即時字幕展示，廖元甫教授認為，未來若能讓電視節目即時呈現台文或其他本土語言字幕，大家就能邊看電視、影片，邊學語言，對本土語言復振肯定有很大幫助。

演講結尾，廖老師為議題畫下總結：此刻的臺灣，不但技術成熟，語音辨識合成、翻譯系統都堪用；政策方面，有 2018 年通過的《國家語言發展法》，更有行政院 111-115 年規劃用於本土語言的約 300 億總經費，有一部分可以用於語料庫建置、語音 AI 的開發，為目前本土語言復振創造了良機。

確實，就個人觀察，想以 AI 幫助本土語言復振，當下最重要的就是語料庫的建置，記錄下本土語言的使用痕跡、語法、用詞，才有機會讓 AI 學會語言。而這段工作，最需要的就是經費──若預算充足，相信臺灣的 AI 技術、研究量能不是問題，將有機會想像未來的某天，AI 幫助我們保存語言，教會下一代使用瀕危語言。

▌關於陽明交大「人工智慧語音研發中心」

該中心隸屬於產學創新研究學院，專注於「大規模多模式基石模型」進行語音、語言、影像、聲音等多媒體處理，或是本土語言應用。目前正招募專任教師，以及博士後、碩士級專案研究助理，歡迎有興趣的讀者參考陽明交大網站，或是與廖教授聯絡（yfliao@nycu.edu.tw）。

※本文由換日線網站授權刊載，原標題為《【台大演講筆記】ChatGPT 會說台語？──台灣團隊研究 AI，為本土語言復振努力》，未經同意禁止轉載

【打破學語言的迷思】「中英文都學不好了，幹嘛多此一舉」的荒謬，與語言的「現實價值」

作者簡介：

王善，阿善，就讀於台大外文系，熱愛語言、電影、閱讀、藝術和旅行，立志成為跨越文化的媒體人；現為 YouTube 創作者、「Rti 央廣」英語廣播主持人。閒暇時除埋頭電影世界，也關注英國流行文化。入選金馬影展青少年電影團，亦曾擔任慕尼黑兒少影展青少年評審。

新聞專題
AI PC世代來臨！各家筆電新品點燃戰火

中天新聞網·11 小時前
苗博雅臉丟大了！于美人親曝「送巧芯舊衣真相」開酸：政治人物要目光如炬
徐巧芯近來成民進黨攻擊焦點，昨更被爆料身穿許多精品名牌行頭，還包含一件超過10萬元LV名牌服飾，氣得徐巧芯當場脫衣澄清，而贈送衣服給徐巧芯的于美人證實是自己送的，希望政治人物目光如炬，不要只會在衣服上打轉。
Reactions470
太報·7 小時前
舒淇48歲生日趴宛如婚宴　嘴對嘴甜吻馮德倫「感謝你的包容」
馮德倫前天（4╱17）與老婆舒淇閨蜜林熙蕾在台北出席設計師珠寶品牌CINDY CHAO The Art Jewel於晶華酒店舉辦的20周年全球巡展，而16 日是舒淇48歲生日，今凌晨她在IG分享老公為她辦的祕密生日趴兼慶祝結婚8周年紀念日，小倆口還換上中式喜服，十分甜蜜。
Reactions9
中天新聞網·21 小時前
苗博雅慘被打臉！于美人證實送二手衣給徐巧芯：不是LV的
徐巧芯遭質疑身上穿著價值超過10萬元的LV名牌服飾，今（18日）受訪時氣得當場脫下外套讓大家檢查，徐巧芯表示那些衣服是于美人送她的二手衣，而于美人也傳簡訊證實這件事，並表示送她的衣服不是LV的。
Reactions796
Yahoo奇摩房地產·2 天前
租屋10年、租金360萬「全送房東」蓮蓬頭掉落萌生買房念頭...跑線記者如何當包租公、10年翻身致富法則
跑線記者林裕豐大學一畢業，就背著助學貸款的債務踏入社會。除了正職的記者工作之外，開始斜槓青年的還債人生。終於在打拚大半年之後，還清40萬元的債務。眼看著拿命去拚的一疊厚厚的血汗錢，只換到一張清償單及清空的存款帳戶，那一瞬間，他感到無比空虛。
Reactions7
中時新聞網·2 小時前
綠委恐剉咧等？郭正亮一看「郭智輝入閣」：台灣問題嚴重
崇越科技董事長郭智輝將出任新任經濟部長，崇越為台積電供應鏈，主要業務涵蓋半導體設備、材料，近年則橫跨生技、光電、綠能、環保、健康及運動等領域相當多元，郭智輝也有「斜槓經濟人」稱號。對此，前立委郭正亮18日就表示，「賴清德用郭智輝來處理核三問題，賴清德知道台灣問題很嚴重，需要找有能力的人來處理」，引發討論。
Reactions75
三立新聞網 setn.com·13 小時前
不是鼎泰豐！孫藝真「來台小籠包吃這家」　讚：螃蟹超好吃
記者楊雅芸／台北報導韓國女神孫藝真近日為了品牌活動，出道25年首度來台，在記者會上就對台灣讚不絕口，不僅說之後要帶玄彬一起來玩，還表達了對小籠包的慾望。在活動結束後，便出發去吃美食
Reactions12
三立新聞網 setn.com·17 小時前
吳宗憲爆遭錢莊大亨追債千萬！害吳姍儒咖啡店被砸　親上火線全招了
記者蔡維歆／台北報導吳姍儒經營的「無聊咖啡店」日前遭砸，兩名嫌犯落網供稱不滿其父吳宗憲主持風格，後疑改口是要幫館長出氣。如今卻被爆出主因是吳宗憲因為跟經營錢莊的Y姓
Reactions71
中時財經即時·11 小時前
台積電ADR狂跌逾5％台指期夜盤崩逾300點 2萬又飛了！
美股四大指數均已摜破月、季線，並出現空頭排列訊號，然市場利空爆不完，台積電18日法說會下修全年晶圓代工產值增幅，且未調高資本支出，重擊市場對半導體今年產業發展的信心，連帶拖累其美股ADR早盤重挫逾5％，台指期夜盤一度崩跌超過400點，目前下跌391點，暫報19,851點，再度摜破2萬點大關。
Reactions15
太報·16 小時前
女神菜單曝光！「小籠包」原來是這家孫藝珍讚嘆這道菜「超好吃」
韓國演藝圈女神孫藝珍，日前因代言活動造訪台灣，讓不少粉絲親睹女神魅力。孫藝珍也透露，此行美食將以「小籠包」為心中首選。女神究竟選擇哪一家店家品嘗小籠包？今天（4／18）女神菜單曝光，是位於台北101內的「捌伍添第」，業者也透露，孫藝珍當天享用都是經典招牌菜。
Reactions4
中天新聞網·10 小時前
影/黃捷批徐巧芯掀軒然大波！柯志恩看不下去開嗆了怒揭民進黨惡劣手段
對於黃捷批徐巧芯從早餐店女孩變成勞力士女孩、全身名牌，柯志恩直言，她認為有點侮辱徐巧芯的出身，難道早餐店女孩不能用自己賺得錢對自己好些，她更踢爆自己在高雄市長選戰時也曾受到類似的待遇。
Reactions189
民視·17 小時前
廣末涼子「透明衣100%無遮」甩不淪包袱！真面目翻車慘變大媽
娛樂中心／巫旻璇報導日本女星廣末涼子2023年6月被日媒爆料與米其林一星餐廳廚師鳥羽周作「雙重不倫」醜聞，2人在深夜於飯店約會的畫面更被捕捉流出，最後廣末涼子手寫道歉信，並承認出軌，最後宣布與丈夫離婚。停工11個月後，她自立門戶成立「株式會社R‧H」，近日她更新近況，整個人消瘦不少，讓粉絲相當心疼。
Reactions34
TSNA·11 小時前
MLB》大谷翔平花5億台幣在夏威夷買別墅　私人打擊、投球設施是基本配備
根據美媒報導，道奇日籍投打「二刀流」大谷翔平以1700萬美元(約5.55億台幣)夏威夷購置房產，是非常豪華的別墅。
Reactions19
TVBS新聞網·2 天前
梁詠琪演唱會「花海一幕」台灣人好熟悉　觀眾嚇：莊嚴肅穆
港星梁詠琪上周末在台北小巨蛋開唱，但唱到其中一首歌的背景，梁詠琪的照片被key在藍天白雲下的花海，意外掀起大家討論，不少人認為真的好像告別式，還有網紅製作成迷因哏圖，笑說「當設計師想把舞台加一點台灣味，但太多的時候」，就會長這樣，笑翻大家。
Reactions135
TVBS新聞網·17 小時前
自泰返台「多噴1.8萬」才搭上機！她喊不懂　內行嗆：是常識
出國時遇到突發狀況時，危機應變的能力就顯得相當重要。日前一名網友準備自泰國飛回台灣，因與朋友搭乘不同航空而分開前往機場。孰料，當她到了機場時才發現「無法搭乘」，甚至噴了1.8萬元買機票，遠遠超過原價格。對此，不少網友相當傻眼稱「以為是常識」。
Reactions11
三立新聞網 setn.com·17 小時前
Keanna駁記錯人！謝和弦「有人真的超噁爛」：跪著求我尿在她身上
娛樂中心／蕭宥宸報導藝人Keanna上週爆料指前夫謝和弦與歌手陳芳語在錄音室呼麻偷情，陳芳語隨即透過粉絲群組闢謠稱「她在說謊」。謝和弦今（18）日指Keanna「記
Reactions36
三立新聞網 setn.com·17 小時前
超傻眼！徐巧芯稱「借100萬像借衛生紙」　苗博雅當機5秒後回：很難想像
記者詹宜庭／台北報導國民黨立委徐巧芯的大姑夫婦涉及洗錢詐騙案，網紅四叉貓質疑，徐巧芯的財產申報資料上為何沒有100萬元的「債權」資料？徐巧芯則回應，「代墊100萬」
Reactions170
TVBS新聞網·2 天前
輔選賴清德有功！傳陳時中接任「這職務」　重返執政團隊回應了
準總統賴清德520就任在即，新內閣名單近日陸續揭曉！繼昨（16）日公布包括經濟部長、金管會主委等6位財經部會首長後，傳出輔選賴清德有功的前衛福部長陳時中有望接棒1職務，他本人也回應了。
Reactions710
品觀點·18 小時前
溫朗東道歉了！立委徐巧芯配偶免役爭議得清白
台中市政府研考會主委劉彥澧遭到媒體人溫朗東的質疑，後者在社交媒體上公開發問劉彥澧是否利用特權，讓他在國軍高雄總醫院屏東分院的體檢中，獲得免役的判定。這一指控立即引起劉彥澧及其妻子，國民黨立委徐巧芯的強烈反駁。
Reactions260
三立新聞網 setn.com·1 天前
柯文哲還能拚2026？郭正亮揭1變數：這人選國民黨主席　對民眾黨大傷
政治中心／施郁韻報導民眾黨在雲林縣麥寮鄉長補選派出林宜豊出征，黨主席柯文哲也在麥寮Longstay，率隊全力輔選，未料13日選舉結果，林宜豊得票率僅11%，以得票率
Reactions102
民視·15 小時前
與趙露思合照被抓包P圖！一對比「4人全換頭」超扯原圖網嚇爛
娛樂中心／許嘉惠報導25歲中國女星趙露思擁有甜美的臉蛋、清新的氣質，過去主演《傳聞中的陳芊芊》「陳芊芊」一角而暴紅，之後演出多部愛情劇，演技十分精湛，常常成為話題的焦點。近日她出席精品品牌Versace的活動，以一襲黑色亮片禮服亮相，一名網紅也透過社群平台曬出與趙露思的合照，怎料修圖過猛引發熱議，有網友曬出原圖對比，沒想到照片中的4個人全都改頭換面，讓大批網友都看傻眼。
Reactions6

相關內容

其他人也在看