Meta飄台味 陳鵬仁為愛翻譯人工智慧上場

(中央社記者周世惠舊金山19日專電)社群媒體Meta今天推出人工智慧閩南語口語翻譯系統。負責這項計畫的陳鵬仁來自台灣,他「為愛翻譯」的初衷是希望他父親能夠用台語和任何人交談。

Meta官網今天發布,人工智慧研究員陳鵬仁(Peng-Jen Chen)表示,他在台灣的成長過程說中文,也就是老一輩人俗稱的「漢語」或「普通話」,而他70歲已退休的父親陳聖獎來自台灣南部,主要說閩南語(Hokkien,台語或福建話)。

他說父親聽得懂中文,但是對較複雜的中文反應較慢,中文和閩南語之間,雖然有關聯性,卻也有其不同。

陳鵬仁了解語言的障礙會影響人們的溝通,他一直希望父親能用閩南語和所有人溝通,因為那是他父親用起來最舒服的語言。

就是這個「為愛翻譯」的初心,他著手解決問題,他領頭開發新技術,進行閩南語和英語之間的翻譯。

今天登場的這個閩南語翻譯系統的展示影音,Meta創辦人兼執行長祖克柏(Mark Zuckerberg)用英語和說台語的陳鵬仁對話,經由機器人中介翻譯,無縫溝通。

不過在開發這套翻譯系統之初,由於閩南語沒有太多現成可用的語音資料庫,加上能夠以英語轉換為福建語的翻譯人員很少,在收集文本、解譯資料,和訓練翻譯模型時困難重重。

陳鵬仁和Meta的研究人員利用「中文」作為中間語言,和會說閩南語的人緊密合作、確保翻譯正確,把閩南語轉為中文、再轉為英文,以兩組配對的句子透過機器學習進行比對訓練。

約書亞.楊(Joshua Yang,譯音)在推文透露,Meta的研究員採用3萬小時台劇作為翻譯文本。

陳鵬仁的高中同學和好友侯宗佑在臉書(Facebook)寫道,陳鵬仁即使「住在美國也一直非常用心地在找台語教材,讓小孩練習母語」。

電腦翻譯早已不是新概念,過去多偏重在書面語言之間的轉譯。Meta表示,在7000多種現存語言中,超過40%為口說語言,沒有標準或廣泛熟知的書寫系統。

陳鵬仁和他的團隊成了早期使用人工智慧科技、為沒有正式書寫系統的語言建立翻譯系統的先驅。這也是Meta「通用語音翻譯器」(Universal Speech Translator)計畫的一部分,即時把語音從一個語言翻譯成另一個語言,無需仰賴書面中介。

一些沒有標準化書寫形式的語言正面臨消失的風險。研究人員認為,人工智慧可以幫助解決非書寫語言的使用者保留語言、解決溝通障礙。(編輯:郭中翰)1111020