Google翻譯史上最大更新!新增110種語言「廣東話也能翻」,為何AI模型PaLM 2是幕後功臣?

Google宣布,Google翻譯新增110種語言的支援,使其支援語言總數從133種增加到243種,甚至包括了網友敲碗多年的廣東話,為Google翻譯推出後最大規模的更新!

Google指出,本次更新仰賴於PaLM 2 AI語言模型。據Google研究學者Isaac Caswell指出,PaLM 2 AI模型在學習高相關性語言時表現特別優異,例如,與印地語相關的阿瓦德語(Awadhi)和馬爾瓦爾語(Marwadi),以及接近法語系的克里奧爾語(French-based creole languages),如塞席爾克里奧爾語(Creole),及毛里裘斯克里奧爾語(Morisien)。

Google也懂廣東話了

在此一波新增的語言中,Google翻譯也支援廣東話了。Caswell表示,廣東話「長期以來都是Google翻譯最受歡迎的請求語言之一」。然而,廣東話在書寫上經常與普通話重疊,因此找到合適的數據並訓練模型是一大挑戰。

粵語.jpg 圖/Google
粵語.jpg 圖/Google

此外,Caswell指出,新增語言中約有四分之一來自非洲,顯示了Google對推動非洲語言數位化的重視。

Caswell受訪時透露,大多數新增語言都有至少一百萬名使用者,且「有些語言的使用者數量達到數億人」。這些語言的納入,擴大了Google翻譯的使用範圍,也加強了其在多語言環境中的實用性。

什麼是PaLM 2?它有多強?

Google表示,此次語言擴展背後的技術支持,主要來自於PaLM 2 AI語言模型的強大學習能力。這一模型不僅能有效學習和理解新語言,還能在相關語言之間建立聯繫,從而提高翻譯的準確性和自然性。

PaLM 2是Google於2023年發布的第二代大型語言訓練模型(LLM),當時Google指出,相較於一代PaLM,二代不論是在 數理、邏輯推理、編碼等領域處理能力皆大幅提升。

Google PaLM 2 也可細分為4種版本,由大到小分別是「Unicorn、Bison、Otter、Gecko」。它們能在不同種類的裝置中運用,輕量級別的 Gecko 甚至可以直接在行動裝置上離線使用。

Google表示,PaLM 2 使用超過100種語言進行訓練,主要擅長理解與生成自然語言、翻譯、編碼、問答、摘要、創作寫作、數理邏輯、常識推理;尤其語意理解的部分,PaLM 2 能夠讀懂像是猜謎、成語等非字面意義的文字。

資料來源:《The Verge》、《Google

延伸閱讀:輝達如何一直贏?量子運算布局是?股東會上,黃仁勳為何不斷強調2大關鍵字?

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
輝達如何一直贏?量子運算布局是?股東會上,黃仁勳為何不斷強調2大關鍵字?
擴大在台投資再+1!蘋果新資料中心擬「落腳北部」,還有哪些雲端大咖落地台灣?