Meta發表AI新模型助語音、文字互轉 支援全球逾4000種語言

臉書母公司Meta今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍,文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。為開發此技術,Meta使用已翻譯成多種語言、譯文的《聖經》,作為語言的文字訓練資料。

臉書(Meta)23日公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍,文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。(美聯社資料照)
臉書母公司Meta23日公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍,文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。(美聯社資料照)

Meta今天發布新聞稿表示,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。由於世界上許多語言正面臨消失危機,而現有的語言辨識與生成技術上的限制更加快此趨勢,Meta這項技術可謂一大突破。

Meta指出,Meta的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍;此外,還能夠辨識超過4000種口語語言,是過去的40倍。

這項技術已有許多應用案例,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解出每個人的聲音。

Meta表示,開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。

Meta表示,《聖經》譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。

責任主編:于維寧

看更多國際新聞
哈日族注意!日本擬改觀光客購物免稅制度 最快明年上路
港建立「與中國器官捐贈機制」!湧上千登記取消申請
土耳其大選二輪決選在即 第三勢力表態挺艾爾段連任
德總理吃了誠實豆沙包?蕭茲批川普製造分裂「拜登連任較好」
專家:印尼政客恐在2024大選操弄反華情緒

【填問卷抽好禮】2023健康生活大調查