Meta新發表AI系列模型, 可辨識超過 4 千種語言

圖/Meta新發表AI系列模型, 可辨識超過 4 千種語言。(Meta)
圖/Meta新發表AI系列模型, 可辨識超過 4 千種語言。(Meta)

世界上許多語言正面臨消失的危機,Meta今日發表一系列的 AI 模型,希望藉此幫助大家以自己習慣的語言,更輕鬆地獲取資訊及使用電子裝置。Meta 的「大規模多語言語音模型」可辨識超過 4 千種口語表達語言,辨識量是既有技術的 40 倍。

Meta 的大規模多語言語音(Massively Multilingual Speech)模型擴展文字轉語音及語音轉文字技術的應用範圍,從最初的 100 種語言,至今已可轉換超過 1 千 1 百種語言,超越過去的 10 倍。此外,還能夠辨識超過 4 千種口語語言,是過去的 40 倍。Meta 將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發。

Meta指出,過去最大型的語音資料庫最多僅涵蓋 100 種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta 使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。

聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta 創造的資料集,蒐集超過 1 千 1 百種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供 32 小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過 4 千種語言。

影像資訊:Meta

◤編輯最愛◢

👉2023網友熱議新手機!這裡買最省