Meta發布AI翻譯技術SeamlessM4T，支援近百種語言！臉書、IG都能用，5大亮點一次看

數位時代

2023年8月23日下午11:35

近年積極投入AI領域的Meta，繼5月發表多個大型語言模型後，如今又發表了能夠翻譯、轉錄近100種語言的AI模型SeamlessAlign，並且同樣以開源的方式提供給所有人使用。

Meta端出全新AI模型SeamlessAlign，能辨識近100種語言！

Meta在聲明中表示，SeamlessM4T的誕生代表著基於AI的語音翻譯、語音轉文字領域的重大突破。按照Meta的說法，SeamlessM4T可以提供：

1.辨識近100種語言的語音
2.支援近100種語言的語音轉文字
3.語音翻譯技術，可支援近100種輸入語言及36種輸出語言
4.近100種語言的文字轉文字技術
5.文字轉語音技術，可支援近100種輸入語言及35種輸出語言

雖然像哆啦A夢裡翻譯蒟蒻般便利的道具還未出現，不過Meta聲稱SeamlessM4T會是人們能夠更便利溝通的重要一步，這個模型無須其他模型協助，即可辨識各個不同語言，透過單一系統的方法減少了翻譯錯誤及延遲，並提升了效率及品質，讓不同語言的人能夠更有效率地溝通。

Meta執行長馬克．祖克柏（Mark Zuckerberg）表示，「隨著時間，我們會將這些AI翻譯與轉換技術成果整合到Facebook、Instagram、WhatsApp、Messenger及Threads。」

身為一間社群媒體公司，Meta已經投入翻譯技術多年，外媒《TechCrunch》就形容SeamlessM4T是傳承自Meta過去所研發的翻譯模型No Language Left Behind，以及通用語音翻譯工具（Universal Speech Translator）──一個少數支援台語的語音翻譯系統。

而SeamlessM4T也是建立在今年5月發表的大規模多語言語音（Massively Multilingual Speech，簡稱MMS）大型語言模型上，該模型可轉換超過1,100種語言，並可辨識4,000種口語語言。

Meta用大量公開資料練成，比當前模型更能應付不完美的狀況

且如同前幾次公布AI領域進展的作法，Meta宣布開放研究人員及開發人員基於SeamlessM4T進行開發與研究，同時將公開訓練時所用數據集SeamlessAlign。Meta聲稱這是目前最大的公開多模式翻譯數據集，將語音與文字校準過的資料高達44.3萬個小時，並且還有2.9萬小時的語音對語音校準資料。

Meta指出，他們從網路上抓取了數百億個句子，以及約400萬小時的語音資料作為最初的材料。雖然AI訓練資料近幾個月引發大量爭議，許多創作者反彈科技公司逕自使用他們的心血，並要求為此付費，Meta強調他們所有資料都沒有版權問題，主要來自開源或者授權的資料來源。

延伸閱讀：我的心血、你的便宜AI素材？《紐約時報》不忍了，出手擋OpenAI爬蟲

也因為如此龐大的資料，Meta聲稱SeamlessM4T在測試艱難條件的表現時結果更佳，與目前最好的模型相比，SeamlessM4T在有背景噪音、說話者換人的情況下準確度要分別高出37%及48%。

不過SeamlessM4T仍有些小問題存在，例如在看不出性別訊息時有10%的情況更喜歡翻譯成男性，Meta認為這可能是因為訓練資料中男性出現得較多。同時在個別語言中，有時SeamlessM4T翻譯時會較容易出現有害言論，涉及性取向及宗教時偶爾也會出現問題。

Meta聲稱，SeamlessM4T的公開測試版本將會有針對輸入及輸出語音的篩選機制，會過濾掉不適宜或有害的內容，只不過Meta開源提供研究人員及開發者的版本中，並沒有包含這項防護措施。

Meta指出，他們希望透過這項技術幫助不同語言的人們聯繫彼此，並且將以此為基礎探索這個基礎模型如何創造新的通訊能力，「最終讓我們更接近一個所有人都能被理解的世界。」

延伸閱讀：Meta聯手微軟，AI模型Llama 2免費商用！開源背後有3但書

資料來源：TechCrunch、Meta

責任編輯：林美欣

新聞專題
蘋果WWDC開幕 Apple Intelligence亮相

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions207
三立新聞網 setn.com·
高虹安有罪「檢察官同天升官」遭狂帶風向　律師揭真相：實在很可恥
政治中心／林昀萱報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地檢署依違反《貪污治罪條例》等罪起訴，一審台北地方法院昨（26）日重判高虹安7年4月、褫奪公權4年。
Reactions48
引新聞·
小吳終於道歉了！十盛標示不實　哽咽認了：早知道有奶精
（記者劉雅文／綜合報導）百萬YouTuber小吳和網紅紀卜心，共同創立的手搖飲品牌「十盛熟成奶茶專賣店」，日前 […]
Reactions296
中天新聞網·
美媒評選奧運開幕式各國出場團服　盛讚中華隊：把時尚帶進巴黎
2024巴黎奧運開幕式已在稍早舉行完畢，本屆奧運也是史上首次在「水上」的戶外開幕式，各國代表隊選手進場後，隊服也成為外界矚目焦點。其中美國媒體《雅虎體育》就對中華隊的出場服裝稱讚滿滿，「中華隊將時尚帶到巴黎！」
Reactions17
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions26
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions872
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions244
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions21
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions55
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions821
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions61
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions25
Yahoo奇摩運動·
奧運》戴資穎、孫振掌旗率隊征戰花都開幕式Lady Gaga、席琳狄翁接連開唱同慶
2024巴黎奧運會於台灣時間27日凌晨1點30分正式開幕，中華代表團搭乘第74艘船進場，掌旗官由台灣羽球一姊戴資穎及霹靂舞一哥孫振擔當，代表團共有21位中華健兒、12位教練、6位行政人員參與開幕儀式，巴黎現場雖然下起不小的雨勢，但仍舊抵擋不了大家的熱情，每位選手皆用力揮舞手上會旗，透過轉播鏡頭讓世界看到台灣。
Reactions56
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions179
三立新聞網 setn.com·
認屍案傳回泰國　唐治平親戚不捨出手了！金援內幕曝光
記者鍾智凱／綜合報導唐治平認母案受到高度關注，日前他受訪時表示：「既然檢警堅持要我認，我就認。」先前他曾指出母親會有百萬保險金部分，他說要拿到母親死亡證明才能領，且
Reactions101
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions24
三立新聞網 setn.com·
關鍵4個月！王義川曝新竹企業家「恐逼高虹安辭職」：辭了黃國昌選不了
記者詹宜庭／台北報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地方法院今（26日）一審判決出爐，依貪污罪高虹安判刑7年4月，褫奪公權4年，可上訴；另依地方制度法第
Reactions120
Yahoo奇摩新聞（記者潘鈺楨）·
席琳狄翁回來了！奧運開幕華麗復出「壓軸飆高音」女神卡卡雨中性感獻舞
2024巴黎奧運於台灣時間27日凌晨開幕，演出陣容如同先前外傳，由女神卡卡（Lady Gaga）在塞納河畔表演揭開序幕，席琳狄翁（Celine Dion）壓軸登場，在巴黎鐵塔為開幕式畫下完美句點。
Reactions32
三立新聞網 setn.com·
高虹安涉貪判7年4月！四叉貓列4人刑期…點名他：最大贏家
政治中心／彭淇昀報導新竹市長高虹安被控2020年擔任立委期間，與其4名國會助理，連手詐領立院公費助理補助共46萬30元，台北地檢署依違反貪污、偽造文書等罪嫌起訴，台北地院今
Reactions102

Meta端出全新AI模型SeamlessAlign，能辨識近100種語言！

Meta用大量公開資料練成，比當前模型更能應付不完美的狀況

相關內容

其他人也在看