15秒「複製人聲、多語系」OpenAI開發新語音工具

美國人工智慧公司OpenAI開發利用AI生成文字、圖片和影片的技術後,29號更公開全新語音複製工具,可以完美重現人類聲音,還能翻譯成多種語言,但是為了安全顧慮,暫時不打算公開釋出。

AI語音技術取得巨大進展,美國人工智慧公司OpenAI開發出可以模仿人聲的語音複製工具,首先來聽聽真人的聲音,英文真人原聲:「我會說英語和葡萄牙語,我要貢獻我的聲音。」

只要有15秒的真人說話錄音樣本,AI就可以複製出同一個人說話的聲音生成AI聲音。

不管是沙啞的嗓子低沉的音調都完美重現,AI保留了真人的語感,還能翻譯成不同語言,OpenAI指出這項技術可以利用在無法說話的病人身上,或是成為跨國企業的溝通管道,英文真人原聲:「友情是很普遍的寶物,它在世界各地都帶給人們生活上的,喜悅支持和歡笑。」

生成AI日文翻譯:「友情是很普遍的寶物,它在世界各地都帶給人們生活上的,喜悅、支持和歡笑。」

不過AI完美模擬人聲也引起外界擔憂,有心人士會用在選舉造假,等假消息上,因此OpenAI目前只和10家開發商分享初步成果,並決定不擴大發表這項新技術也不會公開釋出,防範被濫用。美國科技媒體記者大衛:「我必須承認這(AI)令人驚豔,但我非常擔心這些強大技術的可能性,到目前為止還沒有任何規定。」

OpenAI也為這項技術申請商標權有助和亞馬遜等,其他同類產品業者競爭,進軍語音辨識和數位語音助理業務,打造更尖端的AI人聲複製工具。

(封面示意圖/翻攝自pixabay)

更多東森新聞報導
首例小紅書詐騙!女代購點數遭詐 怒求償無門
美國珠寶店牆壁遭竊賊鑿穿 3千多萬珠寶不翼而飛
墨西哥8歲女童被撕票「警察不管」 女嫌當街遭打死