【AI 再突破】只需10段5秒音頻即可以複製你聲音
百度AI技術雖然在國際上還談不上頂尖但亦多方面發展,從面部識別、語音識別到實時語音翻譯,百度已經連續三年入選 MIT 全球十大突破技術榜,並在「全世界最聰明公司」中排名第二。作為 AI 技術的先行者,百度AI「 Deep Voice」只需聽一個人說話一分鐘,就能模仿其嗓音,與真人聲音無異。
據英國《每日郵報》報導,以 AI 為基礎驅動力的百度不斷完善核心業務,實現了從「人找信息」到「信息找人」的轉變,為百度帶來新的商業模式,為移動營銷提供了新的解決方案。而「Deep Voice」是百度 AI 研發的一個完全由深度神經網絡構建的高質量語音轉文本系統,可以分析並學習發言者交談時的聲音特質,從而「複製」出發言者的合成語音。
目前「Deep Voice」研究人員已經用2400人的聲音樣本對該 AI 進行了800多小時的訓練。現在,通過分析100段5秒的聲音片段它就可以完全複製一個人的聲音,而且只用10段5秒的聲音片段就可以有95%的機率通過語音識別系統的測試。而該技術可以用於幫助喪失發聲能力的人重新「發聲」,為電子遊戲中的上百個虛擬角色配上各具特色的真人語音。但這個開發又是否突破了聲紋識別安全認證呢?值得深究一下。
此文章原刊於 Qooah.com