世界互聯網大會 | 蒐狗與新華社聯合發佈 AI 主播

新浪科技報道,蒐狗公司 CEO 王小川、新華社副社長劉思颺、蒐狗公司智能語音事業部總經理王硯峰和主持人邱浩在第五屆世界互聯網大會上聯合發佈 AI 合成主播。

AI 合成主播由「蒐狗分身」技術打造,透過人臉關鍵點偵測、人臉特徵提取、人臉重構、唇語識别、情感遷移等多項技術,把更接近人類的形象呈現出來。結合語音、圖像等多模態資訊進行聯合建模訓練後,生成與真人無異的 AI 分身模型。

這項技術可以讓機器模擬出逼真的人類聲音、嘴唇動作和表情,並將三者自然疋配。

用戶需要做的隻有輸入新聞文本内容,AI 合成主播將可以用類似真人的聲音進行播報,並且讓畫面中 AI 主播的唇形、表情與真人吻合。

根據此前的報道,蒐狗在第三季度全面升級了語音識别模型,使中文語音識别錯誤率下降 20% 以上,中英文語音混輸錯誤率下降 50% 以上。

圖片來自 新浪科技

延伸閱讀: