OpenAI 開始逐步推出其「先進語音助理」
預計將在今年秋季前對所有的 ChatGPT Plus 會員開放這個新功能。
OpenAI 已經開始逐步推出其「先進語音助理」,從今日起少數付費 ChatGPT 用戶就能夠嘗試與 AI 聊天機器人進行交談。OpenAI 預計將緩緩開放語音助理的適用範圍,預計所有的 ChatGPT Plus 會員將於今年秋季前玩到這個新功能了。
該公司在 X 上宣布,這個進階版的語音模式將提供「更自然、實時的對話,允許你隨時打斷,並能感應並回應你的情緒」。
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
ChatGPT 其實在去年 9 月就已經推出對語音對話的支援,但當時的解決方案需要串接三個獨立的模型,一個將你的語音轉成文字、一個分析並生成文字回覆、而另一個再將文字回覆轉成語言。這中間難免會有些串接不順暢之處,也不太可能將聽到的語氣和情感反應出來。今年 5 月時 OpenAI 演示了新的 GPT-4o 模型,它使用單一多模態來實現語音功能,也就是一個模型中包括所有語音分析、回覆及語音輸出的功能。這除了能產生更適當、更有情感的回應外,也減少了與聊天機器人對話的延遲。
OpenAI 在 5 月的演示中出現一個插曲,就是示範的語音聽起來非常像電影《她》中為 AI 角色薩曼莎配音的演員 Scarlett Johansson 的聲音,而受到大量批評。在遭到反彈後,OpenAI 儘管堅稱配音演員並未刻意模仿 Johansson,但進階語音模式的發布日期依然被推遲,相似發音的聲音也已被剔除。
相關文章: