OpenAI推出GPT-4o模型 免費提供逼真語音對話體驗

OpenAI於5月13日舉行線上發表會,推出新一代AI模型GPT-4o。該模型整合了文字、圖像及音訊處理能力,讓ChatGPT能進行更逼真、即時的語音對話。GPT-4o的平均回應時間僅需320毫秒,與人類對話反應相近,且能感知使用者情緒,透過音樂舒緩情緒,甚至能講睡前故事並變換語調。

GPT-4o在文字處理上與GPT-4 Turbo相當,但非英語文字性能有所提升。OpenAI表示GPT-4o的速度是GPT-4 Turbo的2倍,成本卻只有一半。這項模型將透過API提供給軟體開發商,讓他們能建構更多元的應用。

OpenAI技術長穆拉提(Mira Murati)表示,GPT-4o將對所有用戶免費開放,未來幾週內會推出alpha版本供付費用戶體驗。除了GPT-4o,OpenAI也推出ChatGPT的Mac版桌面應用程式,調整了使用者介面,讓一般用戶也能免費造訪GPT Store。

穆拉提特別感謝輝達(Nvidia)執行長黃仁勳,提供先進GPU協助OpenAI開發新模型。目前各大科技公司正引領一波AI熱潮,爭相將聊天機器人整合到關鍵服務中。市場研究顯示,2023年生成式AI投資額達291億美元,預估10年內將突破1兆美元。

對於AI發展,OpenAI執行長奧特曼提出「無條件基本算力」的概念,希望每個人都能分享GPT-7模型的效益,用於個人使用、轉售、捐贈或研究用途。他認為持有大型語言模型的一個單元,可能比金錢更有價值,等同擁有部分生產力。

儘管AI為各界帶來機會,但學者與倫理學家也憂心技術傳播偏見、威脅就業市場的問題。因應AI的衝擊,奧特曼主張提供全民無條件基本收入(UBI),作為社會安全網,並將於近期公布自己主導的UBI實驗結果。

更多品觀點報導
微軟砸重金打造威斯康辛AI數據中心,原鴻海計劃地轉手引發業界關注
Meta股價暴跌引發市場關注,AI未來投資路徑受質疑