OpenAI新模型GPT-4o問世!對話能力強到會「插嘴」,還能讀懂人類語氣

在Google I/O登場前一天,OpenAI毫不留情搶走他們的風采,率先發表全新模型GPT-4o,在擁有GPT-4等級智慧的同時,具備更為強大的語音、視訊處理能力,並能給予用戶逼近與真人互動的感受。

GPT-4o的特別之處,或許從名字就可以窺之一二,o指的是omni,中文意思類似「全、一切」,代表著新模型跨越文字、音訊及視訊推理的能力。「我們宣佈推出GPT-4o,這是我們的全新旗艦模型,能夠即時推理音訊、視訊及文字。」OpenAI在聲明中表示。

逼近人類的回應能力,「就像電影裡的AI」

GPT-4雖然也能辨識圖像、進行文字語音轉換等服務,但OpenAI過去將這些功能放在不同的模型之中,導致回應時間更長,而GPT-4o則將這些功能全部整合在一個模型裡,被他們稱為omnimodel(全能模型,暫譯)。與上一代旗艦GPT-4 Turbo相比,GPT-4o在英文及程式語言的表現上相仿,不過英文外的語言則有顯著的效能提昇,並且API的速度更快、成本也降低了多達50%。

OpenAI指出,GPT-4o有著接近人類的回應時間,能提供用戶更自然的溝通體驗,可以在最短232毫秒(0.232秒)、平均320毫秒(0.32秒)的時間內回應問題。作為比較,GPT-3.5及GPT-4在語音模式的回應時間,分別為2.8秒和5.4秒。

gpt-4o.jpg 圖/YouTube
gpt-4o.jpg 圖/YouTube

在OpenAI的演示中,GPT-4o能夠在聊天過程中即時口譯,讓說著不同語言的兩人順暢地進行交談。又或者請求GPT-4o講一個睡前故事時,可以用更飽滿、有語氣的聲音生動地說故事;又或者能用接近人類的口吻,教導人們解開簡單的數學問題。

根據OpenAI說法,GPT-4o能夠「讀懂」用戶的表情與語氣,知道什麼時候該如何做出回應,並能在不同的語氣間快速切換,一下是冷冰冰的機械聲,一下又能活潑地唱起歌來。OpenAI技術長米拉.穆拉蒂(Mira Murati)指出,GPT-4o的開發是受到人類交談過程啟發,「當你停止說話時,就輪到我開口了。我可以讀懂你的語氣並回應。它就是這麼自然、豐富且具互動性。」

「新的語音(和視訊)模式是我用過最棒的電腦界面,就像電影裡看到的AI一樣。」OpenAI執行長山姆.奧特曼(Sam Altman)也在部落格上表示,「我還有點吃驚這是真的,事實證明達到人類水準的回應時間和表達能力變化有多大。」

雖然演示過程並沒有一切完美,《MIT科技評論》指出,過程中GPT-4o有時會打斷人們說話、還在未被要求的情況下突然評論起一位主持人的服裝穿著,不過被演示者指正後很快就恢復正常。

穆拉蒂透露,透過omnimodel的力量,未來GPT技術還會進一步提昇,例如能夠在觀看體育賽事轉播後向用戶解釋競賽規則,不單單只是完成翻譯圖片文字等簡單任務。

OpenAI表示,目前用戶將可以在免費版本中使用GPT-4o,而付費訂閱者則可以享有免費版5倍的訊息限制。而以GPT-4o為基礎的語音服務,預計會在下個月提供訂閱用戶測試版。GPT-4o能免費提供給用戶,也反應了OpenAI確實在降低成本上取得成果。

不過OpenAI提到,出於對遭到濫用的擔憂,語音功能暫時不會開放給所有API用戶,未來幾週內會先提供給部份值得信賴的合作夥伴使用。

ChatGPT電腦版程式登場、GPT Store免費開放

在GPT-4o大幅增強語音、視訊功能的同時,OpenAI也宣佈為網頁版推出更新的ChatGPT UI,聲稱具有更對話式的主界面及訊息呈現。穆拉蒂強調,雖然模型越來越複雜,她希望用戶與AI的互動體驗能夠更為簡單明瞭、輕鬆自然,讓用戶不必費神在UI上,而是專注與ChatGPT協作。

OpenAI也公佈了電腦版本的ChatGPT程式,預計率先推出MacOS版本,Windows版本則要今年內稍晚的時候推出。值得一提的是,稍早才傳出OpenAI與蘋果就AI技術合作的協商已經進入尾聲,此時率先端出Mac版本程式,引發外界聯想。

chatgpt macos.jpg 圖/OpenAI
chatgpt macos.jpg 圖/OpenAI

另外,OpenAI在今年初推出GPT Store,讓開發者能客製化各種功能的聊天機器人,並上架到商店裡供其他用戶使用,現在這個平台將免費開放給所有用戶,未來免費用戶也能使用過去付費用戶才能享有的特定功能。

資料來源:OpenAITechCrunchMIT Technology Review

延伸閱讀:iPhone 將導入 ChatGPT?蘋果與OpenAI協商有譜,傳iOS18推新功能

更多報導
OpenAI正面對決Google!盛傳5/9發布ChatGPT搜尋引擎,挑戰谷歌本命產品
狂言「年燒500億美元也要開發通用AI」,奧特曼為何稱GPT-4是最蠢模型?