藉由推論、以不同方式解決問題,OpenAI推出能花費更多時間"思考"的自然語言模型「o1」

OpenAI稍早公布其名為「o1」的自然語言模型,標榜能以較多時間進行"思考",藉由推論、以不同方式解決問題,並且能從錯誤中修正,藉此增加解答準確率。

藉由推論、以不同方式解決問題,OpenAI推出能花費更多時間
藉由推論、以不同方式解決問題,OpenAI推出能花費更多時間"思考"的自然語言模型「o1」

自然語言模型預期就是先前傳聞代號「Strawberry」的產品,強調如真人般思考,同時也會從經驗中學習。

跟其他自然語言模型一樣,OpenAI在推出「o1」預覽版本之餘,同時也提供對應輕量化運算需求、反應速度更快的「o1-mini」。前者目前僅開放OpenAI服務付費用戶測試,同時現階段也有嚴格的30組訊息使用量限制,而後者則同樣僅限付費用戶使用,並且限制50組訊息使用量。

跟先前推出的GPT系列模型不同,「o1」採用不同命名方式,似乎意味將採用不同產品發展策略,同時「o1」本身不具備網路瀏覽功能,同時也無法由使用者上傳文件或圖像,基本上就是透過模型訓練基礎,以及持續與人互動學習結果進行成長。

而「o1」在運算過程會考量問題本質,以及解答內容的正確性,因此在物理、化學、生物學,以及包含數學、程式編碼表現更為突出,但相對在運算執行速度會花費更多時間進行驗證,與GPT系列模型主要透過資料比對歸納結論的方式不同,「o1」會更著重在解答內容是否正確、與提問內容邏輯是否相符等。

以解答國際數學奧林匹克競賽測驗內容中,OpenAI表示GPT-4o的解答正確率僅有13%,但「o1」的正確率則提升至83%。

不過,雖然花費更多時間檢查、驗證,讓實際得出解答正確率更高,並不代表「o1」不會像GPT系列模型有"睜著眼睛說瞎話"情況,實際解答內容可能還是需要由人類作最終確認。

更多Mashdigi.com報導:

Google Wallet目前可加入美國護照,接下來也準備支援加入台灣iPASS一卡通

蘋果在iOS 18新增以AirPods Pro 2作為聽力輔助設備的功能,獲得美國食品藥物管理局批准

通用汽車與現代汽車合作,雙方將共同開發、生產一般車輛及商業用車款