o3模型發布!拆解ChatGPT聖誕禮包3亮點:OpenAI用了12天直播說了什麼故事?

OpenAI自美國時間12月4日起,連續12個工作日進行聖誕倒數直播,先是在首日就推出模型o1的正式版,最後一天又來個驚喜回馬槍,公布最新一代模型o3與o3-mini。

與o1相同,OpenAI最新的o3和o3-mini也是運用「思維鏈」(Chain of Thought,CoT)技術的推理模型,但效能又較o1顯著提升。

o3_1.jpg 圖/OpenAI YouTube
o3_1.jpg 圖/OpenAI YouTube

在美國時間12月20日的直播中,OpenAI研究副總裁陳信翰(Mark Chen)展示o3模型的內部測試成果,例如在軟體工程方面,o3準確度達到71.7%,比o1模型高出約23個百分點;o3也在程式競賽平台Codeforces取得2,727分佳績。除此之外,o3在回答數學及博士級科學問題上,也都有優於o1模型的表現。

特別的是,o3模型在致力於比較AI與人類智慧的ARC-AGI測試中,最高可以達到87.5%得分, 「人類表現得分85%的情況下,就具比較價值,在這以上的分數是一個重要的里程碑。」

ARC Prize基金會主席凱拉特(Greg Kamradt)表示, 這意味著新一代模型更加接近通用人工智慧(Artificial General Intelligence,AGI),能夠學習與獲得新技能。

o3_2.jpg 圖/OpenAI YouTube
o3_2.jpg 圖/OpenAI YouTube

此外,o3-mini支援低度、中等和高度運算模式,也就是說,使用者可以依照任務複雜程度,調整模型的運算和思考時間。

目前新模型還沒正式上線,OpenAI執行長奧特曼(Sam Altman)表示,o3-mini預計在明年1月先推出,o3則會隨後跟上。而在1月10日之前,o3-mini模型會先開放給資安領域研究人員申請使用,以協助測試模型安全。

2024年尾聲,OpenAI用12天直播說了什麼故事?

在o1模型正式發布之前,業界幾度有聲浪質疑,用更大規模算力、參數和資料量,換取更佳模型效能的縮放定律(Scaling Law)已經瀕臨極限。OpenAI在年末一次性公布o1與o3兩代模型,像是一掃悲觀的陰霾,除此之外,為期12天的直播活動中,還有三大亮點:

亮點一:開發者友善的客製化功能

過去大型語言模型(LLM)面對高度產業知識的發揮效果褒貶不一,OpenAI新推出強化學習微調(Reinforcement Fine-Tuning,RFT)功能,提供開發者能以簡單程式,建立為專業領域而生的客製化模型,像是法律、醫療、金融等領域的專業諮詢都能受惠。

此外,OpenAI也開放o1模型的API,提供包含函數調用(Function calling)、結構化輸出(Structured Outputs)、開發者訊息(Developer Messages)和視覺輸入等功能。其中,開發者訊息能夠指定模型要遵循的細部指令,例如定義語氣和呈現風格。而最直觀的應用,是使用者可以串連API,製作出有個人風格的聊天AI。

亮點二:AI輔助工作流程

今年,OpenAI陸續祭出協作式編輯工具Canvas,以及AI搜尋引擎SearchGPT。Canvas讓使用者在寫作或編寫程式時,可以邀請AI協助編輯、補充資料或進行設計建議;SearchGPT則將實時網頁搜尋整合至ChatGPT中。

而新推出的「專案(Projects)」功能,同時整合了Canvas與SearchGPT,使用者能夠依據不同作業需求,自定義工作空間。無論是基本的檔案管理、多人協作,或是整合程式碼與自訂指令,都能在專案空間中實現。

亮點三:多模態AI工具落地

OpenAI在系列直播中,再度展現語言模型從文字拓展至聲音和影像的趨勢。現在透過線上版本或直接撥打電話,都能和ChatGPT用語音對話,ChatGPT Plus和ChatGPT Pro的訂閱者還能開啟視訊功能,讓ChatGPT根據眼前實景互動。

OpenAI也正式發布AI影片生成模型Sora,可以透過文字、圖片或影片創建新的影片內容。Sora支持最高1080p的畫質,以及長達20秒的影片生成,並且,使用者能夠逐幀編輯影像內容。

直播第一天,OpenAI就推出一個月美金2,000元(約新台幣65,443元)的ChatGPT Pro訂閱方案。後續包含Sora在內的新功能,都為訂閱者設計差異化方案,在在彰顯OpenAI今年轉向商業模式的策略決心。此外,OpenAI也積極將ChatGPT與Apple Intelligence、與其他應用程式進行整合,在年末讓使用者感受到ChatGPT無所不在。

延伸閱讀:OpenAI推出o1模型!釋出最新ChatGPT Pro方案:月費高達6,500元,厲害在哪?

責任編輯:李先泰

更多報導
OpenAI最強影片生成模型Sora解密:意思是什麼?誰能用?月費多少?
ChatGPT Search全面開放,免費用戶也能用!跟Google Search有什麼差別?實用查詢教學一次看
ChatGPT canvas全面開放!有哪些功能?如何用它協助寫作?教學一次看