Anthropic 最新的 Claude 模型可以快速回應,也可以慢慢「思考」

Anthropic 號稱這是業界第一個「複合型」的思考模型。

Claude 3.7 Sonnet
Claude 3.7 Sonnet

新的一週,又有新的 AI 模型準備好供大眾使用了。這次是由 Anthropic 推出了其新一代的 Claude 3.7 Sonnet 模型,Anthropic 將其描述為市面上第一個「混合推理模型」,這意味著新版本的 Claude 同時具備即時回答問題,以及慢慢思考、逐步解決問題的能力。用戶可以在模型運轉前,透過下拉式選單選擇你希望它採取的「思考模式」。

Anthropic 表示:「我們開發 Claude 3.7 Sonnet 的理念與市場上其他推理模型不同。正如人類用同一個大腦可以進行快速反應和深度思考一樣,我們認為推理應該是整合在前沿模型內的能力,而不是獨立的模型。這種統一的方法,也能為用戶創造更加流暢的使用體驗。」

Anthropic沒有明確點名指的是誰,但近期發佈的推理模型確實都是與主模型拆分的。這包括了 OpenAI 的 GPT-4 與 o3-mini、DeepSeek 的 DeepSeek-V3 與 DeepSeek-R1、還有上週發表的 Grok 3 與 Grok 3 Reasoning。將推理模型和標準模型合而為一,Claude 3.7 Sonnet 似乎還真是第一個。不過 OpenAI 也早就表示將 GPT 與推理模型合而為一是其長期方向,預計會在 GPT-5 達成

Anthropic 並表示,他們在開發 Claude 的推理能力時,也採取了不同的訓練策略。「我們在數學和電腦科學競賽問題方面的特化程度稍低,而是將重點轉移到更能反映企業實際使用 LLM 的方式的現實世界工作內容上」該公司寫道。因此,Claude 3.7 Sonnet 的用戶可以期待「在程式碼撰寫及前端網頁開發方面有特別強大的改進」。

今日起,所有 Claude 方案(包括 Anthropic 的免費層級)都可以使用 Claude 3.7 Sonnet。同時,開發人員也可以透過該公司的 API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新模型了。

相關新聞: