最強AI來了!Claude 3.5 Sonnet有多神?為何GPT-4o也輸它?一表看懂5大生成式AI性能差異

6月20日,OpenAI的競爭對手Anthropic推出一款名為「Claude 3.5 Sonnet」的新生成式AI模型,標榜其處理資料的速度,比先前釋出的Claude 3 Opus快兩倍以上,正面挑戰OpenAI旗下的GPT-4o!

據Anthropic官網描述,Claude 3.5 Sonnet可以分析文本和圖像,也可以生成文本。在多項AI基準測試中,其在閱讀、編程、數學和視覺方面的表現超過了Claude 3 Sonnet,並且優於Anthropic之前的旗艦模型Claude 3 Opus,甚至略微優於OpenAI推出的GPT-4o。

AI模型上市時間&性能比對表.jpg 圖/VentureBeat
AI模型上市時間&性能比對表.jpg 圖/VentureBeat

性能大PK?Anthropic:會贏喔!

Anthropic也列出圖表比較Claude 3.5 Sonnet性能,其中在推理能力、知識理解、程式編輯及數理等表現上,均優於也是本家的Claude 3 Opus,也有7項指標勝過OpenAI的GPT-4o。也打敗Google的Gemini 1.5 Pro,以及Meta的llama-400b等語言模型。

項目比較.jpeg 圖/Anthropic
項目比較.jpeg 圖/Anthropic

而在各類測試項目的表現上,據Anthropic測試,Claude 3.5 Sonnet在4個項目上碾壓了GPT-4o,包括數理辨識、科學圖表辨識、圖表及文件理解等項目。

項目比較2.jpg 圖/Anthropic
項目比較2.jpg 圖/Anthropic

在此次更新中,Anthropic新增了更新提示的「Artifacts」功能,在聊天機器人自動生成文字、程式碼等內容時,使用者可透過位於右側視窗輸入額外更新提示,更深度與聊天機器人互動以完成工作項目。

據外媒《tech crunch》報導,Anthropic的產品負責人Michael Gerstenhaber解釋:「假設你想生成程式碼,Artifact視窗會出現在UI當中,然後使用者可以與Claude交談,並迭代其生成程式碼並改進它,以便運行程式碼。」

Anthropic:願稱它為「最強」

非官方的實測案例,據美國AI專家Allie K. Miller貼文指出,Claude 3.5 Sonnet 能夠僅根據一張螢幕截圖,在不到半分鐘的時間內,為她創建一個完整的可玩遊戲,讓她直呼「超狂」。

也有另名網友透過Claude 3.5 Sonnet重現3D場景,顯示了其在視覺處理上的潛力。

總地來說,Claude 3.5 Sonnet速度約比Claude 3 Opus快上2倍,而在圖像分析方面,可以更準確地解讀圖表,甚至可從有瑕疵的圖片中轉錄文本,將有利於各類需要影像識別、圖表分析的運算需求,例如零售、物流或金融領域應用。

針對Claude 3.5 Sonnet性能,Gerstenhaber在採訪中豪言表示,「我相信Claude 3.5 Sonne將會超越業界的任何語言模型。」

資料來源:Anthropic、《Tech Church》、《Venture Beat

延伸閱讀:外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!黃仁勳也愛用它

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
輝達成AI搶才贏家!挖走英特爾2,848人、三星515人,台積電多少人跳槽?哪家大廠最冷門?
黃仁勳愛用Perplexity AI!Perplexity AI是什麼樣的工具?盤點科技大佬AI小幫手