Claude 3.5 Sonnet大升級！新功能「電腦操作」可解放雙手，能代訂機票的AI秘書不遠了？

數位時代

2024年10月23日上午5:05

AI新創公司Anthropic於10月22日發布升級版Claude 3.5 Sonnet，以及全新模型Claude 3.5 Haiku！

更新後的Claude 3.5 Sonnet，開放用戶測試「電腦操作」（Computer Use）功能，這項技術允許AI能模擬人類操作滑鼠的動作，透過電腦的應用程式完成多步驟任務，亦即「AI代理」功能。

Anthropic也宣布在10月底釋出全新迷你模型Claude 3.5 Haiku，其在許多智慧基準測試上超過了上一代最大模型Claude 3 Opus，「在編碼任務上尤其強大。」

Claude 3.5 Sonnet評測表現大升級

升級後的Claude 3.5 Sonnet在效能上超越前一代，特別是在編碼、工具使用及推理任務中的表現有著顯著提升。

除了MATH略遜Gemini 1.5 Pro之外， Claude 3.5 Sonnet在其它評測都勝過Gemini 1.5 Pro、Gemini 1.5 Flash、GPT-4o與GPT-4o mini。

在與撰寫程式相關的HummaEval及SWE-bench Verified評測中，Claude 3.5 Sonnet奪得了93.7%及49%的成績，高過前一個版本的88.1%與40.6%。

另一個TAU-bench，是用來測試AI代理工具於真實世界場景中的表現，能否處理複雜且多步驟的任務，並與使用者進行自然對話。 Claude 3.5 Sonnet在零售領域的表現達到69.2%，在航空領域的表現為46%，高於前一版的62.6%與36%。

靠AI訂機票？代理功能值得期待

Claude 3.5 Sonnet的「電腦操作」（Computer Use）功能，能夠模擬人類操作電腦，包括點擊按鈕、移動滑鼠游標、輸入文字等操作，甚至能夠進行網站導和即時網頁瀏覽。

Anthropic的科學總監賈里德．卡普蘭（Jared Kaplan）表示：「Claude 3.5 Sonnet可以理解並與任何桌面應用程式互動，完成數十甚至數百個步驟的任務，這是AI技術在實體世界應用中邁出的重要一步。」

亞馬遜是最早測試「電腦操作」功能來簡化內部流程的企業之一，其他初期測試者也包括Asana、Canva和Notion等知名企業，它們嘗試將功能應用於自動化任務中，例如設計與編輯流程、表單填寫、數據處理等。Replit則利用Claude 3.5開發了一個自動驗證應用程式功能，能在App的開發過程中自動檢查並驗證代碼。

Anthropic計劃未來將「電腦操作」功能擴展到更多應用場景，例如讓AI自動完成預訂航班、安排會議或報銷表單填寫等，進一步提升工作效率。

適合中小企業，更小更快的Claude 3.5 Haiku模型

Anthropic也宣布預計在10月底推出全新Claude 3.5 Haiku模型，這款模型是Claude家族中速度最快的產品。

根據官方說法，Claude 3.5 Haiku以與前代Claude 3 Haiku相同的成本與速度，展現了更強大的綜合能力，並在許多智能評測中超越了此前的最大模型Claude 3 Opus。在SWE-bench編碼評測中，以40.6%的成績勝過多款主流模型。

Claude 3.5 Haiku將先以純文字模式推出，未來也將支援圖像輸入功能。開發者可以透過Anthropic的API、Amazon Bedrock與Google Cloud的Vertex AI等平台進行使用。

如何防範代理AI失控？

儘管「電腦操作」功能開啟了AI應用的新可能性，但AI代理能模擬人類的操作，也意味著可能被濫用。過往的研究發現，AI模型在受到越獄攻擊（jailbreaking）時，有可能執行不法行為，例如購買假證件或發布虛假訊息。對此，Anthropic也在「電腦操作」功能的開發過程中採取了多項預防措施。

首先，Claude 3.5 Sonnet在訓練過程中並未使用用戶的螢幕截圖或輸入內容，確保模型不會接觸到用戶的隱私資料。

此外，Anthropic還開發了一系列分類器，能夠在AI執行被認為是高風險的行動時即時識別，並引導AI遠離高風險行動。例如，在社交媒體上發布資訊、創建帳戶或與政府網站互動，以減少風險。

Anthropic也會保留由「電腦操作」功能捕捉的螢幕截圖，保存期限至少為30天，若有合法需求，Anthropic也會依據法律程序配合調查。

延伸閱讀：虛擬員工時代來了？微軟Copilot Studio將推「AI代理」功能，11月將公開預覽
 OpenAI告「Open AI」！一樁商標爭議為何9年才引爆，比奧特曼傳奇的人物或許是他

參考資料：Anthropic、TechCrunch、CNBC

本文初稿為AI編譯，整理．編輯/黃若彤

新聞專題
永續發展投資大未來

Yahoo Tech·
Sony 在台推出新一代 LinkBuds Open 開放式真無線藍牙耳機
Sony 今天在台灣發表了新一代的 LinkBuds 真無線耳機 LinkBuds Open 與 Link Buds Fit。
華視·
89萬人搶周董票！五分鐘秒殺　創售票系統紀錄
天王周杰倫，12月初前進台北大巨蛋，成為大巨蛋首唱的歌手，今(23)日中午12點搶票，售票系統就同時湧入89萬人，在線搶15萬張票，不到5分鐘就秒殺！就連下午3點清票，同樣在線近80萬人競爭3000張...
蘋果仁·
台人赴日置產留意 1 招，輕鬆避開 55% 遺產稅！
隨著日本疫情後經濟快速復甦，觀光產業和其他產業也蓬勃發展。由於日本地理位置鄰近台灣，且社會經濟環境穩定，吸引了大量台灣投資者進軍房市。雖然日本房市充滿投資潛
Yahoo奇摩新聞編輯室·
冷錢包是什麼？冷錢包安全嗎？何時會用？和熱錢包差在哪？
究竟冷錢包是什麼？冷錢包如何運作？冷錢包種類有哪些？冷錢包安全嗎？什麼時候會用？和熱錢包又有什麼不同？快跟著Yahoo奇摩新聞編輯室一起來了解！
Reactions1
風傳媒·
蘋果AI來了，iPhone 16以下能用嗎？Siri進化、通話逐字稿　適用機型一覽
人工智慧（AI）浪潮全面來襲，9月正式亮相的iPhone 16系列，發售之初並未搭載原先預告的Apple Intelligence功能，...
Reactions1
三立新聞網 setn.com·
iOS 18.1出爐！iPhone和Android可傳免費訊息 AI功能也來了
Apple Intelligence要來了！蘋果釋出iOS 18.1最終測試版，正式支援RCS訊息功能，讓iPhone與Android裝置之間的簡訊溝通不再有隔閡。除此之也引入了全新的「Apple Intelligence」服務功能，包括支援ChatGPT的新版Siri數位助理，並修復iPhone 16系列機種出現的輸入延遲與重新開機等問題，至於一般使用者預期一週內可以更新。
Reactions1
三立新聞網 setn.com·
眼尖網友發現唐綺陽上台念感言手機「很考古」　主人親自揭曉謎底
唐綺陽12日在廣播金鐘獎奪獎，今年首度將Podcast納入獎項，唐綺陽就是Podcast「唐陽雞酒屋」拿下生活風格節目獎，她興奮拿手機上台念感言，不料直到昨晚才有眼尖網友看著她的手機疑惑：「唐老師拿的手機是iPhone幾？難道唐老師是從過去來的嗎？不可能土星回歸到iPhone也回歸吧？」因為大家都覺得她應該會用最新的iPhone16系列。
Reactions4
卡優新聞網·
杜絕信用卡盜刷盜綁　行動支付綁卡變麻煩
國際3大Pay綁卡必須人工查核，銀行合作特店身分驗證二擇一(圖/卡優新聞網)
Reactions1
Mashdigi·
華碩即將推出的ROG Phone 9快速動眼看，背蓋搭載LED顯示功能、同樣支援IP68等級防水防塵
在華碩於Qualcomm於夏威夷舉辦的Snapdragon Tech Summit 2024活動公布ROG Phone 9具體外觀，並且預告將於11月推出消息後，筆者也實際在現場取得實機進行簡單動手玩。
Reactions1
中央社·
中國首個手機作業系統華為「純血鴻蒙」正式發布
（中央社台北23日電）中國首個手機作業系統「華為原生鴻蒙作業系統」（Harmony OS）22日正式發布，成為iOS和安卓（Android）後，全球第3大手機作業系統。
Reactions1
新頭殼·
中華電以科技力降低中風、反覆住院風險
[Newtalk新聞] 中風是全球重大公共衛生議題之一，為提升民眾對腦中風的認識與預防，台灣腦中風學會推廣正確的急救知識，同時攜手科技業者中華電，透過物聯網與雲端技術，即時將個案的生理量測數值傳輸至醫療院所端監控平台，讓醫護人員隨時掌握患者狀況，結合視訊看診即時關懷，進一步提升反應速度與精確度，提供更即時、精準的醫療服務。「在宅住院監測系統」的核心功能包括即時生理量測數值上傳雲端平台，進行遠端監控、數值異常告警與即時視訊看診，適用於慢性病患者的長期監測，及術後康復期的醫療支援。透過遠距照護技術，除了讓患者能在家中獲得類似住院的醫療監控，提升在宅照護品質，更協助醫護人員對在宅住院患者即時監控，減輕醫護人員作業負擔。中華電表示，透過科技創新推動智慧醫療，不斷提升醫療服務品質，並實踐企業社會責任。中華電信台北營運處總經理蘇振乾表示：「中華電信深知健康對每個人的重要性，希望透過我們的網路基礎設施、5G行動網路、資通訊技術及AI創新應用，整合科技的力量，為民眾打造更健康、便利的生活。未來，我們將持續投入智慧醫療/照護領域，並與各界攜手合作，共同為提升國民健康盡一份心力。」查看原文更多New
中央社·
資安事件層出不窮資安院攜手中興大學開課育才
（中央社記者蘇思云台北22日電）企業資安事件不時發生，國家資通安全研究院今天宣布，攜手中興大學首度合作開辦資安事件應變工程師培訓班，盼結合雙方實務與學術研究強項，培育企業第一線資安事件應變人員，提升防護能量，更懂得因應資安事件。
Mashdigi·
Insta360 Ace Pro 2成為第一款搭載雙晶片、提高人工智慧處理能力的可拍攝8K影片運動相機
去年推出加入可180度上掀觸控螢幕、強化低光拍攝，更與徠卡攜手合作1/1.3吋感光元件鏡頭設計的Insta360 Ace Pro之後，Insta360今年宣布推出升級款Insta360 Ace Pro 2，標榜進一步強化8K畫質拍攝表現，並且藉由搭載雙晶片設計提升人工智慧運算功能，讓使用者能容易捕捉日常生活或戶外運動影像。
中央社·
iOS 18.1最終測試版釋出蘋果AI下週上線
（中央社記者吳家豪台北22日電）蘋果公司今天向開發者釋出iOS 18.1 RC（Release Candidate）最終測試版，預計下週釋出正式版，將帶來眾所期待的個人智慧系統Apple Intelligence新功能，包括書寫工具、對話更自然靈活的Siri、可移除照片背景雜物的「清除」工具等。
麥兜小米·
給你最舒適的工作體驗 Logitech 羅技MX ERGO S 無線軌跡球滑鼠 & Wave Keys 人體工學鍵盤
太開心太感動啦！！小米最愛的Logitech 羅技MX Ergo無線軌跡球滑鼠推出新款啦！！這次推出的新款Logitech 羅技MX ERGO S 無線軌跡球滑
聯合新聞網·
三星 Z Fold 6 SE 最薄折疊機售價6.4萬
三星昨（21）日在韓國發表最新折疊機Galaxy Z Fold 6 Special Edition（Z Fold 6 S...
Reactions1
三立新聞網 setn.com·
用AI當手段！微軟：國家級網路攻擊威脅台灣、操作美大選議題
微軟發佈最新年度數位防禦報告，指出國家級網路攻擊威脅活動除集中在美國和英國外，更包括台灣、以色列、烏克蘭與阿拉伯聯合大公國；此外，俄羅斯、伊朗及中國的國家級威脅攻擊者，也將攻擊重點集中在即將到來的美國總統選舉活動上；而以營利為目的的網路犯罪和詐騙，仍構成強大的威脅，AI 更已成為其攻擊的手段。這些攻擊威脅範圍廣泛，從勒索軟體、網路釣魚到身份竊取，單靠任何一個國家或企業已無法獨自應對，必須透過全球性
Reactions3
中央社·
微軟：國家級網路攻擊威脅台灣操作美大選議題
（中央社記者吳家豪台北22日電）微軟今天發布年度數位防禦報告指出，國家級網路攻擊威脅活動除了集中在美國和英國之外，更包括台灣、以色列、烏克蘭與阿拉伯聯合大公國，必須透過全球性的防禦體系應對威脅。
Reactions2
電腦DIY·
Google Pixel Watch 3 45mm LTE 版開箱分享
智慧錶怎麼挑選除了看外型設計之外，再來就是功能是否能滿足使用上的需求，量測心率、血氧、運動相關偵測，以及各種智 […]
三嘻行動哇·
入門款 iPad 11 有望支援 Apple Intelligence 功能！《彭博社》稱最快將在 2025 年底推出
蘋果即將釋出 iOS 18.1、iPadOS 18.1 作業系統更新，其中最重要的是「Apple Intelligence」功能。但是目前只有 iPhone 1

Claude 3.5 Sonnet評測表現大升級

靠AI訂機票？代理功能值得期待

適合中小企業，更小更快的Claude 3.5 Haiku模型

如何防範代理AI失控？

相關內容

其他人也在看