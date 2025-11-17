當AI黑化....Claude遭中國駭客「策反」，協助主動滲透美國目標：一鍵發動攻擊、效率輾壓人類
美國AI新創公司Anthropic上週（14日）發布最新報告，揭露了人類歷史上第一起由AI大規模策劃並自主執行的網路間諜活動。Anthropic指出，該公司「高度確信」這場網路攻勢是由具有中國政府背景的駭客組織主使，成功「欺騙」並操縱了該公司以安全著稱的先進AI模型「Claude」，針對全球約三十個目標發動滲透攻擊，目標涵蓋大型科技公司、金融機構、化學製造商乃至外國政府機構。
這起疑似由中方駭客主導的網路攻勢，其實並未造成嚴重災情，問題是負責這場網路戰的主角已經不再是人類，而是人工智慧本身。這此AI不僅是駭客的輔助工具，而是親自下場、自主執行攻擊任務的主角。一個由「AI代理」（Agentic AI）主導的網路戰新時代，已然揭開序幕。包括《華爾街日報》與《美國之音》都認為，這起事件可說是全球網路戰場的「典範轉移」。
Anthropic威脅情報主管克萊因（Jacob Klein）對《華爾街日報》表示，：「駭客名副其實地『一鍵』發動攻勢，隨後操作者與AI只需極少的互動就能成事。」
被駭客「蠱惑」的AI
這場攻擊的精妙與狡猾之處，在於它並非傳統的暴力破解，而是透過欺騙AI來完成任務。這場攻擊一開始確實始於人類，駭客首先選定想要滲透的目標，然後建立一個「攻擊框架」（attack framework）——一個旨在讓AI能自主攻陷目標的系統。
接下來是最關鍵也最狡猾的一步：說服Claude。一般來說，像Claude這樣由Anthropic開發的先進AI模型，都經過嚴格的安全訓練，內建了避免有害行為的「護欄」。為了繞過這些防線，駭客採用了精密的「越獄」手法：他們並未直接下達「攻擊那家公司」的指令，而是將整個惡意攻擊計畫，拆解成無數個看似無害的微小任務。
更具戲劇性的是，他們為AI虛構了一個「身分」。根據英國廣播公司（BBC）的報導，駭客對Claude謊稱：自己是一家合法資安公司的員工，目前正在代表攻擊目標客戶，執行授權的防禦性「滲透測試」任務。在這個被蒙蔽的認知下，Claude開始為它自以為的「雇主」效力，渾然不知自己已成為邪惡計畫的執行者。
新聞小補帖：「AI代理」（Agentic AI）
這並非傳統意義上執行單一指令的AI。所謂「智慧代理」，是指能夠被賦予一個複雜的總體目標後，自主地、長時間地運行，並能獨立地將任務拆解、串連、做出決策，期間僅需極少或偶爾的人為指導。它們如同被賦予了「靈魂」和「自主意志」的數位員工，既能極大提升生產力，也能在惡意者手中成為恐怖武器。
當AI被駭客「說服」後，Claude便開始了它高效率的間諜工作：包括AI自主對目標組織的系統與基礎設施進行偵察，掃描並鎖定價值最高的資料庫；然後Claude開始自主研究目標系統的安全漏洞，並自行編寫、測試用於攻擊的「漏洞利用程式碼」，一旦成功，攻擊框架便能利用Claude竊取登入憑證（用戶名和密碼），藉此獲得更深層的系統存取權限。
一旦成功後，攻擊框架便能利用Claude竊取登入憑證（即用戶名稱與密碼），藉此獲得更深層的系統存取權限。AI接下來就是大規模提取內部數據，根據情報價值進行分類。它能識別出最高權限的管理員帳戶，在系統中植入「後門」以供日後自由進出。攻擊的最後階段，駭客甚至讓Claude為整場行動撰寫了詳盡的技術文件，將竊得的憑證、分析過的系統資訊整理成檔，以便於駭客組織規劃下一階段的網路作戰。
總體而言，駭客利用AI完成整場間諜活動中高達80%至90%的工作。人類僅需在約4到6個關鍵決策點進行介入，下達如「是的，繼續」、「不要繼續」、「這看起來不對，Claude，你確定嗎？」之類的簡單指令。
在攻擊高峰期，AI發出了數千次請求，頻率時常達到每秒多次——這種攻擊速度與規模，是任何人類團隊都望塵莫及的。儘管Anthropic最終成功阻斷了這些活動並封鎖了駭客帳戶，但在那之前，已有多達四次入侵成功。在其中一個案例中，駭客指示AI自行查詢內部資料庫並提取了敏感數據。
網路安全的「拐點」：當AI既是矛也是盾
這起事件揭示了一個令人不安的真相：發動精密網路攻擊的門檻已大幅降低。過去需要一整個經驗豐富的駭客團隊耗費數月才能完成的工作，如今即便是資源較少的團體，只要具備正確的設定，便能利用「智慧代理」AI系統來完成。
《華爾街日報》指出，網路安全公司Volexity今年稍早也曾發現類似案例，有中國背景的駭客利用大型語言模型（LLM）來自動化部分攻擊流程。Google日前也發表報告，指出與俄羅斯政府有關的駭客利用AI模型即時生成客製化惡意軟體，對烏克蘭發動攻擊。
Anthropic負責測試災難性風險的團隊負責人洛根·格雷厄姆（Logan Graham）對《華爾街日報》坦言：「這類工具只會讓（攻防）節奏加速。如果我們不能讓防禦者擁有非常可觀的持續優勢，我擔心我們可能會輸掉這場競賽。」Anthropic的報稿也指出：「當複雜的網路攻擊不可避免地發生時，我們的目標是讓內建了強大安全機制的Claude，能夠協助網路安全專家偵測、瓦解攻擊，並為未來的攻擊做好準備。」
中方的回應與地緣政治的陰影
對於Anthropic的指控，中國官方一如既往地予以否認。中國駐美大使館發言人表示，網路攻擊溯源複雜，並指責美國利用網路安全問題對中國進行抹黑和詆毀。中國外交部發言人林劍在北京的記者會上也表示，中方堅決反對並依法打擊一切形式的網路攻擊行為。然而美國政府官員多年來一直警告，中國正將美國的AI技術作為目標，試圖侵入美國公司和政府機構以竊取數據。
值得注意的是，AI目前還不是「完美的罪犯」。克萊因提到，AI偶爾會產生「幻覺」（hallucinate），產出不存在的登入憑證、或者誇大訪問權限。這也成為目前阻礙「全自動」網路攻擊實現的最後一道障礙。但這道障礙顯然只是暫時性的，PwC等顧問公司已發出警告，AI驅動的網路攻擊正重塑威脅格局，企業資安長（CISO）必須加速部署AI驅動的防禦系統。
