2026-06-03 18:41 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

繪製AI網路威脅圖譜：來自LLM ATT&CK導航器的洞見

Anthropic分析了832個因違反使用政策而被封禁的賬戶，揭示了AI在網路攻擊中的運用趨勢。研究發現，高風險的AI賦能攻擊者比例在一年內從33%上升至56%，且AI正在幫助攻擊者實現更復雜的攻擊鏈自動化。報告還引入了LLM ATT&CK導航器和AI風險啟用評分（ARiES），以評估AI輔助的危害活動。

來源Hacker News AI作者: berlianta

Anthropic今日釋出了一份新報告，將真實世界的AI賦能網路攻擊對映到MITRE ATT&CK框架上，揭示了威脅行為者如何利用AI進行惡意活動。該分析基於2025年3月至2026年3月期間因違反使用政策而被封禁的832個Claude賬戶，共觀察到13,873次惡意行為，覆蓋所有14種ATT&CK戰術和482種獨特子技術。

關鍵發現之一是，中高風險的AI賦能攻擊者比例在不到一年內從33%增長到56%，提升了約1.7倍。這一增長主要集中於使用AI進行橫向移動、憑據轉儲和Web shell等高危活動的攻擊者，而非常見的程式碼構建與混淆。傳統上，只有技術最精湛的攻擊者才能跨整個攻擊鏈操作，但AI正在打破這一壁壘。

報告還指出，隨著AI賦能的網路技術普及，區分攻擊者風險等級的關鍵不再是他要求模型做什麼，而是他圍繞模型構建的agentic編排（scaffolding）——即實現攻擊階段自主串聯的程式碼、架構和工具。Anthropic在2025年11月挫敗的間諜活動中，攻擊者儘管使用的技術數量與中等風險者相當，但透過AI agent編排達到了100分的最高風險評分。

然而，現有MITRE ATT&CK框架並未涵蓋自主攻擊鏈編排、即時轉向決策以及無人類干預的AI執行等行為。這些行為尚無對應ID，威脅情報依賴的分類法亟需擴充套件。

為評估風險，Anthropic開發了AI風險啟用評分（ARiES），這是一個由威脅、漏洞和影響三個維度組成的加法模型（分別佔0-35、0-35、0-30分），總分0-100。與傳統的乘法模型不同，加法模型即使在某個維度缺失時也能保留訊號，從而捕獲如無意生成漏洞或尚未部署的惡意軟體等部分風險場景。

在技術層面，最常被利用的ATT&CK技術是T1587（開發能力），69%的攻擊者使用AI輔助開發惡意軟體；其次為T1027（混淆檔案或資訊，64.7%）、T1005（從本地系統獲取資料，55.9%）和T1562（削弱防禦，54.9%）。這些資料表明，攻擊者主要利用AI構建進攻性工具、規避檢測並從受感染系統竊取資料。

Anthropic表示，這些發現已直接影響Claude的安全構建，包括更新檢測高危行為的分級器以及擴充套件探針檢測範圍。報告強調，防禦者必須與攻擊者同步進化，而共享框架的更新同樣刻不容緩。