AI News HubLIVE
站内改写2 分鐘閱讀

繪製AI網路威脅圖譜:來自LLM ATT&CK導航器的洞見

Anthropic分析了832個因違反使用政策而被封禁的賬戶,揭示了AI在網路攻擊中的運用趨勢。研究發現,高風險的AI賦能攻擊者比例在一年內從33%上升至56%,且AI正在幫助攻擊者實現更復雜的攻擊鏈自動化。報告還引入了LLM ATT&CK導航器和AI風險啟用評分(ARiES),以評估AI輔助的危害活動。

來源Hacker News AI作者: berlianta

Anthropic今日釋出了一份新報告,將真實世界的AI賦能網路攻擊對映到MITRE ATT&CK框架上,揭示了威脅行為者如何利用AI進行惡意活動。該分析基於2025年3月至2026年3月期間因違反使用政策而被封禁的832個Claude賬戶,共觀察到13,873次惡意行為,覆蓋所有14種ATT&CK戰術和482種獨特子技術。

關鍵發現之一是,中高風險的AI賦能攻擊者比例在不到一年內從33%增長到56%,提升了約1.7倍。這一增長主要集中於使用AI進行橫向移動、憑據轉儲和Web shell等高危活動的攻擊者,而非常見的程式碼構建與混淆。傳統上,只有技術最精湛的攻擊者才能跨整個攻擊鏈操作,但AI正在打破這一壁壘。

報告還指出,隨著AI賦能的網路技術普及,區分攻擊者風險等級的關鍵不再是他要求模型做什麼,而是他圍繞模型構建的agentic編排(scaffolding)——即實現攻擊階段自主串聯的程式碼、架構和工具。Anthropic在2025年11月挫敗的間諜活動中,攻擊者儘管使用的技術數量與中等風險者相當,但透過AI agent編排達到了100分的最高風險評分。

然而,現有MITRE ATT&CK框架並未涵蓋自主攻擊鏈編排、即時轉向決策以及無人類干預的AI執行等行為。這些行為尚無對應ID,威脅情報依賴的分類法亟需擴充套件。

為評估風險,Anthropic開發了AI風險啟用評分(ARiES),這是一個由威脅、漏洞和影響三個維度組成的加法模型(分別佔0-35、0-35、0-30分),總分0-100。與傳統的乘法模型不同,加法模型即使在某個維度缺失時也能保留訊號,從而捕獲如無意生成漏洞或尚未部署的惡意軟體等部分風險場景。

在技術層面,最常被利用的ATT&CK技術是T1587(開發能力),69%的攻擊者使用AI輔助開發惡意軟體;其次為T1027(混淆檔案或資訊,64.7%)、T1005(從本地系統獲取資料,55.9%)和T1562(削弱防禦,54.9%)。這些資料表明,攻擊者主要利用AI構建進攻性工具、規避檢測並從受感染系統竊取資料。

Anthropic表示,這些發現已直接影響Claude的安全構建,包括更新檢測高危行為的分級器以及擴充套件探針檢測範圍。報告強調,防禦者必須與攻擊者同步進化,而共享框架的更新同樣刻不容緩。