2026-06-03 18:41 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

绘制AI网络威胁图谱：来自LLM ATT&CK导航器的洞见

Anthropic分析了832个因违反使用政策而被封禁的账户，揭示了AI在网络攻击中的运用趋势。研究发现，高风险的AI赋能攻击者比例在一年内从33%上升至56%，且AI正在帮助攻击者实现更复杂的攻击链自动化。报告还引入了LLM ATT&CK导航器和AI风险启用评分（ARiES），以评估AI辅助的危害活动。

来源Hacker News AI作者: berlianta

Anthropic今日发布了一份新报告，将真实世界的AI赋能网络攻击映射到MITRE ATT&CK框架上，揭示了威胁行为者如何利用AI进行恶意活动。该分析基于2025年3月至2026年3月期间因违反使用政策而被封禁的832个Claude账户，共观察到13,873次恶意行为，覆盖所有14种ATT&CK战术和482种独特子技术。

关键发现之一是，中高风险的AI赋能攻击者比例在不到一年内从33%增长到56%，提升了约1.7倍。这一增长主要集中于使用AI进行横向移动、凭据转储和Web shell等高危活动的攻击者，而非常见的代码构建与混淆。传统上，只有技术最精湛的攻击者才能跨整个攻击链操作，但AI正在打破这一壁垒。

报告还指出，随着AI赋能的网络技术普及，区分攻击者风险等级的关键不再是他要求模型做什么，而是他围绕模型构建的agentic编排（scaffolding）——即实现攻击阶段自主串联的代码、架构和工具。Anthropic在2025年11月挫败的间谍活动中，攻击者尽管使用的技术数量与中等风险者相当，但通过AI agent编排达到了100分的最高风险评分。

然而，现有MITRE ATT&CK框架并未涵盖自主攻击链编排、实时转向决策以及无人类干预的AI执行等行为。这些行为尚无对应ID，威胁情报依赖的分类法亟需扩展。

为评估风险，Anthropic开发了AI风险启用评分（ARiES），这是一个由威胁、漏洞和影响三个维度组成的加法模型（分别占0-35、0-35、0-30分），总分0-100。与传统的乘法模型不同，加法模型即使在某个维度缺失时也能保留信号，从而捕获如无意生成漏洞或尚未部署的恶意软件等部分风险场景。

在技术层面，最常被利用的ATT&CK技术是T1587（开发能力），69%的攻击者使用AI辅助开发恶意软件；其次为T1027（混淆文件或信息，64.7%）、T1005（从本地系统获取数据，55.9%）和T1562（削弱防御，54.9%）。这些数据表明，攻击者主要利用AI构建进攻性工具、规避检测并从受感染系统窃取数据。

Anthropic表示，这些发现已直接影响Claude的安全构建，包括更新检测高危行为的分级器以及扩展探针检测范围。报告强调，防御者必须与攻击者同步进化，而共享框架的更新同样刻不容缓。