2026-06-05 04:11 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Anthropic 发布开源框架，利用 AI 进行漏洞发现

Anthropic 发布了一个开源参考实现，用于利用 Claude 进行自主漏洞发现和修复。该框架包括侦察、发现、验证、报告和修复的自动化流水线，以及用于威胁建模和分类的交互技能。

Anthropic 近日发布了一个开源参考实现框架，旨在利用其 AI 助手 Claude 实现自主漏洞发现与修复。该框架基于 Anthropic 与多个组织的安全团队合作的实践经验，特别是在 Claude Mythos 预览版发布后的合作成果。框架包含一套交互式技能和自动化流水线，帮助开发者快速构建针对自身代码库的漏洞查找管道。

仓库中提供了多种 Claude Code 交互式技能，包括 /quickstart、/threat-model、/vuln-scan、/triage、/patch 和 /customize。用户可以在 Claude Code 中交互式地执行这些技能，它们仅涉及读写文件，在交互模式下相对安全。此外，框架还包含一个自主参考流水线（harness），该流水线包含侦察、发现、验证、报告和修补五个阶段，目前默认针对 C/C++ 内存漏洞进行检测，并使用 Docker 和 ASAN 构建。该流水线在 gVisor 沙箱中运行，以隔离执行环境，确保安全。

为了进一步提高安全性和减少误报，Anthropic 还提供了托管产品 Claude Security，该产品可以跨多个项目扫描和修复漏洞，并包含多阶段验证管道。对于希望自建管道的团队，该开源框架是一个很好的起点。

框架提供了一个四步指南，帮助团队逐步上手：第一步（第1天）构建威胁模型并运行首次静态扫描和分类；第二步（第2天）在 C/C++ 库上运行参考流水线；第三步（第3-5天）为自身目标定制流水线；第四步（第2周）开始自主扫描、分类和修补。

该框架的流水线包含七个阶段：构建（编译目标为带 ASAN 的 Docker 镜像）、侦察（分析输入解析子系统）、发现（并行生成畸形输入触发崩溃）、验证（在新容器中复现崩溃）、去重（比较并去重）、报告（生成结构化可利用性分析）和修补（生成并验证修复）。整个流水线适用于多种漏洞类型和语言，用户可通过 /customize 技能进行适配。

Anthropic 特别强调，该仓库并非维护状态且不接受贡献，仅供学习和参考。用户在使用时需注意沙箱配置和 API 密钥设置。此外，团队在定制流水线时，需要回答几个关键问题：什么信号表明发现了漏洞（例如 ASAN 崩溃签名）、漏洞利用的概念验证是什么样子的（例如崩溃输入文件）、以及目标如何构建和运行（例如使用 Dockerfile）。通过这些步骤，团队可以在两周内建立自己的自主漏洞扫描能力。