AI News HubLIVE
站内改写2 分钟阅读

Anthropic 发布开源框架,利用 AI 进行漏洞发现

Anthropic 发布了一个开源参考实现,用于利用 Claude 进行自主漏洞发现和修复。该框架包括侦察、发现、验证、报告和修复的自动化流水线,以及用于威胁建模和分类的交互技能。

来源Hacker News AI作者: binyu

Anthropic 近日发布了一个开源参考实现框架,旨在利用其 AI 助手 Claude 实现自主漏洞发现与修复。该框架基于 Anthropic 与多个组织的安全团队合作的实践经验,特别是在 Claude Mythos 预览版发布后的合作成果。框架包含一套交互式技能和自动化流水线,帮助开发者快速构建针对自身代码库的漏洞查找管道。

仓库中提供了多种 Claude Code 交互式技能,包括 /quickstart、/threat-model、/vuln-scan、/triage、/patch 和 /customize。用户可以在 Claude Code 中交互式地执行这些技能,它们仅涉及读写文件,在交互模式下相对安全。此外,框架还包含一个自主参考流水线(harness),该流水线包含侦察、发现、验证、报告和修补五个阶段,目前默认针对 C/C++ 内存漏洞进行检测,并使用 Docker 和 ASAN 构建。该流水线在 gVisor 沙箱中运行,以隔离执行环境,确保安全。

为了进一步提高安全性和减少误报,Anthropic 还提供了托管产品 Claude Security,该产品可以跨多个项目扫描和修复漏洞,并包含多阶段验证管道。对于希望自建管道的团队,该开源框架是一个很好的起点。

框架提供了一个四步指南,帮助团队逐步上手:第一步(第1天)构建威胁模型并运行首次静态扫描和分类;第二步(第2天)在 C/C++ 库上运行参考流水线;第三步(第3-5天)为自身目标定制流水线;第四步(第2周)开始自主扫描、分类和修补。

该框架的流水线包含七个阶段:构建(编译目标为带 ASAN 的 Docker 镜像)、侦察(分析输入解析子系统)、发现(并行生成畸形输入触发崩溃)、验证(在新容器中复现崩溃)、去重(比较并去重)、报告(生成结构化可利用性分析)和修补(生成并验证修复)。整个流水线适用于多种漏洞类型和语言,用户可通过 /customize 技能进行适配。

Anthropic 特别强调,该仓库并非维护状态且不接受贡献,仅供学习和参考。用户在使用时需注意沙箱配置和 API 密钥设置。此外,团队在定制流水线时,需要回答几个关键问题:什么信号表明发现了漏洞(例如 ASAN 崩溃签名)、漏洞利用的概念验证是什么样子的(例如崩溃输入文件)、以及目标如何构建和运行(例如使用 Dockerfile)。通过这些步骤,团队可以在两周内建立自己的自主漏洞扫描能力。