2026-06-02 12:41 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Anthropic 扩大对 Claude Mythos AI 模型的公开访问

Anthropic 宣布将通过 Project Glasswing 扩大对 Claude Mythos 模型的访问，预计在 6-12 个月内实现广泛可用。该模型能发现漏洞并生成利用链，但目前仅限合作伙伴使用。

来源Hacker News AI作者: divija_07

人工智能公司 Anthropic 宣布将扩大对其备受争议的 Claude Mythos 模型的访问权限。该模型因其强大的漏洞发现和利用能力而被限制发布，但 Anthropic 表示将在未来几个月内逐步向更多合作伙伴开放。

Mythos 是 Anthropic 开发的大型语言模型，不仅能以前所未有的水平发现软件中的漏洞，还能生成完整的利用链，有时甚至能将低严重性的缺陷组合成高严重性的威胁。这种能力促使 Anthropic 最初仅通过 Project Glasswing 向约 50 个精心挑选的合作伙伴（包括思科、甲骨文和微软等科技巨头）提供访问权限。

Anthropic 在周五的声明中表示：“我们将与关键合作伙伴——包括美国及盟国政府——合作，将 Project Glasswing 扩展到更多合作伙伴。在不久的将来，一旦我们开发出更强大的安全措施，我们期待通过公开发布提供 Mythos 级别的模型。”

该公司强调，攻击者拥有同等工具只是时间问题。“我们相信 Mythos 级别的模型将在未来 6-12 个月内广泛可用。”

合作伙伴已通过 Mythos 发现了超过 10,000 个高危或严重漏洞，其中 6,202 个存在于开源软件中。Anthropic 表示，第三方审查了 1,752 个漏洞，确认其中 91% 是真实缺陷，三分之二的严重性评级正确。

英国 AI 安全研究所上个月报告称，Mythos 在受控评估中能够自主执行多阶段攻击并利用漏洞，这些任务通常需要人类专业人员数天时间。但该研究所指出，未模拟典型的企业防御环境，因此无法确定 Mythos 是否能攻击防御良好的系统。

随着漏洞发现速度加快，软件维护者面临大量报告，包括 AI 辅助研究者使用相同 LLM 导致的重复报告。微软旗下的 GitHub 已调整其漏洞赏金计划，以应对“不展示真实安全影响的提交”激增。

Cloudflare 作为 Glasswing 参与者分享了经验：将模型视为漏洞发现工具而非聊天界面，通过狭窄指令、多代理协同工作可提高效率。Anthropic 将向经过审查的安全团队提供自定义指令、代码映射工具和威胁模型构建器，以帮助优先处理漏洞。

尽管如此，专家指出漏洞修补速度存在理论限制，组织需要测试和部署补丁，而架构设计仍是未解问题。Cloudflare 首席安全官 Grant Bourzikas 表示：“原则是使攻击者更难利用漏洞，即使漏洞存在，也要缩小从披露到修补之间的差距。”