2026-07-02 04:41 UTC+8站内改写3 分钟阅读更新: 2026-07-02 05:03 UTC+8

Anthropic于7月1日重新部署Claude Fable 5，美国出口管制解除后新增网络安全分类器

Anthropic宣布将于7月1日重新部署其最强大的通用模型Claude Fable 5，此前美国出口管制已解除。新增的安全分类器能以超过99%的准确率阻止报告中提到的技术，并将被阻止的请求路由至Opus 4.8。Anthropic还与亚马逊、微软和谷歌共同提出了一个四准则越狱严重性框架。

来源MarkTechPost作者: Michal Sutter

Anthropic正在重新部署其最强大的通用模型Claude Fable 5。6月30日，该公司宣布美国出口管制已解除。这些管制此前覆盖了Claude Fable 5和Claude Mythos 5。Fable 5于7月1日（周三）重新向全球用户开放，而Mythos 5的访问权限则恢复给一组美国组织。

这些模型于6月12日被暂停使用。美国政府的一项指令将其限制为非外国公民使用。Anthropic无法实时验证国籍，因此暂时中止了这两个模型对所有人的访问。本文解释了触发该限制的原因，介绍了新的安全保障措施和提出的越狱框架，并展示了Fable 5与GLM-5.2等竞争对手的比较。

快速事实

模型：Claude Fable 5（一个为通用使用而安全化的Mythos级模型）
事件：2026年7月1日出口管制解除后重新部署
暂停原因：亚马逊的一份关于安全绕过技术的报告
修复：新的安全分类器可阻止报告中提到的技术
定价：每百万输入令牌10美元，每百万输出令牌50美元
可用平台：Claude Platform、Claude.ai、Claude Code、Claude Cowork

事件时间线 Anthropic于6月9日发布了Fable 5和Mythos 5。两者共享相同的底层模型。Fable 5带有强大的通用安全措施，而Mythos 5则为防御性网络安全合作伙伴解除了一些安全限制。6月12日，美国政府实施出口管制，命令立即生效。Anthropic为避免违规风险暂停了访问。触发这一事件的是亚马逊研究人员的一份报告，他们发现了一种绕过Fable 5安全措施的方法。该提示使模型识别大量软件漏洞，并在一例中生成了利用某个漏洞的代码。到6月26日，政府批准Mythos 5恢复对部分美国组织的访问。6月30日，管制全面解除。

Anthropic为何称该发现并非独有 Anthropic测试了该发现是否仅适用于Fable 5。结果并非如此。能力较弱的模型也识别出了相同的漏洞，包括Claude Opus 4.8、GPT-5.5和Kimi K2.7。对于单个漏洞利用演示，所有测试的模型（包括Haiku 4.5、Sonnet 4.6、Opus 4.6、4.7、4.8、GPT-5.4、5.5和Kimi K2.7）都重现了它。Anthropic团队表示，该技术并未暴露任何独特的Mythos级网络能力，他们认为此案例对于Fable 5的安全措施而言属于边缘情况，所涉及的行为仅为常规的防御性网络安全工作。

新分类器的工作原理 Anthropic仍然采取了措施来弥补这一漏洞。他们训练了一个改进的安全分类器，专门针对报告中的行为。该分类器在超过99%的情况下能阻止特定技术。被阻止的请求不会被直接拒绝，而是被路由到Claude Opus 4.8，用户会收到回退通知。商务部CAISI的研究人员测试了新旧安全措施，他们一致认为安全措施极为强大，但代价是在常规编码和调试过程中会出现更多误报。这反映了Anthropic的“深度防御”设计：分类器是检测有害网络任务的较小AI系统，而故意的“安全余量”也会阻止一些良性请求。Fable 5的安全余量比之前的模型大得多。

提出的越狱严重性框架 这一事件暴露了一个空白：行业缺乏评估“越狱”（绕过模型安全措施的技术）的共享标准。Anthropic正在与亚马逊、微软、谷歌和其他Glasswing合作伙伴共同起草一个框架。该草案基于四个标准对越狱进行评分：能力增益（用户超出现有工具的程度）、能力增益广度（解锁的独立攻击任务数量）、武器化难度（攻击仍需的人工工作）、可发现性（获取技术的难易程度）。对于最严重的类别，Anthropic将立即部署初步缓解措施，并设立24/7监控越狱提交渠道。

用例与示例 Fable 5专注于长周期、代理型工作。早期工程师可将其应用于代码库迁移（Stripe报告一天内完成5000万行Ruby代码库的迁移，手工需两个月）、金融分析（在Hebbia金融基准测试中得分最高）、视觉转代码（从截图重建Web应用源码）以及长运行代理（基于文件的记忆使其能在数百万令牌上保持专注）。

Fable 5对比 暂停期间，竞争对手出现了。在暂停后的几天里，智谱AI以开放权重发布了GLM-5.2。独立测试者将其评为最强的开放权重模型。GLM-5.2采用混合专家设计，总计约7500亿参数，每个令牌仅激活约400亿。在Semgrep的IDOR基准测试中，其F1得分为39%，高于Claude Code的32%。成本方面，在AA-Briefcase上，Fable 5平均每任务31美元，而GLM-5.2仅为2.40美元。

访问与快速API示例 对于Pro、Max、Team和部分Enterprise计划，Fable 5在7月7日前免费包含，覆盖周使用限额的50%。之后将转为使用点数。Anthropic还将在AWS、Google Cloud和Microsoft Foundry上重新启用Fable 5。开发者可使用字符串"claude-fable-5"调用模型。如果分类器触发，响应将来自Opus 4.8，但代码路径保持不变。

要点总结

Fable 5于7月1日在出口管制解除后回归。
新分类器在超过99%的情况下阻止报告中的绕过方法。
被阻止的请求路由至Opus 4.8，而非直接拒绝。
Anthropic提出四准则越狱评分框架。
暂停期间，GLM-5.2作为更便宜的开源竞争对手出现。