Anthropic于7月1日重新部署Claude Fable 5,美国出口管制解除后新增网络安全分类器
Anthropic宣布将于7月1日重新部署其最强大的通用模型Claude Fable 5,此前美国出口管制已解除。新增的安全分类器能以超过99%的准确率阻止报告中提到的技术,并将被阻止的请求路由至Opus 4.8。Anthropic还与亚马逊、微软和谷歌共同提出了一个四准则越狱严重性框架。
Anthropic正在重新部署其最强大的通用模型Claude Fable 5。6月30日,该公司宣布美国出口管制已解除。这些管制此前覆盖了Claude Fable 5和Claude Mythos 5。Fable 5于7月1日(周三)重新向全球用户开放,而Mythos 5的访问权限则恢复给一组美国组织。
这些模型于6月12日被暂停使用。美国政府的一项指令将其限制为非外国公民使用。Anthropic无法实时验证国籍,因此暂时中止了这两个模型对所有人的访问。本文解释了触发该限制的原因,介绍了新的安全保障措施和提出的越狱框架,并展示了Fable 5与GLM-5.2等竞争对手的比较。
快速事实
- 模型:Claude Fable 5(一个为通用使用而安全化的Mythos级模型)
- 事件:2026年7月1日出口管制解除后重新部署
- 暂停原因:亚马逊的一份关于安全绕过技术的报告
- 修复:新的安全分类器可阻止报告中提到的技术
- 定价:每百万输入令牌10美元,每百万输出令牌50美元
- 可用平台:Claude Platform、Claude.ai、Claude Code、Claude Cowork
事件时间线 Anthropic于6月9日发布了Fable 5和Mythos 5。两者共享相同的底层模型。Fable 5带有强大的通用安全措施,而Mythos 5则为防御性网络安全合作伙伴解除了一些安全限制。6月12日,美国政府实施出口管制,命令立即生效。Anthropic为避免违规风险暂停了访问。触发这一事件的是亚马逊研究人员的一份报告,他们发现了一种绕过Fable 5安全措施的方法。该提示使模型识别大量软件漏洞,并在一例中生成了利用某个漏洞的代码。到6月26日,政府批准Mythos 5恢复对部分美国组织的访问。6月30日,管制全面解除。
Anthropic为何称该发现并非独有 Anthropic测试了该发现是否仅适用于Fable 5。结果并非如此。能力较弱的模型也识别出了相同的漏洞,包括Claude Opus 4.8、GPT-5.5和Kimi K2.7。对于单个漏洞利用演示,所有测试的模型(包括Haiku 4.5、Sonnet 4.6、Opus 4.6、4.7、4.8、GPT-5.4、5.5和Kimi K2.7)都重现了它。Anthropic团队表示,该技术并未暴露任何独特的Mythos级网络能力,他们认为此案例对于Fable 5的安全措施而言属于边缘情况,所涉及的行为仅为常规的防御性网络安全工作。
新分类器的工作原理 Anthropic仍然采取了措施来弥补这一漏洞。他们训练了一个改进的安全分类器,专门针对报告中的行为。该分类器在超过99%的情况下能阻止特定技术。被阻止的请求不会被直接拒绝,而是被路由到Claude Opus 4.8,用户会收到回退通知。商务部CAISI的研究人员测试了新旧安全措施,他们一致认为安全措施极为强大,但代价是在常规编码和调试过程中会出现更多误报。这反映了Anthropic的“深度防御”设计:分类器是检测有害网络任务的较小AI系统,而故意的“安全余量”也会阻止一些良性请求。Fable 5的安全余量比之前的模型大得多。
提出的越狱严重性框架 这一事件暴露了一个空白:行业缺乏评估“越狱”(绕过模型安全措施的技术)的共享标准。Anthropic正在与亚马逊、微软、谷歌和其他Glasswing合作伙伴共同起草一个框架。该草案基于四个标准对越狱进行评分:能力增益(用户超出现有工具的程度)、能力增益广度(解锁的独立攻击任务数量)、武器化难度(攻击仍需的人工工作)、可发现性(获取技术的难易程度)。对于最严重的类别,Anthropic将立即部署初步缓解措施,并设立24/7监控越狱提交渠道。
用例与示例 Fable 5专注于长周期、代理型工作。早期工程师可将其应用于代码库迁移(Stripe报告一天内完成5000万行Ruby代码库的迁移,手工需两个月)、金融分析(在Hebbia金融基准测试中得分最高)、视觉转代码(从截图重建Web应用源码)以及长运行代理(基于文件的记忆使其能在数百万令牌上保持专注)。
Fable 5对比 暂停期间,竞争对手出现了。在暂停后的几天里,智谱AI以开放权重发布了GLM-5.2。独立测试者将其评为最强的开放权重模型。GLM-5.2采用混合专家设计,总计约7500亿参数,每个令牌仅激活约400亿。在Semgrep的IDOR基准测试中,其F1得分为39%,高于Claude Code的32%。成本方面,在AA-Briefcase上,Fable 5平均每任务31美元,而GLM-5.2仅为2.40美元。
访问与快速API示例 对于Pro、Max、Team和部分Enterprise计划,Fable 5在7月7日前免费包含,覆盖周使用限额的50%。之后将转为使用点数。Anthropic还将在AWS、Google Cloud和Microsoft Foundry上重新启用Fable 5。开发者可使用字符串"claude-fable-5"调用模型。如果分类器触发,响应将来自Opus 4.8,但代码路径保持不变。
要点总结
- Fable 5于7月1日在出口管制解除后回归。
- 新分类器在超过99%的情况下阻止报告中的绕过方法。
- 被阻止的请求路由至Opus 4.8,而非直接拒绝。
- Anthropic提出四准则越狱评分框架。
- 暂停期间,GLM-5.2作为更便宜的开源竞争对手出现。