2026-07-02 11:03 UTC+8站内改写2 分钟阅读更新: 2026-07-02 11:32 UTC+8

Fable回归：这一安全机制中融入了AI元素

Anthropic在经历出口限制后重新部署Fable 5模型，但新版本引入了更严格的安全分类器，导致更多良性请求被拦截，尤其在编程任务中。美国政府获得模型预发布访问权和专用计算资源，标志着AI行业向国家管控方向转变。

来源Hacker News AI作者: swolpers

Anthropic于2026年7月1日重新上线了其前沿模型Fable 5。此前，该模型因亚马逊研究人员发现的一种越狱方法而被美国政府实施出口限制。现在，Fable 5以更严格的安全措施回归，但用户将面临更多限制，特别是在编程等任务中。

Anthropic在博客中表示，新的安全分类器经过了与政府合作的改进，旨在拦截报告中描述的特定越狱行为。然而，这种改进是以误报增加为代价的。Anthropic承认，在日常编程和调试任务中，更多良性请求会被标记为危险并转交给较弱的Opus 4.8模型处理。公司将此描述为“安全边际”的扩大，即请求必须看起来非常安全才能避免触发分类器。

这一变化引发了担忧。Fable 5最初发布时就因过度敏感而受到批评，如今的新版本似乎进一步加剧了这一问题。对于依赖前沿模型进行复杂实验的用户来说，这种限制可能使有效能力停留在低一级模型水平。Anthropic承诺将继续优化分类器以区分真正滥用和合法请求，但作者指出，在当前的监管框架下，完全开放的模型可能永远不会再现。

此次重新部署还伴随着政府角色的明确加强。Anthropic与美国商务部、国家网络总监办公室等多个机构密切合作，并承诺为未来的模型提供预发布政府访问和评估。此外，Anthropic将设立专门的团队和计算资源用于联合研究。美国商务部长霍华德·卢特尼克在信中指出，这些协议将适用于所有未来的模型，且政府保留根据情况变化重新评估限制的权利。

作者阿尔贝托·罗梅罗认为，这一事件表面上是针对一个可复现的越狱漏洞，实则为政府全面掌控AI行业铺平了道路。他写道：“这是AI将变得最糟糕的时刻，也是AI将变得最自由的时刻。”未来，更强的模型能力可能意味着更严格的安全措施和更少的用户自主权，而政府与AI公司之间的捆绑将日益紧密。

具体而言，Fable 5的新版本仅允许用户使用每周配额中50%的令牌访问该模型，而此前为100%。Anthropic解释这是出于安全考虑，但作者推测真正原因是计算资源不足。此外，安全分类器在编程任务中的误报率显著升高，许多原本合理的请求被拒绝。作者质疑，如果前沿模型的能力被限制在较低水平，那么AI能力前沿实际上被封顶在Opus 4.8或GPT-5.5级别。

政府方面，美国商务部明确表示将审查未来所有模型的发布，并有权在情况变化时重新施加许可要求。这一协议不仅涉及Fable，还涵盖Anthropic未来的所有模型。作者认为，这标志着美国政府对AI行业控制的开端，也是用户自由使用AI的终结。他警告说，随着模型能力的提升，安全限制将更加严格，用户将失去对AI的自主权。