Anthropic如何带回Fable 5——以及何时收费
美国政府解除出口管制后,Anthropic宣布将于7月1日重新推出Fable 5模型。但用户需注意使用限制和额外费用。文章详细说明了访问权限、定价、安全改进以及“越狱”事件的细节。
美国政府于周二解除对Fable 5的出口管制后,Anthropic宣布将于周三(7月1日)重新推出该模型。现在,该公司明确了这一过程的具体安排,以及导致商务部对Claude Fable 5和Claude Mythos 5实施出口管制的“越狱”事件的更多细节。
7月1日,Fable 5将重新在Claude平台、Claude.ai、Claude Code和Claude Cowork上向全球所有Pro、Max、Team和Enterprise计划用户开放。但也有一些坏消息:到7月7日之前,订阅计划用户最多可使用其每周用量限额的50%来调用Fable 5。之后,该模型将仅能通过使用积分访问,其计费标准与Anthropic API计划相同。
对于标准Enterprise用户,Fable 5不会计入其常规配额,即使是在7月7日之前。他们将立即通过使用积分计费。不过,高级Enterprise席位有一个短暂的宽限期至7月7日,在此之前这些用户可通过订阅计划使用Fable 5。
最初,Fable 5原定于6月9日至22日免费提供。
通过AWS、Google Cloud和Microsoft Foundry访问Fable 5的开发者也很快将重新获得访问权限。
在撤下Fable 5之前,Anthropic的定价为每百万输入tokens 10美元,每百万输出tokens 50美元。这一价格似乎不会改变。
根据Anthropic的说法
通过此次更新,Anthropic还公布了导致这一切的更多细节。Anthropic确认,亚马逊研究人员“找到了一种绕过Fable 5安全防护的方法:通过提示使其识别出大量软件漏洞。”在一个案例中(似乎也是唯一一例),他们让模型演示了如何利用该漏洞。
Anthropic表示,它与政府和合作伙伴(包括亚马逊)合作审查了这份报告,发现其他模型(如Claude Opus 4.8、GPT-5.5和Kimi K2.7)也能发现Fable 5报告中提到的相同漏洞,并且团队测试的每一个模型(包括Claude Haiku 4.5等基础模型)都能找出利用该漏洞的方法。
该公司强调,“报告中的技术并未暴露任何独特的Mythos级网络能力”,而只是刚刚触及Fable 5安全防护的边界。
“新的分类器意味着Amazon报告中描述的具体技术在99%以上的情况下都会被阻止。”——Anthropic。
在Fable 5下线后,Anthropic与政府合作训练了改进的安全分类器——一种能够检测用户何时要求模型产生产出有害输出的系统——现在也能阻止这类请求。该公司实质上增加了模型会阻止的良性请求数量。
带回Fable 5的代价:更大的安全裕度
人们不禁要问,对于表现出相同行为的其他模型这意味着什么,但截至目前,这仅适用于Fable 5,美国政府显然对此没有意见。
“新的分类器意味着Amazon报告中描述的具体技术在99%以上的情况下都会被阻止,”Anthropic写道,并指出尽管模型仍不会阻止所有低风险网络防御能力,但应能阻止大多数有害能力。该公司表示,“我们有意将安全分类器设置为触发一组我们知道很可能是良性的请求”,以增加安全裕度。
当Fable 5推出时,已有用户反馈该模型会阻止甚至最无害的请求,因此在这些增强护栏的作用下,情况将如何发展还有待观察。Anthropic在其公告中已有所暗示。
“新的分类器还会在常规编码和调试任务中更频繁地标记良性请求,”该公司写道。“与所有安全保护一样,我们将继续完善,以更好地区分真正的滥用和合法请求,减少误报。”
这似乎是Anthropic为带回Fable所付出的代价。
与之前一样,Fable 5会将任何有问题的请求路由到Opus 4.8——Anthropic自称也能复制Fable 5行为的模型。对此可以自由解读,但不要告诉美国政府。
那么,什么是“越狱”?
由于这一切始于一个看似相对较小的问题,Anthropic也借此公告提出了一种根据越狱为攻击者提供的内容来评分的方法。这些标准包括越狱解锁的能力增益、该能力增益适用的不同进攻性网络安全任务数量、越狱武器化的难易程度以及发现和获取该技术的难易程度。
该公司承认这是一个进展中的工作,目前尚不清楚如何对这些标准进行评分和权衡。
为了监控自己的模型,Anthropic正在组建一个团队,将全天候监控其越狱提交通道。它还在HackerOne上启动了一个新项目,供研究人员提交潜在漏洞。
与华盛顿保持良好关系
至于美国政府,Anthropic表示将继续与网络总监办公室、科技政策办公室、财政部和商务部等机构合作,重点关注白宫在《促进人工智能创新和安全行政令》中建立的框架。
“我们希望这种合作,以及我们提出的行业共识框架,将成为全行业系统规则的基础——甚至为有效协调全球在人工智能风险和收益方面的行动提供模板,”Anthropic写道,并表示希望这些规则能“被纳入强有力的监管,并平等适用于所有前沿模型开发者。”
当然,Anthropic长期以来一直是人工智能安全法规的倡导者,这一点并不令人意外。不过,该公司呼吁这些规则也适用于其竞争对手,这绝非巧合。