Anthropic Fable 混乱事件解析
自上周五以来,Anthropic与Mythos和Fable模型相关的争议持续发酵。本文梳理了事件时间线,包括Anthropic与国防部的争端、Mythos模型的发布、白宫的分歧、Fable 5的推出及其安全限制引发的批评、以及最终导致特朗普政府实施出口管制的风波。文章分析了支持与反对Anthropic的论点,作者认为Anthropic大体上做出了正确决定,并间接为Fable做了广告。
自上周五以来,围绕Anthropic、Mythos和Fable模型的争议成为科技界热议的话题。事件发展迅速,让人目不暇接。以下是我对事件经过的看法,以及各方对Anthropic的评价——有人视其为正义一方,也有人指责其做法不当。我的结论是:Anthropic大体上做得不错,而且这简直是为Fable做了一次绝佳的广告。
事件时间线
2月/3月:Anthropic与美国国防部就使用其AI模型发生争执,Anthropic希望对技术使用施加一定限制。这场争执导致Anthropic被贴上“供应链风险”的标签,理论上限制了政府及其承包商使用该公司模型。
4月7日:Anthropic推出新模型系列Mythos。发现Mythos善于发现和利用新型网络安全漏洞后,Anthropic启动了“Project Glasswing”,向关键科技公司提供工具,以便在更广泛发布前强化其软件。
4月16日:据报道,白宫正努力为政府机构提供Mythos的一个版本。
4月30日:Anthropic希望扩大可访问Mythos的团体数量;白宫据报反对此举,担心增加合作伙伴会使Anthropic的计算资源受限,从而限制美国政府对该模型的访问。
6月2日:Anthropic宣布,Project Glasswing的初始50个合作伙伴通过使用Mythos发现了超过10,000个严重软件漏洞。该公司将Project Glasswing扩展至15个国家的150个新组织。Anthropic还承诺正努力“安全地公开发布Mythos级别的能力”,但“防止模型网络能力被滥用的高度稳健保障措施——这些措施我们(以及据我们所知所有其他AI开发者)尚未开发出来。”
6月9日:Anthropic宣布并发布Fable 5,这是一款旨在降低网络安全和生物学相关风险的“Mythos级别”模型。公司在发布说明中表示,已为Mythos(Fable)建立了足以“公开发布”的安全保障。当时,Anthropic称其“优先考虑安全”,使Fable 5的护栏“比理想情况更严格”。一些用户发现Fable 5在某些用例(主要是生物学相关查询)中受到严重限制,几乎无法使用。Fable 5还具备蒸馏保护和严格的30天数据保留政策,Anthropic声称这将有助于“防御复杂和新颖的攻击(包括新的越狱和跨多个请求的攻击),并帮助我们识别和减少误报”。此时,对Anthropic的主要批评是它过于谨慎;通过保密Mythos并仅发布注重安全的Fable版本,它正在制造一个两级AI市场。人们并不喜欢这样!Anthropic在发布前已“多次提前通知政府”其6月9日的Fable发布日期。
6月10日:Anthropic发布两份框架文件,涉及先进AI开发及其经济影响。这些论文呼吁“政府行动和监管——精心设计的监管以防止政府过度干预并保护创新”,包括当“模型带来此类风险时”,允许政府“拥有阻止或阻止其部署的法律权力”。
6月11日:据报道,亚马逊的安迪·贾西告诉政府,其研究人员找到了一种方法,让Fable 5“提供可用于协助网络攻击且本应被禁止的信息”。(至少还有其他五家公司也提出了类似问题,因此这并非亚马逊独有的问题,尽管它是关键行为者。)
6月12日:白宫高级工作人员和行政领导开会讨论情况,随后通过电话与Anthropic CEO达里奥·阿莫迪联系。(据Politico报道,这花了1.25小时,公司称期间提供了其他高管;关于为何让阿莫迪等这么久存在争议。我们可以跳过戏剧性细节,关注重点。)
6月12日后续:阿莫迪认为问题在于误解,并辩称报道中的“绕过”并未“构成与更广泛的‘越狱’相同的风险”。白宫“敦促”Anthropic“自愿移除模型并与政府协调解决漏洞”。阿莫迪要求更多的“时间和信息,但没有承诺撤下模型”。Politico报道,财政部长斯科特·贝森特“直接告诉阿莫迪,他做出了一个‘糟糕的决定’,据一位白宫高级官员称。”
6月12日更多:未能与Anthropic达成协议后,特朗普政府对Fable 5和Mythos 5(两种可用版本的Mythos级别模型,安全限制不同)实施了出口管制。Anthropic回应称,“出口管制指令要求暂停所有外国国民(无论在美国境内还是境外,包括外国国民Anthropic员工)对Fable 5和Mythos 5的访问”,这意味着它必须“突然禁用所有客户的Fable 5和Mythos 5以确保合规”。(原文强调。)
支持Anthropic的论点
Anthropic构建了一个新的、更强大的AI模型,认为其具有独特的新颖网络相关能力。它希望提前应对模型的网络安全风险,因此迅速组建了领先科技公司群体,并提供补贴的早期访问;政府在Fable发布前对其安全措施进行了红队测试……(完整文章见Cautious Optimism)
本文摘自Cautious Optimism,一份专注于技术、商业和权力的适度乐观的出版物。在Cautious Optimism上阅读支持与反对Anthropic的论据,以及Alex Wilhelm的最终立场。