关于透明AI网络保护措施的公开信
一封由美国及其盟国众多科技领袖签署的公开信,呼吁撤销对Anthropic的Fable和Mythos大模型出口管制,主张以科学、透明的方式处理AI风险评估。
近日,一封由美国及盟国多位高管和技术领袖签署的公开信被递交给商务部长卢特尼克和国家网络总监凯恩克罗斯。信中要求撤销对Anthropic公司Fable和Mythos大型语言模型的出口管制指令,并承诺未来采用开放、科学、透明的AI风险评估流程。
信中指出,AI正在显著影响网络安全,大幅降低了发现软件漏洞和编写利用代码的难度。Anthropic的模型在发现漏洞和武器化利用方面表现出色,但并非独一无二。许多签署人日常使用其他基础模型和开源模型进行安全审计和红队测试。此外,Anthropic已在Fable模型中内置了多重防护措施,以防止其被用于网络攻击,这些措施甚至引发了网络安全社区的调侃。
公开信强调,必须为开发者和安全团队提供AI工具,以便他们比敌人更快地发现和修复代码中的漏洞。中国的开源模型仅落后美国几个月,而且中国政府可能拥有未公开的更强大能力。在对手迅速进步的情况下,无故剥夺防御方的最佳模型是危险的。
签署者们认为,触发此次行动的研究主要测试模型能否识别不安全的代码片段,这其实是编写安全代码的必要能力,不应被视为攻击能力。而且,GPT-5.5、Opus、Sonnet甚至中国的Kimi 2.7等模型也能复现这些能力。Anthropic正在改进其研究,但行动不应是禁止技术,而是推动持续改进。
公开信警告,当前的出口管制从防御者手中拿走了最好的模型,造成了市场不确定性,并危及了美国的AI领导地位,却没有带来真正的风险缓解。如果政府要监管AI模型,那么监管应基于科学评估、民主规则制定、透明公平的执行,并且仅限于保护美国公众安全所需的最小范围。