AI不平等:从GPU贫困到Token贫困
本文讨论了AI领域的持续技术进步与扩散瓶颈之间的矛盾。Anthropic发布的新模型Fable 5展现出惊人的能力提升,但其高昂的成本、有争议的安全限制策略(最初静默降低能力,后改为可见降级)以及数据收集政策引发了关于AI权力集中和访问不平等的担忧。文章还引用了Dario Amodei关于AI政策与公民自由的论述,指出其原则与Anthropic的实际做法存在矛盾。
上周,本通讯质疑实验室内部人员是否真的看到了外界所读到的周期末信号,或者他们急于IPO是否因为看到了市场尚未定价的东西。本周,Anthropic从技术角度给出了一个近似的答案:Fable来了,它强化了作者的观点——模型技术能力实际上并未停滞,AI寒冬将源于资金短缺和采用率不足。
Fable 5是Anthropic新Claude 5系列中的第一个模型,属于名为“Mythos类”的新能力层级,位于Opus之上。发布的关键点在于,Fable 5和Mythos 5本质上是同一底层模型,区别在于Fable的嵌入式护栏。在基准测试中,Fable在编码、金融推理和生物学领域均取得突破性成绩,例如在蛋白质设计上加速约10倍,在分子设计任务中生成14个强候选药物中的9个,并完成仅使用视觉输入的游戏《宝可梦 火红》。然而,这个模型使用成本极高:每百万输入令牌10美元,每百万输出令牌50美元。
社区成员Victor Taelin在解决计算机科学难题时测试了Fable。此前他用大量GPT-5和Opus模型花费20小时仅获得6-34%的加速,且代码质量下降。而Fable在两小时内实现了高达1770%的加速,并主动发现并修复了Taelin代码中的一个细微指针别名错误。Taelin感叹:“这关乎我们作为物种的共同未来。”这证实了AI技术仍在大幅加速,而作者上周提出的AI寒冬框架是关于扩散和采用,以及企业尚未学会使用工具的问题。Fable表明天花板可能仍在快速上升。
此次发布伴随着争议。最受关注的是Fable会静默限制自身在前沿AI开发方面的能力,例如构建大型模型预训练管道、设计训练数据管道等。Anthropic估计这影响约0.03%的流量,但这一群体可能是使用该技术最广泛的。当Fable用于前沿LLM开发时,它不会通知用户,而是降低模型能力。这种策略被比作1968年的《核不扩散条约》或刘慈欣《三体》中的智子——不是阻止科学,而是让下一步变得不可能。Semianalysis团队指出,这类似于核不扩散:已经拥有核武器的国家宣布其他国家不得拥有。Sayash Kapoor指出,静默降解使得第三方评估者无法进行严肃的能力评估,破坏了独立监督机制。
然而,在作者撰写本文时,Anthropic收回这一政策。此后,延迟请求将显式回退到Opus 4.8,API上被标记的请求将返回拒绝原因。Anthropic解释称,隐形防护可以更精确地瞄准,但用户应该了解防护措施。不过,公开拒接也可能使绕过更容易。此外,Anthropic收集所有用户的数据用于训练,且从6月23日起,Fable的订阅访问将关闭,仅剩按使用量付费的API。
作者认为,这些措施叠加起来更像是一种商业策略:展示能力、建立依赖、关闭访问、转向按量计费,同时收集训练数据并限制竞争对手。这类似于GitHub Copilot的补贴定价策略,先锁定用户再提取价值。Dario Amodei在同一周发表了一篇关于AI政策的文章,主张政府行动中的人们应获得至少与政府同等能力的AI,并强调分享利益的关键挑战。然而,这些原则与Anthropic自身的访问模式相矛盾:经过批准的实验室可以使用不受限的Mythos,而外部研究人员只能使用受分类器限制的版本,无法缩小差距。