前沿AI公司再也无法触及能力前沿
文章认为,集中的前沿AI模型正被更小模型组成的网络超越,这些网络在速度、准确性和成本上更具优势。这种转变由集成方法驱动,基于机器学习基本原理,势不可挡。作者将这一变化比作从大型机到联网PC的过渡。
近年来,AI行业普遍认为未来属于更大规模的模型,由少数玩家控制。然而,本文作者指出这一观点大错特错。数据显示,由多个较小AI模型组成的网络,在速度、准确性和成本上已经全面超越所有前沿AI系统(包括Fable/Mythos)。这类似于20世纪60年代大型机被联网PC所取代的历史转折。
经济层面的终结
从能力来看,神经网络集成现在比任何单一前沿模型都更快、更便宜、更强大。作者6个月前就亲自验证了这一点,如今网络上屡见不鲜。例如,一个集成模型在准确率上超越了最佳模型,而成本仅为其一半。关键在于,不同模型会犯不同的错误,集成之后错误相互抵消,整体准确率提升。这就是为什么没有哪个单一前沿AI系统能再次独占能力前沿。
速度方面,开源模型由于服务商专注于快速廉价的结果交付,往往更快。OpenRouter的独立评级证实了这一点。成本方面,开源模型仅收取推理费用,培训成本免费。更重要的是,现在获得Fable级别性能的最廉价方式,不再是Fable本身,而是GPT与Opus等模型的组合。这种集成可以不断递归:用更便宜的模型与前沿模型组合,再与其他开源模型组合,准确率和成本优势越来越大。
集中式AI无法应对这种“九头蛇效应”——每一次它推出一款更强的模型,网络就会将其吸纳,从而变得更强。就像20世纪后期,互联网将大型机连接起来,使网络总是强于任何单体机器。
基础原理:准确率、成本与速度
准确率优势基于机器学习基本原则:不同模型错误不同,加权集成通常能提高准确率,这一方法甚至曾被研究会议禁止。成本优势源于效率提升。当前的AI模型像是不分章节通读整座图书馆的图书管理员,而更高效的方式是建立索引:分区域、书架、书籍、章节、段落。网络中的每个模型都是“神经网络缓存”,路由器则充当索引。这将是成本最低的方案。速度方面,虽然集成模型在首次响应时间(TTFT)上略有延迟,但总体token吞吐量不变,因为模型并行处理然后流式输出。
地缘政治层面的终结
2010-2026年是公司级AI:能力取决于最大公司汇聚的数据、算力和人才。2026年后似乎进入国家级AI,因为中国和美国都在推动国家控制。但目前,世界级AI已经跃然而出。例如,美国政府刚禁止Fable,24小时内OpenRouter就提供了超越Fable质量的网络集成。这就像ARPANET连接大型主机一样,网络的力量远胜单一节点。最终,AI的竞争将不再是公司或国家之间,而是全球化的神经网络网络。