AI模型发布节奏分析:两家实验室加速,三家放缓
本文通过数据分析了前沿AI模型的发布节奏,发现Anthropic和OpenAI的发布频率在加速,而谷歌、Meta和DeepSeek并未出现类似趋势。作者探讨了递归自我改进的可能性,并指出了验证这一假设的下一步观察点。
2026年6月,Ethan Mollick提出了一项引人注目的观察:如果AI自我改进真实存在,哪怕效果很弱,那么具备这种能力的实验室应该会越来越快地发布模型,而不具备的则会落后。他声称这在Anthropic和OpenAI身上已有所体现,但其他实验室并未显现。为了验证这一论断,作者收集了自2023年第一季度至2026年第二季度主要前沿模型的发布数据,并绘制了图表。
数据显示,截至目前,Anthropic累计发布了13个主要模型,OpenAI 11个,谷歌8个,Meta 7个,DeepSeek 5个。更重要的是,发布节奏的斜率(即速度)正在发生变化:Anthropic和OpenAI的斜率越来越陡,而其他三家则保持平缓或下降。例如,Meta在2025年4月发布Llama 4后便再无前沿模型推出;谷歌在2025年几乎停滞,直到2026年第二季度才有所发力;DeepSeek则维持着稳定的季度发布节奏,未见加速。
作者强调,节奏只是代理指标,而非因果证明。加速可能源于递归自我改进,但也可能源于更多资金、更好的管理或单纯决定增加发布频率。为了区分,作者计算了年化发布率(以四个季度为滚动窗口),结果显示Anthropic的年化率在窗口期内几乎翻了三倍,OpenAI翻了一倍多,而谷歌在2026年才追赶,Meta则处于下降态势。
递归自我改进的具体机制是:实验室使用自身产品来构建下一代产品。Anthropic的工程师利用Claude Code编写训练和评估基础设施,OpenAI则使用Codex来优化自身。每一次发布都会改进产生下一次发布的工具链,从而加快后续发布。需要注意的是,这并非权重层面的在线学习,而是组织层面的离线递归——循环跨越发布周期而非前向传播,因此远弱于“自我改进AI”的表述,但图表与之一致。
此外,还有两项支持递归解读的观察:一是计算效率的提升——Tri Dao的FlashAttention-4在2026年3月实现了NVIDIA B200上71%的利用率,Mamba-3则明确从训练优先转向推理优先设计,这使得每次训练和推理成本降低,从而每个季度能完成更多周期。二是人才集中——2026年6月19日当周,Transformer合著者Noam Shazeer加入OpenAI领导架构研究,AlphaFold开发者、2024年诺贝尔奖得主John Jumper离开谷歌DeepMind加入Anthropic。人才正流向发布最快的实验室。
作者提出了几个可证伪的情况:如果未来两个季度Anthropic和OpenAI的斜率不再上升,则加速只是2026年的偶然现象;如果某个落后实验室率先实现真正的在线学习(如持续权重更新),则离线递归的速度优势将失去意义;如果放宽发布定义(包括点发布),图表可能改变;Meta的停滞可能是策略而非失败,因为它转向了开放权重和不同的发布哲学。
最终结论是:图表并未证明AI在进步或递归存在,它只展示了一个更窄、更可辩护的事实——两个特定实验室的发布节奏在加速,三个没有,与Mollick的描述完全一致。如果这一差距是循环而非巧合,它将继续扩大;如果是资金或运气所致,则会回归。未来两个季度的发布数据将是干净的检验。对市场而言,若循环为真,最直接的受益者是计算基础设施(GPU和电力)而非实验室本身,但这一点纯属推测。