AI News HubLIVE
站內改寫2 分鐘閱讀

AI模型釋出節奏分析:兩家實驗室加速,三家放緩

本文透過資料分析了前沿AI模型的釋出節奏,發現Anthropic和OpenAI的釋出頻率在加速,而谷歌、Meta和DeepSeek並未出現類似趨勢。作者探討了遞迴自我改進的可能性,並指出了驗證這一假設的下一步觀察點。

來源Hacker News AI作者: abipal15

2026年6月,Ethan Mollick提出了一項引人注目的觀察:如果AI自我改進真實存在,哪怕效果很弱,那麼具備這種能力的實驗室應該會越來越快地釋出模型,而不具備的則會落後。他聲稱這在Anthropic和OpenAI身上已有所體現,但其他實驗室並未顯現。為了驗證這一論斷,作者收集了自2023年第一季度至2026年第二季度主要前沿模型的釋出資料,並繪製了圖表。

資料顯示,截至目前,Anthropic累計釋出了13個主要模型,OpenAI 11個,谷歌8個,Meta 7個,DeepSeek 5個。更重要的是,釋出節奏的斜率(即速度)正在發生變化:Anthropic和OpenAI的斜率越來越陡,而其他三家則保持平緩或下降。例如,Meta在2025年4月釋出Llama 4後便再無前沿模型推出;谷歌在2025年幾乎停滯,直到2026年第二季度才有所發力;DeepSeek則維持著穩定的季度釋出節奏,未見加速。

作者強調,節奏只是代理指標,而非因果證明。加速可能源於遞迴自我改進,但也可能源於更多資金、更好的管理或單純決定增加發布頻率。為了區分,作者計算了年化釋出率(以四個季度為滾動視窗),結果顯示Anthropic的年化率在視窗期內幾乎翻了三倍,OpenAI翻了一倍多,而谷歌在2026年才追趕,Meta則處於下降態勢。

遞迴自我改進的具體機制是:實驗室使用自身產品來構建下一代產品。Anthropic的工程師利用Claude Code編寫訓練和評估基礎設施,OpenAI則使用Codex來最佳化自身。每一次釋出都會改進產生下一次釋出的工具鏈,從而加快後續釋出。需要注意的是,這並非權重層面的線上學習,而是組織層面的離線遞迴——迴圈跨越發布週期而非前向傳播,因此遠弱於“自我改進AI”的表述,但圖表與之一致。

此外,還有兩項支援遞迴解讀的觀察:一是計算效率的提升——Tri Dao的FlashAttention-4在2026年3月實現了NVIDIA B200上71%的利用率,Mamba-3則明確從訓練優先轉向推理優先設計,這使得每次訓練和推理成本降低,從而每個季度能完成更多週期。二是人才集中——2026年6月19日當週,Transformer合著者Noam Shazeer加入OpenAI領導架構研究,AlphaFold開發者、2024年諾貝爾獎得主John Jumper離開谷歌DeepMind加入Anthropic。人才正流向釋出最快的實驗室。

作者提出了幾個可證偽的情況:如果未來兩個季度Anthropic和OpenAI的斜率不再上升,則加速只是2026年的偶然現象;如果某個落後實驗室率先實現真正的線上學習(如持續權重更新),則離線遞迴的速度優勢將失去意義;如果放寬釋出定義(包括點發布),圖表可能改變;Meta的停滯可能是策略而非失敗,因為它轉向了開放權重和不同的釋出哲學。

最終結論是:圖表並未證明AI在進步或遞迴存在,它只展示了一個更窄、更可辯護的事實——兩個特定實驗室的釋出節奏在加速,三個沒有,與Mollick的描述完全一致。如果這一差距是迴圈而非巧合,它將繼續擴大;如果是資金或運氣所致,則會迴歸。未來兩個季度的釋出資料將是乾淨的檢驗。對市場而言,若迴圈為真,最直接的受益者是計算基礎設施(GPU和電力)而非實驗室本身,但這一點純屬推測。