前沿AI公司再也無法觸及能力前沿
文章認為,集中的前沿AI模型正被更小模型組成的網絡超越,這些網絡在速度、準確性和成本上更具優勢。這種轉變由集成方法驅動,基於機器學習基本原理,勢不可擋。作者將這一變化比作從大型機到聯網PC的過渡。
近年來,AI行業普遍認為未來屬於更大規模的模型,由少數玩家控制。然而,本文作者指出這一觀點大錯特錯。數據顯示,由多個較小AI模型組成的網絡,在速度、準確性和成本上已經全面超越所有前沿AI系統(包括Fable/Mythos)。這類似於20世紀60年代大型機被聯網PC所取代的歷史轉折。
經濟層面的終結
從能力來看,神經網絡集成現在比任何單一前沿模型都更快、更便宜、更強大。作者6個月前就親自驗證了這一點,如今網絡上屢見不鮮。例如,一個集成模型在準確率上超越了最佳模型,而成本僅為其一半。關鍵在於,不同模型會犯不同的錯誤,集成之後錯誤相互抵消,整體準確率提升。這就是為什麼沒有哪個單一前沿AI系統能再次獨佔能力前沿。
速度方面,開源模型由於服務商專注於快速廉價的結果交付,往往更快。OpenRouter的獨立評級證實了這一點。成本方面,開源模型僅收取推理費用,培訓成本免費。更重要的是,現在獲得Fable級別性能的最廉價方式,不再是Fable本身,而是GPT與Opus等模型的組合。這種集成可以不斷遞歸:用更便宜的模型與前沿模型組合,再與其他開源模型組合,準確率和成本優勢越來越大。
集中式AI無法應對這種“九頭蛇效應”——每一次它推出一款更強的模型,網絡就會將其吸納,從而變得更強。就像20世紀後期,互聯網將大型機連接起來,使網絡總是強於任何單體機器。
基礎原理:準確率、成本與速度
準確率優勢基於機器學習基本原則:不同模型錯誤不同,加權集成通常能提高準確率,這一方法甚至曾被研究會議禁止。成本優勢源於效率提升。當前的AI模型像是不分章節通讀整座圖書館的圖書管理員,而更高效的方式是建立索引:分區域、書架、書籍、章節、段落。網絡中的每個模型都是“神經網絡緩存”,路由器則充當索引。這將是成本最低的方案。速度方面,雖然集成模型在首次響應時間(TTFT)上略有延遲,但總體token吞吐量不變,因為模型並行處理然後流式輸出。
地緣政治層面的終結
2010-2026年是公司級AI:能力取決於最大公司匯聚的數據、算力和人才。2026年後似乎進入國家級AI,因為中國和美國都在推動國家控制。但目前,世界級AI已經躍然而出。例如,美國政府剛禁止Fable,24小時內OpenRouter就提供了超越Fable質量的網絡集成。這就像ARPANET連接大型主機一樣,網絡的力量遠勝單一節點。最終,AI的競爭將不再是公司或國家之間,而是全球化的神經網絡網絡。