AI News HubLIVE
站內改寫3 分鐘閱讀

人工智能競賽為何轉向速度

2026年初,人工智能競賽從模型智能轉向推理速度。谷歌、Anthropic和OpenAI等主要實驗室發佈了更快的編碼模型。快速推理加速了模型開發和產品迭代,成為AI進步和商業收入的關鍵因素。

2025年的大部分時間裏,AI競賽的焦點是模型智能。然而,在過去的三個月裏,競賽的焦點發生了轉變。模型智能仍然至關重要,但在每一個前沿實驗室中,推理速度已成為一個新的緊迫焦點。谷歌發佈了Gemini 3 Flash,該模型專為智能體編碼而設計,運行速度比Gemini 3 Pro快3倍。Anthropic發佈了速度提升2.5倍的Claude Opus 4.6版本,用於對速度敏感的編碼場景。OpenAI宣佈與Cerebras合作,推出GPT-5.3-Codex-Spark,運行速度超過每秒1200個token,成為迄今最快的OpenAI編碼模型。

為什麼推理速度突然變得如此重要?因為模型生成token的速度現在直接影響着主要實驗室的模型迭代速度,以及更廣泛經濟中的軟件構建速度。今年二月,OpenAI和Anthropic都透露,他們正在使用自己的編碼模型來構建下一版本的AI模型。這是一個非同尋常的披露。在OpenAI的博文《利用工程》中,他們寫道:“GPT-5.3-Codex是我們的第一個在創造自身過程中發揮了關鍵作用的模型。Codex團隊使用早期版本來調試自己的訓練、管理自己的部署、診斷測試結果和評估——我們的團隊對Codex加速自身開發的能力感到震驚。”該博文描述了一個由三名工程師組成的團隊,使用Codex在五個月內產生了百萬行生產代碼——以手工編寫所需時間的大約十分之一構建了產品。人類從未手動編寫過一行代碼。他們提示智能體,審查其拉取請求,並排除障礙。正如OpenAI所説:“人類掌舵。智能體執行。”

Anthropic的情況類似。當他們發佈速度提升2.5倍的Claude Opus 4.6版本時,他們承認這已經是他們內部一直在使用的速度。Anthropic的Claude Code負責人Boris Cherny公開表示,兩個多月來他所有的代碼都是由AI編寫的,並且Claude Code自身約90%的代碼庫是由Claude Code自己編寫的。簡而言之,Anthropic一直在使用自己的編碼工具來構建他們的下一代產品,而直到最近,他們才將自己模型的最快版本留作己用。

其影響深遠而清晰——軟件開發中的遞歸時刻已經到來,在推理方面,token輸出越快,下一個產品的發佈就越快。每個實驗室都在競相構建更強大的模型。過去,誰擁有最大的訓練集羣誰就能率先到達終點。現在,在其他條件相同的情況下,誰在模型開發過程中使用最快的推理,誰就能率先越過終點線。推理速度現在已成為開發下一代前沿模型,乃至AGI的關鍵路徑。

如果快速推理真的如此重要,那麼它應該非常有價值。驗證這一點的一種方法是看看Anthropic如何根據其模型的智能和速度來定價。Anthropic的旗艦模型Opus 4.6的定價比其中端模型Sonnet 4.6高出66%。而運行速度快2.5倍的Opus 4.6 Fast的價格是基礎模型的6倍。Anthropic的定價肯定了速度現在足夠重要,值得擁有自己的類別,而且就價值而言,它甚至可能比模型智能的提升更有價值。

推理速度不僅對OpenAI和Anthropic具有戰略意義。對於任何構建和交付軟件產品的公司來説,它都具有戰略意義。考慮兩家公司——A公司和B公司——都在構建一個新的AI驅動的CRM。A公司使用頂級前沿模型,六週完成開發。B公司擁有相同的想法、團隊人才和資金。但它使用運行快速推理的前沿模型,僅用三週就發佈了第一個版本。在接下來的幾周裏,B公司根據用户反饋迅速迭代。產品的第三版迅速走紅,在第八週達到了1000萬美元的年度經常性收入。與此同時,A公司還在從第一個產品版本中學習。在這種情況下,快速推理直接加速了產品迭代和創收時間。

上面的例子聽起來可能有些不可思議,但它已經在現實經濟中發生了。在Stripe的2025年度信中,這家支付公司透露,在發佈後三個月內達到1000萬美元ARR的公司數量比2024年翻了一番。這幾乎肯定是由智能體編碼的日益採用所驅動的。我們預計2026年將看到更顯著的加速,因為開發者將使用更強大的編碼智能體,其運行速度比2025年高出一個數量級。

上述模式不僅對初創公司成立,對企業也是如此。2026年1月對於各個階段和規模的SaaS公司來説是一個清算時刻。團隊正在爭先恐後地重建他們的產品堆棧和收入模式。那些擁有最快、最強大的編碼智能體的公司更有可能在後智能體經濟中找到立足點。

速度一直是數字經濟的驅動力。在1990年代,公司購買他們能負擔得起的、最快的計算機。在2000年代,他們爭相獲得最快的互聯網連接。在AI時代,高速推理是關鍵基礎設施。Cerebras從一開始就專注於速度。縱觀行業的發展軌跡——模型構建模型、編碼智能體取代手動開發、市場切入速度成為token吞吐量的函數——很明顯,速度在未來將更加重要。