中國LongCat-2.0成為最大的不使用英偉達芯片的AI模型
美團發佈了LongCat-2.0,一個1.6萬億參數的開源大語言模型,完全使用國產硬件進行訓練和推理,標誌着中國在AI芯片自主化方面的重要突破。
中國外賣巨頭美團近日發佈了其最新的開源大語言模型LongCat-2.0,該模型擁有1.6萬億參數和100萬token的上下文窗口,完全基於國產硬件進行訓練和推理,成為迄今為止規模最大的不依賴英偉達芯片的AI模型。這一突破重塑了全球AI產業對中國技術自主化的看法。
LongCat-2.0的發佈標誌着中國在AI芯片自主化道路上邁出了關鍵一步。與之前DeepSeek的V4-pro僅在推理階段使用國產芯片不同,LongCat-2.0從預訓練到推理全程採用國產硬件。美團表示,該模型是業界首個在國產硬件上完成訓練和推理的萬億參數模型。美團表示,其集羣圍繞大規模ASIC超級計算節點構建,這些芯片針對特定工作負載進行了定製。此外,公司使用了華為的集合通信庫(HCCL)來管理芯片間的大規模協調,這一設置類似於英偉達的NCCL協調其GPU集羣的方式。分析師Yuchen Jin在X上表示:“這讓我想起了黃仁勳在Dwarkesh播客上的觀點:對英偉達GPU的出口管制不會阻止中國,只會加速運行在中國芯片上的AI的發展。”
在性能方面,LongCat-2.0在多個基準測試中表現出色。它在Terminal-Bench 2.1和SWE-Bench Pro上超越了谷歌較老的Gemini 3.1 Pro。然而,在最 demanding 的代理和推理任務上,該模型仍落後於全球前沿系統,包括OpenAI的GPT-5.5和Anthropic的Opus 4.8。行業觀察人士迅速做出反應。科技分析師TP Huang表示,這次發佈打消了人們對華為Atlas-950超級計算節點的擔憂。此外,裏海大學研究員Hanchi Sun稱,這是首個在5萬個中國國產加速器上訓練到接近前沿性能的模型。風險合夥人Alvin Foo指出:“如果中國能夠以這種水平在本土芯片上擴展前沿訓練,那麼計算軍備競賽將比以往任何時候都更加開放。”
然而,整個中國AI堆棧仍然面臨重大障礙。美團承認其軟件生態系統仍落後於英偉達成熟的GPU社區。此外,內存限制是預訓練期間的主要瓶頸,因為國產加速器的每設備內存比被禁的英偉達H800芯片要少。然而,更廣泛的信號是結構性的。美團的成功證明,現在在中國硬件上進行前沿規模的訓練在技術上是可行的。因此,中國開源模型與西方頂級閉源系統之間的差距可能會比最近的預測更快的縮小。