AI News HubLIVE
站內改寫2 分鐘閱讀

中國LongCat-2.0成為最大的不使用輝達晶片的AI模型

美團釋出了LongCat-2.0,一個1.6萬億引數的開源大語言模型,完全使用國產硬體進行訓練和推理,標誌著中國在AI晶片自主化方面的重要突破。

來源Hacker News AI作者: mgh2

中國外賣巨頭美團近日釋出了其最新的開源大語言模型LongCat-2.0,該模型擁有1.6萬億引數和100萬token的上下文視窗,完全基於國產硬體進行訓練和推理,成為迄今為止規模最大的不依賴輝達晶片的AI模型。這一突破重塑了全球AI產業對中國技術自主化的看法。

LongCat-2.0的釋出標誌著中國在AI晶片自主化道路上邁出了關鍵一步。與之前DeepSeek的V4-pro僅在推理階段使用國產晶片不同,LongCat-2.0從預訓練到推理全程採用國產硬體。美團表示,該模型是業界首個在國產硬體上完成訓練和推理的萬億引數模型。美團表示,其叢集圍繞大規模ASIC超級計算節點構建,這些晶片針對特定工作負載進行了定製。此外,公司使用了華為的集合通訊庫(HCCL)來管理晶片間的大規模協調,這一設定類似於輝達的NCCL協調其GPU叢集的方式。分析師Yuchen Jin在X上表示:“這讓我想起了黃仁勳在Dwarkesh播客上的觀點:對輝達GPU的出口管制不會阻止中國,只會加速執行在中國晶片上的AI的發展。”

在效能方面,LongCat-2.0在多個基準測試中表現出色。它在Terminal-Bench 2.1和SWE-Bench Pro上超越了谷歌較老的Gemini 3.1 Pro。然而,在最 demanding 的代理和推理任務上,該模型仍落後於全球前沿系統,包括OpenAI的GPT-5.5和Anthropic的Opus 4.8。行業觀察人士迅速做出反應。科技分析師TP Huang表示,這次釋出打消了人們對華為Atlas-950超級計算節點的擔憂。此外,裡海大學研究員Hanchi Sun稱,這是首個在5萬個中國國產加速器上訓練到接近前沿效能的模型。風險合夥人Alvin Foo指出:“如果中國能夠以這種水平在本土晶片上擴充套件前沿訓練,那麼計算軍備競賽將比以往任何時候都更加開放。”

然而,整個中國AI堆疊仍然面臨重大障礙。美團承認其軟體生態系統仍落後於輝達成熟的GPU社群。此外,記憶體限制是預訓練期間的主要瓶頸,因為國產加速器的每裝置記憶體比被禁的輝達H800晶片要少。然而,更廣泛的訊號是結構性的。美團的成功證明,現在在中國硬體上進行前沿規模的訓練在技術上是可行的。因此,中國開源模型與西方頂級閉源系統之間的差距可能會比最近的預測更快的縮小。

中國LongCat-2.0成為最大的不使用輝達晶片的AI模型 | AI News Hub