AI News HubLIVE
站内改写2 分钟阅读

中国LongCat-2.0成为最大的不使用英伟达芯片的AI模型

美团发布了LongCat-2.0,一个1.6万亿参数的开源大语言模型,完全使用国产硬件进行训练和推理,标志着中国在AI芯片自主化方面的重要突破。

来源Hacker News AI作者: mgh2

中国外卖巨头美团近日发布了其最新的开源大语言模型LongCat-2.0,该模型拥有1.6万亿参数和100万token的上下文窗口,完全基于国产硬件进行训练和推理,成为迄今为止规模最大的不依赖英伟达芯片的AI模型。这一突破重塑了全球AI产业对中国技术自主化的看法。

LongCat-2.0的发布标志着中国在AI芯片自主化道路上迈出了关键一步。与之前DeepSeek的V4-pro仅在推理阶段使用国产芯片不同,LongCat-2.0从预训练到推理全程采用国产硬件。美团表示,该模型是业界首个在国产硬件上完成训练和推理的万亿参数模型。美团表示,其集群围绕大规模ASIC超级计算节点构建,这些芯片针对特定工作负载进行了定制。此外,公司使用了华为的集合通信库(HCCL)来管理芯片间的大规模协调,这一设置类似于英伟达的NCCL协调其GPU集群的方式。分析师Yuchen Jin在X上表示:“这让我想起了黄仁勋在Dwarkesh播客上的观点:对英伟达GPU的出口管制不会阻止中国,只会加速运行在中国芯片上的AI的发展。”

在性能方面,LongCat-2.0在多个基准测试中表现出色。它在Terminal-Bench 2.1和SWE-Bench Pro上超越了谷歌较老的Gemini 3.1 Pro。然而,在最 demanding 的代理和推理任务上,该模型仍落后于全球前沿系统,包括OpenAI的GPT-5.5和Anthropic的Opus 4.8。行业观察人士迅速做出反应。科技分析师TP Huang表示,这次发布打消了人们对华为Atlas-950超级计算节点的担忧。此外,里海大学研究员Hanchi Sun称,这是首个在5万个中国国产加速器上训练到接近前沿性能的模型。风险合伙人Alvin Foo指出:“如果中国能够以这种水平在本土芯片上扩展前沿训练,那么计算军备竞赛将比以往任何时候都更加开放。”

然而,整个中国AI堆栈仍然面临重大障碍。美团承认其软件生态系统仍落后于英伟达成熟的GPU社区。此外,内存限制是预训练期间的主要瓶颈,因为国产加速器的每设备内存比被禁的英伟达H800芯片要少。然而,更广泛的信号是结构性的。美团的成功证明,现在在中国硬件上进行前沿规模的训练在技术上是可行的。因此,中国开源模型与西方顶级闭源系统之间的差距可能会比最近的预测更快的缩小。