AI News HubLIVE
サイト内リライト2 分で読了

美団、NVIDIA GPUなしで1.6兆パラメータのAIモデルを訓練

美団は1.6兆パラメータのMixture-of-ExpertsモデルLongCat-2.0を発表。訓練と推論を完全に国産AI ASICスーパーポッドで行い、NVIDIA GPUを一切使用していない。モデルはOwl Alphaという匿名名でOpenRouterに登場し、高い利用量を記録。性能面では最強ではないが、国産コンピュートで大規模モデルをゼロから訓練する実現可能性を示した。

ソースHacker News AI著者: mgh2

美団は、1.6兆パラメータの基礎モデルLongCat-2.0をリリースしました。しかし、真の注目点はパラメータ数ではなく、その訓練方法にあります。LongCat-2.0は、NVIDIA GPUを一切使用せず、国産AI ASICスーパーポッド上で訓練・デプロイされました。この動きは、米国の輸出規制下にある中国AI産業にとって、ハードウェアの地政学的な意味合いを持ちます。

LongCat-2.0はMixture-of-Expertsアーキテクチャを採用し、総パラメータ1.6兆、トークンあたりの活性化パラメータは約480億です。正式リリース前、Owl Alphaという匿名名でOpenRouterに登場し、総利用量でトップ3に入り、Claude Code Agentシナリオではグローバルで2位(Claude Opus 4.8に次ぐ)となりました。

性能面では、LongCat-2.0は最強モデルではありません。エージェント能力はClaude Opus 4.6に近いものの4.8には劣り、コーディング能力はGLM-5.1をわずかに上回るがGLM-5.2には及びません。しかし、訓練から推論までのパイプライン全体で「NVIDIAゼロ」を実現した点が重要です。

美団の公開モデルカードによると、全訓練と大規模デプロイはAI ASICスーパーポッド上で行われ、35兆トークン以上の事前訓練をロールバックや回復不能な損失スパイクなしで完了しました。これは、従来の国産コンピュートのマイルストーン(既存モデルの推論や後訓練を国産チップで行う)を大きく超えるものです。

ハードウェアの詳細について、美団は具体的なチップモデルやカード数を公式には発表していません。「国産AI計算チップ」「AI ASICスーパーポッド」という表現にとどまっています。メディアやコミュニティでは約5万枚のHuawei Ascend 910Cと推測されていますが、確定情報ではありません。

それでもなお、これは大きな成果です。ゼロから1.6兆パラメータのモデルを訓練するには、システム全体の安定性が求められます。美団は訓練MFUを1.5倍改善し、1日あたりの障害率を70%以上削減、主要演算子の効率を14%向上させました。これらは、演算子の適応、通信最適化、例外処理、自動障害回復など、地道なインフラ構築の賜物です。

アーキテクチャ面では、LongCat-2.0は「ゼロ計算エキスパート」と「ショートカット接続MoE」を採用。ゼロ計算エキスパートは入力をそのまま返し、ルーターがトークンごとに使用する実エキスパートとゼロ計算エキスパートの数を動的に決定します。これにより、活性化パラメータが範囲を持ち、難しいトークンにより多くの計算を割り当てられます。

注目すべきは、LongCat-2.0のMoE疎密度が約97%に達し、さらに1350億エキスパートパラメータを追加しても性能向上がほとんど見られなかった点です。これはトップMoEモデルが疎密度の限界に近づいていることを示唆し、今後の改善はアテンション機構やコンテキスト効率、後訓練データ品質などにシフトする可能性があります。

LongCat-2.0は単独でAIの方向性を変えるものではありませんが、DeepSeek-V4、GLM-5.2、Kimi K2.7などと並んで、国産コンピュートによる大規模オープンモデルの産業化を現実のものとしています。中国にとっては、NVIDIA依存からの脱却と輸出規制回避の戦略的価値があります。

もし食品配送大手がNVIDIA GPUなしで1.6兆パラメータモデルを訓練し、実際のエージェントコーディング利用を得られるなら、中国のAIスタックは外部の想定よりもはるかに成熟していると言えるでしょう。次なる問いは、この「NVIDIAなし」の訓練パスが再現可能になるかどうかです。