AI News HubLIVE
站内改写

DeepSeek V4 Pro(1.6T-A49B)およびFlash(284B-A13B)、ベースとインストラクト版——Huawei Ascendチップで動作可能

数ヶ月の遅延を経て、DeepSeekは待望のDSV4シリーズを発表。ProとFlashの2モデルは1Mコンテキスト、混合精度量子化、MITライセンス、Huawei Ascend対応を備え、オープンウェイトモデルでトップクラスの性能を示すが、クローズドフロンティアモデルには及ばない。

記事インテリジェンス

エンジニア上級

要点

  • DSV4 Pro: 1.6Tパラメータ/49Bアクティブ、Flash: 284B/13Bアクティブ、1Mコンテキスト
  • CSAとHCAによる新しいアーキテクチャでKVキャッシュをV3.2の10%に削減
  • MITライセンス、Huawei Ascend互換、競争力のある価格設定だが、評価でのトークン消費量が多い

重要な理由

このニュースが重要なのは、DSV4 Pro: 1.6Tパラメータ/49Bアクティブ、Flash: 284B/13Bアクティブ、1Mコンテキストためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

数ヶ月の遅延と多くの憶測を経て、DeepSeekはついに待望のDeepSeek-V4シリーズをリリースしました。これは2024年12月のDSV3と2025年1月のDSR1以来のメジャーバージョンアップです。シリーズにはV4 Pro(総パラメータ1.6T、アクティブ49B)とV4 Flash(総パラメータ284B、アクティブ13B)の2モデルがあり、どちらも最大1Mトークンのコンテキスト長をサポートし、MITライセンスで提供されます。さらに、ベース版とインストラクト版の両方がリリースされ、将来の「DeepSeek R2」への道を開くものと期待されています。

DSV4シリーズはアーキテクチャに多くの革新をもたらしました。混合精度量子化(FP4エキスパート重み、FP8アテンション/正規化/ルーター)に加え、新しい圧縮スパースアテンション(CSA)と高圧縮アテンション(HCA)技術を採用し、1MコンテキストにおいてKVキャッシュをDSV3.2の10%、FLOPsを27%に削減しました。この効率的なアテンション機構は、多くの研究者から本モデルの最も重要な貢献と評価されています。技術レポートは58ページにわたり、1月に発表された多様体制約ハイパーコネクション(mHC)やMoonshotのMuonオプティマイザーなど、トレーニングと推論の改善点を詳細に説明しており、複数の研究者が今年最も重要なAI論文の一つと称賛しています。

性能面では、独立したベンチマークにより、V4 Proはオープンウェイトモデルの中でKimi K2.6に次ぐ第2位に位置しますが、全体としてはGPT-5.4、Opus 4.7、Gemini 3.1 Proなどのクローズドフロンティアモデルには劣ります。エージェントタスクと長コンテキストでは優れた性能を発揮し、GDPval-AA(エージェント現実作業)ベンチマークで1554点を記録し、Kimi K2.6、GLM-5.1、MiniMax-M2.7を上回りました。しかし、AA-Omniscience評価ではV4 Proの幻覚率は94%、Flashは96%と高く、トークン消費量も多く、AI Index評価でProが1.9億、Flashが2.4億出力トークンを消費しました。これは、トークン単価が安くても総タスクコストが低いとは限らないことを示しています。

DeepSeek V4はHuawei Ascendチップとの互換性を実現し、輸出規制されたNVIDIA/CUDAチップへの依存を減らす重要な一歩となりました。DeepSeekは、Huawei Ascend 950スーパーノードが2026年下半期に大規模展開されれば、Proの価格が大幅に下がる可能性があると述べています。現在のAPI価格は、V4 Proが入力/出力百万トークンあたり$1.74/$3.48、Flashが$0.14/$0.28です。コミュニティからの反応は活発で、vLLM、Togethercompute、basetenなどによる迅速なサポートが提供されています。

コミュニティの議論では、V4がフロンティアに近いかどうか、真の貢献がモデル品質か長コンテキストシステム設計か、V4が「オープンな民主化」か複製困難かなど、いくつかの重要な論点が浮かび上がりました。多くの人は、実用的な採用においてFlashがProよりも重要である可能性があると指摘しています。また、DeepSeekはDeepEP V2とTileKernelsもリリースし、モデル最適化と並列化における進歩を示しました。TileKernelsは線形スケーリングを実現すると主張されています。

全体として、DSV4のリリースは、オープンウェイトモデルにおける長コンテキストとシステム設計の重要な進歩を示すとともに、中国のラボがAI分野で引き続き競争力を持っていることを浮き彫りにしました。最高のクローズドモデルにはまだ及ばないものの、V4シリーズはオープンソースコミュニティに新たな基準を打ち立てました。