Mistral AIがMistral 3を発表:オープンソースの最先端AIモデルファミリー
Mistral AIは、Mistral 3シリーズを発表しました。これには、Mistral Large 3(スパースMoE、アクティブ41B/総パラメータ675B)と、エッジ最適化されたMinistral 3モデル(3B、8B、14B)が含まれ、すべてApache 2.0ライセンスでオープンソース化され、マルチモーダルおよび多言語機能を備えています。
記事インテリジェンス
要点
- Mistral 3シリーズには、Mistral Large 3とMinistral 3(3B、8B、14B)が含まれ、すべてオープンソース。
- Mistral Large 3はスパースMoEモデルで、LMArenaの非推論OSSリーダーボードで2位。
- Ministral 3はコストパフォーマンスに優れ、推論バリアントはAIME '25で85%の精度を達成。
- NVIDIA、vLLM、Red Hatとの連携により、多様なプラットフォームでの効率的なデプロイを実現。
重要な理由
このニュースが重要なのは、Mistral 3シリーズには、Mistral Large 3とMinistral 3(3B、8B、14B)が含まれ、すべてオープンソースためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Mistral AIは本日、次世代の大規模言語モデルシリーズ「Mistral 3」を発表しました。このシリーズは、エッジデバイスからハイパフォーマンスコンピューティングまで、幅広いユースケースをカバーします。新シリーズには、3つの高密度小型モデルMinistral 3(パラメータサイズ3B、8B、14B)と、フラッグシップモデルMistral Large 3が含まれます。Mistral Large 3はスパース混合専門家(MoE)アーキテクチャを採用し、アクティブパラメータ41B、総パラメータ675Bを誇ります。すべてのモデルはApache 2.0ライセンスで公開され、多様な圧縮フォーマットで提供され、開発者コミュニティを強化し、分散インテリジェンスを通じてAIをユーザーの手に届けることを目指しています。
Mistral Large 3は、MistralにとってMixtralシリーズ以来初のMoEモデルであり、NVIDIA H200 GPU 3000台を使用してゼロからトレーニングされました。ポストトレーニング後、このモデルは汎用プロンプトにおいて市場で最高のインストラクションチューニング済みオープンウェイトモデルと同等の性能を達成し、画像理解能力と多言語会話(英語/中国語以外)でトップクラスの性能を示しています。LMArenaリーダーボードでは、Mistral Large 3はオープンソース非推論モデルカテゴリで2位、全オープンソースモデル中6位にランクインしました。Mistralはベース版とインストラクションチューニング版の両方を公開し、企業や開発者に強力なカスタマイズ基盤を提供します。今後、推論バージョンもリリース予定です。
エッジおよびローカルユースケース向けに、MistralはMinistral 3シリーズをリリースしました。各サイズでベース版、インストラクション版、推論版が提供され、すべてマルチモーダルおよび多言語機能を備え、Apache 2.0ライセンスのもとで公開されます。Ministralインストラクションモデルは、同等クラスのモデルと同等以上の性能を発揮しながら、生成トークン数が1桁少ないことが多く、最高のコストパフォーマンスを実現しています。推論バリアントはAIME '25で14B版が85%の精度を達成しました。
MistralはNVIDIA、vLLM、Red Hatと緊密に協力し、モデルの効率的なデプロイを実現しました。Mistral Large 3はNVFP4フォーマットのチェックポイントが提供され、Blackwell NVL72システムや単一ノードの8×A100/8×H100上でvLLMを通じて効率的に実行できます。NVIDIAはMistral 3ファミリー全体に対してTensorRT-LLMおよびSGLangの推論サポートを提供し、Large 3のMoEアーキテクチャ向けに最新のBlackwellアテンションおよびMoEカーネルを統合し、プリフィル/デコード分離サービスと投機的デコードをサポートしています。MinistralモデルはDGX Spark、RTX PC、Jetsonデバイス上で最適化されたデプロイが可能です。
Mistral 3は本日より、Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face、Modal、IBM WatsonX、OpenRouter、Fireworks、Unsloth AI、Together AIで利用可能であり、近日中にNVIDIA NIMおよびAWS SageMakerでも提供開始予定です。さらに、Mistralはカスタムモデルトレーニングサービスを提供し、企業が特定のニーズに合わせてモデルを微調整または完全に適応させることができます。
Mistral AIは、AIの未来は透明性、アクセシビリティ、そして集団的な進歩の上に構築されるべきだと強調しています。Mistral 3シリーズは、推論効率、マルチモーダル能力、実世界のアプリケーションにおいて新たな可能性を切り開き、世界中の開発者を探索と構築に招待します。