Mistral AI、推論・マルチモーダル・エージェント機能を統合した「Mistral Small 4」を公開
Mistral AIは、Apache 2.0ライセンスのオープンソースモデルMistral Small 4を発表。推論、マルチモーダル、コーディングエージェントの機能を統合し、設定可能な推論努力と効率向上を実現。
記事インテリジェンス
要点
- Mistral Small 4はMagistral、Pixtral、Devstralの機能を統合
- MoEアーキテクチャ、総パラメータ119B、アクティブ6B
- 設定可能な推論努力と256kコンテキストウィンドウ
- Mistral Small 3比でレイテンシ40%削減、スループット3倍
重要な理由
このニュースが重要なのは、Mistral Small 4はMagistral、Pixtral、Devstralの機能を統合ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Mistral AIは本日、Mistral Small 4を発表しました。これはMistral Smallファミリーの次期メジャーリリースです。Mistral Small 4は、推論用のMagistral、マルチモーダル用のPixtral、エージェントコーディング用のDevstralというフラッグシップモデルの機能を1つの汎用モデルに統合した初めてのMistralモデルです。Small 4により、ユーザーは高速インストラクトモデル、強力な推論エンジン、マルチモーダルアシスタントの選択を強いられることなく、1つのモデルでこれらすべてを利用でき、設定可能な推論努力と業界最高の効率を実現します。
Mistral Small 4はApache 2.0ライセンスでリリースされ、オープンでアクセス可能、カスタマイズ可能なAIへの取り組みを継続します。
Mistral Small 4は、汎用チャット、コーディング、エージェントタスク、複雑な推論に最適化されたハイブリッドモデルです。そのアーキテクチャはテキストと画像の両方の入力をサポートし、幅広いアプリケーションに柔軟に対応します。モデルはMixture of Experts(MoE)アーキテクチャを採用し、128のエキスパート、トークンあたり4つのアクティブエキスパートを持ち、効率的なスケーリングと専門化を可能にします。総パラメータ数は119B、トークンあたりのアクティブパラメータは6B(埋め込み層と出力層を含めると8B)、コンテキストウィンドウは256kで、長文の分析や対話をサポートします。
パフォーマンス面では、Mistral Small 4はMistral Small 3と比較して、エンドツーエンドの完了時間を40%短縮、1秒あたりのリクエスト数を3倍に向上させました。複数のベンチマークで、推論を有効にしたMistral Small 4は競争力のあるスコアを達成しつつ、より短い出力長を維持し、レイテンシと推論コストを削減しています。
Mistral Small 4は開発者、企業、研究者向けに設計されており、コーディング自動化、汎用チャットアシスタント、文書理解、数学・研究などのタスクに適しています。vLLM、llama.cpp、SGLang、Transformersなどのプラットフォームで利用可能で、NVIDIA NIMを通じて最適化された推論を提供します。
インストラクト、推論、マルチモーダル機能を統合することで、Mistral Small 4はAI統合を簡素化し、ユーザーが単一の適応可能なツールでより幅広いタスクに取り組めるようにし、オープンソースAIの利点を実世界のユースケースにもたらします。