AI News HubLIVE
站内改写

Mistral AI釋出Mistral 3:開源前沿AI模型家族

Mistral AI宣佈推出Mistral 3系列,包括前沿的Mistral Large 3(稀疏MoE,41B活躍/675B總引數)和三款Ministral 3邊緣最佳化模型(3B、8B、14B)。所有模型均採用Apache 2.0許可證開源,支援多模態和多語言,並在多項基準測試中取得領先效能。

文章情報

工程師進階

要點

  • Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部開源。
  • Mistral Large 3是稀疏MoE模型,在LMArena非推理開源模型中排名第二。
  • Ministral 3提供極佳價效比,推理變體在AIME '25上達到85%準確率。
  • 與NVIDIA、vLLM、Red Hat合作,最佳化部署並支援多平臺。

為什麼重要

這條新聞值得關注,因為Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部開源。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Mistral AI今日正式釋出Mistral 3,這是其下一代大語言模型系列,涵蓋從邊緣裝置到高效能運算場景的全面解決方案。新系列包括三款密集型小模型Ministral 3(引數規模分別為3B、8B和14B),以及旗艦級Mistral Large 3——一款採用稀疏混合專家(MoE)架構的模型,擁有41B活躍引數和675B總引數。所有模型均以Apache 2.0許可證開源,並提供多種壓縮格式,旨在賦能開發者社群,透過分散式智慧將AI交到使用者手中。

Mistral Large 3是Mistral自Mixtral系列以來的首個MoE模型,在NVIDIA H200 GPU叢集上從零開始訓練,使用了3000顆GPU。經過後訓練,該模型在通用提示上已達到與市場最佳指令調優開源權重模型持平的水平,同時展現出影像理解能力,並在多語言對話(非英語/中文)中達到頂尖效能。在LMArena排行榜上,Mistral Large 3在開源非推理模型類別中位列第二,在所有開源模型中排名第六。Mistral同時釋出了基礎版和指令調優版,為企業和開發者提供了強大的定製基礎。未來還將推出推理版本。

針對邊緣和本地使用場景,Mistral釋出了Ministral 3系列,每個尺寸均提供基礎版、指令版和推理版,均支援多模態和多語言,並採用Apache 2.0許可證。Ministral指令模型在效能上能與同類模型媲美,同時生成的token數量往往少一個數量級,實現了最佳價效比。其推理變體在AIME '25上,14B引數版本達到了85%的準確率。

Mistral與NVIDIA、vLLM和Red Hat深度合作,確保模型的高效部署。Mistral Large 3已提供NVFP4格式的檢查點,可在Blackwell NVL72系統以及單節點8×A100或8×H100上透過vLLM高效執行。NVIDIA為完整的Mistral 3系列提供了TensorRT-LLM和SGLang的推理支援,針對Large 3的MoE架構整合了最新的Blackwell注意力與MoE核心,並支援預填充/解碼分離服務與推測解碼。Ministral模型則可在DGX Spark、RTX PC和Jetson裝置上最佳化部署。

Mistral 3即日起可在Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face、Modal、IBM WatsonX、OpenRouter、Fireworks、Unsloth AI和Together AI等平臺使用,並將很快登陸NVIDIA NIM和AWS SageMaker。此外,Mistral還提供定製模型訓練服務,幫助企業微調或適配模型以滿足特定需求。

Mistral AI強調,未來AI應建立在透明、可及和集體進步之上。Mistral 3系列在推理效率、多模態能力和實際應用方面開闢了新的可能性,邀請全球開發者共同探索和構建。