AI News HubLIVE
站内改写

Mistral AI發佈Mistral 3:開源前沿AI模型家族

Mistral AI宣佈推出Mistral 3系列,包括前沿的Mistral Large 3(稀疏MoE,41B活躍/675B總參數)和三款Ministral 3邊緣優化模型(3B、8B、14B)。所有模型均採用Apache 2.0許可證開源,支持多模態和多語言,並在多項基準測試中取得領先性能。

文章情報

工程師進階

要點

  • Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部開源。
  • Mistral Large 3是稀疏MoE模型,在LMArena非推理開源模型中排名第二。
  • Ministral 3提供極佳性價比,推理變體在AIME '25上達到85%準確率。
  • 與NVIDIA、vLLM、Red Hat合作,優化部署並支持多平台。

為甚麼重要

這條新聞值得關注,因為Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部開源。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Mistral AI今日正式發佈Mistral 3,這是其下一代大語言模型系列,涵蓋從邊緣設備到高性能計算場景的全面解決方案。新系列包括三款密集型小模型Ministral 3(參數規模分別為3B、8B和14B),以及旗艦級Mistral Large 3——一款採用稀疏混合專家(MoE)架構的模型,擁有41B活躍參數和675B總參數。所有模型均以Apache 2.0許可證開源,並提供多種壓縮格式,旨在賦能開發者社區,通過分佈式智能將AI交到用户手中。

Mistral Large 3是Mistral自Mixtral系列以來的首個MoE模型,在NVIDIA H200 GPU集羣上從零開始訓練,使用了3000顆GPU。經過後訓練,該模型在通用提示上已達到與市場最佳指令調優開源權重模型持平的水平,同時展現出圖像理解能力,並在多語言對話(非英語/中文)中達到頂尖性能。在LMArena排行榜上,Mistral Large 3在開源非推理模型類別中位列第二,在所有開源模型中排名第六。Mistral同時發佈了基礎版和指令調優版,為企業和開發者提供了強大的定製基礎。未來還將推出推理版本。

針對邊緣和本地使用場景,Mistral發佈了Ministral 3系列,每個尺寸均提供基礎版、指令版和推理版,均支持多模態和多語言,並採用Apache 2.0許可證。Ministral指令模型在性能上能與同類模型媲美,同時生成的token數量往往少一個數量級,實現了最佳性價比。其推理變體在AIME '25上,14B參數版本達到了85%的準確率。

Mistral與NVIDIA、vLLM和Red Hat深度合作,確保模型的高效部署。Mistral Large 3已提供NVFP4格式的檢查點,可在Blackwell NVL72系統以及單節點8×A100或8×H100上通過vLLM高效運行。NVIDIA為完整的Mistral 3系列提供了TensorRT-LLM和SGLang的推理支持,針對Large 3的MoE架構集成了最新的Blackwell注意力與MoE內核,並支持預填充/解碼分離服務與推測解碼。Ministral模型則可在DGX Spark、RTX PC和Jetson設備上優化部署。

Mistral 3即日起可在Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face、Modal、IBM WatsonX、OpenRouter、Fireworks、Unsloth AI和Together AI等平台使用,並將很快登陸NVIDIA NIM和AWS SageMaker。此外,Mistral還提供定製模型訓練服務,幫助企業微調或適配模型以滿足特定需求。

Mistral AI強調,未來AI應建立在透明、可及和集體進步之上。Mistral 3系列在推理效率、多模態能力和實際應用方面開闢了新的可能性,邀請全球開發者共同探索和構建。