AI News HubLIVE
站内改写

Mistral AI发布Mistral 3:开源前沿AI模型家族

Mistral AI宣布推出Mistral 3系列,包括前沿的Mistral Large 3(稀疏MoE,41B活跃/675B总参数)和三款Ministral 3边缘优化模型(3B、8B、14B)。所有模型均采用Apache 2.0许可证开源,支持多模态和多语言,并在多项基准测试中取得领先性能。

文章情报

工程师进阶

要点

  • Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部开源。
  • Mistral Large 3是稀疏MoE模型,在LMArena非推理开源模型中排名第二。
  • Ministral 3提供极佳性价比,推理变体在AIME '25上达到85%准确率。
  • 与NVIDIA、vLLM、Red Hat合作,优化部署并支持多平台。

为什么重要

这条新闻值得关注,因为Mistral 3系列包含Mistral Large 3和Ministral 3(3B、8B、14B),全部开源。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Mistral AI今日正式发布Mistral 3,这是其下一代大语言模型系列,涵盖从边缘设备到高性能计算场景的全面解决方案。新系列包括三款密集型小模型Ministral 3(参数规模分别为3B、8B和14B),以及旗舰级Mistral Large 3——一款采用稀疏混合专家(MoE)架构的模型,拥有41B活跃参数和675B总参数。所有模型均以Apache 2.0许可证开源,并提供多种压缩格式,旨在赋能开发者社区,通过分布式智能将AI交到用户手中。

Mistral Large 3是Mistral自Mixtral系列以来的首个MoE模型,在NVIDIA H200 GPU集群上从零开始训练,使用了3000颗GPU。经过后训练,该模型在通用提示上已达到与市场最佳指令调优开源权重模型持平的水平,同时展现出图像理解能力,并在多语言对话(非英语/中文)中达到顶尖性能。在LMArena排行榜上,Mistral Large 3在开源非推理模型类别中位列第二,在所有开源模型中排名第六。Mistral同时发布了基础版和指令调优版,为企业和开发者提供了强大的定制基础。未来还将推出推理版本。

针对边缘和本地使用场景,Mistral发布了Ministral 3系列,每个尺寸均提供基础版、指令版和推理版,均支持多模态和多语言,并采用Apache 2.0许可证。Ministral指令模型在性能上能与同类模型媲美,同时生成的token数量往往少一个数量级,实现了最佳性价比。其推理变体在AIME '25上,14B参数版本达到了85%的准确率。

Mistral与NVIDIA、vLLM和Red Hat深度合作,确保模型的高效部署。Mistral Large 3已提供NVFP4格式的检查点,可在Blackwell NVL72系统以及单节点8×A100或8×H100上通过vLLM高效运行。NVIDIA为完整的Mistral 3系列提供了TensorRT-LLM和SGLang的推理支持,针对Large 3的MoE架构集成了最新的Blackwell注意力与MoE内核,并支持预填充/解码分离服务与推测解码。Ministral模型则可在DGX Spark、RTX PC和Jetson设备上优化部署。

Mistral 3即日起可在Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face、Modal、IBM WatsonX、OpenRouter、Fireworks、Unsloth AI和Together AI等平台使用,并将很快登陆NVIDIA NIM和AWS SageMaker。此外,Mistral还提供定制模型训练服务,帮助企业微调或适配模型以满足特定需求。

Mistral AI强调,未来AI应建立在透明、可及和集体进步之上。Mistral 3系列在推理效率、多模态能力和实际应用方面开辟了新的可能性,邀请全球开发者共同探索和构建。