AI News HubLIVE
站内改写

Mistral AI 发布 Mistral Small 4:统一推理、多模态与编码代理的开放模型

Mistral AI 推出 Mistral Small 4,这是一款采用 Apache 2.0 许可的开源模型,将推理、多模态和编码代理功能整合为一体,支持可配置推理强度,性能显著提升。

文章情报

工程师进阶

要点

  • Mistral Small 4 统一了 Magistral、Pixtral 和 Devstral 的功能
  • Mixture of Experts 架构,119B 总参数,6B 活跃参数
  • 支持可配置推理努力和 256k 上下文窗口
  • 延迟降低 40%,吞吐量提升 3 倍

为什么重要

这条新闻值得关注,因为Mistral Small 4 统一了 Magistral、Pixtral 和 Devstral 的功能。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Mistral AI 今日宣布推出 Mistral Small 4,这是 Mistral Small 系列的重要新版本。该模型首次将旗舰模型 Magistral(推理)、Pixtral(多模态)和 Devstral(编码代理)的能力统一到一个通用模型中。用户无需再在快速指令模型、强大推理引擎或多模态助手之间做出选择:一个模型即可提供所有功能,并支持可配置的推理强度,同时保持业界领先的效率。

Mistral Small 4 基于 Apache 2.0 许可证发布,延续了 Mistral 对开放、可访问、可定制 AI 的承诺。

Mistral Small 4 是一款混合模型,针对通用聊天、编码、代理任务和复杂推理进行了优化。其架构同时支持文本和图像输入,适用于广泛的应用场景。模型采用 Mixture of Experts(MoE)架构,拥有 128 个专家,每个 token 激活 4 个专家,从而实现高效扩展和专业化。总参数量达 119B,每个 token 活跃参数为 6B(包括嵌入和输出层为 8B),上下文窗口为 256k,支持长文档分析和交互。

性能方面,Mistral Small 4 相比 Mistral Small 3,端到端完成时间减少 40%,每秒请求数提升 3 倍。在多个基准测试中,Mistral Small 4 在推理开启时取得了竞争性的分数,同时保持更短的输出长度,降低了延迟和推理成本。

Mistral Small 4 专为开发者、企业和研究人员设计,适用于编码自动化、通用聊天助手、文档理解、数学与研究等任务。它已在 vLLM、llama.cpp、SGLang、Transformers 等平台上可用,并通过 NVIDIA NIM 提供优化推理。

通过统一指令、推理和多模态能力,Mistral Small 4 简化了 AI 集成,使用户能够用单一、适应性的工具处理更广泛的任务,将开源 AI 的优势带入实际应用。