2026-05-28站内改写

Mistral AI 发布 Mistral Small 4：统一推理、多模态与编码代理的开放模型

Mistral AI 推出 Mistral Small 4，这是一款采用 Apache 2.0 许可的开源模型，将推理、多模态和编码代理功能整合为一体，支持可配置推理强度，性能显著提升。

文章情报

工程师进阶

要点

Mistral Small 4 统一了 Magistral、Pixtral 和 Devstral 的功能
Mixture of Experts 架构，119B 总参数，6B 活跃参数
支持可配置推理努力和 256k 上下文窗口
延迟降低 40%，吞吐量提升 3 倍

为什么重要

这条新闻值得关注，因为Mistral Small 4 统一了 Magistral、Pixtral 和 Devstral 的功能。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Mistral AI 今日宣布推出 Mistral Small 4，这是 Mistral Small 系列的重要新版本。该模型首次将旗舰模型 Magistral（推理）、Pixtral（多模态）和 Devstral（编码代理）的能力统一到一个通用模型中。用户无需再在快速指令模型、强大推理引擎或多模态助手之间做出选择：一个模型即可提供所有功能，并支持可配置的推理强度，同时保持业界领先的效率。

Mistral Small 4 基于 Apache 2.0 许可证发布，延续了 Mistral 对开放、可访问、可定制 AI 的承诺。

Mistral Small 4 是一款混合模型，针对通用聊天、编码、代理任务和复杂推理进行了优化。其架构同时支持文本和图像输入，适用于广泛的应用场景。模型采用 Mixture of Experts（MoE）架构，拥有 128 个专家，每个 token 激活 4 个专家，从而实现高效扩展和专业化。总参数量达 119B，每个 token 活跃参数为 6B（包括嵌入和输出层为 8B），上下文窗口为 256k，支持长文档分析和交互。

性能方面，Mistral Small 4 相比 Mistral Small 3，端到端完成时间减少 40%，每秒请求数提升 3 倍。在多个基准测试中，Mistral Small 4 在推理开启时取得了竞争性的分数，同时保持更短的输出长度，降低了延迟和推理成本。

Mistral Small 4 专为开发者、企业和研究人员设计，适用于编码自动化、通用聊天助手、文档理解、数学与研究等任务。它已在 vLLM、llama.cpp、SGLang、Transformers 等平台上可用，并通过 NVIDIA NIM 提供优化推理。

通过统一指令、推理和多模态能力，Mistral Small 4 简化了 AI 集成，使用户能够用单一、适应性的工具处理更广泛的任务，将开源 AI 的优势带入实际应用。