2026-05-28站内改写

Mistral AI 發佈 Mistral Small 4：統一推理、多模態與編碼代理的開放模型

Mistral AI 推出 Mistral Small 4，這是一款採用 Apache 2.0 許可的開源模型，將推理、多模態和編碼代理功能整合為一體，支持可配置推理強度，性能顯著提升。

文章情報

工程師進階

要點

Mistral Small 4 統一了 Magistral、Pixtral 和 Devstral 的功能
Mixture of Experts 架構，119B 總參數，6B 活躍參數
支持可配置推理努力和 256k 上下文窗口
延遲降低 40%，吞吐量提升 3 倍

為甚麼重要

這條新聞值得關注，因為Mistral Small 4 統一了 Magistral、Pixtral 和 Devstral 的功能。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Mistral AI 今日宣佈推出 Mistral Small 4，這是 Mistral Small 系列的重要新版本。該模型首次將旗艦模型 Magistral（推理）、Pixtral（多模態）和 Devstral（編碼代理）的能力統一到一個通用模型中。用户無需再在快速指令模型、強大推理引擎或多模態助手之間做出選擇：一個模型即可提供所有功能，並支持可配置的推理強度，同時保持業界領先的效率。

Mistral Small 4 基於 Apache 2.0 許可證發佈，延續了 Mistral 對開放、可訪問、可定製 AI 的承諾。

Mistral Small 4 是一款混合模型，針對通用聊天、編碼、代理任務和複雜推理進行了優化。其架構同時支持文本和圖像輸入，適用於廣泛的應用場景。模型採用 Mixture of Experts（MoE）架構，擁有 128 個專家，每個 token 激活 4 個專家，從而實現高效擴展和專業化。總參數量達 119B，每個 token 活躍參數為 6B（包括嵌入和輸出層為 8B），上下文窗口為 256k，支持長文檔分析和交互。

性能方面，Mistral Small 4 相比 Mistral Small 3，端到端完成時間減少 40%，每秒請求數提升 3 倍。在多個基準測試中，Mistral Small 4 在推理開啓時取得了競爭性的分數，同時保持更短的輸出長度，降低了延遲和推理成本。

Mistral Small 4 專為開發者、企業和研究人員設計，適用於編碼自動化、通用聊天助手、文檔理解、數學與研究等任務。它已在 vLLM、llama.cpp、SGLang、Transformers 等平台上可用，並通過 NVIDIA NIM 提供優化推理。

通過統一指令、推理和多模態能力，Mistral Small 4 簡化了 AI 集成，使用户能夠用單一、適應性的工具處理更廣泛的任務，將開源 AI 的優勢帶入實際應用。