AI News HubLIVE
站内改写

Mistral AI 發佈 Mistral Small 4:統一推理、多模態與編碼代理的開放模型

Mistral AI 推出 Mistral Small 4,這是一款採用 Apache 2.0 許可的開源模型,將推理、多模態和編碼代理功能整合為一體,支持可配置推理強度,性能顯著提升。

文章情報

工程師進階

要點

  • Mistral Small 4 統一了 Magistral、Pixtral 和 Devstral 的功能
  • Mixture of Experts 架構,119B 總參數,6B 活躍參數
  • 支持可配置推理努力和 256k 上下文窗口
  • 延遲降低 40%,吞吐量提升 3 倍

為甚麼重要

這條新聞值得關注,因為Mistral Small 4 統一了 Magistral、Pixtral 和 Devstral 的功能。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Mistral AI 今日宣佈推出 Mistral Small 4,這是 Mistral Small 系列的重要新版本。該模型首次將旗艦模型 Magistral(推理)、Pixtral(多模態)和 Devstral(編碼代理)的能力統一到一個通用模型中。用户無需再在快速指令模型、強大推理引擎或多模態助手之間做出選擇:一個模型即可提供所有功能,並支持可配置的推理強度,同時保持業界領先的效率。

Mistral Small 4 基於 Apache 2.0 許可證發佈,延續了 Mistral 對開放、可訪問、可定製 AI 的承諾。

Mistral Small 4 是一款混合模型,針對通用聊天、編碼、代理任務和複雜推理進行了優化。其架構同時支持文本和圖像輸入,適用於廣泛的應用場景。模型採用 Mixture of Experts(MoE)架構,擁有 128 個專家,每個 token 激活 4 個專家,從而實現高效擴展和專業化。總參數量達 119B,每個 token 活躍參數為 6B(包括嵌入和輸出層為 8B),上下文窗口為 256k,支持長文檔分析和交互。

性能方面,Mistral Small 4 相比 Mistral Small 3,端到端完成時間減少 40%,每秒請求數提升 3 倍。在多個基準測試中,Mistral Small 4 在推理開啓時取得了競爭性的分數,同時保持更短的輸出長度,降低了延遲和推理成本。

Mistral Small 4 專為開發者、企業和研究人員設計,適用於編碼自動化、通用聊天助手、文檔理解、數學與研究等任務。它已在 vLLM、llama.cpp、SGLang、Transformers 等平台上可用,並通過 NVIDIA NIM 提供優化推理。

通過統一指令、推理和多模態能力,Mistral Small 4 簡化了 AI 集成,使用户能夠用單一、適應性的工具處理更廣泛的任務,將開源 AI 的優勢帶入實際應用。