MiniMax M3 正式上線:長上下文 + 原生多模態,價格僅為 1/20
MiniMax 發佈旗艦模型 M3,具備超 50 萬 token 上下文窗口、原生多模態能力(文本、圖像、視頻),並採用創新的 MiniMax 稀疏注意力(MSA)架構,大幅提升推理效率。在 Fireworks 平台上,M3 價格僅為 M2.7 的 1/20,旨在為開源社區提供前沿水平的編碼和智能體能力。
MiniMax 正式發佈了其旗艦模型 M3,這是開源生態系統向前邁出的重要一步。M3 集強大的智能體能力、原生多模態輸入(文本、圖像和視頻)以及超過 500K token 的上下文窗口於一身,為開發者提供了前所未有的靈活性和性能。
在開源模型快速發展的背景下,M3 的出現具有重要意義。此前,Kimi K2.5 在 2026 年 1 月推動了原生多模態輸入的發展,而 DeepSeek V4 則在 4 月將上下文窗口擴展至 1M token,但僅限於文本輸入。M3 首次將長上下文擴展和多模態理解融合在一個模型中,標誌着開源模型能力的重大躍升。目前,M3 支持高達 500K token 的上下文,但 MiniMax 團隊正在努力在不久的將來提供完整的 1M token 窗口。
M3 的核心創新在於其 MiniMax 稀疏注意力(MSA)架構。與標準全注意力機制的指數級擴展不同,MSA 通過預過濾階段將 KV 緩存劃分為塊,有效上下文覆蓋率更高,從而實現了次二次方擴展。此外,MiniMax 在算子層面進行了優化,採用“KV outer gather Q”方法,使得每個 KV 塊只需從內存中獲取一次,從而實現了超過 4 倍於開源 Flash-Sparse-Attention 和 flash-moba 的速度提升。
在性能方面,M3 在第三方評測中表現卓越。根據 Artificial Analysis 的智能指數,M3 在所有開源模型中總體智能最高,甚至超過了包括 Opus 4.6 在內的一些閉源模型。在基準測試中,M3 在編碼、推理和多模態任務上均表現出色。
M3 專為實際編碼和智能體工作流而設計。MiniMax 開發了交互式用户模擬器框架,訓練模型處理多輪開發場景,如澄清需求、調整解決方案、切換任務和基於中間結果迭代。這使得 M3 非常適合長時間自主協作任務,如學術論文復現、內核優化和模型微調。
在定價方面,M3 在 Fireworks 平台上的價格僅為 M2.7 的 1/20,成為極具競爭力的選擇。對於已經使用 M2.7 的團隊,升級到 M3 可以獲得更長的上下文、智能體執行和多模態輸入能力,而成本幾乎不變。對於輸入 token 超過 512K 的調用,將適用更高的長上下文費率,適用於全倉庫代碼理解和超長文檔解析等任務。
開發者可以立即在 Fireworks 上通過無服務器方式使用 M3,也可以按需部署以獲得最佳性能和可預測的吞吐量。MiniMax M3 的發佈為開源社區帶來了前沿的編碼能力、長上下文支持和原生多模態理解,開啓了 AI 應用的新可能性。