2026-06-13 13:36 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

MiniMax M3 正式上線：長上下文 + 原生多模態，價格僅為 1/20

MiniMax 發佈旗艦模型 M3，具備超 50 萬 token 上下文窗口、原生多模態能力（文本、圖像、視頻），並採用創新的 MiniMax 稀疏注意力（MSA）架構，大幅提升推理效率。在 Fireworks 平台上，M3 價格僅為 M2.7 的 1/20，旨在為開源社區提供前沿水平的編碼和智能體能力。

來源Fireworks AI Blog

MiniMax 正式發佈了其旗艦模型 M3，這是開源生態系統向前邁出的重要一步。M3 集強大的智能體能力、原生多模態輸入（文本、圖像和視頻）以及超過 500K token 的上下文窗口於一身，為開發者提供了前所未有的靈活性和性能。

在開源模型快速發展的背景下，M3 的出現具有重要意義。此前，Kimi K2.5 在 2026 年 1 月推動了原生多模態輸入的發展，而 DeepSeek V4 則在 4 月將上下文窗口擴展至 1M token，但僅限於文本輸入。M3 首次將長上下文擴展和多模態理解融合在一個模型中，標誌着開源模型能力的重大躍升。目前，M3 支持高達 500K token 的上下文，但 MiniMax 團隊正在努力在不久的將來提供完整的 1M token 窗口。

M3 的核心創新在於其 MiniMax 稀疏注意力（MSA）架構。與標準全注意力機制的指數級擴展不同，MSA 通過預過濾階段將 KV 緩存劃分為塊，有效上下文覆蓋率更高，從而實現了次二次方擴展。此外，MiniMax 在算子層面進行了優化，採用“KV outer gather Q”方法，使得每個 KV 塊只需從內存中獲取一次，從而實現了超過 4 倍於開源 Flash-Sparse-Attention 和 flash-moba 的速度提升。

在性能方面，M3 在第三方評測中表現卓越。根據 Artificial Analysis 的智能指數，M3 在所有開源模型中總體智能最高，甚至超過了包括 Opus 4.6 在內的一些閉源模型。在基準測試中，M3 在編碼、推理和多模態任務上均表現出色。

M3 專為實際編碼和智能體工作流而設計。MiniMax 開發了交互式用户模擬器框架，訓練模型處理多輪開發場景，如澄清需求、調整解決方案、切換任務和基於中間結果迭代。這使得 M3 非常適合長時間自主協作任務，如學術論文復現、內核優化和模型微調。

在定價方面，M3 在 Fireworks 平台上的價格僅為 M2.7 的 1/20，成為極具競爭力的選擇。對於已經使用 M2.7 的團隊，升級到 M3 可以獲得更長的上下文、智能體執行和多模態輸入能力，而成本幾乎不變。對於輸入 token 超過 512K 的調用，將適用更高的長上下文費率，適用於全倉庫代碼理解和超長文檔解析等任務。

開發者可以立即在 Fireworks 上通過無服務器方式使用 M3，也可以按需部署以獲得最佳性能和可預測的吞吐量。MiniMax M3 的發佈為開源社區帶來了前沿的編碼能力、長上下文支持和原生多模態理解，開啓了 AI 應用的新可能性。