2026-06-02 04:40 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

MiniMax 發佈 M3 模型：採用 MSA 架構，支持 100 萬 Token 上下文、原生多模態與智能編程

MiniMax 於 2026 年 6 月 1 日正式發佈 M3 模型，引入 MiniMax 稀疏注意力（MSA）架構，支持 100 萬 Token 上下文窗口、原生圖像/視頻輸入及桌面操作，API 已上線。

來源MarkTechPost作者: Asif Razzaq

MiniMax 於 2026 年 6 月 1 日正式發佈 MiniMax M3 模型。該模型採用全新的 MSA（MiniMax 稀疏注意力）架構，支持 100 萬 Token 的上下文窗口，並原生支持圖像、視頻輸入以及桌面電腦操作。API 已上線，可通過 MiniMax Code、MiniMax Token Plan 和 MiniMax API 使用。

M3 是 M2.7 之後的下一代模型。MiniMax 將其定位為首個將前沿編碼性能、100 萬 Token 上下文窗口與原生多模態輸入結合於單一架構的開源權重模型。模型權重和技術報告將在發佈後 10 天內公開。

MSA 架構 MSA 通過“KV 外部聚合 Q”的方式，將 KV 緩存分塊，每個塊只讀取一次，內存訪問連續。相比全注意力機制，在 100 萬 Token 上下文下，每個 Token 的計算量僅為上一代 M2 模型的 1/20，預填充階段速度提升 9 倍以上，解碼階段速度提升 15 倍以上。與 Flash-Sparse-Attention 等開源實現相比，速度提升超過 4 倍。

編碼與智能基準 MiniMax 報告了以下基準測試結果：SWE-Bench Pro 得分 59.0%，超越 GPT-5.5 和 Gemini 3.1 Pro，接近 Opus 4.7；Terminal-Bench 2.1 得分 66.0%；SWE-fficiency 得分 34.8%；KernelBench Hard 得分 28.8%；MCP Atlas 得分 74.2%；Claw-Eval 在評估模型中得分最高；SVG-Bench 超越 Opus 4.7；OmniDocBench 得分高於 Gemini 3.1 Pro；OSWorld-Verified 計算機使用任務完成率達 70.06%。

MiniMax 還構建了交互式用户模擬框架，用於多輪開發者協作訓練和評估。

原生多模態 M3 從訓練的第一步起就進行混合模態訓練，文本、圖像和視頻同時訓練。MiniMax 報告稱，交錯數據（文本與圖像自然混合）對模型性能的影響比通常認為的更關鍵。訓練數據規模達到約 100 萬億 Token。

實際任務示例

論文復現：M3 自主運行近 12 小時，復現了 ICLR 2025 最佳論文實驗，產生 18 次提交和 23 張實驗圖。
CUDA 內核優化：M3 在約 24 小時內優化了 FP8 GEMM 內核，將 Hopper FP8 峯值利用率從 7.6% 提升至 71.3%（9.4 倍加速）。
PostTrainBench：M3 在 12 小時內自主完成數據合成、訓練、評估和迭代，得分為 0.37。

MiniMax Code MiniMax Code 是基於 M3 構建的智能代理產品，支持多智能體團隊、生產者+驗證者循環和計算機使用。

API 與定價 M3 API 已在 platform.minimax.io 上線。輸入長度不超過 512K Token 時按標準費率計費，超過 512K 則按長上下文費率計費。提供思考模式切換。Token Plan 套餐從每月 20 美元（約 17 億 Token）起。