2026-06-01 15:30 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

MiniMax M3：首個融合三種前沿能力的開源模型

MiniMax 發佈了 M3 模型，這是首個將編碼與智能體能力、稀疏注意力實現百萬 Token 上下文、以及原生多模態融合的開源權重模型。模型在 SWE-Bench Pro 等基準測試中表現優異，API 已上線並提供首週五折優惠，權重和技術報告將在約 10 天內發佈。

來源Hacker News AI作者: 44za12

MiniMax 官方正式發佈了 MiniMax M3，這是一款具有開創性的開源權重模型，首次將編碼與智能體能力、基於稀疏注意力的百萬 Token 上下文窗口以及原生多模態能力融合於單一架構之中。這一組合在開源模型領域中尚屬首次，標誌着 MiniMax 在人工智能前沿技術上的重大突破。M3 在多項權威基準測試中取得了領先成績，例如在 SWE-Bench Pro 上達到 59.0%，在 Terminal Bench 2.1 上獲得 66.0%，在 SWE-fficiency 上獲得 34.8%，在 KernelBench Hard 上達到 28.8%，以及在 MCP Atlas 上取得 74.2% 的成績。這些分數充分展示了 M3 在編碼和自動化任務中的強大能力，甚至可與一些封閉源前沿模型相媲美。

M3 的核心創新在於其稀疏注意力機制。傳統上，大語言模型在處理長上下文時面臨計算量呈二次增長的問題，而 MiniMax 的稀疏注意力技術通過選擇性關注關鍵信息，使模型能夠高效處理長達 100 萬 Token 的上下文，遠遠超出傳統稠密注意力模型的限制。這使得 M3 在處理大型代碼庫、多文件重構和複雜推理任務時具有顯著優勢。此外，M3 從零開始就原生支持多模態輸入，包括文本、圖像、音頻等，無需任何額外的適配模塊，這為開發者提供了更靈活的應用場景。

在服務方面，M3 的 API 已通過 platform.minimax.io 向公眾開放。為了吸引早期用户，MiniMax 推出了限時優惠：在發佈後的首七天內，標準使用（上下文長度不超過 512K）可享受 50% 的折扣。同時，MiniMax 還推出了新的代碼開發平台 code.minimax.io，為開發者提供便捷的編程工具和集成環境。模型權重和技術報告預計將在約十天後正式公開發布，屆時研究人員和開發者可以深入分析模型內部機制並自行部署。

社區對 M3 的反響十分熱烈。許多開發者稱讚其稀疏注意力突破和極具競爭力的定價策略，認為 M3 有可能改變編碼和智能體工作流程的經濟性，使得高質量的 AI 輔助開發更加普惠。例如，有評論指出“59% SWE-Bench Pro 加上 $0.30 的輸入價格正是我期待已久的”，還有人表示“這個發佈讓每月 $200 的訂閲看起來可有可無”。與此同時，也有用户提出了關注點，例如訂閲計劃變更、模型在創意寫作方面的表現需要改進，以及關於開源模型安全性的討論。總體而言，MiniMax M3 的發佈不僅是技術上的重要進展，也引發了關於開源模型如何與封閉源模型競爭、以及如何平衡性能與成本的廣泛討論。