MiniMax M3:首個融合三種前沿能力的開源模型
MiniMax 發佈了 M3 模型,這是首個將編碼與智能體能力、稀疏注意力實現百萬 Token 上下文、以及原生多模態融合的開源權重模型。模型在 SWE-Bench Pro 等基準測試中表現優異,API 已上線並提供首週五折優惠,權重和技術報告將在約 10 天內發佈。
MiniMax 官方正式發佈了 MiniMax M3,這是一款具有開創性的開源權重模型,首次將編碼與智能體能力、基於稀疏注意力的百萬 Token 上下文窗口以及原生多模態能力融合於單一架構之中。這一組合在開源模型領域中尚屬首次,標誌着 MiniMax 在人工智能前沿技術上的重大突破。M3 在多項權威基準測試中取得了領先成績,例如在 SWE-Bench Pro 上達到 59.0%,在 Terminal Bench 2.1 上獲得 66.0%,在 SWE-fficiency 上獲得 34.8%,在 KernelBench Hard 上達到 28.8%,以及在 MCP Atlas 上取得 74.2% 的成績。這些分數充分展示了 M3 在編碼和自動化任務中的強大能力,甚至可與一些封閉源前沿模型相媲美。
M3 的核心創新在於其稀疏注意力機制。傳統上,大語言模型在處理長上下文時面臨計算量呈二次增長的問題,而 MiniMax 的稀疏注意力技術通過選擇性關注關鍵信息,使模型能夠高效處理長達 100 萬 Token 的上下文,遠遠超出傳統稠密注意力模型的限制。這使得 M3 在處理大型代碼庫、多文件重構和複雜推理任務時具有顯著優勢。此外,M3 從零開始就原生支持多模態輸入,包括文本、圖像、音頻等,無需任何額外的適配模塊,這為開發者提供了更靈活的應用場景。
在服務方面,M3 的 API 已通過 platform.minimax.io 向公眾開放。為了吸引早期用户,MiniMax 推出了限時優惠:在發佈後的首七天內,標準使用(上下文長度不超過 512K)可享受 50% 的折扣。同時,MiniMax 還推出了新的代碼開發平台 code.minimax.io,為開發者提供便捷的編程工具和集成環境。模型權重和技術報告預計將在約十天後正式公開發布,屆時研究人員和開發者可以深入分析模型內部機制並自行部署。
社區對 M3 的反響十分熱烈。許多開發者稱讚其稀疏注意力突破和極具競爭力的定價策略,認為 M3 有可能改變編碼和智能體工作流程的經濟性,使得高質量的 AI 輔助開發更加普惠。例如,有評論指出“59% SWE-Bench Pro 加上 $0.30 的輸入價格正是我期待已久的”,還有人表示“這個發佈讓每月 $200 的訂閲看起來可有可無”。與此同時,也有用户提出了關注點,例如訂閲計劃變更、模型在創意寫作方面的表現需要改進,以及關於開源模型安全性的討論。總體而言,MiniMax M3 的發佈不僅是技術上的重要進展,也引發了關於開源模型如何與封閉源模型競爭、以及如何平衡性能與成本的廣泛討論。