MiniMax M3:首个融合三种前沿能力的开源模型
MiniMax 发布了 M3 模型,这是首个将编码与智能体能力、稀疏注意力实现百万 Token 上下文、以及原生多模态融合的开源权重模型。模型在 SWE-Bench Pro 等基准测试中表现优异,API 已上线并提供首周五折优惠,权重和技术报告将在约 10 天内发布。
MiniMax 官方正式发布了 MiniMax M3,这是一款具有开创性的开源权重模型,首次将编码与智能体能力、基于稀疏注意力的百万 Token 上下文窗口以及原生多模态能力融合于单一架构之中。这一组合在开源模型领域中尚属首次,标志着 MiniMax 在人工智能前沿技术上的重大突破。M3 在多项权威基准测试中取得了领先成绩,例如在 SWE-Bench Pro 上达到 59.0%,在 Terminal Bench 2.1 上获得 66.0%,在 SWE-fficiency 上获得 34.8%,在 KernelBench Hard 上达到 28.8%,以及在 MCP Atlas 上取得 74.2% 的成绩。这些分数充分展示了 M3 在编码和自动化任务中的强大能力,甚至可与一些封闭源前沿模型相媲美。
M3 的核心创新在于其稀疏注意力机制。传统上,大语言模型在处理长上下文时面临计算量呈二次增长的问题,而 MiniMax 的稀疏注意力技术通过选择性关注关键信息,使模型能够高效处理长达 100 万 Token 的上下文,远远超出传统稠密注意力模型的限制。这使得 M3 在处理大型代码库、多文件重构和复杂推理任务时具有显著优势。此外,M3 从零开始就原生支持多模态输入,包括文本、图像、音频等,无需任何额外的适配模块,这为开发者提供了更灵活的应用场景。
在服务方面,M3 的 API 已通过 platform.minimax.io 向公众开放。为了吸引早期用户,MiniMax 推出了限时优惠:在发布后的首七天内,标准使用(上下文长度不超过 512K)可享受 50% 的折扣。同时,MiniMax 还推出了新的代码开发平台 code.minimax.io,为开发者提供便捷的编程工具和集成环境。模型权重和技术报告预计将在约十天后正式公开发布,届时研究人员和开发者可以深入分析模型内部机制并自行部署。
社区对 M3 的反响十分热烈。许多开发者称赞其稀疏注意力突破和极具竞争力的定价策略,认为 M3 有可能改变编码和智能体工作流程的经济性,使得高质量的 AI 辅助开发更加普惠。例如,有评论指出“59% SWE-Bench Pro 加上 $0.30 的输入价格正是我期待已久的”,还有人表示“这个发布让每月 $200 的订阅看起来可有可无”。与此同时,也有用户提出了关注点,例如订阅计划变更、模型在创意写作方面的表现需要改进,以及关于开源模型安全性的讨论。总体而言,MiniMax M3 的发布不仅是技术上的重要进展,也引发了关于开源模型如何与封闭源模型竞争、以及如何平衡性能与成本的广泛讨论。