2026-06-01 15:30 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

MiniMax M3：首个融合三种前沿能力的开源模型

MiniMax 发布了 M3 模型，这是首个将编码与智能体能力、稀疏注意力实现百万 Token 上下文、以及原生多模态融合的开源权重模型。模型在 SWE-Bench Pro 等基准测试中表现优异，API 已上线并提供首周五折优惠，权重和技术报告将在约 10 天内发布。

来源Hacker News AI作者: 44za12

MiniMax 官方正式发布了 MiniMax M3，这是一款具有开创性的开源权重模型，首次将编码与智能体能力、基于稀疏注意力的百万 Token 上下文窗口以及原生多模态能力融合于单一架构之中。这一组合在开源模型领域中尚属首次，标志着 MiniMax 在人工智能前沿技术上的重大突破。M3 在多项权威基准测试中取得了领先成绩，例如在 SWE-Bench Pro 上达到 59.0%，在 Terminal Bench 2.1 上获得 66.0%，在 SWE-fficiency 上获得 34.8%，在 KernelBench Hard 上达到 28.8%，以及在 MCP Atlas 上取得 74.2% 的成绩。这些分数充分展示了 M3 在编码和自动化任务中的强大能力，甚至可与一些封闭源前沿模型相媲美。

M3 的核心创新在于其稀疏注意力机制。传统上，大语言模型在处理长上下文时面临计算量呈二次增长的问题，而 MiniMax 的稀疏注意力技术通过选择性关注关键信息，使模型能够高效处理长达 100 万 Token 的上下文，远远超出传统稠密注意力模型的限制。这使得 M3 在处理大型代码库、多文件重构和复杂推理任务时具有显著优势。此外，M3 从零开始就原生支持多模态输入，包括文本、图像、音频等，无需任何额外的适配模块，这为开发者提供了更灵活的应用场景。

在服务方面，M3 的 API 已通过 platform.minimax.io 向公众开放。为了吸引早期用户，MiniMax 推出了限时优惠：在发布后的首七天内，标准使用（上下文长度不超过 512K）可享受 50% 的折扣。同时，MiniMax 还推出了新的代码开发平台 code.minimax.io，为开发者提供便捷的编程工具和集成环境。模型权重和技术报告预计将在约十天后正式公开发布，届时研究人员和开发者可以深入分析模型内部机制并自行部署。

社区对 M3 的反响十分热烈。许多开发者称赞其稀疏注意力突破和极具竞争力的定价策略，认为 M3 有可能改变编码和智能体工作流程的经济性，使得高质量的 AI 辅助开发更加普惠。例如，有评论指出“59% SWE-Bench Pro 加上 $0.30 的输入价格正是我期待已久的”，还有人表示“这个发布让每月 $200 的订阅看起来可有可无”。与此同时，也有用户提出了关注点，例如订阅计划变更、模型在创意写作方面的表现需要改进，以及关于开源模型安全性的讨论。总体而言，MiniMax M3 的发布不仅是技术上的重要进展，也引发了关于开源模型如何与封闭源模型竞争、以及如何平衡性能与成本的广泛讨论。