2026-06-03 06:21 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

微软的新MAI模型

微软发布了两个新的文本LLM：MAI-Thinking-1（350亿参数，推理模型）和MAI-Code-1-Flash（50亿参数，代码模型）。两者均采用经过许可的干净数据进行训练，避免了从第三方模型蒸馏。MAI-Thinking-1在盲测中表现优于Sonnet 4.6。MAI-Code-1-Flash已面向Visual Studio Code的GitHub Copilot个人用户推出。

来源Simon Willison's Weblog

微软在今天上午宣布了两款新的文本大语言模型（LLM）：MAI-Thinking-1 和 MAI-Code-1-Flash。MAI-Thinking-1 是一个拥有350亿参数的推理模型，目前仅向“选定的早期合作伙伴”提供。而 MAI-Code-1-Flash 是一个50亿参数的代码专用模型，旨在为 GitHub Copilot 和 Visual Studio Code 提供高性能和更低成本，现已面向 Visual Studio Code 中的 GitHub Copilot 个人用户推出。本文作者 Simon Willison 表示尚未有机会试用它们。

值得注意的是，微软发布的这两款模型参数量都相对较小，尤其是在当前大型模型访问成本高昂的背景下。微软声称，在盲测中，MAI-Thinking-1 的表现优于 Sonnet 4.6。考虑到作者经常在自己的笔记本电脑上运行比35B更大的模型，这一成绩令人印象深刻。这暗示着更小、更高效的模型可能在特定任务上具有竞争力，同时也可能降低推理成本。

微软还强调，MAI-Thinking-1 是从头开始训练的，使用了企业级、干净且经过商业许可的数据，没有从第三方模型进行蒸馏。同样，MAI-Code-1-Flash 也是端到端由微软构建，使用了干净且适当许可的数据。作者对此表示强烈兴趣，并猜测这是否是第一批没有使用未经许可的网络数据训练、但依然实用的代码专用模型。这一做法可能引发关于AI模型训练数据合法性和可持续性的更广泛讨论。

此外，微软此次发布正值AI行业对高质量、合规数据需求日益增长的时期。许多模型依赖于大规模抓取的网络数据，往往涉及版权问题。微软明确强调数据许可和清洁度，可能为行业树立新标准。MAI-Thinking-1 的推出尤其值得关注，因为它是一个推理模型，尽管参数较少，却能在盲测中胜过 Sonnet 4.6，这表明其架构或训练方法有所创新。

对于开发者而言，MAI-Code-1-Flash 的可用性意味着他们可以在日常编码中享受更快速、更低成本的代码补全和生成能力，尤其是在 Visual Studio Code 环境下。随着 GitHub Copilot 的普及，这一模型可能显著提升开发效率。未来，微软可能会将类似的轻量级模型扩展到其他应用场景。总体而言，这两款模型展示了微软在打造更高效、更负责任的AI方面的努力，同时也为模型选择提供了新的选项。