微软的新MAI模型
微软发布了两个新的文本LLM:MAI-Thinking-1(350亿参数,推理模型)和MAI-Code-1-Flash(50亿参数,代码模型)。两者均采用经过许可的干净数据进行训练,避免了从第三方模型蒸馏。MAI-Thinking-1在盲测中表现优于Sonnet 4.6。MAI-Code-1-Flash已面向Visual Studio Code的GitHub Copilot个人用户推出。
微软在今天上午宣布了两款新的文本大语言模型(LLM):MAI-Thinking-1 和 MAI-Code-1-Flash。MAI-Thinking-1 是一个拥有350亿参数的推理模型,目前仅向“选定的早期合作伙伴”提供。而 MAI-Code-1-Flash 是一个50亿参数的代码专用模型,旨在为 GitHub Copilot 和 Visual Studio Code 提供高性能和更低成本,现已面向 Visual Studio Code 中的 GitHub Copilot 个人用户推出。本文作者 Simon Willison 表示尚未有机会试用它们。
值得注意的是,微软发布的这两款模型参数量都相对较小,尤其是在当前大型模型访问成本高昂的背景下。微软声称,在盲测中,MAI-Thinking-1 的表现优于 Sonnet 4.6。考虑到作者经常在自己的笔记本电脑上运行比35B更大的模型,这一成绩令人印象深刻。这暗示着更小、更高效的模型可能在特定任务上具有竞争力,同时也可能降低推理成本。
微软还强调,MAI-Thinking-1 是从头开始训练的,使用了企业级、干净且经过商业许可的数据,没有从第三方模型进行蒸馏。同样,MAI-Code-1-Flash 也是端到端由微软构建,使用了干净且适当许可的数据。作者对此表示强烈兴趣,并猜测这是否是第一批没有使用未经许可的网络数据训练、但依然实用的代码专用模型。这一做法可能引发关于AI模型训练数据合法性和可持续性的更广泛讨论。
此外,微软此次发布正值AI行业对高质量、合规数据需求日益增长的时期。许多模型依赖于大规模抓取的网络数据,往往涉及版权问题。微软明确强调数据许可和清洁度,可能为行业树立新标准。MAI-Thinking-1 的推出尤其值得关注,因为它是一个推理模型,尽管参数较少,却能在盲测中胜过 Sonnet 4.6,这表明其架构或训练方法有所创新。
对于开发者而言,MAI-Code-1-Flash 的可用性意味着他们可以在日常编码中享受更快速、更低成本的代码补全和生成能力,尤其是在 Visual Studio Code 环境下。随着 GitHub Copilot 的普及,这一模型可能显著提升开发效率。未来,微软可能会将类似的轻量级模型扩展到其他应用场景。总体而言,这两款模型展示了微软在打造更高效、更负责任的AI方面的努力,同时也为模型选择提供了新的选项。