AI News HubLIVE
站内改写2 分钟阅读

MAI-Thinking-1 即将登陆 Baseten

Baseten 与微软 AI 宣布,MAI-Thinking-1 即将在 Baseten 平台上提供。该模型是微软 AI 的旗舰推理模型,结合了开源模型的灵活性与闭源模型的管理便利性,具有干净数据来源、商业级质量和定制化能力。

MAI-Thinking-1 即将登陆 Baseten 平台,这是 Baseten 与微软 AI 共同宣布的重磅消息。MAI-Thinking-1 是微软 AI 推出的旗舰推理模型,专为那些希望同时拥有强大能力和完全控制权的 AI 团队设计。该模型定位在开源模型与闭源模型之间,填补了市场的空白。

当前 AI 模型市场主要分为两类:开源模型提供完全的自由度,但需要用户自行承担基础设施、优化、安全和维护的负担,同时数据来源的清洁度也常令人担忧;闭源模型则提供托管的 API,易于使用,但用户的数据可能被模型提供商看到,且用户的应用依赖于提供商的发展路线图。MAI-Thinking-1 通过结合两者的优点,提供了新的选择。

MAI-Thinking-1 的核心特点包括:

  • 干净的数据:模型从零开始使用经过精心挑选的高完整性数据训练,完全没有从第三方模型进行蒸馏。用户可以获得清洁、可审计且商业安全的数据来源,这对于受监管行业或严格知识产权政策的企业尤为重要。
  • 商业级设计:模型从设计之初就面向商业应用,微软完全不会接触用户的模型数据。用户的微调数据、反馈信号和领域适配都不会回流到微软,确保用户的智能资产完全属于自己。
  • 高效架构:MAI-Thinking-1 是一个中型模型,拥有 350 亿个活跃参数,在提供强大能力的同时保持了成本效率,使得大规模生产部署成为可能。

在定制化方面,Baseten 将获得 MAI-Thinking-1 的模型权重,从而支持优化和定制。用户可以通过 Baseten 进行微调,并且微调后的检查点完全由用户控制,分发渠道独立于模型创建者,微软对用户在上层构建的内容没有任何可见性。为了支持微调需求,Baseten 最近发布了 Loops,这是一款专为迭代式、生产级后训练工作流设计的训练 SDK,支持长序列微调、基于人类反馈的强化学习以及异步强化学习流水线。

Baseten 与微软的合作旨在确保基于 AI 的企业能够拥有自己的智能,而不是无限期地从一个利益可能不一致的实验室租赁智能。双方共同构建一个前沿生态系统,让基于 AI 的业务能够保持对自身成果的控制。MAI-Thinking-1 即将在 Baseten 上可用,感兴趣的用户可以提交早期访问申请。