微软与OpenAI分手——现在它们准备开战
在年度Build大会上,微软宣布了一系列新AI举措,包括超级应用、自研推理模型、网络安全工具和类似OpenClaw的AI代理,标志着其作为AI主要玩家的独立姿态。此前微软高度依赖OpenAI,但双方实质上已于4月底分离。微软AI主管穆斯塔法·苏莱曼表示,目标是成为全球四大AI实验室之一,并强调新模型MAI-Thinking-1未使用蒸馏技术,完全基于自有IP开发。
在周二举行的微软年度Build开发者大会上,该公司公布了一系列新的人工智能举措,包括一款超级应用、自研推理模型、网络安全工具以及类似OpenClaw的AI代理。所有这些消息传递出一个明确的信息:微软已定位为AI领域最大的玩家之一,并且终于开始展现出相应的实力。
多年来,微软的AI业务严重依赖其与OpenAI的早期独家合作关系。但这段充满戏剧性的“婚姻”逐渐演变成一种暧昧关系,双方在4月底实际上已经分离(尽管微软目前仍是OpenAI的主要云合作伙伴)。今年的Build大会给人一种刚刚恢复单身的离婚者在Instagram上发魅力帖的感觉。微软CEO萨提亚·纳德拉在台上表示:“在巨变时期参加开发者大会总是很有趣,”并补充说这类活动关乎“把握新机遇。”
AI主管穆斯塔法·苏莱曼在接受The Verge采访时更加直白。“目标是证明我们可以成为全球四大实验室之一,”苏莱曼说,“目前有三个重要的实验室:谷歌DeepMind、OpenAI和Anthropic。我们还不是其中之一,而这一直是我的意图。这就是我来这里的原因。我想打造世界上最优秀的前沿模型,完全多模态,为此我们必须证明我们能从头完成所有必要工作,而不仅仅是借鉴他人的成果。”
微软在Build上的第一步确实是追赶AI模型。苏莱曼发布了MAI-Thinking-1,这是微软的首款推理模型,同时还有另外六款专注于图像、语音、转录和编码的新模型。微软表示,这款中型MAI-Thinking-1模型(可能主要面向企业客户)是“为严肃的数学、编码和企业级部署而从头构建的”。微软在这方面落后OpenAI和Anthropic数年;OpenAI在2024年秋季就开始发布推理模型。但苏莱曼强调了其在编码等基准测试上的性能以及价格点,称它在某些任务上比OpenAI的同类产品更便宜——这在AI资金紧缩的时代是个大事,许多客户对此抱怨不已。
尽管微软有多年时间从OpenAI汲取见解,但苏莱曼特意提到其开发没有涉及任何蒸馏,即没有使用其他公司的AI模型进行训练。如果MAI-Thinking-1表现良好,微软显然不希望人们认为这归功于OpenAI的影响。
苏莱曼告诉The Verge,对微软来说,“关键转折点是重新谈判与OpenAI的合同。这意味着我们被允许以更大规模训练模型,并完全使用自己的IP、自己的数据、无蒸馏、从头训练来追求超级智能。”
纳德拉还重点介绍了微软最近推出的AI网络安全工具MDASH,他称其汇集了100个AI代理,能“比任何单一模型”更好地发现可利用的漏洞。这显然是在暗指Anthropic在4月推出的Claude Mythos Preview——该模型引发了极大恐惧和关注,并在Build前刚刚扩大了访问权限。OpenAI也有自己的网络安全系统,三家公司可能会利用各自的产品在政府和亟需争取的企业市场上争夺地位。
微软在AI代理方面处境更为复杂。流行的开源平台OpenClaw展示了AI代理的一条潜在前进道路,在OpenAI迅速聘请其创建者彼得·斯坦伯格后,微软(以及其他公司)正试图迎头赶上。其关键策略之一是让OpenClaw在Windows上良好运行。在Build大会上,纳德拉表示他非常致力于OpenClaw支持,微软员工与观众中的开发者交流他们如何使用OpenClaw。
斯坦伯格本人意外现身,引发观众热烈反响,他登台夸耀OpenClaw如何增强了安全性并赢得了用户信任。“我一直听到的是,‘彼得,我喜欢我的Claw,但我能在工作中使用它吗?’”斯坦伯格说,“现在你完全可以公司在内部运行OpenClaw,我们甚至让工具本身成为插件。”斯坦伯格表示,无论用户信任Copilot、Codex还是其他公司的编码平台,他们现在都可以通过Windows在之上运行OpenClaw。
但微软也在推广自己的独立Copilot“超级应用”,该应用集成了类似OpenClaw的代理。超级应用是OpenAI目前的主要焦点——总裁格雷格·布罗克曼正在领导开发一个整合ChatGPT、Codex编码平台和Atlas网络浏览器的超级应用。微软的策略类似,将各种现有Copilot AI助手整合在一起。其名为“Autopilot”代理旨在充当有用的用户界面。GitHub开发者倡导高级总监卡西迪·威廉姆斯称Copilot为“计算机上开发和运营的大本营”,并演示了多个代理如何执行应用构建等任务。(更精彩的是,威廉姆斯演示了如何通过向电脑摄像头竖大拇指或拇指向下来批准或拒绝代码更改。)
Autopilot专门设计用于吸引商业客户——纳德拉称其为“完全企业合规的自主、长期运行代理”。微软将提供的第一个是“Scout”,被宣传为“随时待命的个人代理”,但客户可以构建和个性化自己的代理。Autopilot代理应能查看电子邮件收件箱、加入Teams群聊、检查日历以及发送每日简报等。相应地,台上微软员工反复强调Copilot的安全工具和护栏——显然是为了安抚那些可能听说过OpenClaw等工具恐怖故事的企业客户。
苏莱曼一再强调微软的“人本超级智能”是“优先考虑人性的AI”——这是AI公司近期对AGI进行品牌重塑的一部分,以使其在人们比以往任何时候都更抵制AI的时代听起来不那么可怕。
英伟达CEO黄仁勋(另一位以与OpenAI密切合作闻名的演讲者)通过视频通话出现,宣传英伟达的RTX Spark芯片如何推动微软的AI代理目标。“我可能在旅行,在打电话,我可以给我的PC发短信……它会启动PC上的工具,”黄仁勋说,“PC从个人电脑演变为个人AI的想法非常令人兴奋。”
微软多年来押注OpenAI,从某些方面来说,这让它在AI竞赛中落后了。但随着OpenAI和其他竞争对手转向企业以最终盈利,微软拥有一些明显的优势。微软已经拥有庞大的客户基础,并且与其他AI公司相比,拥有安全和可靠的声誉。与谷歌一样,它也有雄厚的资金、可观的计算资源和多元化的收入来源,这意味着它可以进行大赌注而不承担太大风险。
苏莱曼告诉The Verge:“有很多人要么追逐初创公司估值,要么即将IPO,所以我们可以更加谦逊,更注重长期优化。”他补充道:“我们有足够的资金在需要时购买Anthropic模型。我们在Azure中有11000个模型的可选性,所以人们可以在任何时候使用他们想要的任何东西,但这为我们赢得了足够的时间从一开始就把事情做对。”
与此同时,这里还有许多未解问题。微软为其七款新模型列出了许多基准测试胜利和进步,但这并不总能转化为实际采用,即使一款模型领先一两周也可能很快落后。AI超级应用基本上还是一个未经测试的想法。而微软正进入一个拥挤但总体上仍不尽人意的AI代理市场,其产品我们尚未看到实际应用。其承诺仍有落空的空间。