WWDC 2026:Siri AI 的承诺与现实
在WWDC 2026上,苹果发布了新一代Siri AI,采用定制的Gemini模型和Vision-LLM技术,能够从用户屏幕提取信息,无需应用单独适配。新的Core AI库基于Meta的开源PyTorch,允许开发者充分利用苹果硬件运行模型。目前iOS 27开发者测试版已发布,但需排队等候Siri AI访问权限。
在2026年6月8日的WWDC主题演讲中,苹果公司正式推出了新一代Siri AI,这次他们采取了完全不同的策略。回顾2024年WWDC,当时苹果高调宣布了Apple Intelligence计划,但后续的交付却远未达到预期,导致许多开发者对苹果的承诺持怀疑态度。正因如此,本篇报道的作者Simon Willison明确表示,他将坚持“眼见为实”的原则,直到看到实际可用的产品。不过,从技术角度看,本次发布的新功能至少在可行性上迈出了坚实的一步。
其中最引人注目的是苹果正在授权一个定制的Gemini衍生模型。这个模型将运行在苹果自己的私有云计算(Private Cloud Compute)基础设施上,从而在提供强大AI能力的同时,兼顾用户隐私保护。这与苹果一贯强调的隐私优先理念相符。
另一项关键创新是Vision-LLM(视觉大语言模型)的应用。苹果计划利用Vision-LLM直接从用户屏幕上提取信息,而不再要求每个现有应用都为Apple Intelligence编写自定义集成代码。这种设计巧妙且实用。要知道,在2024年6月,Vision-LLM几乎还不算一个独立的类别,但如今苹果将其作为核心功能推出,这无疑将彻底改变第三方应用与系统级AI交互的方式。
此外,苹果推出了全新的Core AI库,旨在帮助开发者充分利用苹果硬件来运行自己的AI模型。该库基于Meta的开源PyTorch框架,并通过Core AI PyTorch扩展(coreai-torch)实现。根据苹果的官方文档,coreai-torch是一个Python包,它连接了PyTorch和Core AI。开发者可以将现有的PyTorch模型(导出的torch.export.ExportedProgram)转换为Core AI的AIProgram,从而在苹果硬件上直接运行。转换过程会遍历FX图节点,并将ATen算子映射为Core AI操作。这一机制使得拥有PyTorch模型的开发者能够非常便捷地将模型部署到苹果生态中,而无需从头开始学习新的框架。
目前,iOS 27开发者测试版已经发布,其中包含了这些新功能。但需要注意的是,要获得新Siri AI的访问权限,用户必须通过一个等待列表。MacRumors的Aaron Perris在社交媒体上报告称,他已经成功从等待列表中出来,这意味着我们很快就能看到关于新版Siri AI实际表现的第一手评测报告。总而言之,尽管苹果过去的承诺曾让人失望,但这次的技术路线图显得更加务实和可行。Vision-LLM和Core AI库的引入,标志着苹果在AI领域的战略发生了重大转变,从单纯的硬件优化转向更加开放的生态系统建设。未来几周,随着更多开发者拿到访问权限,我们有望获得关于Siri AI能力的更清晰图景。