WWDC 2026:Siri AI 的承諾與現實
在WWDC 2026上,蘋果發佈了新一代Siri AI,採用定製的Gemini模型和Vision-LLM技術,能夠從用户屏幕提取信息,無需應用單獨適配。新的Core AI庫基於Meta的開源PyTorch,允許開發者充分利用蘋果硬件運行模型。目前iOS 27開發者測試版已發佈,但需排隊等候Siri AI訪問權限。
在2026年6月8日的WWDC主題演講中,蘋果公司正式推出了新一代Siri AI,這次他們採取了完全不同的策略。回顧2024年WWDC,當時蘋果高調宣佈了Apple Intelligence計劃,但後續的交付卻遠未達到預期,導致許多開發者對蘋果的承諾持懷疑態度。正因如此,本篇報道的作者Simon Willison明確表示,他將堅持“眼見為實”的原則,直到看到實際可用的產品。不過,從技術角度看,本次發佈的新功能至少在可行性上邁出了堅實的一步。
其中最引人注目的是蘋果正在授權一個定製的Gemini衍生模型。這個模型將運行在蘋果自己的私有云計算(Private Cloud Compute)基礎設施上,從而在提供強大AI能力的同時,兼顧用户隱私保護。這與蘋果一貫強調的隱私優先理念相符。
另一項關鍵創新是Vision-LLM(視覺大語言模型)的應用。蘋果計劃利用Vision-LLM直接從用户屏幕上提取信息,而不再要求每個現有應用都為Apple Intelligence編寫自定義集成代碼。這種設計巧妙且實用。要知道,在2024年6月,Vision-LLM幾乎還不算一個獨立的類別,但如今蘋果將其作為核心功能推出,這無疑將徹底改變第三方應用與系統級AI交互的方式。
此外,蘋果推出了全新的Core AI庫,旨在幫助開發者充分利用蘋果硬件來運行自己的AI模型。該庫基於Meta的開源PyTorch框架,並通過Core AI PyTorch擴展(coreai-torch)實現。根據蘋果的官方文檔,coreai-torch是一個Python包,它連接了PyTorch和Core AI。開發者可以將現有的PyTorch模型(導出的torch.export.ExportedProgram)轉換為Core AI的AIProgram,從而在蘋果硬件上直接運行。轉換過程會遍歷FX圖節點,並將ATen算子映射為Core AI操作。這一機制使得擁有PyTorch模型的開發者能夠非常便捷地將模型部署到蘋果生態中,而無需從頭開始學習新的框架。
目前,iOS 27開發者測試版已經發布,其中包含了這些新功能。但需要注意的是,要獲得新Siri AI的訪問權限,用户必須通過一個等待列表。MacRumors的Aaron Perris在社交媒體上報告稱,他已經成功從等待列表中出來,這意味着我們很快就能看到關於新版Siri AI實際表現的第一手評測報告。總而言之,儘管蘋果過去的承諾曾讓人失望,但這次的技術路線圖顯得更加務實和可行。Vision-LLM和Core AI庫的引入,標誌着蘋果在AI領域的戰略發生了重大轉變,從單純的硬件優化轉向更加開放的生態系統建設。未來幾周,隨着更多開發者拿到訪問權限,我們有望獲得關於Siri AI能力的更清晰圖景。