苹果会效仿SpaceX吗?
苹果正在开发自研AI推理芯片Baltra,但更值得关注的是其容量如何使用。文章分析了三种可能:内部使用、出售硬件、出租推理服务。借鉴SpaceX将过剩算力出租给Anthropic以及Meta的类似动向,作者认为苹果最可能选择出租其高度隐私保护的推理能力,将“信任”作为核心产品。
苹果自主研发服务器芯片的计划,表面上看无非是又一家科技巨头自建AI推理硬件:不再依赖英伟达,而是像谷歌(TPU)、亚马逊(Inferentia)、微软(Maia)和Meta(MTIA)一样,为自家AI负载定制芯片。据马克·古尔曼报道,苹果的这款芯片代号Baltra,采用台积电3纳米工艺,由博通协助设计,专攻推理而非训练,预计2027年问世。这听起来中规中矩,不过是入局的标配。
但真正有趣的问题在芯片落地之后:苹果将如何处理这些计算能力?
让我们先看事实,因为这一传言已有迹可循。在2024年的WWDC上,苹果推出了私有云计算(Private Cloud Compute),这是运行在苹果自研芯片上的真实数据中心服务器,搭载专为LLM推理打造的硬化版iOS。据报道,这些机架最初基于M2 Ultra,未来将过渡到M5;而Baltra则是其专用后继芯片。苹果已经在运行AI数据中心,唯一悬而未决的是其规模。
而恰恰是规模问题,最近出现了新的变量。那些为自有需求建造庞大AI计算集群的公司,开始将富余算力对外出租。眼下最鲜明的例子来自SpaceX:它建成了Colossus 1集群,功率超过300兆瓦,配备超过22万块英伟达GPU,随后竟将整个集群以每月约12.5亿美元的价格租给了Anthropic——这直接与马斯克的所有AI项目形成竞争。背后的实际原因更是点明了趋势:据彭博社报道,SpaceX出租集群是因为自己的团队难以充分利用它。先为使命建算力,却发现算力过剩,于是转身成为“房东”。
Meta也公开表露了类似想法。当被问及是否要成立云业务时,扎克伯格表示这“肯定在考虑之中”,并指出“几乎每周”都有外部公司请求Meta开放API或出售算力。将自有的AI容量对外出租——这已是亚马逊和谷歌(通过Inferentia和TPU)正在做的事情——正迅速成为所有算力大户的本能反应。
这一趋势重新定义了苹果的选择。它面前有三条路。
第一条:内部专用。将Baltra完全用于苹果智能,绝不外租。这曾是不言自明的默认选择,但现在连Meta都在说服自己放弃这条路,因为如此规模的闲置算力无异于烧钱。
第二条:出售硬件,将苹果芯片在数据中心领域复制其在PC领域的成功。苹果在笔记本电脑上并非靠原始速度取胜,而是凭借每瓦性能让英特尔显得又热又慢。而在电力与散热成本占据主导的机架环境中,每瓦性能恰恰是最关键的指标。戴尔一个季度的AI服务器收入已达161亿美元,超过其整个PC业务。一台能效优异的苹果推理服务器确实能构成威胁。但问题在于,苹果此前做过类似尝试并最终放弃:2011年它砍掉了Xserve,因为向IT部门销售硬件利润微薄,不符合苹果的风格,而如今AI买家大多需要CUDA,苹果并不提供。
第三条:出租推理能力。这是SpaceX的做法,也是最值得押注的一条路,但苹果的版本不会与Colossus雷同。SpaceX出租的是一种通用商品:一堆英伟达GPU,你在其他地方也能租到。而苹果将提供独一无二的东西:私有云计算(Private Cloud Compute)的设计确保了即使苹果自身也无法窥探其上运行的内容,并且该架构已公开供研究者检验。对于每一家希望使用前沿模型但因法律限制无法将数据送入黑盒云的医院、银行和律师事务所而言,“天生具备隐私保护的推理”是一种没有竞争对手的产品。SpaceX出租的是原始算力,而苹果可以出租“信任”。
这项业务的形态堪称最“苹果”式的构想。它不是苹果拒绝涉足的松散芯片组件交易,而是服务——服务如今正是苹果的核心业务:苹果年度服务收入刚刚突破1000亿美元,毛利率约75%,而硬件毛利率仅为36%。一个私密推理云是一种高利润服务,运行在苹果本已为自己打造的芯片之上。效率与隐私——苹果在全球最擅长的两件事——恰好是当前市场愿意为之付出最高溢价的两大要素。
那么,苹果会效仿SpaceX吗?诚实的谨慎在于:内部需求必须首先到位,而苹果智能的起步确实缓慢。但SpaceX出租Colossus集群正是因为建造的算力超出了自身需求;Meta出于同样原因正盯着同一扇门。苹果正朝着建造地球上最高效、最私密的推理算力舰队的方向前进,而与此同时,Anthropic以及半数财富500强企业正在四处寻觅可信任的计算能力。问题不再是苹果能否建成它,而是苹果能否忍住不外租。