轨道计算
本文分析了在太空建设AI数据中心的可行性,包括其物理优势(持续的太阳能、被动辐射冷却、真空光速通信)和工程限制(散热、辐射加固、训练同步、维护)。关键假设是星舰的发射成本。目前多个初创公司和谷歌、SpaceX等巨头已启动试点项目。近期的投资影响有限,但值得关注。
文章情报
要点
- 轨道AI数据中心利用LEO的连续太阳能、被动冷却和激光链路,潜在优于地面数据中心
- 工程挑战包括散热(高密度集群需要巨大散热面积)、辐射加固(商用芯片在轨寿命未知)以及训练同步延迟
- 经济性完全依赖于星舰发射成本降至每公斤100美元以下,预计2029-2031年可能实现
- 现有项目多专注于推理而非训练,市场规模比乐观估计窄得多
为什么重要
这条新闻值得关注,因为轨道AI数据中心利用LEO的连续太阳能、被动冷却和激光链路,潜在优于地面数据中心。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
近年来,随着地面AI数据中心扩张面临电网容量、冷却密度和土地成本等日益严重的制约,部分投资者和技术人员开始将目光投向太空。其中,以阿特里德斯管理公司的加文·贝克以及埃隆·马斯克(通过SpaceX/xAI)为代表的主张认为,低地球轨道(LEO)是AI计算的理想场所。虽然太空计算的概念已存在数十年,但随着猎鹰9号的可重复使用性大幅降低发射成本,以及星舰有望进一步压低成本,这一构想正逐步从理论走向实践。截至2026年5月,多家初创公司和至少一家超大规模云服务商已公开启动轨道数据中心项目。
轨道计算的物理优势主要体现在三个方面。首先是电力:LEO的太阳辐照度约为1361 W/m²,比地面高30%,且无大气吸收;在太阳同步等优化轨道上,卫星可长时间处于连续阳光中,避免了地面太阳能需配备大量电池储能的问题。这意味着轨道数据中心不受电网接入限制,而地面数据中心常因变电站排队、输电线路建设和地方许可而延误数年。这是贝克从基础设施稀缺性角度提出的最有力论据。
其次是冷却:太空的真空环境虽无对流冷却,但提供了约3K(-270°C)的辐射热汇。安装在卫星背光面的散热器可被动排热,无需水、制冷剂或能耗巨大的压缩机。地面数据中心在冷却系统上投入巨大,而被动辐射冷却理论上可消除这一运营成本。
第三是网络:激光在真空中的传播速度比在光纤中快约47%(因玻璃折射率)。利用星间激光链路(ISL,SpaceX已在星链上商业使用)连接的密集星座,其延迟和每链路吞吐量可能优于地面长距离光纤。对于分布式推理服务全球用户而言,这能显著改善跨洲请求的响应延迟。
然而,工程限制使这一构想面临严峻挑战。散热方面:辐射冷却的功率与散热器表面积成正比;随着计算密度增加(如地面100kW/机架的高密度集群),表面积与体积比恶化,导致在轨道上实现同等密度所需散热面积过大,远超载荷容量。这迫使轨道计算转向分布式、低密度架构(大量小卫星而非少数密集集群),这与地面前沿AI训练集群的密度化趋势相反。瓦达太空工业等公司的工程师指出,虽未排除物理可能性,但实现与地面设施相当的计算密度所需的散热器工程尚未大规模验证。
辐射加固是另一关键问题:LEO环境中的电离辐射(俘获电子、质子、宇宙射线)对商用芯片(COTS)构成威胁。传统抗辐射芯片每瓦性能比领先的地面硅芯片差一个数量级以上,且差距随AI加速器性能提升而扩大。若轨道计算必须使用抗辐射芯片,则每公斤计算能力的优势将大幅缩水。替代方案是采用COTS芯片配合冗余和纠错(SpaceX在星链上采用此方法)。星云公司2025年11月发射的卫星搭载了NVIDIA H100(完全商用、非抗辐射),初期报告显示其能运行任务(在轨运行NanoGPT和Google Gemini版本),但H100级密度下长期退化率尚不明确。对于某些工作负载此方案可行,但会增加故障率并使集群管理复杂化。截至2026年中期,尚无在AI加速器密度下经过验证的多年解决方案。
在训练与推理的权衡上,训练前沿模型需要数千个加速器之间紧密、低延迟的同步(亚微秒级集体操作,如NVLink)。协调数十颗运动中的卫星组成的集群进行训练,即使有ISL,也会引入地面NVLink架构所没有的同步延迟。因此,近期内轨道训练并不现实。推理则更具可行性,因为单个推理请求是并行且独立的,无需集体同步。因此,近期的轨道计算机会主要集中于推理,其潜在市场规模远小于支持者所声称的。
维护和服务性方面:地面数据中心可在数小时内更换故障GPU,而轨道硬件要么无法维修(多数LEO卫星),要么维修成本极高(需载人任务或机器人服务)。辐射环境下故障率高于地面,且无法廉价更换故障硬件,导致每计算小时的有效硬件成本增加。
轨道计算投资案例几乎完全取决于一个变量:每公斤LEO发射成本。当前猎鹰9号(可重复使用)约3000-4500美元/公斤,猎鹰重型约1000-1500美元/公斤,星舰目标约65-200美元/公斤(长期目标10-20美元/公斤)。在猎鹰9号价格下,轨道数据中心明显不经济。SpaceX本身表示星舰每次飞行成本约1000万美元,对应100-150吨运力,即65-100美元/公斤。但欧洲空间政策研究所研究员指出,近年内实现1000万美元/次的星舰发射“不现实”,多数轨道数据中心成本模型假设的星舰经济性尚未被证明。多数工作负载与地面托管达到成本平价的经济路径预计在2029-2031年窗口,存在巨大不确定性。
市场参与者方面:星云公司(华盛顿州雷德蒙德,NVIDIA投资)于2025年11月发射了搭载NVIDIA H100的Starcloud-1卫星,在轨训练了首个LLM(基于莎士比亚语料的NanoGPT),并运行了Google Gemini版本,已融资1.7亿美元,估值11亿美元,向FCC申请了8.8万颗卫星,下一代卫星(Starcloud-2)计划2026年10月搭载Blackwell GPU。开普勒通信公司于2026年初部署了最大的轨道计算集群:10颗卫星搭载40个NVIDIA Jetson Orin处理器,通过激光通信互连,有18个付费客户,专注于推理工作负载,非前沿AI级别。公理太空公司于2026年1月11日发射了首批两个轨道数据中心节点,目标用于云计算、AI/ML和边缘处理。轨道公司(洛杉矶初创,a16z投资)于2026年4月从隐身模式中走出,计划2027年发射,2028年建设制造设施。SpaceX/xAI方面,马斯克已暗示将xAI的计算需求与SpaceX轨道基础设施合并,向FCC申请了多达100万颗数据中心卫星。谷歌的“太阳捕手”项目于2025年11月公布,计划与行星实验室合作发射两颗搭载TPU的卫星,长期规划为81颗卫星的集群,另有报道称谷歌正与SpaceX洽谈使用星舰发射更大星座。
投资影响方面:短期内,以当前发射成本和芯片抗辐射限制,轨道计算对地面AI基础设施不构成威胁,其经济性对于多数工作负载比地面托管差3-20倍。监控此主题的主要价值在于追踪星舰是否达到成本目标,以及芯片厂商是否开发出适合轨道环境的COTS AI芯片。