OpenAI Jalapeño芯片背后的数学原理
OpenAI为降低基础设施成本,与博通合作开发了定制ASIC芯片“Jalapeño”,专为大语言模型推理设计。该芯片由台积电制造,预计2026年底部署,有望显著降低运营成本并提升效率。
OpenAI的财务状况严重依赖于基础设施成本,这一现实促使该公司开发了全新的定制芯片“Jalapeño”。与博通合作开发的这款专用集成电路(ASIC)旨在减轻第三方硬件带来的巨大资本支出。
目前,英伟达在其高端处理器上享有约75%的利润率,而OpenAI的利润率要低得多,在扣除庞大的运营费用后,每产生1美元收入仅保留约33美分利润。大规模运行大型语言模型的财务负担极为沉重。
去年,维持ChatGPT服务器响应状态花费了OpenAI高达84亿美元。随着该平台每周吸引9亿用户,今年运营成本预计将达到约140亿美元。未来八年,OpenAI已承诺在计算能力上投入约1.4万亿美元,这对于一家年收入250亿美元的公司来说是一场豪赌。
Jalapeño芯片被称为OpenAI的首款“智能处理器”,专门针对大语言模型推理而非通用AI工作负载。OpenAI基于其具体的模型路线图和服务系统提供了核心架构设计,而博通负责硅工程和高性能网络集成。台积电负责在台湾进行物理制造,Celestica则负责构建板卡和机架系统。据OpenAI称,早期实验室样品已经在目标生产频率和功耗下运行前沿工作负载,包括未发布的GPT-5.3-Codex-Spark模型。
OpenAI硬件项目负责人Richard Ho指出,该架构最大限度地减少了数据移动,使实际利用率接近理论峰值性能。与从传统AI工作负载改造的通用加速器不同,该架构专门平衡了计算、内存和网络资源,以解决交互式LLM服务固有的数据移动瓶颈。为了实现大规模部署,该平台直接将博通的Tomahawk网络硅集成到设计中,使定制处理器能够在庞大的集群数据中心环境中进行通信。
通过涉足定制芯片,OpenAI从单纯的软件层转变为垂直整合的基础设施公司。这种全栈战略涵盖了整个管道:芯片架构、软件内核、内存系统、网络调度以及最终的应用层。与苹果专有硬件和iOS的紧密结合类似,OpenAI现在可以围绕其内部模型路线图优化基础设施。
这种整合形成了一个持续的运营飞轮。增强的基础设施效率降低了训练和服务模型的成本。更经济的服务带来了更好、更灵敏的产品,从而推动用户量和收入增长,进而再投资于下一代定制基础设施。
通过推出自有芯片,OpenAI进入了一个主要竞争对手已经花了近十年开发专有硬件的领域。谷歌自2015年开始部署其TPU,目前控制着英伟达供应链之外全球约四分之一的AI计算能力。亚马逊已出货超过100万颗定制芯片,而Meta和微软继续扩展其基础设施。
OpenAI联合创始人兼总裁Greg Brockman表示:“Jalapeño是我们长期全栈基础设施战略的一部分,旨在让计算更加充裕。通过自行设计更多堆栈组件,我们能够以更高效率提供更多智能。”为了缩小时间差距,OpenAI加速了开发阶段。Jalapeño芯片从白板设计到制造流片(物理生产前的最后一步)仅用了9个月。工程团队利用OpenAI自身的语言模型自动化和优化了硬件设计过程的各个部分。
这形成了一个独特的反馈循环:为用户服务的模型正被积极用于构建运行未来迭代的物理基础设施。该硬件计划于2026年底开始部署到数据中心。博通CEO Hock Tan确认,将与微软等基础设施合作伙伴一起扩大部署规模,为千兆瓦级数据中心集成做好准备。