2026-06-25 14:00 UTC+8站内改写2 分钟阅读更新: 2026-06-25 14:12 UTC+8

OpenAI Jalapeño芯片背后的数学原理

OpenAI为降低基础设施成本，与博通合作开发了定制ASIC芯片“Jalapeño”，专为大语言模型推理设计。该芯片由台积电制造，预计2026年底部署，有望显著降低运营成本并提升效率。

来源Artificial Intelligence News作者: Dashveenjit Kaur

OpenAI的财务状况严重依赖于基础设施成本，这一现实促使该公司开发了全新的定制芯片“Jalapeño”。与博通合作开发的这款专用集成电路（ASIC）旨在减轻第三方硬件带来的巨大资本支出。

目前，英伟达在其高端处理器上享有约75%的利润率，而OpenAI的利润率要低得多，在扣除庞大的运营费用后，每产生1美元收入仅保留约33美分利润。大规模运行大型语言模型的财务负担极为沉重。

去年，维持ChatGPT服务器响应状态花费了OpenAI高达84亿美元。随着该平台每周吸引9亿用户，今年运营成本预计将达到约140亿美元。未来八年，OpenAI已承诺在计算能力上投入约1.4万亿美元，这对于一家年收入250亿美元的公司来说是一场豪赌。

Jalapeño芯片被称为OpenAI的首款“智能处理器”，专门针对大语言模型推理而非通用AI工作负载。OpenAI基于其具体的模型路线图和服务系统提供了核心架构设计，而博通负责硅工程和高性能网络集成。台积电负责在台湾进行物理制造，Celestica则负责构建板卡和机架系统。据OpenAI称，早期实验室样品已经在目标生产频率和功耗下运行前沿工作负载，包括未发布的GPT-5.3-Codex-Spark模型。

OpenAI硬件项目负责人Richard Ho指出，该架构最大限度地减少了数据移动，使实际利用率接近理论峰值性能。与从传统AI工作负载改造的通用加速器不同，该架构专门平衡了计算、内存和网络资源，以解决交互式LLM服务固有的数据移动瓶颈。为了实现大规模部署，该平台直接将博通的Tomahawk网络硅集成到设计中，使定制处理器能够在庞大的集群数据中心环境中进行通信。

通过涉足定制芯片，OpenAI从单纯的软件层转变为垂直整合的基础设施公司。这种全栈战略涵盖了整个管道：芯片架构、软件内核、内存系统、网络调度以及最终的应用层。与苹果专有硬件和iOS的紧密结合类似，OpenAI现在可以围绕其内部模型路线图优化基础设施。

这种整合形成了一个持续的运营飞轮。增强的基础设施效率降低了训练和服务模型的成本。更经济的服务带来了更好、更灵敏的产品，从而推动用户量和收入增长，进而再投资于下一代定制基础设施。

通过推出自有芯片，OpenAI进入了一个主要竞争对手已经花了近十年开发专有硬件的领域。谷歌自2015年开始部署其TPU，目前控制着英伟达供应链之外全球约四分之一的AI计算能力。亚马逊已出货超过100万颗定制芯片，而Meta和微软继续扩展其基础设施。

OpenAI联合创始人兼总裁Greg Brockman表示：“Jalapeño是我们长期全栈基础设施战略的一部分，旨在让计算更加充裕。通过自行设计更多堆栈组件，我们能够以更高效率提供更多智能。”为了缩小时间差距，OpenAI加速了开发阶段。Jalapeño芯片从白板设计到制造流片（物理生产前的最后一步）仅用了9个月。工程团队利用OpenAI自身的语言模型自动化和优化了硬件设计过程的各个部分。

这形成了一个独特的反馈循环：为用户服务的模型正被积极用于构建运行未来迭代的物理基础设施。该硬件计划于2026年底开始部署到数据中心。博通CEO Hock Tan确认，将与微软等基础设施合作伙伴一起扩大部署规模，为千兆瓦级数据中心集成做好准备。