2026-06-25 14:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-25 14:12 UTC+8

OpenAI Jalapeño芯片背後的數學原理

OpenAI為降低基礎設施成本，與博通合作開發了定製ASIC芯片“Jalapeño”，專為大語言模型推理設計。該芯片由台積電製造，預計2026年底部署，有望顯著降低運營成本並提升效率。

來源Artificial Intelligence News作者: Dashveenjit Kaur

OpenAI的財務狀況嚴重依賴於基礎設施成本，這一現實促使該公司開發了全新的定製芯片“Jalapeño”。與博通合作開發的這款專用集成電路（ASIC）旨在減輕第三方硬件帶來的巨大資本支出。

目前，英偉達在其高端處理器上享有約75%的利潤率，而OpenAI的利潤率要低得多，在扣除龐大的運營費用後，每產生1美元收入僅保留約33美分利潤。大規模運行大型語言模型的財務負擔極為沉重。

去年，維持ChatGPT服務器響應狀態花費了OpenAI高達84億美元。隨着該平台每週吸引9億用户，今年運營成本預計將達到約140億美元。未來八年，OpenAI已承諾在計算能力上投入約1.4萬億美元，這對於一家年收入250億美元的公司來説是一場豪賭。

Jalapeño芯片被稱為OpenAI的首款“智能處理器”，專門針對大語言模型推理而非通用AI工作負載。OpenAI基於其具體的模型路線圖和服務系統提供了核心架構設計，而博通負責硅工程和高性能網絡集成。台積電負責在台灣進行物理製造，Celestica則負責構建板卡和機架系統。據OpenAI稱，早期實驗室樣品已經在目標生產頻率和功耗下運行前沿工作負載，包括未發佈的GPT-5.3-Codex-Spark模型。

OpenAI硬件項目負責人Richard Ho指出，該架構最大限度地減少了數據移動，使實際利用率接近理論峯值性能。與從傳統AI工作負載改造的通用加速器不同，該架構專門平衡了計算、內存和網絡資源，以解決交互式LLM服務固有的數據移動瓶頸。為了實現大規模部署，該平台直接將博通的Tomahawk網絡硅集成到設計中，使定製處理器能夠在龐大的集羣數據中心環境中進行通信。

通過涉足定製芯片，OpenAI從單純的軟件層轉變為垂直整合的基礎設施公司。這種全棧戰略涵蓋了整個管道：芯片架構、軟件內核、內存系統、網絡調度以及最終的應用層。與蘋果專有硬件和iOS的緊密結合類似，OpenAI現在可以圍繞其內部模型路線圖優化基礎設施。

這種整合形成了一個持續的運營飛輪。增強的基礎設施效率降低了訓練和服務模型的成本。更經濟的服務帶來了更好、更靈敏的產品，從而推動用户量和收入增長，進而再投資於下一代定製基礎設施。

通過推出自有芯片，OpenAI進入了一個主要競爭對手已經花了近十年開發專有硬件的領域。谷歌自2015年開始部署其TPU，目前控制着英偉達供應鏈之外全球約四分之一的AI計算能力。亞馬遜已出貨超過100萬顆定製芯片，而Meta和微軟繼續擴展其基礎設施。

OpenAI聯合創始人兼總裁Greg Brockman表示：“Jalapeño是我們長期全棧基礎設施戰略的一部分，旨在讓計算更加充裕。通過自行設計更多堆棧組件，我們能夠以更高效率提供更多智能。”為了縮小時間差距，OpenAI加速了開發階段。Jalapeño芯片從白板設計到製造流片（物理生產前的最後一步）僅用了9個月。工程團隊利用OpenAI自身的語言模型自動化和優化了硬件設計過程的各個部分。

這形成了一個獨特的反饋循環：為用户服務的模型正被積極用於構建運行未來迭代的物理基礎設施。該硬件計劃於2026年底開始部署到數據中心。博通CEO Hock Tan確認，將與微軟等基礎設施合作伙伴一起擴大部署規模，為千兆瓦級數據中心集成做好準備。