OpenAI Jalapeño芯片背後的數學原理
OpenAI為降低基礎設施成本,與博通合作開發了定製ASIC芯片“Jalapeño”,專為大語言模型推理設計。該芯片由台積電製造,預計2026年底部署,有望顯著降低運營成本並提升效率。
OpenAI的財務狀況嚴重依賴於基礎設施成本,這一現實促使該公司開發了全新的定製芯片“Jalapeño”。與博通合作開發的這款專用集成電路(ASIC)旨在減輕第三方硬件帶來的巨大資本支出。
目前,英偉達在其高端處理器上享有約75%的利潤率,而OpenAI的利潤率要低得多,在扣除龐大的運營費用後,每產生1美元收入僅保留約33美分利潤。大規模運行大型語言模型的財務負擔極為沉重。
去年,維持ChatGPT服務器響應狀態花費了OpenAI高達84億美元。隨着該平台每週吸引9億用户,今年運營成本預計將達到約140億美元。未來八年,OpenAI已承諾在計算能力上投入約1.4萬億美元,這對於一家年收入250億美元的公司來説是一場豪賭。
Jalapeño芯片被稱為OpenAI的首款“智能處理器”,專門針對大語言模型推理而非通用AI工作負載。OpenAI基於其具體的模型路線圖和服務系統提供了核心架構設計,而博通負責硅工程和高性能網絡集成。台積電負責在台灣進行物理製造,Celestica則負責構建板卡和機架系統。據OpenAI稱,早期實驗室樣品已經在目標生產頻率和功耗下運行前沿工作負載,包括未發佈的GPT-5.3-Codex-Spark模型。
OpenAI硬件項目負責人Richard Ho指出,該架構最大限度地減少了數據移動,使實際利用率接近理論峯值性能。與從傳統AI工作負載改造的通用加速器不同,該架構專門平衡了計算、內存和網絡資源,以解決交互式LLM服務固有的數據移動瓶頸。為了實現大規模部署,該平台直接將博通的Tomahawk網絡硅集成到設計中,使定製處理器能夠在龐大的集羣數據中心環境中進行通信。
通過涉足定製芯片,OpenAI從單純的軟件層轉變為垂直整合的基礎設施公司。這種全棧戰略涵蓋了整個管道:芯片架構、軟件內核、內存系統、網絡調度以及最終的應用層。與蘋果專有硬件和iOS的緊密結合類似,OpenAI現在可以圍繞其內部模型路線圖優化基礎設施。
這種整合形成了一個持續的運營飛輪。增強的基礎設施效率降低了訓練和服務模型的成本。更經濟的服務帶來了更好、更靈敏的產品,從而推動用户量和收入增長,進而再投資於下一代定製基礎設施。
通過推出自有芯片,OpenAI進入了一個主要競爭對手已經花了近十年開發專有硬件的領域。谷歌自2015年開始部署其TPU,目前控制着英偉達供應鏈之外全球約四分之一的AI計算能力。亞馬遜已出貨超過100萬顆定製芯片,而Meta和微軟繼續擴展其基礎設施。
OpenAI聯合創始人兼總裁Greg Brockman表示:“Jalapeño是我們長期全棧基礎設施戰略的一部分,旨在讓計算更加充裕。通過自行設計更多堆棧組件,我們能夠以更高效率提供更多智能。”為了縮小時間差距,OpenAI加速了開發階段。Jalapeño芯片從白板設計到製造流片(物理生產前的最後一步)僅用了9個月。工程團隊利用OpenAI自身的語言模型自動化和優化了硬件設計過程的各個部分。
這形成了一個獨特的反饋循環:為用户服務的模型正被積極用於構建運行未來迭代的物理基礎設施。該硬件計劃於2026年底開始部署到數據中心。博通CEO Hock Tan確認,將與微軟等基礎設施合作伙伴一起擴大部署規模,為千兆瓦級數據中心集成做好準備。