AI News HubLIVE
站內改寫2 分鐘閱讀

OpenAI Jalapeño晶片背後的數學原理

OpenAI為降低基礎設施成本,與博通合作開發了定製ASIC晶片“Jalapeño”,專為大語言模型推理設計。該晶片由臺積電製造,預計2026年底部署,有望顯著降低運營成本並提升效率。

來源Artificial Intelligence News作者: Dashveenjit Kaur

OpenAI的財務狀況嚴重依賴於基礎設施成本,這一現實促使該公司開發了全新的定製晶片“Jalapeño”。與博通合作開發的這款專用積體電路(ASIC)旨在減輕第三方硬體帶來的巨大資本支出。

目前,輝達在其高階處理器上享有約75%的利潤率,而OpenAI的利潤率要低得多,在扣除龐大的運營費用後,每產生1美元收入僅保留約33美分利潤。大規模執行大型語言模型的財務負擔極為沉重。

去年,維持ChatGPT伺服器響應狀態花費了OpenAI高達84億美元。隨著該平臺每週吸引9億使用者,今年運營成本預計將達到約140億美元。未來八年,OpenAI已承諾在計算能力上投入約1.4萬億美元,這對於一家年收入250億美元的公司來說是一場豪賭。

Jalapeño晶片被稱為OpenAI的首款“智慧處理器”,專門針對大語言模型推理而非通用AI工作負載。OpenAI基於其具體的模型路線圖和服務系統提供了核心架構設計,而博通負責矽工程和高效能網路整合。臺積電負責在臺灣進行物理製造,Celestica則負責構建板卡和機架系統。據OpenAI稱,早期實驗室樣品已經在目標生產頻率和功耗下執行前沿工作負載,包括未釋出的GPT-5.3-Codex-Spark模型。

OpenAI硬體專案負責人Richard Ho指出,該架構最大限度地減少了資料移動,使實際利用率接近理論峰值效能。與從傳統AI工作負載改造的通用加速器不同,該架構專門平衡了計算、記憶體和網路資源,以解決互動式LLM服務固有的資料移動瓶頸。為了實現大規模部署,該平臺直接將博通的Tomahawk網路矽整合到設計中,使定製處理器能夠在龐大的叢集資料中心環境中進行通訊。

透過涉足定製晶片,OpenAI從單純的軟體層轉變為垂直整合的基礎設施公司。這種全棧戰略涵蓋了整個管道:晶片架構、軟體核心、記憶體系統、網路排程以及最終的應用層。與蘋果專有硬體和iOS的緊密結合類似,OpenAI現在可以圍繞其內部模型路線圖最佳化基礎設施。

這種整合形成了一個持續的運營飛輪。增強的基礎設施效率降低了訓練和服務模型的成本。更經濟的服務帶來了更好、更靈敏的產品,從而推動使用者量和收入增長,進而再投資於下一代定製基礎設施。

透過推出自有晶片,OpenAI進入了一個主要競爭對手已經花了近十年開發專有硬體的領域。谷歌自2015年開始部署其TPU,目前控制著輝達供應鏈之外全球約四分之一的AI計算能力。亞馬遜已出貨超過100萬顆定製晶片,而Meta和微軟繼續擴充套件其基礎設施。

OpenAI聯合創始人兼總裁Greg Brockman表示:“Jalapeño是我們長期全棧基礎設施戰略的一部分,旨在讓計算更加充裕。透過自行設計更多堆疊元件,我們能夠以更高效率提供更多智慧。”為了縮小時間差距,OpenAI加速了開發階段。Jalapeño晶片從白板設計到製造流片(物理生產前的最後一步)僅用了9個月。工程團隊利用OpenAI自身的語言模型自動化和最佳化了硬體設計過程的各個部分。

這形成了一個獨特的反饋迴圈:為使用者服務的模型正被積極用於構建執行未來迭代的物理基礎設施。該硬體計劃於2026年底開始部署到資料中心。博通CEO Hock Tan確認,將與微軟等基礎設施合作伙伴一起擴大部署規模,為千兆瓦級資料中心整合做好準備。