Tensordyne 將 AI 矩陣數學轉換為對數以提升推理性能
Tensordyne 推出基於對數運算的 Napier 推理芯片,將矩陣乘法轉換為加法,大幅提升性能、降低功耗和成本。該芯片採用 3 納米工藝,功耗僅 300 瓦,支持多種數據格式,計劃 2026 年底提供雲訪問。
Tensordyne 公司近日發佈了其創新的 Napier AI 推理引擎,該引擎通過將對數運算引入矩陣乘法,顯著提升了推理性能並降低了功耗。Napier 芯片以蘇格蘭數學家約翰·納皮爾命名,他發明了對數。該芯片的核心思想是將數據轉換為對數形式,從而用加法替代乘法,因為加法在硬件上更容易實現。與傳統的 GPU 相比,這種對數方法提供了超過一個數量級的性能提升,同時降低了成本和能耗。
Napier 芯片包含 48 個對數核心,每個核心內置 128×128 的脈動陣列,並支持 NVFP4、FP8 和 FP16 等數據格式。此外,芯片還集成了向量處理單元和 RISC-V 核心,用於處理 softmax 等操作以及 MoE 路由等任務。整個芯片採用 TSMC 的 3 納米工藝製造,擁有 1380 億個晶體管,功耗僅為 300 瓦,是 NVIDIA Blackwell B300 的 1/4 左右。低功耗使得該系統可以風冷,非常適合城市數據中心等環境。
在系統架構方面,Tensordyne 將 9 個 Napier 芯片與一個 40 核 Xeon 處理器組成一個計算托盤,每個機架可容納 288 個芯片。機架內還集成了 320 個 Xeon 核心和 4608 個 RISC-V 核心,用於處理不同層次的推理任務。每個機架配備 64 個 200 Gb/s 的以太網鏈接,用於跨機架通信。
Tensordyne 由 RK Anand 和 Gilles Backhus 共同創立,兩人此前曾創辦專注於自動駕駛 AI 的公司 Recogni。公司已從三個融資輪次中籌集了 1.76 億美元,團隊超過 120 人。Napier 芯片由 Broadcom 負責代工,確保 HBM 內存和晶圓的供應。Tensordyne 計劃在 2026 年底提供雲訪問,2027 年第一季度向客户交付測試系統。如果 Napier 芯片能夠大規模生產並支持主流推理框架,它可能成為 AI 硬件領域的“DeepSeek 時刻”,改變當前市場格局。