2026-06-01 20:40 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Nemotron 3 Ultra：高速、領先的美國開放權重智慧模型

NVIDIA在Computex主題演講中釋出了Nemotron 3 Ultra，擁有550B引數（55B活躍），是美國開放權重模型中智慧最高的，AI Index得分48，推理速度超過300 tokens/s。

來源Hacker News AI作者: cmrdporcupine

NVIDIA在Computex 2026主題演講中正式釋出了Nemotron 3 Ultra，這是Nemotron 3系列中最大的模型，擁有約5500億總引數（550B），其中55B引數處於活躍狀態。該模型採用90%稀疏性技術，顯著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上獲得了48分，成為美國開放權重模型中智慧水平最高的，遠超Gemma 4 31B（39分）、Nemotron 3 Super（36分）和gpt-oss-120b（33分），但低於中國開放權重模型Kimi K2.6（54分）。

在推理速度方面，Nemotron 3 Ultra在預釋出的DeepInfra端點上實現了超過300 tokens/s的速度，而同類中國模型（如DeepSeek和Moonshot）的市場速度通常在50-100 tokens/s之間。gpt-oss-120b的速度與Nemotron 3 Ultra相近，但智慧水平顯著較低。NVIDIA表示，該模型將提供BF16權重和NVFP4量化版本，以進一步提升推理效能。

此外，該平臺還報道了其他重要AI新聞：Claude Opus 4.8成為新的#1 AI模型，在GDPval-AA上取得領先，並在終端使用和科學推理方面取得進展；MiniCPM5-1B是領先的1B開放權重模型，得分為17.9；Cursor的Composer 2.5在編碼代理指數上排名第三，成本比競爭對手低10-60倍。

總體而言，Nemotron 3 Ultra的釋出標誌著美國在開放權重模型領域邁出了重要一步，儘管在智慧水平上仍落後於中國領先模型，但其推理速度和稀疏性技術展示了巨大的潛力。NVIDIA計劃在正式釋出時提供更詳細的分析和完整基準測試結果。