2026-06-01 20:40 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Nemotron 3 Ultra：高速、領先的美國開放權重智能模型

NVIDIA在Computex主題演講中發佈了Nemotron 3 Ultra，擁有550B參數（55B活躍），是美國開放權重模型中智能最高的，AI Index得分48，推理速度超過300 tokens/s。

來源Hacker News AI作者: cmrdporcupine

NVIDIA在Computex 2026主題演講中正式發佈了Nemotron 3 Ultra，這是Nemotron 3系列中最大的模型，擁有約5500億總參數（550B），其中55B參數處於活躍狀態。該模型採用90%稀疏性技術，顯著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上獲得了48分，成為美國開放權重模型中智能水平最高的，遠超Gemma 4 31B（39分）、Nemotron 3 Super（36分）和gpt-oss-120b（33分），但低於中國開放權重模型Kimi K2.6（54分）。

在推理速度方面，Nemotron 3 Ultra在預發佈的DeepInfra端點上實現了超過300 tokens/s的速度，而同類中國模型（如DeepSeek和Moonshot）的市場速度通常在50-100 tokens/s之間。gpt-oss-120b的速度與Nemotron 3 Ultra相近，但智能水平顯著較低。NVIDIA表示，該模型將提供BF16權重和NVFP4量化版本，以進一步提升推理性能。

此外，該平台還報道了其他重要AI新聞：Claude Opus 4.8成為新的#1 AI模型，在GDPval-AA上取得領先，並在終端使用和科學推理方面取得進展；MiniCPM5-1B是領先的1B開放權重模型，得分為17.9；Cursor的Composer 2.5在編碼代理指數上排名第三，成本比競爭對手低10-60倍。

總體而言，Nemotron 3 Ultra的發佈標誌着美國在開放權重模型領域邁出了重要一步，儘管在智能水平上仍落後於中國領先模型，但其推理速度和稀疏性技術展示了巨大的潛力。NVIDIA計劃在正式發佈時提供更詳細的分析和完整基準測試結果。