AI News HubLIVE
站内改写1 分鐘閱讀

Nemotron 3 Ultra:高速、領先的美國開放權重智能模型

NVIDIA在Computex主題演講中發佈了Nemotron 3 Ultra,擁有550B參數(55B活躍),是美國開放權重模型中智能最高的,AI Index得分48,推理速度超過300 tokens/s。

來源Hacker News AI作者: cmrdporcupine

NVIDIA在Computex 2026主題演講中正式發佈了Nemotron 3 Ultra,這是Nemotron 3系列中最大的模型,擁有約5500億總參數(550B),其中55B參數處於活躍狀態。該模型採用90%稀疏性技術,顯著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上獲得了48分,成為美國開放權重模型中智能水平最高的,遠超Gemma 4 31B(39分)、Nemotron 3 Super(36分)和gpt-oss-120b(33分),但低於中國開放權重模型Kimi K2.6(54分)。

在推理速度方面,Nemotron 3 Ultra在預發佈的DeepInfra端點上實現了超過300 tokens/s的速度,而同類中國模型(如DeepSeek和Moonshot)的市場速度通常在50-100 tokens/s之間。gpt-oss-120b的速度與Nemotron 3 Ultra相近,但智能水平顯著較低。NVIDIA表示,該模型將提供BF16權重和NVFP4量化版本,以進一步提升推理性能。

此外,該平台還報道了其他重要AI新聞:Claude Opus 4.8成為新的#1 AI模型,在GDPval-AA上取得領先,並在終端使用和科學推理方面取得進展;MiniCPM5-1B是領先的1B開放權重模型,得分為17.9;Cursor的Composer 2.5在編碼代理指數上排名第三,成本比競爭對手低10-60倍。

總體而言,Nemotron 3 Ultra的發佈標誌着美國在開放權重模型領域邁出了重要一步,儘管在智能水平上仍落後於中國領先模型,但其推理速度和稀疏性技術展示了巨大的潛力。NVIDIA計劃在正式發佈時提供更詳細的分析和完整基準測試結果。