Nemotron 3 Ultra:高速、領先的美國開放權重智慧模型
NVIDIA在Computex主題演講中釋出了Nemotron 3 Ultra,擁有550B引數(55B活躍),是美國開放權重模型中智慧最高的,AI Index得分48,推理速度超過300 tokens/s。
NVIDIA在Computex 2026主題演講中正式釋出了Nemotron 3 Ultra,這是Nemotron 3系列中最大的模型,擁有約5500億總引數(550B),其中55B引數處於活躍狀態。該模型採用90%稀疏性技術,顯著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上獲得了48分,成為美國開放權重模型中智慧水平最高的,遠超Gemma 4 31B(39分)、Nemotron 3 Super(36分)和gpt-oss-120b(33分),但低於中國開放權重模型Kimi K2.6(54分)。
在推理速度方面,Nemotron 3 Ultra在預釋出的DeepInfra端點上實現了超過300 tokens/s的速度,而同類中國模型(如DeepSeek和Moonshot)的市場速度通常在50-100 tokens/s之間。gpt-oss-120b的速度與Nemotron 3 Ultra相近,但智慧水平顯著較低。NVIDIA表示,該模型將提供BF16權重和NVFP4量化版本,以進一步提升推理效能。
此外,該平臺還報道了其他重要AI新聞:Claude Opus 4.8成為新的#1 AI模型,在GDPval-AA上取得領先,並在終端使用和科學推理方面取得進展;MiniCPM5-1B是領先的1B開放權重模型,得分為17.9;Cursor的Composer 2.5在編碼代理指數上排名第三,成本比競爭對手低10-60倍。
總體而言,Nemotron 3 Ultra的釋出標誌著美國在開放權重模型領域邁出了重要一步,儘管在智慧水平上仍落後於中國領先模型,但其推理速度和稀疏性技術展示了巨大的潛力。NVIDIA計劃在正式釋出時提供更詳細的分析和完整基準測試結果。