Nemotron 3 Ultra:高速、领先的美国开放权重智能模型
NVIDIA在Computex主题演讲中发布了Nemotron 3 Ultra,拥有550B参数(55B活跃),是美国开放权重模型中智能最高的,AI Index得分48,推理速度超过300 tokens/s。
NVIDIA在Computex 2026主题演讲中正式发布了Nemotron 3 Ultra,这是Nemotron 3系列中最大的模型,拥有约5500亿总参数(550B),其中55B参数处于活跃状态。该模型采用90%稀疏性技术,显著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上获得了48分,成为美国开放权重模型中智能水平最高的,远超Gemma 4 31B(39分)、Nemotron 3 Super(36分)和gpt-oss-120b(33分),但低于中国开放权重模型Kimi K2.6(54分)。
在推理速度方面,Nemotron 3 Ultra在预发布的DeepInfra端点上实现了超过300 tokens/s的速度,而同类中国模型(如DeepSeek和Moonshot)的市场速度通常在50-100 tokens/s之间。gpt-oss-120b的速度与Nemotron 3 Ultra相近,但智能水平显著较低。NVIDIA表示,该模型将提供BF16权重和NVFP4量化版本,以进一步提升推理性能。
此外,该平台还报道了其他重要AI新闻:Claude Opus 4.8成为新的#1 AI模型,在GDPval-AA上取得领先,并在终端使用和科学推理方面取得进展;MiniCPM5-1B是领先的1B开放权重模型,得分为17.9;Cursor的Composer 2.5在编码代理指数上排名第三,成本比竞争对手低10-60倍。
总体而言,Nemotron 3 Ultra的发布标志着美国在开放权重模型领域迈出了重要一步,尽管在智能水平上仍落后于中国领先模型,但其推理速度和稀疏性技术展示了巨大的潜力。NVIDIA计划在正式发布时提供更详细的分析和完整基准测试结果。