2026-06-01 20:40 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Nemotron 3 Ultra：高速、领先的美国开放权重智能模型

NVIDIA在Computex主题演讲中发布了Nemotron 3 Ultra，拥有550B参数（55B活跃），是美国开放权重模型中智能最高的，AI Index得分48，推理速度超过300 tokens/s。

来源Hacker News AI作者: cmrdporcupine

NVIDIA在Computex 2026主题演讲中正式发布了Nemotron 3 Ultra，这是Nemotron 3系列中最大的模型，拥有约5500亿总参数（550B），其中55B参数处于活跃状态。该模型采用90%稀疏性技术，显著提升了推理效率。Nemotron 3 Ultra在Artificial Analysis Intelligence Index上获得了48分，成为美国开放权重模型中智能水平最高的，远超Gemma 4 31B（39分）、Nemotron 3 Super（36分）和gpt-oss-120b（33分），但低于中国开放权重模型Kimi K2.6（54分）。

在推理速度方面，Nemotron 3 Ultra在预发布的DeepInfra端点上实现了超过300 tokens/s的速度，而同类中国模型（如DeepSeek和Moonshot）的市场速度通常在50-100 tokens/s之间。gpt-oss-120b的速度与Nemotron 3 Ultra相近，但智能水平显著较低。NVIDIA表示，该模型将提供BF16权重和NVFP4量化版本，以进一步提升推理性能。

此外，该平台还报道了其他重要AI新闻：Claude Opus 4.8成为新的#1 AI模型，在GDPval-AA上取得领先，并在终端使用和科学推理方面取得进展；MiniCPM5-1B是领先的1B开放权重模型，得分为17.9；Cursor的Composer 2.5在编码代理指数上排名第三，成本比竞争对手低10-60倍。

总体而言，Nemotron 3 Ultra的发布标志着美国在开放权重模型领域迈出了重要一步，尽管在智能水平上仍落后于中国领先模型，但其推理速度和稀疏性技术展示了巨大的潜力。NVIDIA计划在正式发布时提供更详细的分析和完整基准测试结果。