AI News HubLIVE
站内改写1 分で読了

Nemotron 3 Ultra:高速、最先端の米国オープンウェイトインテリジェンス

NVIDIAはComputex基調講演でNemotron 3 Ultraを発表。550Bパラメータ(55Bアクティブ)で、米国オープンウェイトモデルで最高の知能を誇り、AI Indexスコア48、推論速度は300トークン/秒超。

ソースHacker News AI著者: cmrdporcupine

NVIDIAはComputex 2026のキーノートで、Nemotron 3シリーズ最大のモデル「Nemotron 3 Ultra」を発表しました。総パラメータ約5500億(550B)、アクティブパラメータ55Bで、90%のスパース性を採用し、推論効率を大幅に向上させています。Artificial Analysis Intelligence Indexで48点を獲得し、米国オープンウェイトモデルの中で最高の知能レベルを達成。Gemma 4 31B(39点)、Nemotron 3 Super(36点)、gpt-oss-120b(33点)を上回りましたが、中国のKimi K2.6(54点)には及びません。

推論速度については、プレリリースのDeepInfraエンドポイントで毎秒300トークン以上を記録。一方、DeepSeekやMoonshot(Kimi)などの中国ラボの同クラスモデルは、市場で毎秒50~100トークン程度です。gpt-oss-120bは同程度の速度ですが、知能は大幅に低くなっています。NVIDIAは、BF16ウェイトに加えてNVFP4量子化版も提供し、さらなる推論性能向上を図る予定です。

また、同プラットフォームでは以下の注目ニュースも報じられています:Claude Opus 4.8が新たな#1 AIモデルに、MiniCPM5-1Bが1Bオープンウェイトモデルで首位、CursorのComposer 2.5がコーディングエージェント指標で3位にランクイン。

全体として、Nemotron 3 Ultraのリリースは、米国がオープンウェイトモデル分野で重要な一歩を踏み出したことを示しています。知能レベルでは中国の先行モデルに劣るものの、その推論速度とスパース性技術は大きな可能性を示しています。NVIDIAは正式リリース時に、より詳細な分析と完全なベンチマーク結果を共有する予定です。