AI News HubLIVE
站内改写

AINews:今日は特に大きなニュースなし

静かな一日だが、NVIDIA Nemotron 3 Nano Omni、vLLM v0.20、Poolside初の公開モデル、DeepSeek V4の推論ベンチマークなど注目すべき発表があった。エージェントツールが成熟し、新しいベンチマークも登場している。

記事インテリジェンス

エンジニア上級

要点

  • NVIDIAが256Kコンテキストを持つ30BマルチモーダルMoEモデルNemotron 3 Nano Omniを発表。
  • vLLM v0.20がTurboQuant、MLAプレフィルのFA4、新しいIR基盤を導入。
  • Poolsideが初の公開コードモデルLaguna XS.2(33B総パラメータ/3Bアクティブ)をApache 2.0でリリース。
  • DeepSeek V4の推論ベンチマークでB300がH200の最大8倍高速化。

重要な理由

このニュースが重要なのは、NVIDIAが256Kコンテキストを持つ30BマルチモーダルMoEモデルNemotron 3 Nano Omniを発表ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

本日のAIニュースは比較的静かでしたが、いくつかの重要な発表がありました。まず、NVIDIAはNemotron 3 Nano Omniをリリースしました。これは30B/3BのマルチモーダルMoEモデルで、256Kコンテキストを備え、テキスト、画像、ビデオ、音声、ドキュメントを処理可能なエージェントワークロード向けに設計されています。OpenRouter、LM Studio、Ollamaなど複数のプラットフォームで即日利用可能となり、NVIDIAは同様のオープンモデルと比較して約9倍のスループットを実現していると述べています。

推論システムでは、vLLM v0.20.0がリリースされ、メモリとMoEサービングの効率向上に重点が置かれました。主な機能には、TurboQuant 2ビットKVキャッシュ(KV容量4倍)、SM90+でのMLAプリフィル向けFA4の再有効化、新しいvLLM IR基盤、融合RMSNorm(エンドツーエンドのレイテンシを2.1%改善)、およびBlackwell、Jetson Thor、ROCm、Intel XPU上でのDeepSeek V4 MegaMoEのサポートが含まれます。また、SemiAnalysisはB200/B300/H200/GB2026上のDeepSeek V4 Proの初期推論結果を発表し、B300はH200よりもこのワークロードで最大8倍高速であると主張しています。

オープンモデルでは、Poolsideが初の公開モデルLaguna XS.2をリリースしました。これは33B総パラメータ/3BアクティブパラメータのMoEコードモデルで、完全に社内データでトレーニングされ、Apache 2.0ライセンスで提供され、単一GPUで実行可能です。さらに、MicrosoftはTRELLIS.2を発表しました。これはオープンソースの4Bパラメータ画像-to-3Dモデルで、最大1536³解像度のPBRテクスチャアセットを生成できます。

エージェントツールでは、MistralがエンタープライズAIプロセスのオーケストレーションレイヤーとしてWorkflowsのパブリックプレビューを開始しました。ローカルエージェントも進展し、Tekniumは完全オフラインエージェントが可能になったと述べています。Hermesエージェントフレームワークは、指示追従や実用的なワークフローでOpenClawを上回るパフォーマンスを示しています。

ベンチマークでは、EpochはGPT-5.5 ProがEpoch Capabilities Indexで159点を記録し、FrontierMathで新記録を達成したと報告しました。VibeBenchは1000人の資格のあるソフトウェアエンジニアによる主観的テストを提案しています。研究ノートには、DeepSpeedとOpenRLHFのバグ修正、およびDeepSeek-V4論文の圧縮スパースアテンションの忠実な実装が含まれていました。