2026-06-05 03:57 UTC+9サイト内リライト2 分で読了更新: 2026-06-30 22:03 UTC+9

Nemotron 3.5 Content Safety: グローバルエンタープライズAIのためのカスタマイズ可能なマルチモーダルセーフティ

NVIDIA は Nemotron 3.5 Content Safety をリリースしました。これは、マルチモーダル入力、多言語対応、カスタムエンタープライズポリシーの適用、および監査可能な推論を統合したコンテンツセーフティモデルです。Google Gemma 3 4B IT をベースに LoRA アダプターで微調整され、12言語の明示的トレーニングと、約140言語へのゼロショット汎化をサポートします。自然言語によるカスタムポリシー適用と、監査可能なステップバイステップの推論を提供する THINK モードを新たに導入しました。複数の多言語・マルチモーダルセーフティベンチマークで平均約85%の精度を達成しつつ、コンパクトな4Bパラメータサイズと低レイテンシを維持しています。NVIDIA は、推論トレースを含むマルチモーダル・多言語のセーフティデータセットも公開しています。

ソースHugging Face Blog

記事インテリジェンス

エンジニア上級

要点

Nemotron 3.5 はマルチモーダル入力、多言語対応、カスタムポリシー、監査可能な推論を統合。
12言語の明示的トレーニングと、Gemma 3 ベースによる約140言語へのゼロショット汎化。
カスタムポリシー適用と THINK モード推論トレースを導入し、監査可能なセーフティ判断を実現。
ベンチマークで平均約85%の精度を達成し、推論トレースを含むマルチモーダル・多言語セーフティデータセットを公開。

重要な理由

このニュースが重要なのは、Nemotron 3.5 はマルチモーダル入力、多言語対応、カスタムポリシー、監査可能な推論を統合ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

NVIDIA は Nemotron 3.5 Content Safety をリリースしました。これは、コンテンツセーフティスタックの大幅な進化を示すものであり、マルチモーダル入力、多言語カバレッジ、カスタムエンタープライズポリシーの適用、および監査可能な推論を単一の推論呼び出しに統合し、グローバルなエンタープライズ AI 展開に強力なセーフティを提供します。

Nemotron 3.5 は Google Gemma 3 4B IT モデルをベースにしており、128K のコンテキストウィンドウを持ち、LoRA アダプターによって微調整され、ターゲットとするセーフティ分類動作を組み込んでいます。このモデルは3つの出力モードをサポートします：低レイテンシのバイナリ判定、カテゴリ付きバイナリ判定、および THINK モード（段階的な推論トレースと判定を含む）。

言語カバレッジに関して、Nemotron 3.5 は12言語（英語、フランス語、スペイン語、ドイツ語、中国語、日本語、韓国語、アラビア語、ヒンディー語、ロシア語、ポルトガル語、イタリア語）を明示的にトレーニングし、Gemma 3 ベースモデルを通じて約140言語へのゼロショット汎化を実現しています。これにより、トレーニングデータが不足している市場（東南アジア言語、スカンジナビア言語、リソースの少ないアフリカ言語など）でも、個別のファインチューニングなしで多言語転送の恩恵を受けることができます。

カスタムポリシーの適用は、Nemotron 3.5 の最も重要なアーキテクチャ上の改善点です。本番環境では、単一のユニバーサルセーフティタクソノミーの下で動作することはほとんどありません。Nemotron 3.5 は入力とともにカスタムポリシー仕様を受け入れ、モデルはそのポリシーに基づいて推論を行い、組み込みのタクソノミーに完全に依存するのではなく判定を下します。これは、以前 Nemotron Content Safety Reasoning 4B で導入された作業を、完全なマルチモーダル・多言語設定に拡張したものです。

THINK モード（推論トレース）は、各セーフティ判定に監査可能な推論を提供します。有効にすると、モデルは最終的な安全/不安全ラベルを出力する前に、ステップバイステップの推論を出力します。推論トレースは、コンプライアンスと監査ログの記録に役立つだけでなく、人間によるレビューやポリシーの反復改善もサポートします。レイテンシを制御するため、Nemotron 3.5 は2段階のプロセスで簡潔な推論チェーンを生成します：まず大きなモデル（Qwen 397B など）を使用してチェーン・オブ・ソート推論トレースを生成し、次に別の大きなモデル（Qwen 80B）を使用してそれを3文以内に圧縮します。

トレーニングデータに関して、Nemotron 3.5 は多言語テキストセーフティデータ、人間がアノテーションしたマルチモーダルデータ（99% が実際の写真で、合成生成ではありません）、セーフマルチモーダルデータ、推論トレースデータ、トピックフォローデータ、および総トレーニング量の約10%を占める合成データを使用しています。NVIDIA は Nemotron 3.5 Content Safety Dataset も公開しています。これは、オープンソースのセーフティモデルにとって重要なマイルストーンとなる、マルチモーダル・多言語でセーフティ推論トレースを含むデータセットです。

ベンチマークでは、Nemotron 3.5 は VLGuard、MM-SafetyBench、PolyGuard、RTP-LX、Aya Redteaming、XSafety などの複数の多言語・マルチモーダルセーフティベンチマークで平均約85%の精度を達成しています。多言語 Aegis では平均96.5%の有害コンテンツ分類精度、RTP-LX では88.8%を記録し、組み合わせ平均は92.7%です。

Nemotron 3.5 はコンパクトな4Bパラメータサイズを維持し、8GB以上のVRAMを搭載したGPU上でリアルタイム展開が可能であり、グローバルエンタープライズAIシステムのプロダクションパイプラインに適しています。