AI News HubLIVE
站内改写2 分で読了

Nemotron 3.5 Content Safety: グローバルエンタープライズAIのためのカスタマイズ可能なマルチモーダルセーフティ

NVIDIA は Nemotron 3.5 Content Safety をリリースしました。これは、マルチモーダル入力、多言語対応、カスタムエンタープライズポリシーの適用、および監査可能な推論を統合したコンテンツセーフティモデルです。Google Gemma 3 4B IT をベースに LoRA アダプターで微調整され、12言語の明示的トレーニングと、約140言語へのゼロショット汎化をサポートします。自然言語によるカスタムポリシー適用と、監査可能なステップバイステップの推論を提供する THINK モードを新たに導入しました。複数の多言語・マルチモーダルセーフティベンチマークで平均約85%の精度を達成しつつ、コンパクトな4Bパラメータサイズと低レイテンシを維持しています。NVIDIA は、推論トレースを含むマルチモーダル・多言語のセーフティデータセットも公開しています。

NVIDIA は Nemotron 3.5 Content Safety をリリースしました。これは、コンテンツセーフティスタックの大幅な進化を示すものであり、マルチモーダル入力、多言語カバレッジ、カスタムエンタープライズポリシーの適用、および監査可能な推論を単一の推論呼び出しに統合し、グローバルなエンタープライズ AI 展開に強力なセーフティを提供します。

Nemotron 3.5 は Google Gemma 3 4B IT モデルをベースにしており、128K のコンテキストウィンドウを持ち、LoRA アダプターによって微調整され、ターゲットとするセーフティ分類動作を組み込んでいます。このモデルは3つの出力モードをサポートします:低レイテンシのバイナリ判定、カテゴリ付きバイナリ判定、および THINK モード(段階的な推論トレースと判定を含む)。

言語カバレッジに関して、Nemotron 3.5 は12言語(英語、フランス語、スペイン語、ドイツ語、中国語、日本語、韓国語、アラビア語、ヒンディー語、ロシア語、ポルトガル語、イタリア語)を明示的にトレーニングし、Gemma 3 ベースモデルを通じて約140言語へのゼロショット汎化を実現しています。これにより、トレーニングデータが不足している市場(東南アジア言語、スカンジナビア言語、リソースの少ないアフリカ言語など)でも、個別のファインチューニングなしで多言語転送の恩恵を受けることができます。

カスタムポリシーの適用は、Nemotron 3.5 の最も重要なアーキテクチャ上の改善点です。本番環境では、単一のユニバーサルセーフティタクソノミーの下で動作することはほとんどありません。Nemotron 3.5 は入力とともにカスタムポリシー仕様を受け入れ、モデルはそのポリシーに基づいて推論を行い、組み込みのタクソノミーに完全に依存するのではなく判定を下します。これは、以前 Nemotron Content Safety Reasoning 4B で導入された作業を、完全なマルチモーダル・多言語設定に拡張したものです。

THINK モード(推論トレース)は、各セーフティ判定に監査可能な推論を提供します。有効にすると、モデルは最終的な安全/不安全ラベルを出力する前に、ステップバイステップの推論を出力します。推論トレースは、コンプライアンスと監査ログの記録に役立つだけでなく、人間によるレビューやポリシーの反復改善もサポートします。レイテンシを制御するため、Nemotron 3.5 は2段階のプロセスで簡潔な推論チェーンを生成します:まず大きなモデル(Qwen 397B など)を使用してチェーン・オブ・ソート推論トレースを生成し、次に別の大きなモデル(Qwen 80B)を使用してそれを3文以内に圧縮します。

トレーニングデータに関して、Nemotron 3.5 は多言語テキストセーフティデータ、人間がアノテーションしたマルチモーダルデータ(99% が実際の写真で、合成生成ではありません)、セーフマルチモーダルデータ、推論トレースデータ、トピックフォローデータ、および総トレーニング量の約10%を占める合成データを使用しています。NVIDIA は Nemotron 3.5 Content Safety Dataset も公開しています。これは、オープンソースのセーフティモデルにとって重要なマイルストーンとなる、マルチモーダル・多言語でセーフティ推論トレースを含むデータセットです。

ベンチマークでは、Nemotron 3.5 は VLGuard、MM-SafetyBench、PolyGuard、RTP-LX、Aya Redteaming、XSafety などの複数の多言語・マルチモーダルセーフティベンチマークで平均約85%の精度を達成しています。多言語 Aegis では平均96.5%の有害コンテンツ分類精度、RTP-LX では88.8%を記録し、組み合わせ平均は92.7%です。

Nemotron 3.5 はコンパクトな4Bパラメータサイズを維持し、8GB以上のVRAMを搭載したGPU上でリアルタイム展開が可能であり、グローバルエンタープライズAIシステムのプロダクションパイプラインに適しています。