Yuvion VL:敵対的コンテンツとAI安全性のためのマルチモーダル基盤モデル
Yuvion VLは、コンテンツとAIの安全性に特化したマルチモーダル大規模言語モデルのファミリーです。安全性を本質的に敵対的かつマルチモーダルな問題と捉え、敵対的ロバスト性を中心にパイプライン全体を設計しています。データ構築では、敵対的認識型データ合成と多段階品質管理を統合した自動パイプラインを開発。訓練では、リスク概念のクロスモーダルアライメントのための継続事前訓練、本番環境向け安全タスクのための指示後訓練、複雑タスクでの解釈可能性向上のための推論後訓練の3段階を採用。さらに、モデル固有の混乱を掘り起こし、複数画像の対比グループを構築して細粒度の視覚意味要素を明示的に識別させる「混乱-対比微調整」フレームワークを導入。YVREベンチマークセットで多様な評価を実施。Yuvion VL-32Bは、同等規模のオープンソースモデルや最高のクローズドソース商用モデルを上回る安全性性能を達成し、一般能力も維持しています。
Yuvion VLは、Shikai Qiuら54名の研究者によって提案されたマルチモーダル基盤モデルのファミリーであり、コンテンツ安全性とAI安全性に焦点を当てています。汎用モデルは、現実世界のマルチモーダルリスクを確実に識別・理解するのに苦労することが多く、これはコンテンツとAI安全性に内在するマルチモーダル敵対的性質に起因します。Yuvion VLは、安全性を本質的に敵対的かつマルチモーダルな問題として扱い、敵対的ロバスト性を中心にパイプライン全体を設計することで、このギャップを埋めます。
データ構築では、敵対的認識型データ合成と多段階品質管理を統合した自動パイプラインを開発し、ドメイン知識と推論アノテーションで強化された大規模かつ高品質なマルチモーダルサンプルを生成します。データ構築パイプラインには、敵対的サンプル生成、品質フィルタリング、ドメイン専門家によるアノテーションが含まれ、トレーニングデータの多様性と信頼性を確保します。
訓練では、リスク概念のクロスモーダルアライメントのための継続事前訓練、本番環境向け安全タスク(有害コンテンツ検出、ヘイトスピーチ認識など)のための指示後訓練、複雑タスクでの解釈可能性と性能向上のための推論後訓練からなる3段階パイプラインを採用。さらに、モデル固有の混乱を掘り起こし、複数画像の対比グループを構築して細粒度の視覚意味要素の明示的識別を強制する「混乱-対比微調整」フレームワークを導入し、敵対的安全タスクにおいて視覚的に類似したケースを異なる安全性の含意で区別できるようにします。
厳格な評価を支援するため、Yuvion VLリスク評価(YVRE)ベンチマークセットも導入され、多様な公開および内部評価をカバーし、コンテンツとAI安全性、敵対的ロバスト性、実世界能力要件に焦点を当てています。YVREは標準的な安全ベンチマークとカスタマイズされた敵対的テストセットを含み、現実世界のシナリオでのモデルのパフォーマンスを包括的に評価します。
実験の結果、Yuvion VL-32Bは業界最先端の安全性性能を達成し、同等サイズのオープンソースモデル(LLaVA-1.6、Qwen-VLなど)や最高のクローズドソース商用モデル(GPT-4V、Claude-3など)を上回りながら、同等の一般能力を維持しています。本研究はarXivで公開され(arXiv:2606.25034)、関連コードとモデルはオープンソース化される予定です。