画像自己回帰生成のデータプロビナンス
本研究は、画像自己回帰モデル(IAR)によって生成された画像に現れる特徴的なパターンを検出するポストホックフレームワークを提案する。生成プロセスや出力を変更することなく、生成画像をソースモデルに確実に追跡できる。既に公開されたウォーターマークなしのコンテンツやウォーターマーク統合がないモデルにも適用可能であり、偽情報拡散防止、詐欺検出、有害コンテンツの帰属に貢献する。様々なIARで有効性が確認され、ICLR 2026に採択された。
画像自己回帰モデル(IAR)は、近年、視覚コンテンツ生成において顕著な能力を示し、大規模言語モデルから適応された次トークン予測パラダイムを通じて、写真のようにリアルな品質と高速合成を実現している。しかし、これらのモデルが広く利用可能になるにつれて、IARが生成した画像を合成元のモデルに確実に追跡するためのロバストなデータプロビナンス(由来追跡)が求められている。これは、偽情報の拡散防止、詐欺の検出、有害コンテンツの帰属に不可欠である。
研究者らは、IAR生成画像は視覚的に実写と区別がつかないことが多いものの、その生成過程で出力に特徴的なパターンが導入されることを発見した。このパターンは生成画像の信頼性の高いプロビナンス信号として機能する。この知見に基づき、彼らは事後的(ポストホック)なフレームワークを提案する。このフレームワークは生成プロセスや出力を変更する必要がなく、したがって従来のウォーターマーク法が使用できない状況、例えば追加のマークなしで既に公開された生成コンテンツやウォーターマークを統合していないモデルに対しても適用可能である。
研究チームは多様なIARにわたってアプローチの有効性を実証し、自己回帰画像生成におけるロバストなデータプロビナンス追跡への高い可能性を強調している。本成果は国際会議ICLR 2026に採択された。著者らはBihe Zhaoを含む6名で、2026年6月22日にarXivに投稿された。実験では、異なるアーキテクチャと学習戦略を持つ複数のIARモデルを対象とし、提案手法の汎用性と頑健性が確認された。この研究は、生成コンテンツのトレーサビリティ標準の確立に寄与し、信頼できる人工知能エコシステムの構築に重要な技術的基盤を提供するものである。