圖像自迴歸生成的數據溯源
本研究提出了一種事後溯源框架,無需修改生成過程或輸出,即可檢測圖像自迴歸模型(IAR)生成圖像中的特徵模式,從而可靠地將生成圖像與其源模型關聯。該方法適用於已發佈的無水印圖像或未集成水印的模型,有助於防止虛假信息傳播、欺詐檢測和有害內容溯源。實驗表明該方法在多種IAR上有效,並被ICLR 2026接收。
來源arXiv Computer Vision作者: Bihe Zhao, Louis Kerner, Michel Meintz, Tameem Bakr, Franziska Boenisch, Adam Dziedzic
圖像自迴歸模型(Image Autoregressive Models, IARs)近年來在視覺內容生成領域展現出卓越能力,通過繼承自大語言模型的下一詞預測範式,實現了照片級真實感質量和快速合成。然而,隨着這些模型變得廣泛可及,需要穩健的數據溯源機制來可靠地將IAR生成的圖像追溯至合成它們的源模型。這對於防止虛假信息傳播、檢測欺詐以及歸因有害內容至關重要。
研究者發現,儘管IAR生成的圖像在視覺上通常與真實圖像難以區分,但其生成過程會在輸出中引入特徵模式,這些模式可以作為可靠的溯源信號。基於此,他們提出了一種事後(post-hoc)框架,能夠穩健地檢測這些模式以實現溯源追蹤。值得注意的是,該框架不需要修改生成過程或輸出,因此適用於無法使用傳統水印方法的場景,例如無需額外標記即可追蹤已發佈的生成內容,或未集成水印機制的模型。
研究團隊在多種IAR模型上展示了該方法的有效性,凸顯了其在自迴歸圖像生成中實現穩健數據溯源的巨大潛力。該工作已被國際學習表徵會議(ICLR)2026接收。該論文由Bihe Zhao等六位作者共同完成,於2026年6月22日提交至arXiv。實驗覆蓋了廣泛的自迴歸圖像生成模型,驗證了該方法在不同架構和訓練策略下的泛化能力。這一創新成果有望推動生成內容溯源技術的標準化,為構建可信賴的人工智能生態系統提供關鍵技術支持。