2026-07-03 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-03 16:16 UTC+8

CPG-PAD: 概念引導提示的呈現攻擊檢測

提出CPG-PAD框架，通過模型級概念引導的提示學習提升呈現攻擊檢測的跨域泛化能力。利用可解釋AI自動發現攻擊相關視覺概念，並注入提示空間，在九個基準數據集上取得最先進性能。

來源arXiv Computer Vision作者: Haoyuan Zhang, Xiangyu Zhu, Li Gao, Ajian Liu, Siran Peng, Zhen Lei

呈現攻擊檢測（PAD）是人臉識別系統抵禦打印照片、重放視頻和3D面具等攻擊的關鍵防線。儘管已有顯著進展，現有PAD模型仍因傳感器、光照和攻擊材料的差異而難以泛化到未見領域。近期視覺-語言模型（VLM）展現出強泛化能力，但其在PAD中的應用有限，因為學習的提示通常在類別標籤監督下優化，未能明確對齊細粒度的攻擊相關視覺語義，導致表示過擬合領域特定偽影而非捕獲可遷移的攻擊線索。

為解決這一問題，研究人員提出了CPG-PAD（Concept-Informed Prompts Guided Presentation Attack Detection）框架，創新地將模型級概念引導引入提示學習過程。具體而言，視覺概念驅動增強（VCE）模塊利用可解釋AI（XAI）技術自動發現PAD相關的視覺概念，並生成概念關聯熱力圖，提供局部化的細粒度引導。在這些熱力圖引導下，基於提示的概念注入（PCI）機制通過視覺-提示解碼器（VPD）和概念映射損失將概念集成到提示空間，使提示與模型的內部概念空間對齊。

該設計使CPG-PAD能夠捕獲可泛化的、領域不變攻擊線索，同時有效抑制數據集特定偏差。在九個基準數據集上的大量實驗表明，CPG-PAD在多源、有限源和單源設置下均持續達到最先進的跨域性能。該研究已被IEEE信息取證與安全彙刊（TIFS）接收。

CPG-PAD的核心貢獻在於證明了模型級概念引導可以顯著提升提示學習在細粒度視覺任務中的有效性。通過XAI自動發現的概念不僅提供了可解釋性，還增強了模型的泛化能力。未來工作可以探索將概念引導擴展到其他視覺任務，以及結合更多模態信息進一步提升檢測魯棒性。