CPG-PAD: 概念引导提示的呈现攻击检测
提出CPG-PAD框架,通过模型级概念引导的提示学习提升呈现攻击检测的跨域泛化能力。利用可解释AI自动发现攻击相关视觉概念,并注入提示空间,在九个基准数据集上取得最先进性能。
呈现攻击检测(PAD)是人脸识别系统抵御打印照片、重放视频和3D面具等攻击的关键防线。尽管已有显著进展,现有PAD模型仍因传感器、光照和攻击材料的差异而难以泛化到未见领域。近期视觉-语言模型(VLM)展现出强泛化能力,但其在PAD中的应用有限,因为学习的提示通常在类别标签监督下优化,未能明确对齐细粒度的攻击相关视觉语义,导致表示过拟合领域特定伪影而非捕获可迁移的攻击线索。
为解决这一问题,研究人员提出了CPG-PAD(Concept-Informed Prompts Guided Presentation Attack Detection)框架,创新地将模型级概念引导引入提示学习过程。具体而言,视觉概念驱动增强(VCE)模块利用可解释AI(XAI)技术自动发现PAD相关的视觉概念,并生成概念关联热力图,提供局部化的细粒度引导。在这些热力图引导下,基于提示的概念注入(PCI)机制通过视觉-提示解码器(VPD)和概念映射损失将概念集成到提示空间,使提示与模型的内部概念空间对齐。
该设计使CPG-PAD能够捕获可泛化的、领域不变攻击线索,同时有效抑制数据集特定偏差。在九个基准数据集上的大量实验表明,CPG-PAD在多源、有限源和单源设置下均持续达到最先进的跨域性能。该研究已被IEEE信息取证与安全汇刊(TIFS)接收。
CPG-PAD的核心贡献在于证明了模型级概念引导可以显著提升提示学习在细粒度视觉任务中的有效性。通过XAI自动发现的概念不仅提供了可解释性,还增强了模型的泛化能力。未来工作可以探索将概念引导扩展到其他视觉任务,以及结合更多模态信息进一步提升检测鲁棒性。