COD10K-C:在自然图像损坏下伪装目标检测的鲁棒性基准测试
本文提出了COD10K-C基准,基于COD10K数据集,包含8种损坏类型和5个严重级别,共计40种条件和81,040个评估对。评估了SINet-v2、PFNet、ZoomNet和轻量级模型RobustCODLite。所有模型在损坏图像上性能显著下降,运动模糊和高斯模糊影响最大。RobustCODLite采用损坏增强、频率先验分支和不确定性一致性损失,在损坏下保留92.3%的干净Dice分数,优于其他模型。该工作将开源以促进鲁棒伪装目标检测研究。
近日,研究人员提出了COD10K-C基准,旨在评估伪装目标检测模型在自然图像损坏下的鲁棒性。当前大多数标准基准仅使用干净图像进行测试,但现实场景中相机捕获的图像常受模糊、传感器噪声、天气效果和压缩伪影等影响。COD10K-C基于COD10K数据集,涵盖了8种损坏类型,包括运动模糊、高斯模糊、亮度变化、雾化、对比度变化、 JPEG压缩、像素化以及弹性变换,每种损坏类型设置5个严重级别,总共创建了40种不同条件,共计81,040个评估对。这一设计使得研究人员能够系统性地评估模型在多样化真实世界退化下的表现。
研究团队评估了三种流行的伪装目标检测模型:SINet-v2、PFNet和ZoomNet,以及他们提出的轻量级模型RobustCODLite。实验结果显示,所有模型在损坏图像上的性能均出现明显下降。其中,运动模糊和高斯模糊对性能的影响最大,例如SINet-v2在运动模糊下损失了18.5个Dice点,而ZoomNet和PFNet也分别损失了15.2和16.8个Dice点。相比之下,亮度和雾化造成的性能下降较小,表明模型对全局亮度变化和雾状模糊具有一定的容忍度。值得注意的是,即使是性能最好的模型在严重损坏下也无法保持其干净状态下的精度,这凸显了鲁棒性研究的重要性。
为了提升鲁棒性,RobustCODLite采用了多种创新策略。首先,它引入了损坏增强训练,即在训练过程中随机应用各种损坏和不同严重级别,使模型学会适应退化。其次,它设计了一个频率先验分支,利用频域信息增强对纹理和边缘的感知,这对于伪装目标尤其重要。最后,不确定性一致性损失被用于约束模型在不同损坏版本下输出的一致性,从而减少对特定退化的过拟合。这些技术共同作用,使得RobustCODLite在损坏条件下能保留92.3%的干净Dice分数,而SINet-v2、ZoomNet和PFNet分别仅保留87.7%、84.8%和84.1%。在最困难的损坏条件下,例如高强度的运动模糊或高斯模糊,RobustCODLite甚至能够达到或超越在干净数据上表现更好的模型,展示了其卓越的泛化能力。
该研究不仅提供了一个全面的鲁棒性评估基准,还展示了通过针对性设计可以有效提升模型在复杂环境下的表现。未来,研究团队将公开COD10K-C的GitHub仓库,包括基准测试代码和预训练模型,以推动该领域的进一步发展。这一工作预计将对自动驾驶、安防监控等依赖伪装目标检测的实际应用产生积极影响。