AI News HubLIVE
站内改写2 分钟阅读

超越美学:量化浑浊场景中的信息损失

研究人员引入了浑浊水下基线(TUB)数据集和新指标PCD,以量化极端浑浊度下水下场景的信息损失。PCD与实例分割性能强相关,优于常用指标。

来源arXiv Computer Vision作者: Vasiliki Ismiroglou, Stefan H. Bengtson, Tasos Benos, Thomas B. Moeslund, Malte Pedersen

水下视觉在浑浊条件下会迅速退化,但计算机视觉模型受其影响的程度尚不明确。现有研究多依赖合成浑浊数据集,可能无法准确反映真实世界的信息损失。针对这一空白,由奥尔堡大学等机构的研究人员组成的团队发布了Turbid Underwater Baseline (TUB)数据集。该数据集包含1320张在极端浑浊度下拍摄的图像以及超过16000个高置信度真实分割掩码,旨在为评估水下视觉模型提供可靠的基准。这些图像涵盖了多种浑浊度水平,并配备了精细的实例分割标注,确保能够全面反映真实场景的复杂性。

为了量化真实浑浊场景中的信息损失,研究者提出了PCD(Phase Congruency Degradation)指标。PCD基于相位一致性图,这是一种与人眼视觉感知密切相关的特征,具有对比度不变性,能够有效捕捉结构信息的损失。与传统的峰值信噪比(PSNR)、结构相似性(SSIM)等指标不同,PCD专门针对浑浊场景设计,对对比度变化不敏感,因此能更准确地评估模型在真实条件下的性能。实验表明,在真实和合成浑浊图像上,PCD与实例分割模型(如Mask R-CNN、YOLACT)的性能呈现出强相关性(相关系数超过0.9),而现有指标则表现出弱相关甚至不相关(相关系数不足0.5)。这一发现揭示了一个重要问题:现有评价指标可能严重低估了浑浊对视觉模型的负面影响,导致模型在实际部署中表现不佳。

此外,研究还发现合成浑浊数据集与真实浑浊场景之间存在显著的分布差异,进一步强调了使用真实数据的重要性。TUB数据集的发布正好填补了这一空白,为领域提供了宝贵的资源。该论文于2026年6月24日提交至arXiv,作者包括Vasiliki Ismiroglou等五人。TUB数据集和PCD指标不仅为水下视觉研究提供了更可靠的评估工具,还为开发更鲁棒的计算机视觉模型奠定了基础。数据集和代码已在项目网站(https://vap.aau.dk/pcd)公开,未来研究团队计划扩展数据集以涵盖更多水下场景,并探索PCD在其他视觉任务(如目标检测、语义分割)中的适用性。这项工作对于水下机器人、海洋监测、潜水辅助等应用具有重要意义,有望推动整个领域的发展。