AI News HubLIVE
站內改寫2 分鐘閱讀

超越美學:量化渾濁場景中的資訊損失

研究人員引入了渾濁水下基線(TUB)資料集和新指標PCD,以量化極端渾濁度下水下場景的資訊損失。PCD與例項分割效能強相關,優於常用指標。

來源arXiv Computer Vision作者: Vasiliki Ismiroglou, Stefan H. Bengtson, Tasos Benos, Thomas B. Moeslund, Malte Pedersen

水下視覺在渾濁條件下會迅速退化,但計算機視覺模型受其影響的程度尚不明確。現有研究多依賴合成渾濁資料集,可能無法準確反映真實世界的資訊損失。針對這一空白,由奧爾堡大學等機構的研究人員組成的團隊釋出了Turbid Underwater Baseline (TUB)資料集。該資料集包含1320張在極端渾濁度下拍攝的影像以及超過16000個高置信度真實分割掩碼,旨在為評估水下視覺模型提供可靠的基準。這些影像涵蓋了多種渾濁度水平,並配備了精細的例項分割標註,確保能夠全面反映真實場景的複雜性。

為了量化真實渾濁場景中的資訊損失,研究者提出了PCD(Phase Congruency Degradation)指標。PCD基於相位一致性圖,這是一種與人眼視覺感知密切相關的特徵,具有對比度不變性,能夠有效捕捉結構資訊的損失。與傳統的峰值訊雜比(PSNR)、結構相似性(SSIM)等指標不同,PCD專門針對渾濁場景設計,對對比度變化不敏感,因此能更準確地評估模型在真實條件下的效能。實驗表明,在真實和合成渾濁影像上,PCD與例項分割模型(如Mask R-CNN、YOLACT)的效能呈現出強相關性(相關係數超過0.9),而現有指標則表現出弱相關甚至不相關(相關係數不足0.5)。這一發現揭示了一個重要問題:現有評價指標可能嚴重低估了渾濁對視覺模型的負面影響,導致模型在實際部署中表現不佳。

此外,研究還發現合成渾濁資料集與真實渾濁場景之間存在顯著的分佈差異,進一步強調了使用真實資料的重要性。TUB資料集的釋出正好填補了這一空白,為領域提供了寶貴的資源。該論文於2026年6月24日提交至arXiv,作者包括Vasiliki Ismiroglou等五人。TUB資料集和PCD指標不僅為水下視覺研究提供了更可靠的評估工具,還為開發更魯棒的計算機視覺模型奠定了基礎。資料集和程式碼已在專案網站(https://vap.aau.dk/pcd)公開,未來研究團隊計劃擴充套件資料集以涵蓋更多水下場景,並探索PCD在其他視覺任務(如目標檢測、語義分割)中的適用性。這項工作對於水下機器人、海洋監測、潛水輔助等應用具有重要意義,有望推動整個領域的發展。