2026-06-03 12:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

COD10K-C：在自然影像損壞下偽裝目標檢測的魯棒性基準測試

本文提出了COD10K-C基準，基於COD10K資料集，包含8種損壞型別和5個嚴重級別，共計40種條件和81,040個評估對。評估了SINet-v2、PFNet、ZoomNet和輕量級模型RobustCODLite。所有模型在損壞影像上效能顯著下降，運動模糊和高斯模糊影響最大。RobustCODLite採用損壞增強、頻率先驗分支和不確定性一致性損失，在損壞下保留92.3%的乾淨Dice分數，優於其他模型。該工作將開源以促進魯棒偽裝目標檢測研究。

來源arXiv Computer Vision作者: Arafat Hossain Sayem

近日，研究人員提出了COD10K-C基準，旨在評估偽裝目標檢測模型在自然影像損壞下的魯棒性。當前大多數標準基準僅使用乾淨影像進行測試，但現實場景中相機捕獲的影像常受模糊、感測器噪聲、天氣效果和壓縮偽影等影響。COD10K-C基於COD10K資料集，涵蓋了8種損壞型別，包括運動模糊、高斯模糊、亮度變化、霧化、對比度變化、 JPEG壓縮、畫素化以及彈性變換，每種損壞型別設定5個嚴重級別，總共建立了40種不同條件，共計81,040個評估對。這一設計使得研究人員能夠系統性地評估模型在多樣化真實世界退化下的表現。

研究團隊評估了三種流行的偽裝目標檢測模型：SINet-v2、PFNet和ZoomNet，以及他們提出的輕量級模型RobustCODLite。實驗結果顯示，所有模型在損壞影像上的效能均出現明顯下降。其中，運動模糊和高斯模糊對效能的影響最大，例如SINet-v2在運動模糊下損失了18.5個Dice點，而ZoomNet和PFNet也分別損失了15.2和16.8個Dice點。相比之下，亮度和霧化造成的效能下降較小，表明模型對全域性亮度變化和霧狀模糊具有一定的容忍度。值得注意的是，即使是效能最好的模型在嚴重損壞下也無法保持其乾淨狀態下的精度，這凸顯了魯棒性研究的重要性。

為了提升魯棒性，RobustCODLite採用了多種創新策略。首先，它引入了損壞增強訓練，即在訓練過程中隨機應用各種損壞和不同嚴重級別，使模型學會適應退化。其次，它設計了一個頻率先驗分支，利用頻域資訊增強對紋理和邊緣的感知，這對於偽裝目標尤其重要。最後，不確定性一致性損失被用於約束模型在不同損壞版本下輸出的一致性，從而減少對特定退化的過擬合。這些技術共同作用，使得RobustCODLite在損壞條件下能保留92.3%的乾淨Dice分數，而SINet-v2、ZoomNet和PFNet分別僅保留87.7%、84.8%和84.1%。在最困難的損壞條件下，例如高強度的運動模糊或高斯模糊，RobustCODLite甚至能夠達到或超越在乾淨資料上表現更好的模型，展示了其卓越的泛化能力。

該研究不僅提供了一個全面的魯棒性評估基準，還展示了透過針對性設計可以有效提升模型在複雜環境下的表現。未來，研究團隊將公開COD10K-C的GitHub倉庫，包括基準測試程式碼和預訓練模型，以推動該領域的進一步發展。這一工作預計將對自動駕駛、安防監控等依賴偽裝目標檢測的實際應用產生積極影響。