2026-06-04 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

基于联合潜在扩散的单图像反射分离

本文提出一种专门针对单图像反射分离任务微调的扩散模型，通过联合生成透射层和反射层，并引入跨层自注意力机制和不相交采样策略，在强光或弱反射等极端条件下显著优于现有方法。

来源arXiv Computer Vision作者: Zheng-Hui Huang, Zhixiang Wang, Yu-Lun Liu, Yung-Yu Chuang

单图像反射分离是计算机视觉领域长期存在的难题，尤其在存在强光眩光或微弱反射等极端条件下，传统方法由于信息不足，难以同时准确恢复透射层和反射层。针对这一瓶颈，来自CVPR 2026的一篇论文提出了一种专门针对该任务微调的潜在扩散模型，利用生成式扩散先验实现鲁棒的层分离。该方法通过一个统一的扩散模型同时生成透射层和反射层，并创新性地引入了跨层自注意力机制，以促进两个层之间特征的解耦。该跨层自注意力机制使得透射层和反射层的特征能够在不同尺度上进行交互，从而更有效地分离彼此。为了进一步减少扩散过程中层间的相互干扰，研究者提出了一种不相交采样策略，该策略在每一步迭代中交替更新两个层，有效降低了耦合。此外，模型还包含一个带有学习合成函数的潜在优化步骤，使得在复杂真实场景中能够获得更优的重建结果。该步骤通过一个可学习的函数模拟图像形成过程，进一步校正重构图像的质量。广泛的实验表明，该方法在多个真实世界基准数据集（如Flickr、SIR等）上超越了现有的最先进技术。例如，在标准测试集上，该模型在PSNR和SSIM等指标上均取得了显著提升，尤其在处理包含强烈眩光或微弱反射的困难样本时，优势更为明显。论文还提供了项目页面和代码，便于其他研究者复现和进一步探索。该工作为单图像反射分离提供了一种新的思路，展示了扩散模型在低层视觉任务中的巨大潜力，有望推动相关领域的发展。