2026-06-04 13:00 UTC+9サイト内リライト1 分で読了更新: 2026-06-30 22:03 UTC+9

結合潜在拡散による単一画像からの反射分離

本研究では、単一画像からの反射分離に特化して微調整された拡散モデルを提案。透過層と反射層を同時に生成し、クロス層自己注意機構と非結合サンプリング戦略により、強いグレアや弱い反射などの極端条件下で既存手法を凌駕する性能を達成した。

ソースarXiv Computer Vision著者: Zheng-Hui Huang, Zhixiang Wang, Yu-Lun Liu, Yung-Yu Chuang

単一画像からの反射分離はコンピュータビジョンにおける長年の課題であり、特に強いグレアや弱い反射などの極端な条件下では、既存手法は情報不足のために透過層と反射層の両方を正確に復元することが困難でした。この問題に対して、CVPR 2026で発表された論文は、タスクに特化して微調整された潜在拡散モデルを提案し、生成拡散事前分布を活用したロバストな層分離を実現しています。提案手法は、統一された拡散モデルを通じて透過層と反射層を同時に生成し、新規のクロス層自己注意機構を導入することで、二つの層の特徴を効果的に解離します。このクロス層自己注意機構は、異なるスケールで特徴を相互作用させ、層間の分離を促進します。さらに、拡散中の層間干渉を低減するために、非結合サンプリング戦略を提案し、各イテレーションで二つの層を交互に更新することで結合を低減します。また、学習された合成関数を用いた潜在最適化ステップを追加し、複雑な実世界シーンでの再構成品質を向上させます。このステップでは、画像形成過程を模倣する学習可能な関数により、再構成画像の品質をさらに校正します。広範な実験により、本手法はFlickrやSIRなどの複数の実世界ベンチマークデータセットにおいて、既存の最先端手法を上回る性能を示しました。例えば、標準テストセットではPSNRやSSIMなどの指標で大幅な改善が確認され、特に強いグレアや弱い反射を含む困難なサンプルで顕著な優位性を示しました。論文ではプロジェクトページとコードも公開されており、他の研究者による再現やさらなる研究が促進されています。本研究は、単一画像反射分離に新たなアプローチを提供し、拡散モデルの低レベルビジョンタスクにおける大きな可能性を示しており、関連分野の発展に貢献することが期待されます。