远程单次条纹投影轮廓测量中形状先验捷径的诊断与修复
本研究针对远程(1.5-2.1米)单次条纹投影轮廓测量中基于学习的深度估计算法存在的形状先验捷径问题,提出了诊断-修复-验证框架。通过机械可解释性和共形不确定性量化,发现UNet基线模型依赖物体边界形状先验而非条纹相位解码。提出的PhiCalNet网络通过输出包裹相位并应用固定可微校准层,将物体平均绝对误差降低3.3倍至4.46毫米,并验证了架构而非损失函数是关键因素。
基于学习的单次条纹投影轮廓测量(FPP)在近距离场景中已得到广泛研究,但远程(超过1米)场景仍面临诸多挑战。由于光强随距离平方衰减,条纹信噪比降低,物理真值退化,且单次图像缺失条纹阶次信息,导致问题不适定。现有网络架构的机制尚未被深入研究。
本研究由Adam Haroon等人提出了一种诊断-修复-验证框架,结合机械可解释性(MI)和共形不确定性量化(UQ)作为收敛诊断工具。在包含15,600张条纹图像、50个物体、距离1.5-2.1米的光真实合成基准上,最佳UNet基线的物体平均绝对误差(MAE)为14.54毫米。通过线性探针、Grad-CAM和平坦面分布外测试三种探针,发现基线模型并非通过条纹相位解码,而是利用物体边界形状先验来完成任务。
为解决这一问题,研究者提出了PhiCalNet网络,该网络输出包裹相位而非深度,并应用固定可微校准层将相位映射为深度,从架构上而非通过损失惩罚消除了形状先验解。对比实验表明,在深度回归网络上施加相同物理原理的物理信息损失函数并未带来可测量的改进,从而确认架构是关键因素。PhiCalNet将物体MAE降低3.3倍至4.46毫米,残余误差主要来自±π包裹不连续处的0.103%像素。
像素级共形UQ进一步验证了诊断:拒绝按快照不一致性排序的前5%物体像素,PhiCalNet的均方根误差降低64%(从20.6毫米降至7.4毫米),而基线仅降低3.5%。MI和UQ在相同的故障点上达成一致,证明了诊断的有效性。该研究为远程单次FPP提供了一种可靠的解决方案,并为深度学习模型的机械可解释性分析提供了范例。