AI News HubLIVE
站内改写1 分鐘閱讀

遠程單次條紋投影輪廓測量中形狀先驗捷徑的診斷與修復

本研究針對遠程(1.5-2.1米)單次條紋投影輪廓測量中基於學習的深度估計算法存在的形狀先驗捷徑問題,提出了診斷-修復-驗證框架。通過機械可解釋性和共形不確定性量化,發現UNet基線模型依賴物體邊界形狀先驗而非條紋相位解碼。提出的PhiCalNet網絡通過輸出包裹相位並應用固定可微校準層,將物體平均絕對誤差降低3.3倍至4.46毫米,並驗證了架構而非損失函數是關鍵因素。

來源arXiv Machine Learning作者: Adam Haroon, Anush Lakshman, Cody Fleming, Beiwen Li

基於學習的單次條紋投影輪廓測量(FPP)在近距離場景中已得到廣泛研究,但遠程(超過1米)場景仍面臨諸多挑戰。由於光強隨距離平方衰減,條紋信噪比降低,物理真值退化,且單次圖像缺失條紋階次信息,導致問題不適定。現有網絡架構的機制尚未被深入研究。

本研究由Adam Haroon等人提出了一種診斷-修復-驗證框架,結合機械可解釋性(MI)和共形不確定性量化(UQ)作為收斂診斷工具。在包含15,600張條紋圖像、50個物體、距離1.5-2.1米的光真實合成基準上,最佳UNet基線的物體平均絕對誤差(MAE)為14.54毫米。通過線性探針、Grad-CAM和平坦面分布外測試三種探針,發現基線模型並非通過條紋相位解碼,而是利用物體邊界形狀先驗來完成任務。

為解決這一問題,研究者提出了PhiCalNet網絡,該網絡輸出包裹相位而非深度,並應用固定可微校準層將相位映射為深度,從架構上而非通過損失懲罰消除了形狀先驗解。對比實驗表明,在深度迴歸網絡上施加相同物理原理的物理信息損失函數並未帶來可測量的改進,從而確認架構是關鍵因素。PhiCalNet將物體MAE降低3.3倍至4.46毫米,殘餘誤差主要來自±π包裹不連續處的0.103%像素。

像素級共形UQ進一步驗證了診斷:拒絕按快照不一致性排序的前5%物體像素,PhiCalNet的均方根誤差降低64%(從20.6毫米降至7.4毫米),而基線僅降低3.5%。MI和UQ在相同的故障點上達成一致,證明了診斷的有效性。該研究為遠程單次FPP提供了一種可靠的解決方案,併為深度學習模型的機械可解釋性分析提供了範例。