2026-06-17站内改写1 分鐘閱讀更新: 2026-06-17

遠端單次條紋投影輪廓測量中形狀先驗捷徑的診斷與修復

本研究針對遠端（1.5-2.1米）單次條紋投影輪廓測量中基於學習的深度估計演算法存在的形狀先驗捷徑問題，提出了診斷-修復-驗證框架。透過機械可解釋性和共形不確定性量化，發現UNet基線模型依賴物體邊界形狀先驗而非條紋相位解碼。提出的PhiCalNet網路透過輸出包裹相位並應用固定可微校準層，將物體平均絕對誤差降低3.3倍至4.46毫米，並驗證了架構而非損失函式是關鍵因素。

來源arXiv Machine Learning作者: Adam Haroon, Anush Lakshman, Cody Fleming, Beiwen Li

基於學習的單次條紋投影輪廓測量（FPP）在近距離場景中已得到廣泛研究，但遠端（超過1米）場景仍面臨諸多挑戰。由於光強隨距離平方衰減，條紋訊雜比降低，物理真值退化，且單次影像缺失條紋階次資訊，導致問題不適定。現有網路架構的機制尚未被深入研究。

本研究由Adam Haroon等人提出了一種診斷-修復-驗證框架，結合機械可解釋性（MI）和共形不確定性量化（UQ）作為收斂診斷工具。在包含15,600張條紋影像、50個物體、距離1.5-2.1米的光真實合成基準上，最佳UNet基線的物體平均絕對誤差（MAE）為14.54毫米。透過線性探針、Grad-CAM和平坦面分布外測試三種探針，發現基線模型並非透過條紋相位解碼，而是利用物體邊界形狀先驗來完成任務。

為解決這一問題，研究者提出了PhiCalNet網路，該網路輸出包裹相位而非深度，並應用固定可微校準層將相位對映為深度，從架構上而非透過損失懲罰消除了形狀先驗解。對比實驗表明，在深度迴歸網路上施加相同物理原理的物理資訊損失函式並未帶來可測量的改進，從而確認架構是關鍵因素。PhiCalNet將物體MAE降低3.3倍至4.46毫米，殘餘誤差主要來自±π包裹不連續處的0.103%畫素。

畫素級共形UQ進一步驗證了診斷：拒絕按快照不一致性排序的前5%物體畫素，PhiCalNet的均方根誤差降低64%（從20.6毫米降至7.4毫米），而基線僅降低3.5%。MI和UQ在相同的故障點上達成一致，證明了診斷的有效性。該研究為遠端單次FPP提供了一種可靠的解決方案，併為深度學習模型的機械可解釋性分析提供了範例。