長距離単一ショット縞投影プロフィロメトリにおける形状事前知識のショートカットの診断と修復
本研究は、長距離(1.5-2.1メートル)単一ショット縞投影プロフィロメトリ(FPP)における学習ベースの深度推定アルゴリズムの形状事前知識ショートカット問題に取り組む。メカニスティック解釈可能性とコンフォーマル不確実性定量化を用いて、UNetベースラインが縞位相復号ではなく物体境界形状事前知識に依存していることを診断。提案するPhiCalNetは、ラップ位相を出力し、固定微分可能校正層を適用することで、物体平均絶対誤差を3.3倍削減し4.46 mmとし、アーキテクチャが重要因子であることを確認した。
学習ベースの単一ショット縞投影プロフィロメトリ(FPP)は近距離では広く研究されてきたが、長距離(1m超)の領域では多くの課題が残されている。逆二乗則による強度減衰で縞信号対雑音比が低下し、物理的真値が劣化することに加え、単一画像からは縞次数情報が欠落するため不良設定問題となる。これらのアーキテクチャのメカニズムは十分に研究されていない。
本研究では、Adam Haroonらがメカニスティック解釈可能性(MI)とコンフォーマル不確実性定量化(UQ)を収束診断ツールとして用いた診断-修復-検証フレームワークを提案する。15,600枚の縞画像、50物体、距離1.5-2.1mのフォトリアリスティック合成ベンチマークにおいて、最良のUNetベースラインの物体平均絶対誤差(MAE)は14.54 mmであった。線形プローブ、Grad-CAM、平面分布外テストの3つのプローブにより、ベースラインが縞位相復号ではなく、物体境界の形状事前知識を用いてタスクを解決していることが明らかになった。
この問題に対処するため、研究者らはPhiCalNetを提案した。PhiCalNetは深度ではなくラップ位相を出力し、固定微分可能な校正層を適用して位相を深度にマッピングする。これにより、損失ペナルティではなくアーキテクチャ的に形状事前知識の解を仮説空間から除去する。深度回帰ネットワークに同じ物理原理を課す物理情報損失関数を適用しても測定可能な改善は見られず、アーキテクチャが動作因子であることが確認された。PhiCalNetは物体MAEを3.3倍削減し4.46 mmとし、残差は±πラップ不連続部の0.103%のピクセルに起因する。
ピクセル単位のコンフォーマルUQは診断を裏付ける:スナップショット不一致度で上位5%の物体ピクセルを拒否すると、PhiCalNetのRMSEが64%低下(20.6 mm→7.4 mm)したのに対し、ベースラインでは3.5%の低下にとどまった。MIとUQは同じ故障点で収束し、診断の有効性が示された。本研究は、長距離単一ショットFPPに信頼性の高い解決策を提供するとともに、深層学習モデルのメカニスティック解釈可能性解析の好例を示している。