UfM*:基于高斯分布的运动不确定性用于深度神经网络深度估计
本文提出UfM*算法,通过紧凑高斯混合模型高效衡量多视图不一致性,仅需单次深度神经网络推理即可实现可靠的不确定性估计,在能耗和内存上远优于传统集成方法,适用于资源受限的机器人系统。
文章情报
要点
- UfM*利用运动信息通过高斯混合模型计算多视图不一致性,避免了传统方法多次推理的高开销。
- 相比点云方法,高斯表示在计算和内存效率上更优,并能测量三维空间区域的不一致性。
- UfM*与偶然不确定性结合,在校准误差上比集成方法提升24-28%,仅消耗3%的能量和0.02%的内存。
- 在小型能量受限机器人上以30 FPS实时运行,每帧仅需63 mJ,验证了其高效性。
为什么重要
这条新闻值得关注,因为UfM*利用运动信息通过高斯混合模型计算多视图不一致性,避免了传统方法多次推理的高开销。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
在安全关键的机器人系统中,单目深度深度神经网络(DNN)的部署需要可靠的不确定性估计。传统方法如集成学习和基于采样的方式每张图像需多次推理,导致巨大的计算和内存开销,且单帧预测无法捕捉跨视角的不一致性。针对这一挑战,来自Soumya Sudhakar等研究团队提出了UfM*(Uncertainty from Motion*),一种基于运动的不确定性估计算法。该算法通过紧凑高斯混合模型比较前后帧,仅需单次DNN推理即可高效衡量多视角不一致性。相比早期利用点云的方法,高斯表示不仅在计算和内存上更高效,还能更好地测量三维空间区域的不一致性,从而提升不确定性估计的质量。实验表明,UfM*与偶然不确定性结合后,在100个分布外ScanNet序列上,预期校准误差比集成方法改善24-28%,而能耗仅为后者的3%,内存占用仅0.02%。具体而言,集成方法需要多次推理,而UfM*只需一次,计算成本大幅降低。此外,在配备Arm Cortex-A76 CPU的小型能量受限机器人上,UfM*对224x224图像仅消耗63 mJ,即可实现30 FPS的实时运行。这充分证明,利用高斯分布衡量多视角不一致性为资源受限的机器人系统提供了高效且实用的不确定性估计方案。论文全文长达18页,包含15张图表,详细阐述了算法设计、理论分析和实验结果,并于2026年5月21日提交至arXiv,编号2605.23098,现可在该平台获取。