AI News HubLIVE
站内改写1 分钟阅读

SCOUT:基于不确定性引导遍历的语义场景覆盖

SCOUT是一个在线语义探索框架,通过将主动遍历与概率场景图构建相结合,使机器人能够逐步理解环境。它利用不确定性引导的遍历规划器,在语义确定性增益、几何覆盖增益和移动成本之间取得平衡,从而实现自主的长期场景理解和更新。

来源arXiv Robotics作者: Junyu Mao, Sara Ayoubi, Vishnu D. Sharma, Ilija Had\v{z}i\'c, Matthew Andrews

近日,一篇题为《SCOUT: Semantic scene COverage via Uncertainty-guided Traversal》的论文在arXiv上发布,提出了一种新颖的在线语义探索框架。该框架旨在解决长期运行机器人在环境理解中的关键问题——机器人不应仅仅访问空间,而应逐步理解空间。

传统3D场景图管道通常将感知视为固定数据集的后处理阶段,将场景表示与决定观察内容的决策相分离。SCOUT通过耦合主动遍历与概率场景图构建,打破了这一局限。给定先验2D占用地图和带有位姿的RGB-D观测,SCOUT增量式地构建一个不确定性感知的3D场景图。图中的节点维护融合的几何信息和开放词汇对象标签的后验信念,而边则编码如“在...上”、“内部”、“属于”和“旁边”等结构关系。

这些信念被反馈给一个不确定性引导的遍历规划器,该规划器通过平衡预期的语义确定性增益、几何覆盖增益和移动成本来选择视角。这样,当额外证据有意义时,机器人会重新访问模糊对象;当场景仍不完整时,则扩展到未知自由空间。

最终系统将语义场景完整性视为操作目标,而非语义映射的被动副产品。这标志着向能够以最少人工干预巡逻、更新和推理变化室内环境的自主代理迈进了一步。该论文已被2026年ICRA不确定性开放世界机器人研讨会接收。

SCOUT的设计考虑到了实际部署中的挑战,例如如何在部分已知环境中高效决策,以及如何处理开放世界中的未知物体类别。通过使用开放词汇标签,SCOUT能够识别未在训练集中出现的新物体,从而增强了系统的适应性。实验结果表明,在多个模拟和真实环境中,SCOUT在语义覆盖率和探索效率上均优于传统方法,为长周期自主机器人应用提供了新的可能性。