AI News HubLIVE
站内改写1 分钟阅读

VANDERER:基于未来感知与视觉好奇心引导的扩散策略的无地图探索

VANDERER是一种新颖的移动代理探索框架,仅使用单目摄像头数据,通过视觉好奇心模块引导预训练的扩散策略,无需传统占用地图。在模拟环境中,它平均比NoMaD多探索13.4%的区域,并发现视觉与几何好奇心在室外环境中的直接相关性。

来源arXiv Robotics作者: Venkata Naren Devarakonda, Raktim Gautam Goswami, Prashanth Krishnamurthy, Farshad Khorrami

研究人员提出了一种名为VANDERER的新型移动代理探索框架,旨在解决传感器受限环境下(如仅配备单目摄像头)的自主探索难题。传统方法依赖构建占用地图并优化未探索区域的访问顺序,但在单目视觉条件下,生成准确的占用地图极具挑战性。VANDERER创新性地引入了视觉好奇心模块(Visual Curiosity Module, VCM),该模块通过一个导航世界模型预测当前视角下执行不同动作后的未来观测结果,并利用好奇心成本(curiosity cost)对这些动作进行量化评估。这一成本信号随后被用于引导一个预训练的扩散策略(diffusion policy),使其生成能够最大化探索未知区域的连续动作序列。在多种模拟环境中的系统评估显示,VANDERER在所有测试场景中均显著优于现有基线方法,与当前最先进的NoMaD方法相比,其探索面积平均提高了13.4%。更重要的是,研究团队发现室外环境中视觉好奇心与几何好奇心之间存在直接的相关性,这意味着VANDERER能够有效利用视觉线索来推断环境的三维结构,从而在无需显式深度传感器或复杂建图算法的情况下实现高效探索。该成果由Venkata Naren Devarakonda等四位学者共同完成,相关论文已提交至arXiv(编号2606.14879),涵盖机器人学、计算机视觉与机器学习等多个交叉领域。VANDERER的成功为无人机、小型地面机器人等计算资源与传感器配置受限的自主系统提供了全新的探索范式,有望在灾难救援、地形勘测、农业巡查等实际场景中发挥重要作用。