MASt3R-Nav:基于相对三维地图的WayPixel导航
一种名为MASt3R-Nav的新型视觉导航方法,利用像素相对连通性构建几何精确但无需全局一致性的地图,相比传统拓扑图实现更强大的导航能力。
文章情报
要点
- 提出像素相对连通图作为新型地图表示。
- 利用三维基础图像匹配建立图像间的像素对应。
- 推导出WayPixel代价图用于全局路径规划和控制器训练。
- 在仿真和真实场景中验证了优越性能。
为什么重要
这条新闻值得关注,因为提出像素相对连通图作为新型地图表示。
技术影响
可能影响 Agent 架构、工具调用、工作流自动化和产品集成。
在机器人视觉导航领域,地图表示方式是决定导航能力的关键因素。传统方法主要分为两类:一类是基于全局一致三维几何的经典地图,这类地图精确但构建复杂,对计算和存储要求高;另一类是图像或物体级别的拓扑图,它们舍弃了几何理解以换取构建的简便性,但代价是导航能力受限,往往只能执行“教-重复”式的简单任务。为了在几何精度和可扩展性之间取得平衡,来自多所机构的研究人员提出了MASt3R-Nav系统,其核心是一种新颖的“像素相对连通图”(pixel-relative connectivity)表示法。
该方法受近期三维基础图像匹配技术的启发,通过图像序列中每对图像之间的像素对应关系,在相对三维坐标系下建立跨图像连通性,从而构建地图。具体而言,系统利用像素在各自图像对相对坐标系中的对应关系,逐步建立图像间的连接,形成一张无需全局几何一致性的像素级图。在此基础上,研究者通过近似和稀疏化图像内部像素连通性,实现了全局路径规划,并进一步推导出一种名为“WayPixel代价图”(WayPixel Costmap)的表示形式。该代价图是一种密集的像素级代价地图,能够反映不同区域的导航成本。随后,系统训练了一个控制器,以该代价图为条件来预测轨迹展开。
实验结果表明,这种基于相对几何的密集像素级代价图,作为控制预测的条件变量,比图像级或物体级的表示更为准确。MASt3R-Nav在四种典型的导航任务仿真中均表现出色,并在真实世界演示中验证了其有效性。该工作已被2026年IEEE国际机器人与自动化大会(ICRA)接收。MASt3R-Nav为视觉导航提供了一种兼顾几何精度与可扩展性的新思路,有望推动机器人自主导航技术在实际应用中的进一步发展。