基于占据感知的层次化3D场景图房间分割方法
本文提出一种基于占据感知的层次化3D场景图(3DSG)流程,通过将房间节点锚定到从占据分解中提取的自由空间区域,为每个房间提供明确的凸多边形足迹。该方法在12个Matterport3D场景上评估,与现有方法相比能恢复更多房间实例,但精度较低,且墙面精确的房间边界仍是开放问题。
室内机器人需要理解空间结构以支持导航、操作等高级任务。层次化3D场景图(3DSG)是一种有效的空间表示方法,它通过多尺度组织几何与语义信息,使机器人能够在不同粒度上理解环境。其中,房间层扮演着关键角色,它将物体级的感知与房间级的推理连接起来。然而,现有系统在构建房间层时依赖于不同的空间基元,例如地点聚类、墙面平面或语义分割输出,导致不同方法生成的房间节点缺乏统一的几何评价标准,难以进行公平比较。
为了解决这一问题,来自墨西哥国立自治大学(UNAM)的研究团队提出了一种基于占据感知的3DSG流程。该方法的核心创新在于,它利用占据分解算法来跟踪环境中的自由空间区域,并将每个房间节点锚定到这些区域上,从而为每个房间生成明确的凸多边形足迹。这种设计使得房间分割结果可以直接与任意多边形标注进行几何匹配,大大简化了评估过程。
研究人员在12个Matterport3D场景上进行了系统的实验评估。他们将预测的房间多边形与人工标注的真实房间实例进行匹配,并与当前最先进的基于地点连通性的Hydra方法进行对比。结果显示,基于占据感知的方法能够恢复显著更多的房间实例,召回率明显高于Hydra,但代价是精度略低。此外,实验还发现,两种方法都无法精确捕捉与墙面一致的真实房间边界,这仍然是未来研究面临的关键挑战。
该研究的代码已在GitHub上开源,网址为https://github.com/crcz25/OccuSG。这一工作为室内机器人场景理解提供了新的视角,尤其是利用占据信息直接构建房间层,有望推动3DSG在实际机器人系统中的应用。未来研究可以进一步探索如何结合其他传感器信息(如激光雷达深度图)来提升边界精度,或者将这种方法扩展到更大规模的场景中。