2026-05-28 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Trinity：利用合成数据统一非结构化户外环境中的类无关地形与语义分割

本文提出了一种基于Transformer的架构Trinity，能够在一个统一网络中同时进行类特定语义分割和类无关地形分割。该方法无需预定义标签或机器人相关的可通行性分数，仅基于视觉外观分割地形区域，从而学习机器人无关的视觉地形先验，可结合机器人特定经验用于下游任务。为了支持大规模训练，研究团队扩展了OAISYS模拟器并推出RUGDSynth合成数据集，同时提供了EXTerra真实世界数据集。实验验证了该方法在复杂户外环境中的有效性。

来源arXiv Robotics作者: Marcus G M\"uller, Wout Boerdijk, Maximilian Durner, Riccardo Giubilato, Abel Gawel, Wolfgang St\"urzl, Roland Siegwart, Rudolph Triebel

户外非结构化环境中的地形理解是移动机器人自主导航的关键挑战。现有的基于视觉的可通行性估计方法通常依赖机器人特定的标注或语义类别映射，这不仅限制了跨平台的迁移能力，而且当机器人能力（如尺寸、驱动方式）发生变化时需要昂贵的重新标注。同时，标准的语义分割方法只关注预定义的类别（如“道路”、“车辆”等），无法捕获多样化的地形（如泥泞、沙地、草地等不同视觉外观）。针对这些不足，研究团队提出了Trinity，一种基于Transformer的统一架构。Trinity的核心创新在于它同时执行类特定的语义分割和类无关的地形分割。类无关分割不依赖任何预定义语义标签或机器人相关的可通行性分数，而是纯粹基于地形的视觉外观进行分割。这种设计使得模型能够学习到与具体机器人无关的视觉地形先验知识。这些先验知识可以与特定机器人的经验（例如，通过少量演示或自我探索获得的可通行性反馈）结合，从而适应不同的机器人平台和任务需求。为了训练这样一个模型，需要大量涵盖各种地形外观的图像。为此，研究团队扩展了OAISYS模拟器，使其能够生成更真实的地形场景，并基于RUGD数据集创建了RUGDSynth合成数据集，该数据集包含了丰富的类无关地形样本。此外，他们还贡献了EXTerra真实世界数据集，其中图像同时标注了类特定标签（如“草地”、“碎石”等）和类无关标签（如“可通行”、“危险”等）。实验在多种复杂户外环境中进行，包括森林、山地、沙漠等，验证了Trinity联合分割方法的有效性和泛化能力。研究团队表示，代码和数据集将在论文评审后公开，以促进该领域的研究进展。