语义提取:基于LLM的机器人本体自动填充方法
提出了一种利用大语言模型(LLM)从URDF模型自动生成机器人语义本体(ontology)的初步方法,通过多数投票和语法校验提升可靠性,弥合低层描述与表征之间的差距。
arXiv 上发布的一篇新论文提出了一种自动化方法,利用大语言模型(LLM)从标准化机器人描述文件(URDF)中提取语义信息,以填充机器人本体(ontology)。该研究由LAAS-RIS的Bastien Dussard等人完成,旨在解决认知机器人学中本体手动构建的瓶颈问题。
本体在认知机器人学中扮演关键角色,它整合异构知识,支持可解释的推理,即使在持续知识更新的场景下也能保持有效。然而,传统上本体需要人工构建,效率低下。URDF 文件提供了机器人的结构和运动学描述,但其中的标识符通常缺乏直接语义,例如“arm_left”或“gripper”等名称,需要常识解释才能恢复有意义的概念。这正是大语言模型(LLM)的强项。
研究团队的管线通过向 LLM 提示现有本体中的概念,让其推断 URDF 标识符的语义关系,并确保最终分类与正式模型一致。为了提高可靠性,管线结合了多次查询的多数投票机制,以及语法和模式级验证,以保证输出符合预期的表示格式和本体约束。在实验中,他们对多种机器人(包括移动机器人、机械臂等)的URDF进行了测试,发现LLM能够正确地将“base_link”映射到“MobileBase”等类,但偶尔也会出现歧义,例如将“head”解释为摄像机平台而非人体头部。多数投票机制有效减少了这类错误。
初步结果表明,该方法能有效填补低层机器人描述与结构化、有根基的知识表示之间的鸿沟,这对于人机交互至关重要。论文将发表于2026年7月在伦敦举办的第十八届国际社会机器人学会议(ICSR 2026)。未来工作将扩展本体库,并考虑更复杂的机器人结构。