2026-06-25 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-25 16:03 UTC+8

BFMTrack：基于行为基础模型的物理模拟运动追踪的潜序列优化方法

一种名为潜序列优化（LSO）的新方法，通过优化行为基础模型中的潜变量序列，实现了精确的物理模拟运动追踪，并在真实人形机器人上得到验证。

来源arXiv Robotics作者: Thomas Rupf, Agon Serifi, David M\"uller, Sammy Christen, Ruben Grandia, Espen Knoop, Moritz B\"acher

行为基础模型（BFM）通过大规模运动数据集将丰富的物理合理行为组织到潜空间中，为通用物理角色控制提供了有前景的途径。这些模型在目标到达和基于状态的奖励优化等时间不变任务上表现出色，但其潜空间无法直接支持时变目标，例如追踪一段运动序列。现有的追踪启发式方法通常依赖滑动窗口平均，无法捕捉高度动态运动的细微差别，导致追踪精度受限。

为了克服这些限制，本文提出一种新颖的潜序列优化（LSO）方法。该方法将模拟推演与策略梯度更新相结合，通过优化一系列潜变量来扩展BFM的能力，使其能够实现精确的运动追踪，无需繁琐的奖励工程和参数调整。为了引导优化过程产生平滑且连贯的潜轨迹，LSO采用时间相关噪声对潜序列进行建模，确保优化出的动作序列在时间上具有连贯性。

研究团队在多个场景下验证了LSO的有效性，包括密集追踪（高频参考信号）、稀疏关键帧（少量关键姿态）以及直接部署到真实人形机器人上。实验结果表明，LSO显著提升了追踪精度和鲁棒性，尤其在处理快速、动态运动时表现优于传统方法。这项工作为将行为基础模型应用于实际机器人控制迈出了重要一步，展示了利用预训练行为先验解决复杂时序任务的可能性。未来，该方法有望在动画生成、人机交互和自动驾驶等领域发挥重要作用。