轮式四足机器人的竞速:通过模型预测控制主动抑制载荷转移
本文提出了一种结合模型预测控制(MPC)和强化学习(RL)的层次化控制框架,用于在自主竞速中管理轮式四足机器人的侧向载荷转移。该框架包括离线最优路径生成、在线MPC规划器以及直接作用于16个执行器的全身RL策略。实验表明,主动侧倾控制将平均载荷转移率降低44%,最快圈速提升8.7%,峰值侧向加速度提高21.3%至1.98 m/s²。
- 层次化控制框架结合MPC和RL,主动管理侧向载荷转移
- 机器人腿部执行器充当主动悬架,膝关节产生抗侧倾扭矩
Use abstract and metadata; check individual paper license before full text.
本文提出了一种结合模型预测控制(MPC)和强化学习(RL)的层次化控制框架,用于在自主竞速中管理轮式四足机器人的侧向载荷转移。该框架包括离线最优路径生成、在线MPC规划器以及直接作用于16个执行器的全身RL策略。实验表明,主动侧倾控制将平均载荷转移率降低44%,最快圈速提升8.7%,峰值侧向加速度提高21.3%至1.98 m/s²。
NavIsaacLab是一个基于Isaac Lab的框架,利用基于物理和逼真的场景渲染以及GPU并行模拟,为机器人导航提供实时的3D视觉反馈。它采用数据驱动方法,结合轨迹扩散模型和对抗运动学习控制器,实现可控的、基于物理的行人模拟,并整合多种跨尺度场景,为人感知导航算法提供强大的基准测试。
这篇论文提出了TaskNPoint训练协议,通过人类教练提供少量输入(技能集、一次演示、交互窗口和目标),让人形机器人在物理仿真环境中快速掌握动态技能。实验在Unitree G1人形机器人上进行,成功执行了网球正反手击球、踢足球和搬箱子等任务,且训练时间不到一小时,无需每任务奖励调整。
RoboTales是一个低成本机器人讲故事系统,通过富有表现力的袜子木偶动作来演绎叙事。在Baxter机器人上的自主测试实现中,该系统同步叙述、手势和嘴部动作来表演角色驱动的故事。一项初步研究表明,木偶式讲故事优于仅手势模式,获得了更高的HRIES评分和更好的故事回忆效果,表明具身木偶表演能增强参与度和叙事理解。该系统设计模块化且平台无关,可适配其他机械臂,并提供了一种无屏幕的被动媒体替代方案,支持未来在儿童中心学习环境中的部署。
本文提出OmniContact分层框架,核心是接触流(CF)表示,由关键身体轨迹和时序二进制接触信号组成。底层策略CF-Track学习统一技能库,高层模块CF-Gen启发式合成未来接触流序列。在搬运箱子和推叠箱子任务中分别达到98.7%和76.5%成功率,显著超越基线。框架支持与视觉语言模型集成,实现语义驱动的复杂操作。
本文提出了首个针对对数螺旋连续臂的形态特定闭环任务空间控制框架。通过分段肌腱驱动模型和在线雅可比误差补偿(Broyden更新和卡尔曼滤波),实现了精确鲁棒的控制,并在仿真中显著优于分段常曲率方法,适用于抓取、避障等操作。
本文提出LiMoDE,一种基于动态专家混合(MoE)的两阶段学习方案,用于解决机器人终身操作中的灾难性遗忘和技能迁移问题。第一阶段通过多任务预训练学习先验知识,根据运动信息激活不同专家;第二阶段设计终身专家适应机制,动态组合新老专家以适应新任务。在模拟和真实任务中验证了其有效性。
本文提出RMTL(强化微任务学习),将长时操作任务分解为多个语言描述的微任务,并训练智能体进行切换。通过多视角VLM奖励、逆向课程和分层策略,RMTL提供了比单提示VLM奖励更丰富的奖励信号,加速学习。在Fetch操作环境中的实验验证了其有效性。
研究人员开发了基于物理的血液毛细血管网络模拟,利用深度强化学习训练微型机器人通过趋化性导航。他们系统绘制了导航的物理极限,发现了禁止区域,并观察到智能体自主发现多种通用策略。无需重新训练,这些智能体即可执行毛细血管流的定向阻塞与疏通,恢复健康基准水平。
本文提出了一种名为VMTAD的全无监督实时障碍物检测方法,专为农业机器人设计。它利用变换器架构和记忆模块处理动态场景,在油菜数据集上达到0.973检测和0.997分割AUC,轻量版推理仅需14毫秒,兼顾高精度与实时性。
本文研究了在自我中心视觉理解中,如何通过权重剪枝实现低延迟视觉-语言模型,同时保证预测的准确性和证据基础(双重正确)。现有剪枝方法常保持证据定位但损害准确性,作者提出理由告知剪枝策略,在自我中心视频数据集上达到了最高准确率和双重正确预测。
SwarmFly是一个基于MATLAB的开源无人机集群仿真平台,解决了现有工具维护不足、学习曲线陡峭和场景单一的问题。它支持四种集群协调模式、插件架构和实时地图,并通过八项实验验证了编队精度、抗风、故障恢复、续航和空域合规性。其模块化设计便于扩展至硬件在环测试和更大规模集群。
本文介绍了HALO,一种用于长时程机器人控制的视觉运动策略,通过注意力机制进行记忆检索,克服了模仿学习中的虚假相关性和错误累积问题。
该论文提出了一种基于因果推理的参数化控制屏障函数方法,用于解决多车交互中的安全控制问题。通过将因果推断嵌入到参数化CBF中,该方法能够显式推理车辆间的相互影响,克服了现有方法中难以确定因果关系或过度保守的缺陷。基于学习到的因果关系参数化CBF,自适应安全控制器允许自车根据对周围车辆行为的预期做出安全反应,并在多种交互密集场景中显著提升了任务效率。该工作已被ICRA 2026接收。
RGB框架将预训练的强化学习策略作为采样先验,结合模型预测路径积分(MPPI)在线优化,无需重新训练即可实现人形机器人的全身鲁棒控制。在Unitree G1仿真中达到280Hz控制率,任务精度显著提升。
AeroCast是一个概率性轨迹预测框架,结合了Transformer编码器和混合密度网络,用于预测未来三维位移的高斯混合分布。在混合真实与合成的四旋翼飞行器数据集上,相比基线方法,平均位移误差和最终位移误差降低了约50%,每个样本推理时间仅0.1毫秒,支持机载实时部署。
一种新型室内协同物体导航数据集及框架SurveilNav,通过整合主动相机调度、联合2D/3D地图、基于视觉语言模型的价值估计和协同目标验证,克服了单机器人感知范围有限和固定摄像头盲区的局限。在HM3D数据集上的实验表明,该方法在探索效率和导航成功率上均达到最优水平,有望应用于大规模搜索、家庭环境和救援任务。
提出ADM-Fusion,一种端到端深度学习多传感器融合方法,采用自适应传感器混合专家框架和内容感知路由,动态分配传感器权重,并分离平移和旋转分支,通过跨任务注意力机制实现信息共享。在CARLA-LOC模拟数据集训练并在KITTI真实数据微调,展示了仿真到现实的有效迁移,在退化条件下保持鲁棒性。
本研究提出了一种用于多IMU铰接刚体系统的扩展位姿估计的不变卡尔曼滤波方法。通过引入相对L扩展位姿这一李群表示,并结合迭代不变扩展卡尔曼滤波(IterIEKF),该方法有效处理了关节运动学约束,在UR5e机器人和人体腿部验证中,均方根误差降低至少50%。
一种名为潜序列优化(LSO)的新方法,通过优化行为基础模型中的潜变量序列,实现了精确的物理模拟运动追踪,并在真实人形机器人上得到验证。
NavWM是一个统一的导航世界模型,它无缝集成了潜在世界推理、多模态动作预测和可控视觉生成。通过引入锚点基础的多模态轨迹预测框架,模型能够生成多样化的动作空间,并利用视觉预见性进行鲁棒闭环规划。实验证明,NavWM在高质量未来状态生成和零样本导航成功率上均取得了显著提升。
提出DynaWM框架,通过世界模型正则化和动量目标编码器增强双轮足机器人在连续楼梯上的地形适应性和运动平滑性,在仿真和真实硬件上验证了有效性。
本文提出MinInter方法,通过选择需要最少插值的示范轨迹来生成更高质量的合成数据,从而提升模仿学习的性能。在MimicGen基准的12个任务上,MinInter显著提高了数据生成成功率和策略成功率,尤其在接触密集、长周期和高方差场景中表现突出。
SPACE框架提出使用笛卡尔状态增量作为通用动作表示,结合状态预测与自适应命令执行,解决不同机器人因动力学差异导致的行为克隆训练和部署问题。实验表明,该方法在跨形态、跨硬件单元及运行中动力学变化下均显著优于直接预测控制指令的策略。
TurboMPC是一种完全在GPU上运行的可微分MPC求解器,支持多种约束和隐式积分器。通过SQP、ADMM和隐式微分等技术的结合,在仿真和实际车辆测试中分别比CPU和GPU求解器快15倍和58倍,且能扩展至超过8000个规划节点。
本文介绍了将模拟到现实性能估计与赌博(来自Chen等人)和安全随时有效推断(来自Ramdas等人)相结合的方法。该方法利用缩放模拟器,为均值估计产生高效可靠的证书,在机器人性能测试中尤其有价值。
本文提出TOLD框架,一种实时边级自适应方法,通过在线更新交互拓扑权重来最小化编队畸变,相比传统节点级控制器显著提升鲁棒性。理论分析和仿真实验验证了其有效性,在Crazyflie 2.0四旋翼上实现了超过62%的畸变降低。
强化学习可以训练双灵巧手在物理仿真中高精度地弹奏钢琴,但高自由度手的任务奖励或逆运动学方法常导致不自然的姿态和关节过度伸展。本文提出对抗姿势正则化(APR),利用少量随意的人类弹奏数据,通过对抗目标使策略的姿势分布与人类先验匹配,从而产生更像人类的手形。同时,使用消费级Meta Quest 3收集并发布非结构化手部运动数据,并将其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指标及视觉质量上均显著优于先前方法。
本文报道了2024年6月10日至14日举行的洛伦兹中心研讨会“工程化可靠自主系统”(ERAS)的成果。研讨会聚焦于自主系统的验证与确认技术、实际工程应用以及安全软件架构,形成了一份挑战目录和解决方案路线图。部分挑战可通过现有学术方法解决,但未在工业界广泛应用;其他挑战仍需进一步研究。
本文提出FEARL框架,通过将策略分解为大型控制器和小型安全模块,实现了对机器人控制基础模型的形式化验证,在保持感知与推理能力的同时,使安全关键属性可被现有工具验证。在模拟和实体机器人上的实验证明了该方法的有效性。