arXiv Robotics AI 新闻来源

公开文章 318采集文章 350可信度 75刷新频率 360 分钟

健康状态健康来源类型研究原文权限 允许原文最近入库 2026-06-26ID arxiv-cs-ro运行状态 已启用

Use abstract and metadata; check individual paper license before full text.

最新公开文章

轮式四足机器人的竞速：通过模型预测控制主动抑制载荷转移

2026-06-26 12:00 UTC+8

本文提出了一种结合模型预测控制（MPC）和强化学习（RL）的层次化控制框架，用于在自主竞速中管理轮式四足机器人的侧向载荷转移。该框架包括离线最优路径生成、在线MPC规划器以及直接作用于16个执行器的全身RL策略。实验表明，主动侧倾控制将平均载荷转移率降低44%，最快圈速提升8.7%，峰值侧向加速度提高21.3%至1.98 m/s²。

层次化控制框架结合MPC和RL，主动管理侧向载荷转移
机器人腿部执行器充当主动悬架，膝关节产生抗侧倾扭矩

NavIsaacLab：通过并行机器人学习生成逼真人群以基准测试人感知导航

2026-06-26 12:00 UTC+8

NavIsaacLab是一个基于Isaac Lab的框架，利用基于物理和逼真的场景渲染以及GPU并行模拟，为机器人导航提供实时的3D视觉反馈。它采用数据驱动方法，结合轨迹扩散模型和对抗运动学习控制器，实现可控的、基于物理的行人模拟，并整合多种跨尺度场景，为人感知导航算法提供强大的基准测试。

NavIsaacLab使用逼真渲染和GPU并行模拟，提供实时3D视觉反馈。
通过轨迹扩散模型和对抗运动学习控制器实现逼真且可控的行人运动。

TaskNPoint：如何在几分钟内教会你的人形机器人打反手球

2026-06-26 12:00 UTC+8

这篇论文提出了TaskNPoint训练协议，通过人类教练提供少量输入（技能集、一次演示、交互窗口和目标），让人形机器人在物理仿真环境中快速掌握动态技能。实验在Unitree G1人形机器人上进行，成功执行了网球正反手击球、踢足球和搬箱子等任务，且训练时间不到一小时，无需每任务奖励调整。

TaskNPoint协议将教练与学习者的分工明确化，人类仅需提供四次输入。
利用动态技能的结构特性，聚焦于关键交互窗口的学习。

RoboTales是一个低成本机器人讲故事系统，通过富有表现力的袜子木偶动作来演绎叙事。在Baxter机器人上的自主测试实现中，该系统同步叙述、手势和嘴部动作来表演角色驱动的故事。一项初步研究表明，木偶式讲故事优于仅手势模式，获得了更高的HRIES评分和更好的故事回忆效果，表明具身木偶表演能增强参与度和叙事理解。该系统设计模块化且平台无关，可适配其他机械臂，并提供了一种无屏幕的被动媒体替代方案，支持未来在儿童中心学习环境中的部署。

RoboTales是一种低成本机器人讲故事系统，使用袜子木偶进行表达。
在Baxter机器人上实现的自主系统同步叙述、手势和嘴部动作。

OmniContact：通过接触流链式元技能实现通用人形机器人移动操作

2026-06-26 12:00 UTC+8

本文提出OmniContact分层框架，核心是接触流（CF）表示，由关键身体轨迹和时序二进制接触信号组成。底层策略CF-Track学习统一技能库，高层模块CF-Gen启发式合成未来接触流序列。在搬运箱子和推叠箱子任务中分别达到98.7%和76.5%成功率，显著超越基线。框架支持与视觉语言模型集成，实现语义驱动的复杂操作。

提出OmniContact框架，以接触流为共享接口，连接高层规划与底层执行
底层CF-Track通过模仿或强化学习从接触流中学习通用移动操作技能

通过在线雅可比误差补偿实现对数螺旋连续臂的形态特定闭环控制

2026-06-26 12:00 UTC+8

本文提出了首个针对对数螺旋连续臂的形态特定闭环任务空间控制框架。通过分段肌腱驱动模型和在线雅可比误差补偿（Broyden更新和卡尔曼滤波），实现了精确鲁棒的控制，并在仿真中显著优于分段常曲率方法，适用于抓取、避障等操作。

首次提出针对对数螺旋形态的闭环控制框架
结合解析雅可比矩阵与在线误差补偿

LiMoDE：从动态专家混合视角重新思考机器人终身操作

2026-06-26 12:00 UTC+8

本文提出LiMoDE，一种基于动态专家混合（MoE）的两阶段学习方案，用于解决机器人终身操作中的灾难性遗忘和技能迁移问题。第一阶段通过多任务预训练学习先验知识，根据运动信息激活不同专家；第二阶段设计终身专家适应机制，动态组合新老专家以适应新任务。在模拟和真实任务中验证了其有效性。

LiMoDE采用两阶段学习：多任务预训练（动态MoE）和任务适应（终身MoE机制）。
动态MoE根据运动信息激活异构专家，处理短期操作。

RMTL：基于强化微任务学习的长时操作与VLM奖励

2026-06-26 12:00 UTC+8

本文提出RMTL（强化微任务学习），将长时操作任务分解为多个语言描述的微任务，并训练智能体进行切换。通过多视角VLM奖励、逆向课程和分层策略，RMTL提供了比单提示VLM奖励更丰富的奖励信号，加速学习。在Fetch操作环境中的实验验证了其有效性。

单提示VLM奖励在长时操作中奖励信号平坦，难以检测早期进展。
RMTL将任务分解为微任务，每个微任务有独立的语言提示，并训练智能体切换。

强化学习实现自主微型机器人在模拟毛细血管中的导航与干预

2026-06-26 12:00 UTC+8

研究人员开发了基于物理的血液毛细血管网络模拟，利用深度强化学习训练微型机器人通过趋化性导航。他们系统绘制了导航的物理极限，发现了禁止区域，并观察到智能体自主发现多种通用策略。无需重新训练，这些智能体即可执行毛细血管流的定向阻塞与疏通，恢复健康基准水平。

开发了包含真实流体动力学和红细胞动力学的毛细血管网络模拟
深度强化学习智能体通过趋化性成功导航

无监督记忆增强视频变换器：自主农业机器人的障碍物检测

2026-06-26 12:00 UTC+8

本文提出了一种名为VMTAD的全无监督实时障碍物检测方法，专为农业机器人设计。它利用变换器架构和记忆模块处理动态场景，在油菜数据集上达到0.973检测和0.997分割AUC，轻量版推理仅需14毫秒，兼顾高精度与实时性。

VMTAD是一种全无监督的实时障碍物检测方法，适用于动态农业场景。
通过记忆模块处理视频帧的时间上下文，有效应对机器人移动带来的动态变化。

面向低延迟视觉-语言模型的自我中心视觉理解中的双重正确预测

2026-06-25 12:00 UTC+8

本文研究了在自我中心视觉理解中，如何通过权重剪枝实现低延迟视觉-语言模型，同时保证预测的准确性和证据基础（双重正确）。现有剪枝方法常保持证据定位但损害准确性，作者提出理由告知剪枝策略，在自我中心视频数据集上达到了最高准确率和双重正确预测。

权重剪枝可用于降低VLM在自我中心视觉任务中的延迟
现有方法往往保留正确证据但降低预测准确性

SwarmFly：一种用于无人机集群实验设计与验证的仿真平台

2026-06-25 12:00 UTC+8

SwarmFly是一个基于MATLAB的开源无人机集群仿真平台，解决了现有工具维护不足、学习曲线陡峭和场景单一的问题。它支持四种集群协调模式、插件架构和实时地图，并通过八项实验验证了编队精度、抗风、故障恢复、续航和空域合规性。其模块化设计便于扩展至硬件在环测试和更大规模集群。

SwarmFly是MATLAB平台，支持四种集群协调模式（领航-跟随、分散、异构中继、异构速度）
插件架构允许研究人员在不修改核心代码的情况下扩展功能

用于长时程机器人控制的视觉运动策略中的记忆检索

2026-06-25 12:00 UTC+8

本文介绍了HALO，一种用于长时程机器人控制的视觉运动策略，通过注意力机制进行记忆检索，克服了模仿学习中的虚假相关性和错误累积问题。

HALO通过蒸馏视觉语言模型先验来抑制虚假相关性。
HALO使用稀疏注意力减少闭环控制中的记忆错误累积。

基于因果关系的参数化控制屏障函数用于安全多车交互

2026-06-25 12:00 UTC+8

该论文提出了一种基于因果推理的参数化控制屏障函数方法，用于解决多车交互中的安全控制问题。通过将因果推断嵌入到参数化CBF中，该方法能够显式推理车辆间的相互影响，克服了现有方法中难以确定因果关系或过度保守的缺陷。基于学习到的因果关系参数化CBF，自适应安全控制器允许自车根据对周围车辆行为的预期做出安全反应，并在多种交互密集场景中显著提升了任务效率。该工作已被ICRA 2026接收。

将因果推理嵌入参数化CBF，以显式处理多车交互中的相互影响
避免基于最坏情况分析的过度保守行为，提升任务效率

RGB：强化学习引导的全身MPPI人形机器人控制

2026-06-25 12:00 UTC+8

RGB框架将预训练的强化学习策略作为采样先验，结合模型预测路径积分（MPPI）在线优化，无需重新训练即可实现人形机器人的全身鲁棒控制。在Unitree G1仿真中达到280Hz控制率，任务精度显著提升。

RGB利用RL策略作为MPPI的采样先验，使得新目标可以通过成本函数灵活添加，避免重新训练。
MPPI在线校正RL先验，纠正行走漂移并跟踪全身参考信号，实现精确控制。

AeroCast: 基于Transformer-MDN架构的非合作空中障碍物概率三维轨迹预测

2026-06-25 12:00 UTC+8

AeroCast是一个概率性轨迹预测框架，结合了Transformer编码器和混合密度网络，用于预测未来三维位移的高斯混合分布。在混合真实与合成的四旋翼飞行器数据集上，相比基线方法，平均位移误差和最终位移误差降低了约50%，每个样本推理时间仅0.1毫秒，支持机载实时部署。

结合Transformer编码器和混合密度网络，实现非合作障碍物的概率性三维轨迹预测。
在五秒预测范围内，平均和最终位移误差相比基线降低约50%。

SurveilNav：机器人与监控系统协同的物体目标导航

2026-06-25 12:00 UTC+8

一种新型室内协同物体导航数据集及框架SurveilNav，通过整合主动相机调度、联合2D/3D地图、基于视觉语言模型的价值估计和协同目标验证，克服了单机器人感知范围有限和固定摄像头盲区的局限。在HM3D数据集上的实验表明，该方法在探索效率和导航成功率上均达到最优水平，有望应用于大规模搜索、家庭环境和救援任务。

构建了包含74个楼层206个摄像头的室内协同导航数据集，支持多视角信息利用的系统评估
提出SurveilNav框架，融合机器人动态局部感知与监控静态全局视图，实现高效协同

ADM-Fusion：自适应深度多传感器融合，实现多样条件下的鲁棒自我运动估计

2026-06-25 12:00 UTC+8

提出ADM-Fusion，一种端到端深度学习多传感器融合方法，采用自适应传感器混合专家框架和内容感知路由，动态分配传感器权重，并分离平移和旋转分支，通过跨任务注意力机制实现信息共享。在CARLA-LOC模拟数据集训练并在KITTI真实数据微调，展示了仿真到现实的有效迁移，在退化条件下保持鲁棒性。

ADM-Fusion采用自适应传感器混合专家框架，实时动态调整传感器输入权重。
系统包含独立的平移和旋转分支，通过跨任务注意力机制保持任务特异性并促进信息共享。

多IMU铰接刚体系统的扩展位姿估计的不变卡尔曼滤波

2026-06-25 12:00 UTC+8

本研究提出了一种用于多IMU铰接刚体系统的扩展位姿估计的不变卡尔曼滤波方法。通过引入相对L扩展位姿这一李群表示，并结合迭代不变扩展卡尔曼滤波（IterIEKF），该方法有效处理了关节运动学约束，在UR5e机器人和人体腿部验证中，均方根误差降低至少50%。

提出相对L扩展位姿李群表示，实现多IMU铰接系统的群仿射动力学
将关节约束作为无噪声伪测量纳入迭代不变扩展卡尔曼滤波（IterIEKF）

BFMTrack：基于行为基础模型的物理模拟运动追踪的潜序列优化方法

2026-06-25 12:00 UTC+8

一种名为潜序列优化（LSO）的新方法，通过优化行为基础模型中的潜变量序列，实现了精确的物理模拟运动追踪，并在真实人形机器人上得到验证。

行为基础模型将物理合理的行为组织到潜空间中，但不支持时变目标。
BFMTrack引入潜序列优化，结合模拟 rollout 和策略梯度更新。

NavWM：面向预见性规划的统一导航世界模型

2026-06-24 12:00 UTC+8

NavWM是一个统一的导航世界模型，它无缝集成了潜在世界推理、多模态动作预测和可控视觉生成。通过引入锚点基础的多模态轨迹预测框架，模型能够生成多样化的动作空间，并利用视觉预见性进行鲁棒闭环规划。实验证明，NavWM在高质量未来状态生成和零样本导航成功率上均取得了显著提升。

NavWM整合了感知、生成和控制，统一处理时空动态。
利用潜在世界标记提取几何与语义先验，增强结构理解。

DynaWM：基于动力学感知的知识蒸馏框架，结合世界模型与动量目标实现连续楼梯上的平滑运动

2026-06-24 12:00 UTC+8

提出DynaWM框架，通过世界模型正则化和动量目标编码器增强双轮足机器人在连续楼梯上的地形适应性和运动平滑性，在仿真和真实硬件上验证了有效性。

DynaWM采用世界模型作为正则化项，强制前向动力学感知，保留完整地形几何信息。
动量目标编码器提供一致的蒸馏目标，防止维度坍塌。

MinInter：在模仿学习的数据增强中最小化轨迹插值

2026-06-24 12:00 UTC+8

本文提出MinInter方法，通过选择需要最少插值的示范轨迹来生成更高质量的合成数据，从而提升模仿学习的性能。在MimicGen基准的12个任务上，MinInter显著提高了数据生成成功率和策略成功率，尤其在接触密集、长周期和高方差场景中表现突出。

MinInter通过最小化插值选择源示范，生成更高质量的合成轨迹。
在12个操作任务中，MinInter一致提升了数据生成和策略成功率。

SPACE：从跨机器人数据学习通用策略的框架

2026-06-24 12:00 UTC+8

SPACE框架提出使用笛卡尔状态增量作为通用动作表示，结合状态预测与自适应命令执行，解决不同机器人因动力学差异导致的行为克隆训练和部署问题。实验表明，该方法在跨形态、跨硬件单元及运行中动力学变化下均显著优于直接预测控制指令的策略。

提出笛卡尔状态增量作为通用动作表示，统一不同机器人动作空间
SPACE框架包含状态预测策略与动作适配器，处理三种层次的动力学变化

TurboMPC：在GPU上实现快速、可扩展且可微分的模型预测控制

2026-06-24 12:00 UTC+8

TurboMPC是一种完全在GPU上运行的可微分MPC求解器，支持多种约束和隐式积分器。通过SQP、ADMM和隐式微分等技术的结合，在仿真和实际车辆测试中分别比CPU和GPU求解器快15倍和58倍，且能扩展至超过8000个规划节点。

TurboMPC是首个完全基于GPU的可微分MPC求解器
相比现有CPU和GPU求解器分别提速15倍和58倍

模拟到现实赌注在E过程上：将“模拟器”引入随时有效的置信序列

2026-06-24 12:00 UTC+8

本文介绍了将模拟到现实性能估计与赌博（来自Chen等人）和安全随时有效推断（来自Ramdas等人）相结合的方法。该方法利用缩放模拟器，为均值估计产生高效可靠的证书，在机器人性能测试中尤其有价值。

结合了模拟到现实性能估计与赌博方法
利用缩放模拟器产生高效可靠的均值估计证书

基于拓扑在线学习的位移编队控制

2026-06-24 12:00 UTC+8

本文提出TOLD框架，一种实时边级自适应方法，通过在线更新交互拓扑权重来最小化编队畸变，相比传统节点级控制器显著提升鲁棒性。理论分析和仿真实验验证了其有效性，在Crazyflie 2.0四旋翼上实现了超过62%的畸变降低。

TOLD是首个在线调整交互拓扑权重的编队控制方法，而非仅调节单个机器人输入。
提出了OGF和OExpGF两种策略，分别保证有界畸变和渐近一致性。

通过对抗姿势正则化实现灵巧钢琴演奏中的人体运动学约束

2026-06-24 12:00 UTC+8

强化学习可以训练双灵巧手在物理仿真中高精度地弹奏钢琴，但高自由度手的任务奖励或逆运动学方法常导致不自然的姿态和关节过度伸展。本文提出对抗姿势正则化（APR），利用少量随意的人类弹奏数据，通过对抗目标使策略的姿势分布与人类先验匹配，从而产生更像人类的手形。同时，使用消费级Meta Quest 3收集并发布非结构化手部运动数据，并将其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指标及视觉质量上均显著优于先前方法。

提出对抗姿势正则化（APR）方法，避免依赖昂贵的、与歌曲对齐的专家演示数据
利用消费级Meta Quest 3收集随意的人类钢琴弹奏手部运动数据，并重定向到Shadow Hand

工程化可靠自主系统：挑战与解决方案

2026-06-24 12:00 UTC+8

本文报道了2024年6月10日至14日举行的洛伦兹中心研讨会“工程化可靠自主系统”(ERAS)的成果。研讨会聚焦于自主系统的验证与确认技术、实际工程应用以及安全软件架构，形成了一份挑战目录和解决方案路线图。部分挑战可通过现有学术方法解决，但未在工业界广泛应用；其他挑战仍需进一步研究。

研讨会由FMAS和AREA社区共同组织，汇集了学术界、工业界及特殊领域代表。
三大核心议题：验证与确认、实际系统工程、安全软件架构。

可验证的机器人安全基础模型

2026-06-24 12:00 UTC+8

本文提出FEARL框架，通过将策略分解为大型控制器和小型安全模块，实现了对机器人控制基础模型的形式化验证，在保持感知与推理能力的同时，使安全关键属性可被现有工具验证。在模拟和实体机器人上的实验证明了该方法的有效性。

FEARL框架将机器人策略分为大型控制器（负责感知与推理）和可验证的小型安全模块。
安全模块仅处理低维度安全传感器数据，使形式化验证变得可行。

arXiv Robotics

最新公开文章

轮式四足机器人的竞速：通过模型预测控制主动抑制载荷转移

NavIsaacLab：通过并行机器人学习生成逼真人群以基准测试人感知导航

TaskNPoint：如何在几分钟内教会你的人形机器人打反手球

RoboTales：机器人拟人化学习系统

OmniContact：通过接触流链式元技能实现通用人形机器人移动操作

通过在线雅可比误差补偿实现对数螺旋连续臂的形态特定闭环控制

LiMoDE：从动态专家混合视角重新思考机器人终身操作

RMTL：基于强化微任务学习的长时操作与VLM奖励

强化学习实现自主微型机器人在模拟毛细血管中的导航与干预

无监督记忆增强视频变换器：自主农业机器人的障碍物检测

面向低延迟视觉-语言模型的自我中心视觉理解中的双重正确预测

SwarmFly：一种用于无人机集群实验设计与验证的仿真平台

用于长时程机器人控制的视觉运动策略中的记忆检索

基于因果关系的参数化控制屏障函数用于安全多车交互

RGB：强化学习引导的全身MPPI人形机器人控制

AeroCast: 基于Transformer-MDN架构的非合作空中障碍物概率三维轨迹预测

SurveilNav：机器人与监控系统协同的物体目标导航

ADM-Fusion：自适应深度多传感器融合，实现多样条件下的鲁棒自我运动估计

多IMU铰接刚体系统的扩展位姿估计的不变卡尔曼滤波

BFMTrack：基于行为基础模型的物理模拟运动追踪的潜序列优化方法

NavWM：面向预见性规划的统一导航世界模型

DynaWM：基于动力学感知的知识蒸馏框架，结合世界模型与动量目标实现连续楼梯上的平滑运动

MinInter：在模仿学习的数据增强中最小化轨迹插值

SPACE：从跨机器人数据学习通用策略的框架

TurboMPC：在GPU上实现快速、可扩展且可微分的模型预测控制

模拟到现实赌注在E过程上：将“模拟器”引入随时有效的置信序列

基于拓扑在线学习的位移编队控制

通过对抗姿势正则化实现灵巧钢琴演奏中的人体运动学约束

工程化可靠自主系统：挑战与解决方案

可验证的机器人安全基础模型

全部来源