arXiv Robotics AI 新聞來源

公開文章 318採集文章 350可信度 75刷新頻率 360 分鐘

健康狀態健康來源類型研究原文權限 允許原文最近入庫 2026-06-26ID arxiv-cs-ro運行狀態 已啟用

Use abstract and metadata; check individual paper license before full text.

最新公開文章

輪式四足機器人的競速：通過模型預測控制主動抑制載荷轉移

2026-06-26 12:00 UTC+8

本文提出了一種結合模型預測控制（MPC）和強化學習（RL）的層次化控制框架，用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、在線MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明，主動側傾控制將平均載荷轉移率降低44%，最快圈速提升8.7%，峯值側向加速度提高21.3%至1.98 m/s²。

層次化控制框架結合MPC和RL，主動管理側向載荷轉移
機器人腿部執行器充當主動懸架，膝關節產生抗側傾扭矩

NavIsaacLab：通過並行機器人學習生成逼真人羣以基準測試人感知導航

2026-06-26 12:00 UTC+8

NavIsaacLab是一個基於Isaac Lab的框架，利用基於物理和逼真的場景渲染以及GPU並行模擬，為機器人導航提供實時的3D視覺反饋。它採用數據驅動方法，結合軌跡擴散模型和對抗運動學習控制器，實現可控的、基於物理的行人模擬，並整合多種跨尺度場景，為人感知導航算法提供強大的基準測試。

NavIsaacLab使用逼真渲染和GPU並行模擬，提供實時3D視覺反饋。
通過軌跡擴散模型和對抗運動學習控制器實現逼真且可控的行人運動。

TaskNPoint：如何在幾分鐘內教會你的人形機器人打反手球

2026-06-26 12:00 UTC+8

這篇論文提出了TaskNPoint訓練協議，通過人類教練提供少量輸入（技能集、一次演示、交互窗口和目標），讓人形機器人在物理仿真環境中快速掌握動態技能。實驗在Unitree G1人形機器人上進行，成功執行了網球正反手擊球、踢足球和搬箱子等任務，且訓練時間不到一小時，無需每任務獎勵調整。

TaskNPoint協議將教練與學習者的分工明確化，人類僅需提供四次輸入。
利用動態技能的結構特性，聚焦於關鍵交互窗口的學習。

RoboTales是一個低成本機器人講故事系統，通過富有表現力的襪子木偶動作來演繹敍事。在Baxter機器人上的自主測試實現中，該系統同步敍述、手勢和嘴部動作來表演角色驅動的故事。一項初步研究表明，木偶式講故事優於僅手勢模式，獲得了更高的HRIES評分和更好的故事回憶效果，表明具身木偶表演能增強參與度和敍事理解。該系統設計模塊化且平台無關，可適配其他機械臂，並提供了一種無屏幕的被動媒體替代方案，支持未來在兒童中心學習環境中的部署。

RoboTales是一種低成本機器人講故事系統，使用襪子木偶進行表達。
在Baxter機器人上實現的自主系統同步敍述、手勢和嘴部動作。

OmniContact：通過接觸流鏈式元技能實現通用人形機器人移動操作

2026-06-26 12:00 UTC+8

本文提出OmniContact分層框架，核心是接觸流（CF）表示，由關鍵身體軌跡和時序二進制接觸信號組成。底層策略CF-Track學習統一技能庫，高層模塊CF-Gen啓發式合成未來接觸流序列。在搬運箱子和推疊箱子任務中分別達到98.7%和76.5%成功率，顯著超越基線。框架支持與視覺語言模型集成，實現語義驅動的複雜操作。

提出OmniContact框架，以接觸流為共享接口，連接高層規劃與底層執行
底層CF-Track通過模仿或強化學習從接觸流中學習通用移動操作技能

通過在線雅可比誤差補償實現對數螺旋連續臂的形態特定閉環控制

2026-06-26 12:00 UTC+8

本文提出了首個針對對數螺旋連續臂的形態特定閉環任務空間控制框架。通過分段肌腱驅動模型和在線雅可比誤差補償（Broyden更新和卡爾曼濾波），實現了精確魯棒的控制，並在仿真中顯著優於分段常曲率方法，適用於抓取、避障等操作。

首次提出針對對數螺旋形態的閉環控制框架
結合解析雅可比矩陣與在線誤差補償

LiMoDE：從動態專家混合視角重新思考機器人終身操作

2026-06-26 12:00 UTC+8

本文提出LiMoDE，一種基於動態專家混合（MoE）的兩階段學習方案，用於解決機器人終身操作中的災難性遺忘和技能遷移問題。第一階段通過多任務預訓練學習先驗知識，根據運動信息激活不同專家；第二階段設計終身專家適應機制，動態組合新老專家以適應新任務。在模擬和真實任務中驗證了其有效性。

LiMoDE採用兩階段學習：多任務預訓練（動態MoE）和任務適應（終身MoE機制）。
動態MoE根據運動信息激活異構專家，處理短期操作。

RMTL：基於強化微任務學習的長時操作與VLM獎勵

2026-06-26 12:00 UTC+8

本文提出RMTL（強化微任務學習），將長時操作任務分解為多個語言描述的微任務，並訓練智能體進行切換。通過多視角VLM獎勵、逆向課程和分層策略，RMTL提供了比單提示VLM獎勵更豐富的獎勵信號，加速學習。在Fetch操作環境中的實驗驗證了其有效性。

單提示VLM獎勵在長時操作中獎勵信號平坦，難以檢測早期進展。
RMTL將任務分解為微任務，每個微任務有獨立的語言提示，並訓練智能體切換。

強化學習實現自主微型機器人在模擬毛細血管中的導航與干預

2026-06-26 12:00 UTC+8

研究人員開發了基於物理的血液毛細血管網絡模擬，利用深度強化學習訓練微型機器人通過趨化性導航。他們系統繪製了導航的物理極限，發現了禁止區域，並觀察到智能體自主發現多種通用策略。無需重新訓練，這些智能體即可執行毛細血管流的定向阻塞與疏通，恢復健康基準水平。

開發了包含真實流體動力學和紅細胞動力學的毛細血管網絡模擬
深度強化學習智能體通過趨化性成功導航

無監督記憶增強視頻變換器：自主農業機器人的障礙物檢測

2026-06-26 12:00 UTC+8

本文提出了一種名為VMTAD的全無監督實時障礙物檢測方法，專為農業機器人設計。它利用變換器架構和記憶模塊處理動態場景，在油菜數據集上達到0.973檢測和0.997分割AUC，輕量版推理僅需14毫秒，兼顧高精度與實時性。

VMTAD是一種全無監督的實時障礙物檢測方法，適用於動態農業場景。
通過記憶模塊處理視頻幀的時間上下文，有效應對機器人移動帶來的動態變化。

面向低延遲視覺-語言模型的自我中心視覺理解中的雙重正確預測

2026-06-25 12:00 UTC+8

本文研究了在自我中心視覺理解中，如何通過權重剪枝實現低延遲視覺-語言模型，同時保證預測的準確性和證據基礎（雙重正確）。現有剪枝方法常保持證據定位但損害準確性，作者提出理由告知剪枝策略，在自我中心視頻數據集上達到了最高準確率和雙重正確預測。

權重剪枝可用於降低VLM在自我中心視覺任務中的延遲
現有方法往往保留正確證據但降低預測準確性

SwarmFly：一種用於無人機集羣實驗設計與驗證的仿真平台

2026-06-25 12:00 UTC+8

SwarmFly是一個基於MATLAB的開源無人機集羣仿真平台，解決了現有工具維護不足、學習曲線陡峭和場景單一的問題。它支持四種集羣協調模式、插件架構和實時地圖，並通過八項實驗驗證了編隊精度、抗風、故障恢復、續航和空域合規性。其模塊化設計便於擴展至硬件在環測試和更大規模集羣。

SwarmFly是MATLAB平台，支持四種集羣協調模式（領航-跟隨、分散、異構中繼、異構速度）
插件架構允許研究人員在不修改核心代碼的情況下擴展功能

用於長時程機器人控制的視覺運動策略中的記憶檢索

2026-06-25 12:00 UTC+8

本文介紹了HALO，一種用於長時程機器人控制的視覺運動策略，通過注意力機制進行記憶檢索，克服了模仿學習中的虛假相關性和錯誤累積問題。

HALO通過蒸餾視覺語言模型先驗來抑制虛假相關性。
HALO使用稀疏注意力減少閉環控制中的記憶錯誤累積。

基於因果關係的參數化控制屏障函數用於安全多車交互

2026-06-25 12:00 UTC+8

該論文提出了一種基於因果推理的參數化控制屏障函數方法，用於解決多車交互中的安全控制問題。通過將因果推斷嵌入到參數化CBF中，該方法能夠顯式推理車輛間的相互影響，克服了現有方法中難以確定因果關係或過度保守的缺陷。基於學習到的因果關係參數化CBF，自適應安全控制器允許自車根據對周圍車輛行為的預期做出安全反應，並在多種交互密集場景中顯著提升了任務效率。該工作已被ICRA 2026接收。

將因果推理嵌入參數化CBF，以顯式處理多車交互中的相互影響
避免基於最壞情況分析的過度保守行為，提升任務效率

RGB：強化學習引導的全身MPPI人形機器人控制

2026-06-25 12:00 UTC+8

RGB框架將預訓練的強化學習策略作為採樣先驗，結合模型預測路徑積分（MPPI）在線優化，無需重新訓練即可實現人形機器人的全身魯棒控制。在Unitree G1仿真中達到280Hz控制率，任務精度顯著提升。

RGB利用RL策略作為MPPI的採樣先驗，使得新目標可以通過成本函數靈活添加，避免重新訓練。
MPPI在線校正RL先驗，糾正行走漂移並跟蹤全身參考信號，實現精確控制。

AeroCast: 基於Transformer-MDN架構的非合作空中障礙物概率三維軌跡預測

2026-06-25 12:00 UTC+8

AeroCast是一個概率性軌跡預測框架，結合了Transformer編碼器和混合密度網絡，用於預測未來三維位移的高斯混合分佈。在混合真實與合成的四旋翼飛行器數據集上，相比基線方法，平均位移誤差和最終位移誤差降低了約50%，每個樣本推理時間僅0.1毫秒，支持機載實時部署。

結合Transformer編碼器和混合密度網絡，實現非合作障礙物的概率性三維軌跡預測。
在五秒預測範圍內，平均和最終位移誤差相比基線降低約50%。

SurveilNav：機器人與監控系統協同的物體目標導航

2026-06-25 12:00 UTC+8

一種新型室內協同物體導航數據集及框架SurveilNav，通過整合主動相機調度、聯合2D/3D地圖、基於視覺語言模型的價值估計和協同目標驗證，克服了單機器人感知範圍有限和固定攝像頭盲區的侷限。在HM3D數據集上的實驗表明，該方法在探索效率和導航成功率上均達到最優水平，有望應用於大規模搜索、家庭環境和救援任務。

構建了包含74個樓層206個攝像頭的室內協同導航數據集，支持多視角信息利用的系統評估
提出SurveilNav框架，融合機器人動態局部感知與監控靜態全局視圖，實現高效協同

ADM-Fusion：自適應深度多傳感器融合，實現多樣條件下的魯棒自我運動估計

2026-06-25 12:00 UTC+8

提出ADM-Fusion，一種端到端深度學習多傳感器融合方法，採用自適應傳感器混合專家框架和內容感知路由，動態分配傳感器權重，並分離平移和旋轉分支，通過跨任務注意力機制實現信息共享。在CARLA-LOC模擬數據集訓練並在KITTI真實數據微調，展示了仿真到現實的有效遷移，在退化條件下保持魯棒性。

ADM-Fusion採用自適應傳感器混合專家框架，實時動態調整傳感器輸入權重。
系統包含獨立的平移和旋轉分支，通過跨任務注意力機制保持任務特異性並促進信息共享。

多IMU鉸接剛體系統的擴展位姿估計的不變卡爾曼濾波

2026-06-25 12:00 UTC+8

本研究提出了一種用於多IMU鉸接剛體系統的擴展位姿估計的不變卡爾曼濾波方法。通過引入相對L擴展位姿這一李羣表示，並結合迭代不變擴展卡爾曼濾波（IterIEKF），該方法有效處理了關節運動學約束，在UR5e機器人和人體腿部驗證中，均方根誤差降低至少50%。

提出相對L擴展位姿李羣表示，實現多IMU鉸接系統的羣仿射動力學
將關節約束作為無噪聲偽測量納入迭代不變擴展卡爾曼濾波（IterIEKF）

BFMTrack：基於行為基礎模型的物理模擬運動追蹤的潛序列優化方法

2026-06-25 12:00 UTC+8

一種名為潛序列優化（LSO）的新方法，通過優化行為基礎模型中的潛變量序列，實現了精確的物理模擬運動追蹤，並在真實人形機器人上得到驗證。

行為基礎模型將物理合理的行為組織到潛空間中，但不支持時變目標。
BFMTrack引入潛序列優化，結合模擬 rollout 和策略梯度更新。

NavWM：面向預見性規劃的統一導航世界模型

2026-06-24 12:00 UTC+8

NavWM是一個統一的導航世界模型，它無縫集成了潛在世界推理、多模態動作預測和可控視覺生成。通過引入錨點基礎的多模態軌跡預測框架，模型能夠生成多樣化的動作空間，並利用視覺預見性進行魯棒閉環規劃。實驗證明，NavWM在高質量未來狀態生成和零樣本導航成功率上均取得了顯著提升。

NavWM整合了感知、生成和控制，統一處理時空動態。
利用潛在世界標記提取幾何與語義先驗，增強結構理解。

DynaWM：基於動力學感知的知識蒸餾框架，結合世界模型與動量目標實現連續樓梯上的平滑運動

2026-06-24 12:00 UTC+8

提出DynaWM框架，通過世界模型正則化和動量目標編碼器增強雙輪足機器人在連續樓梯上的地形適應性和運動平滑性，在仿真和真實硬件上驗證了有效性。

DynaWM採用世界模型作為正則化項，強制前向動力學感知，保留完整地形幾何信息。
動量目標編碼器提供一致的蒸餾目標，防止維度坍塌。

MinInter：在模仿學習的數據增強中最小化軌跡插值

2026-06-24 12:00 UTC+8

本文提出MinInter方法，通過選擇需要最少插值的示範軌跡來生成更高質量的合成數據，從而提升模仿學習的性能。在MimicGen基準的12個任務上，MinInter顯著提高了數據生成成功率和策略成功率，尤其在接觸密集、長週期和高方差場景中表現突出。

MinInter通過最小化插值選擇源示範，生成更高質量的合成軌跡。
在12個操作任務中，MinInter一致提升了數據生成和策略成功率。

SPACE：從跨機器人數據學習通用策略的框架

2026-06-24 12:00 UTC+8

SPACE框架提出使用笛卡爾狀態增量作為通用動作表示，結合狀態預測與自適應命令執行，解決不同機器人因動力學差異導致的行為克隆訓練和部署問題。實驗表明，該方法在跨形態、跨硬件單元及運行中動力學變化下均顯著優於直接預測控制指令的策略。

提出笛卡爾狀態增量作為通用動作表示，統一不同機器人動作空間
SPACE框架包含狀態預測策略與動作適配器，處理三種層次的動力學變化

TurboMPC：在GPU上實現快速、可擴展且可微分的模型預測控制

2026-06-24 12:00 UTC+8

TurboMPC是一種完全在GPU上運行的可微分MPC求解器，支持多種約束和隱式積分器。通過SQP、ADMM和隱式微分等技術的結合，在仿真和實際車輛測試中分別比CPU和GPU求解器快15倍和58倍，且能擴展至超過8000個規劃節點。

TurboMPC是首個完全基於GPU的可微分MPC求解器
相比現有CPU和GPU求解器分別提速15倍和58倍

模擬到現實賭注在E過程上：將“模擬器”引入隨時有效的置信序列

2026-06-24 12:00 UTC+8

本文介紹了將模擬到現實性能估計與賭博（來自Chen等人）和安全隨時有效推斷（來自Ramdas等人）相結合的方法。該方法利用縮放模擬器，為均值估計產生高效可靠的證書，在機器人性能測試中尤其有價值。

結合了模擬到現實性能估計與賭博方法
利用縮放模擬器產生高效可靠的均值估計證書

基於拓撲在線學習的位移編隊控制

2026-06-24 12:00 UTC+8

本文提出TOLD框架，一種實時邊級自適應方法，通過在線更新交互拓撲權重來最小化編隊畸變，相比傳統節點級控制器顯著提升魯棒性。理論分析和仿真實驗驗證了其有效性，在Crazyflie 2.0四旋翼上實現了超過62%的畸變降低。

TOLD是首個在線調整交互拓撲權重的編隊控制方法，而非僅調節單個機器人輸入。
提出了OGF和OExpGF兩種策略，分別保證有界畸變和漸近一致性。

通過對抗姿勢正則化實現靈巧鋼琴演奏中的人體運動學約束

2026-06-24 12:00 UTC+8

強化學習可以訓練雙靈巧手在物理仿真中高精度地彈奏鋼琴，但高自由度手的任務獎勵或逆運動學方法常導致不自然的姿態和關節過度伸展。本文提出對抗姿勢正則化（APR），利用少量隨意的人類彈奏數據，通過對抗目標使策略的姿勢分佈與人類先驗匹配，從而產生更像人類的手形。同時，使用消費級Meta Quest 3收集併發布非結構化手部運動數據，並將其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指標及視覺質量上均顯著優於先前方法。

提出對抗姿勢正則化（APR）方法，避免依賴昂貴的、與歌曲對齊的專家演示數據
利用消費級Meta Quest 3收集隨意的人類鋼琴彈奏手部運動數據，並重定向到Shadow Hand

工程化可靠自主系統：挑戰與解決方案

2026-06-24 12:00 UTC+8

本文報道了2024年6月10日至14日舉行的洛倫茲中心研討會“工程化可靠自主系統”(ERAS)的成果。研討會聚焦於自主系統的驗證與確認技術、實際工程應用以及安全軟件架構，形成了一份挑戰目錄和解決方案路線圖。部分挑戰可通過現有學術方法解決，但未在工業界廣泛應用；其他挑戰仍需進一步研究。

研討會由FMAS和AREA社區共同組織，彙集了學術界、工業界及特殊領域代表。
三大核心議題：驗證與確認、實際系統工程、安全軟件架構。

可驗證的機器人安全基礎模型

2026-06-24 12:00 UTC+8

本文提出FEARL框架，通過將策略分解為大型控制器和小型安全模塊，實現了對機器人控制基礎模型的形式化驗證，在保持感知與推理能力的同時，使安全關鍵屬性可被現有工具驗證。在模擬和實體機器人上的實驗證明了該方法的有效性。

FEARL框架將機器人策略分為大型控制器（負責感知與推理）和可驗證的小型安全模塊。
安全模塊僅處理低維度安全傳感器數據，使形式化驗證變得可行。

arXiv Robotics

最新公開文章

輪式四足機器人的競速：通過模型預測控制主動抑制載荷轉移

NavIsaacLab：通過並行機器人學習生成逼真人羣以基準測試人感知導航

TaskNPoint：如何在幾分鐘內教會你的人形機器人打反手球

RoboTales：機器人擬人化學習系統

OmniContact：通過接觸流鏈式元技能實現通用人形機器人移動操作

通過在線雅可比誤差補償實現對數螺旋連續臂的形態特定閉環控制

LiMoDE：從動態專家混合視角重新思考機器人終身操作

RMTL：基於強化微任務學習的長時操作與VLM獎勵

強化學習實現自主微型機器人在模擬毛細血管中的導航與干預

無監督記憶增強視頻變換器：自主農業機器人的障礙物檢測

面向低延遲視覺-語言模型的自我中心視覺理解中的雙重正確預測

SwarmFly：一種用於無人機集羣實驗設計與驗證的仿真平台

用於長時程機器人控制的視覺運動策略中的記憶檢索

基於因果關係的參數化控制屏障函數用於安全多車交互

RGB：強化學習引導的全身MPPI人形機器人控制

AeroCast: 基於Transformer-MDN架構的非合作空中障礙物概率三維軌跡預測

SurveilNav：機器人與監控系統協同的物體目標導航

ADM-Fusion：自適應深度多傳感器融合，實現多樣條件下的魯棒自我運動估計

多IMU鉸接剛體系統的擴展位姿估計的不變卡爾曼濾波

BFMTrack：基於行為基礎模型的物理模擬運動追蹤的潛序列優化方法

NavWM：面向預見性規劃的統一導航世界模型

DynaWM：基於動力學感知的知識蒸餾框架，結合世界模型與動量目標實現連續樓梯上的平滑運動

MinInter：在模仿學習的數據增強中最小化軌跡插值

SPACE：從跨機器人數據學習通用策略的框架

TurboMPC：在GPU上實現快速、可擴展且可微分的模型預測控制

模擬到現實賭注在E過程上：將“模擬器”引入隨時有效的置信序列

基於拓撲在線學習的位移編隊控制

通過對抗姿勢正則化實現靈巧鋼琴演奏中的人體運動學約束

工程化可靠自主系統：挑戰與解決方案

可驗證的機器人安全基礎模型

全部來源