arXiv Robotics AI 新聞來源

公開文章 318採集文章 350可信度 75刷新頻率 360 分鐘

健康狀態健康來源類型研究原文權限 允許原文最近入庫 2026-06-26ID arxiv-cs-ro運行狀態 已啟用

Use abstract and metadata; check individual paper license before full text.

最新公開文章

輪式四足機器人的競速：透過模型預測控制主動抑制載荷轉移

2026-06-26 12:00 UTC+8

本文提出了一種結合模型預測控制（MPC）和強化學習（RL）的層次化控制框架，用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、線上MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明，主動側傾控制將平均載荷轉移率降低44%，最快圈速提升8.7%，峰值側向加速度提高21.3%至1.98 m/s²。

層次化控制框架結合MPC和RL，主動管理側向載荷轉移
機器人腿部執行器充當主動懸架，膝關節產生抗側傾扭矩

NavIsaacLab：透過並行機器人學習生成逼真人群以基準測試人感知導航

2026-06-26 12:00 UTC+8

NavIsaacLab是一個基於Isaac Lab的框架，利用基於物理和逼真的場景渲染以及GPU並行模擬，為機器人導航提供即時的3D視覺反饋。它採用資料驅動方法，結合軌跡擴散模型和對抗運動學習控制器，實現可控的、基於物理的行人模擬，並整合多種跨尺度場景，為人感知導航演算法提供強大的基準測試。

NavIsaacLab使用逼真渲染和GPU並行模擬，提供即時3D視覺反饋。
透過軌跡擴散模型和對抗運動學習控制器實現逼真且可控的行人運動。

TaskNPoint：如何在幾分鐘內教會你的人形機器人打反手球

2026-06-26 12:00 UTC+8

這篇論文提出了TaskNPoint訓練協議，透過人類教練提供少量輸入（技能集、一次演示、互動視窗和目標），讓人形機器人在物理模擬環境中快速掌握動態技能。實驗在Unitree G1人形機器人上進行，成功執行了網球正反手擊球、踢足球和搬箱子等任務，且訓練時間不到一小時，無需每任務獎勵調整。

TaskNPoint協議將教練與學習者的分工明確化，人類僅需提供四次輸入。
利用動態技能的結構特性，聚焦於關鍵互動視窗的學習。

RoboTales是一個低成本機器人講故事系統，透過富有表現力的襪子木偶動作來演繹敘事。在Baxter機器人上的自主測試實現中，該系統同步敘述、手勢和嘴部動作來表演角色驅動的故事。一項初步研究表明，木偶式講故事優於僅手勢模式，獲得了更高的HRIES評分和更好的故事回憶效果，表明具身木偶表演能增強參與度和敘事理解。該系統設計模組化且平臺無關，可適配其他機械臂，並提供了一種無螢幕的被動媒體替代方案，支援未來在兒童中心學習環境中的部署。

RoboTales是一種低成本機器人講故事系統，使用襪子木偶進行表達。
在Baxter機器人上實現的自主系統同步敘述、手勢和嘴部動作。

OmniContact：透過接觸流鏈式元技能實現通用人形機器人移動操作

2026-06-26 12:00 UTC+8

本文提出OmniContact分層框架，核心是接觸流（CF）表示，由關鍵身體軌跡和時序二進位制接觸訊號組成。底層策略CF-Track學習統一技能庫，高層模組CF-Gen啟發式合成未來接觸流序列。在搬運箱子和推疊箱子任務中分別達到98.7%和76.5%成功率，顯著超越基線。框架支援與視覺語言模型整合，實現語義驅動的複雜操作。

提出OmniContact框架，以接觸流為共享介面，連線高層規劃與底層執行
底層CF-Track透過模仿或強化學習從接觸流中學習通用移動操作技能

透過線上雅可比誤差補償實現對數螺旋連續臂的形態特定閉環控制

2026-06-26 12:00 UTC+8

本文提出了首個針對對數螺旋連續臂的形態特定閉環任務空間控制框架。透過分段肌腱驅動模型和線上雅可比誤差補償（Broyden更新和卡爾曼濾波），實現了精確魯棒的控制，並在模擬中顯著優於分段常曲率方法，適用於抓取、避障等操作。

首次提出針對對數螺旋形態的閉環控制框架
結合解析雅可比矩陣與線上誤差補償

LiMoDE：從動態專家混合視角重新思考機器人終身操作

2026-06-26 12:00 UTC+8

本文提出LiMoDE，一種基於動態專家混合（MoE）的兩階段學習方案，用於解決機器人終身操作中的災難性遺忘和技能遷移問題。第一階段透過多工預訓練學習先驗知識，根據運動資訊啟用不同專家；第二階段設計終身專家適應機制，動態組合新老專家以適應新任務。在模擬和真實任務中驗證了其有效性。

LiMoDE採用兩階段學習：多工預訓練（動態MoE）和任務適應（終身MoE機制）。
動態MoE根據運動資訊啟用異構專家，處理短期操作。

RMTL：基於強化微任務學習的長時操作與VLM獎勵

2026-06-26 12:00 UTC+8

本文提出RMTL（強化微任務學習），將長時操作任務分解為多個語言描述的微任務，並訓練智慧體進行切換。透過多視角VLM獎勵、逆向課程和分層策略，RMTL提供了比單提示VLM獎勵更豐富的獎勵訊號，加速學習。在Fetch操作環境中的實驗驗證了其有效性。

單提示VLM獎勵在長時操作中獎勵訊號平坦，難以檢測早期進展。
RMTL將任務分解為微任務，每個微任務有獨立的語言提示，並訓練智慧體切換。

強化學習實現自主微型機器人在模擬毛細血管中的導航與干預

2026-06-26 12:00 UTC+8

研究人員開發了基於物理的血液毛細血管網路模擬，利用深度強化學習訓練微型機器人透過趨化性導航。他們系統繪製了導航的物理極限，發現了禁止區域，並觀察到智慧體自主發現多種通用策略。無需重新訓練，這些智慧體即可執行毛細血管流的定向阻塞與疏通，恢復健康基準水平。

開發了包含真實流體動力學和紅細胞動力學的毛細血管網路模擬
深度強化學習智慧體透過趨化性成功導航

無監督記憶增強影片變換器：自主農業機器人的障礙物檢測

2026-06-26 12:00 UTC+8

本文提出了一種名為VMTAD的全無監督即時障礙物檢測方法，專為農業機器人設計。它利用變換器架構和記憶模組處理動態場景，在油菜資料集上達到0.973檢測和0.997分割AUC，輕量版推理僅需14毫秒，兼顧高精度與即時性。

VMTAD是一種全無監督的即時障礙物檢測方法，適用於動態農業場景。
透過記憶模組處理影片幀的時間上下文，有效應對機器人移動帶來的動態變化。

面向低延遲視覺-語言模型的自我中心視覺理解中的雙重正確預測

2026-06-25 12:00 UTC+8

本文研究了在自我中心視覺理解中，如何透過權重剪枝實現低延遲視覺-語言模型，同時保證預測的準確性和證據基礎（雙重正確）。現有剪枝方法常保持證據定位但損害準確性，作者提出理由告知剪枝策略，在自我中心影片資料集上達到了最高準確率和雙重正確預測。

權重剪枝可用於降低VLM在自我中心視覺任務中的延遲
現有方法往往保留正確證據但降低預測準確性

SwarmFly：一種用於無人機叢集實驗設計與驗證的模擬平臺

2026-06-25 12:00 UTC+8

SwarmFly是一個基於MATLAB的開源無人機叢集模擬平臺，解決了現有工具維護不足、學習曲線陡峭和場景單一的問題。它支援四種叢集協調模式、外掛架構和即時地圖，並透過八項實驗驗證了編隊精度、抗風、故障恢復、續航和空域合規性。其模組化設計便於擴充套件至硬體在環測試和更大規模叢集。

SwarmFly是MATLAB平臺，支援四種叢集協調模式（領航-跟隨、分散、異構中繼、異構速度）
外掛架構允許研究人員在不修改核心程式碼的情況下擴充套件功能

用於長時程機器人控制的視覺運動策略中的記憶檢索

2026-06-25 12:00 UTC+8

本文介紹了HALO，一種用於長時程機器人控制的視覺運動策略，透過注意力機制進行記憶檢索，克服了模仿學習中的虛假相關性和錯誤累積問題。

HALO透過蒸餾視覺語言模型先驗來抑制虛假相關性。
HALO使用稀疏注意力減少閉環控制中的記憶錯誤累積。

基於因果關係的引數化控制屏障函式用於安全多車互動

2026-06-25 12:00 UTC+8

該論文提出了一種基於因果推理的引數化控制屏障函式方法，用於解決多車互動中的安全控制問題。透過將因果推斷嵌入到引數化CBF中，該方法能夠顯式推理車輛間的相互影響，克服了現有方法中難以確定因果關係或過度保守的缺陷。基於學習到的因果關係引數化CBF，自適應安全控制器允許自車根據對周圍車輛行為的預期做出安全反應，並在多種互動密集場景中顯著提升了任務效率。該工作已被ICRA 2026接收。

將因果推理嵌入引數化CBF，以顯式處理多車互動中的相互影響
避免基於最壞情況分析的過度保守行為，提升任務效率

RGB：強化學習引導的全身MPPI人形機器人控制

2026-06-25 12:00 UTC+8

RGB框架將預訓練的強化學習策略作為取樣先驗，結合模型預測路徑積分（MPPI）線上最佳化，無需重新訓練即可實現人形機器人的全身魯棒控制。在Unitree G1模擬中達到280Hz控制率，任務精度顯著提升。

RGB利用RL策略作為MPPI的取樣先驗，使得新目標可以透過成本函式靈活新增，避免重新訓練。
MPPI線上校正RL先驗，糾正行走漂移並跟蹤全身參考訊號，實現精確控制。

AeroCast: 基於Transformer-MDN架構的非合作空中障礙物機率三維軌跡預測

2026-06-25 12:00 UTC+8

AeroCast是一個機率性軌跡預測框架，結合了Transformer編碼器和混合密度網路，用於預測未來三維位移的高斯混合分佈。在混合真實與合成的四旋翼飛行器資料集上，相比基線方法，平均位移誤差和最終位移誤差降低了約50%，每個樣本推理時間僅0.1毫秒，支援機載即時部署。

結合Transformer編碼器和混合密度網路，實現非合作障礙物的機率性三維軌跡預測。
在五秒預測範圍內，平均和最終位移誤差相比基線降低約50%。

SurveilNav：機器人與監控系統協同的物體目標導航

2026-06-25 12:00 UTC+8

一種新型室內協同物體導航資料集及框架SurveilNav，透過整合主動相機排程、聯合2D/3D地圖、基於視覺語言模型的價值估計和協同目標驗證，克服了單機器人感知範圍有限和固定攝像頭盲區的侷限。在HM3D資料集上的實驗表明，該方法在探索效率和導航成功率上均達到最優水平，有望應用於大規模搜尋、家庭環境和救援任務。

構建了包含74個樓層206個攝像頭的室內協同導航資料集，支援多視角資訊利用的系統評估
提出SurveilNav框架，融合機器人動態區域性感知與監控靜態全域性檢視，實現高效協同

ADM-Fusion：自適應深度多感測器融合，實現多樣條件下的魯棒自我運動估計

2026-06-25 12:00 UTC+8

提出ADM-Fusion，一種端到端深度學習多感測器融合方法，採用自適應感測器混合專家框架和內容感知路由，動態分配感測器權重，並分離平移和旋轉分支，透過跨任務注意力機制實現資訊共享。在CARLA-LOC模擬資料集訓練並在KITTI真實資料微調，展示了模擬到現實的有效遷移，在退化條件下保持魯棒性。

ADM-Fusion採用自適應感測器混合專家框架，即時動態調整感測器輸入權重。
系統包含獨立的平移和旋轉分支，透過跨任務注意力機制保持任務特異性並促進資訊共享。

多IMU鉸接剛體系統的擴充套件位姿估計的不變卡爾曼濾波

2026-06-25 12:00 UTC+8

本研究提出了一種用於多IMU鉸接剛體系統的擴充套件位姿估計的不變卡爾曼濾波方法。透過引入相對L擴充套件位姿這一李群表示，並結合迭代不變擴充套件卡爾曼濾波（IterIEKF），該方法有效處理了關節運動學約束，在UR5e機器人和人體腿部驗證中，均方根誤差降低至少50%。

提出相對L擴充套件位姿李群表示，實現多IMU鉸接系統的群仿射動力學
將關節約束作為無噪聲偽測量納入迭代不變擴充套件卡爾曼濾波（IterIEKF）

BFMTrack：基於行為基礎模型的物理模擬運動追蹤的潛序列最佳化方法

2026-06-25 12:00 UTC+8

一種名為潛序列最佳化（LSO）的新方法，透過最佳化行為基礎模型中的潛變數序列，實現了精確的物理模擬運動追蹤，並在真實人形機器人上得到驗證。

行為基礎模型將物理合理的行為組織到潛空間中，但不支援時變目標。
BFMTrack引入潛序列最佳化，結合模擬 rollout 和策略梯度更新。

NavWM：面向預見性規劃的統一導航世界模型

2026-06-24 12:00 UTC+8

NavWM是一個統一的導航世界模型，它無縫整合了潛在世界推理、多模態動作預測和可控視覺生成。透過引入錨點基礎的多模態軌跡預測框架，模型能夠生成多樣化的動作空間，並利用視覺預見性進行魯棒閉環規劃。實驗證明，NavWM在高質量未來狀態生成和零樣本導航成功率上均取得了顯著提升。

NavWM整合了感知、生成和控制，統一處理時空動態。
利用潛在世界標記提取幾何與語義先驗，增強結構理解。

DynaWM：基於動力學感知的知識蒸餾框架，結合世界模型與動量目標實現連續樓梯上的平滑運動

2026-06-24 12:00 UTC+8

提出DynaWM框架，透過世界模型正則化和動量目標編碼器增強雙輪足機器人在連續樓梯上的地形適應性和運動平滑性，在模擬和真實硬體上驗證了有效性。

DynaWM採用世界模型作為正則化項，強制前向動力學感知，保留完整地形幾何資訊。
動量目標編碼器提供一致的蒸餾目標，防止維度坍塌。

MinInter：在模仿學習的資料增強中最小化軌跡插值

2026-06-24 12:00 UTC+8

本文提出MinInter方法，透過選擇需要最少插值的示範軌跡來生成更高質量的合成資料，從而提升模仿學習的效能。在MimicGen基準的12個任務上，MinInter顯著提高了資料生成成功率和策略成功率，尤其在接觸密集、長週期和高方差場景中表現突出。

MinInter透過最小化插值選擇源示範，生成更高質量的合成軌跡。
在12個操作任務中，MinInter一致提升了資料生成和策略成功率。

SPACE：從跨機器人資料學習通用策略的框架

2026-06-24 12:00 UTC+8

SPACE框架提出使用笛卡爾狀態增量作為通用動作表示，結合狀態預測與自適應命令執行，解決不同機器人因動力學差異導致的行為克隆訓練和部署問題。實驗表明，該方法在跨形態、跨硬體單元及執行中動力學變化下均顯著優於直接預測控制指令的策略。

提出笛卡爾狀態增量作為通用動作表示，統一不同機器人動作空間
SPACE框架包含狀態預測策略與動作介面卡，處理三種層次的動力學變化

TurboMPC：在GPU上實現快速、可擴充套件且可微分的模型預測控制

2026-06-24 12:00 UTC+8

TurboMPC是一種完全在GPU上執行的可微分MPC求解器，支援多種約束和隱式積分器。透過SQP、ADMM和隱式微分等技術的結合，在模擬和實際車輛測試中分別比CPU和GPU求解器快15倍和58倍，且能擴充套件至超過8000個規劃節點。

TurboMPC是首個完全基於GPU的可微分MPC求解器
相比現有CPU和GPU求解器分別提速15倍和58倍

模擬到現實賭注在E過程上：將“模擬器”引入隨時有效的置信序列

2026-06-24 12:00 UTC+8

本文介紹了將模擬到現實效能估計與賭博（來自Chen等人）和安全隨時有效推斷（來自Ramdas等人）相結合的方法。該方法利用縮放模擬器，為均值估計產生高效可靠的證書，在機器人效能測試中尤其有價值。

結合了模擬到現實效能估計與賭博方法
利用縮放模擬器產生高效可靠的均值估計證書

基於拓撲線上學習的位移編隊控制

2026-06-24 12:00 UTC+8

本文提出TOLD框架，一種即時邊級自適應方法，透過線上更新互動拓撲權重來最小化編隊畸變，相比傳統節點級控制器顯著提升魯棒性。理論分析和模擬實驗驗證了其有效性，在Crazyflie 2.0四旋翼上實現了超過62%的畸變降低。

TOLD是首個線上調整互動拓撲權重的編隊控制方法，而非僅調節單個機器人輸入。
提出了OGF和OExpGF兩種策略，分別保證有界畸變和漸近一致性。

透過對抗姿勢正則化實現靈巧鋼琴演奏中的人體運動學約束

2026-06-24 12:00 UTC+8

強化學習可以訓練雙靈巧手在物理模擬中高精度地彈奏鋼琴，但高自由度手的任務獎勵或逆運動學方法常導致不自然的姿態和關節過度伸展。本文提出對抗姿勢正則化（APR），利用少量隨意的人類彈奏資料，透過對抗目標使策略的姿勢分佈與人類先驗匹配，從而產生更像人類的手形。同時，使用消費級Meta Quest 3收集併發布非結構化手部運動資料，並將其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指標及視覺質量上均顯著優於先前方法。

提出對抗姿勢正則化（APR）方法，避免依賴昂貴的、與歌曲對齊的專家演示資料
利用消費級Meta Quest 3收集隨意的人類鋼琴彈奏手部運動資料，並重定向到Shadow Hand

工程化可靠自主系統：挑戰與解決方案

2026-06-24 12:00 UTC+8

本文報道了2024年6月10日至14日舉行的洛倫茲中心研討會“工程化可靠自主系統”(ERAS)的成果。研討會聚焦於自主系統的驗證與確認技術、實際工程應用以及安全軟體架構，形成了一份挑戰目錄和解決方案路線圖。部分挑戰可透過現有學術方法解決，但未在工業界廣泛應用；其他挑戰仍需進一步研究。

研討會由FMAS和AREA社群共同組織，彙集了學術界、工業界及特殊領域代表。
三大核心議題：驗證與確認、實際系統工程、安全軟體架構。

可驗證的機器人安全基礎模型

2026-06-24 12:00 UTC+8

本文提出FEARL框架，透過將策略分解為大型控制器和小型安全模組，實現了對機器人控制基礎模型的形式化驗證，在保持感知與推理能力的同時，使安全關鍵屬性可被現有工具驗證。在模擬和實體機器人上的實驗證明了該方法的有效性。

FEARL框架將機器人策略分為大型控制器（負責感知與推理）和可驗證的小型安全模組。
安全模組僅處理低維度安全感測器資料，使形式化驗證變得可行。

arXiv Robotics

最新公開文章

輪式四足機器人的競速：透過模型預測控制主動抑制載荷轉移

NavIsaacLab：透過並行機器人學習生成逼真人群以基準測試人感知導航

TaskNPoint：如何在幾分鐘內教會你的人形機器人打反手球

RoboTales：機器人擬人化學習系統

OmniContact：透過接觸流鏈式元技能實現通用人形機器人移動操作

透過線上雅可比誤差補償實現對數螺旋連續臂的形態特定閉環控制

LiMoDE：從動態專家混合視角重新思考機器人終身操作

RMTL：基於強化微任務學習的長時操作與VLM獎勵

強化學習實現自主微型機器人在模擬毛細血管中的導航與干預

無監督記憶增強影片變換器：自主農業機器人的障礙物檢測

面向低延遲視覺-語言模型的自我中心視覺理解中的雙重正確預測

SwarmFly：一種用於無人機叢集實驗設計與驗證的模擬平臺

用於長時程機器人控制的視覺運動策略中的記憶檢索

基於因果關係的引數化控制屏障函式用於安全多車互動

RGB：強化學習引導的全身MPPI人形機器人控制

AeroCast: 基於Transformer-MDN架構的非合作空中障礙物機率三維軌跡預測

SurveilNav：機器人與監控系統協同的物體目標導航

ADM-Fusion：自適應深度多感測器融合，實現多樣條件下的魯棒自我運動估計

多IMU鉸接剛體系統的擴充套件位姿估計的不變卡爾曼濾波

BFMTrack：基於行為基礎模型的物理模擬運動追蹤的潛序列最佳化方法

NavWM：面向預見性規劃的統一導航世界模型

DynaWM：基於動力學感知的知識蒸餾框架，結合世界模型與動量目標實現連續樓梯上的平滑運動

MinInter：在模仿學習的資料增強中最小化軌跡插值

SPACE：從跨機器人資料學習通用策略的框架

TurboMPC：在GPU上實現快速、可擴充套件且可微分的模型預測控制

模擬到現實賭注在E過程上：將“模擬器”引入隨時有效的置信序列

基於拓撲線上學習的位移編隊控制

透過對抗姿勢正則化實現靈巧鋼琴演奏中的人體運動學約束

工程化可靠自主系統：挑戰與解決方案

可驗證的機器人安全基礎模型

全部來源