輪式四足機器人的競速:透過模型預測控制主動抑制載荷轉移
本文提出了一種結合模型預測控制(MPC)和強化學習(RL)的層次化控制框架,用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、線上MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明,主動側傾控制將平均載荷轉移率降低44%,最快圈速提升8.7%,峰值側向加速度提高21.3%至1.98 m/s²。
- 層次化控制框架結合MPC和RL,主動管理側向載荷轉移
- 機器人腿部執行器充當主動懸架,膝關節產生抗側傾扭矩
Use abstract and metadata; check individual paper license before full text.
本文提出了一種結合模型預測控制(MPC)和強化學習(RL)的層次化控制框架,用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、線上MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明,主動側傾控制將平均載荷轉移率降低44%,最快圈速提升8.7%,峰值側向加速度提高21.3%至1.98 m/s²。
NavIsaacLab是一個基於Isaac Lab的框架,利用基於物理和逼真的場景渲染以及GPU並行模擬,為機器人導航提供即時的3D視覺反饋。它採用資料驅動方法,結合軌跡擴散模型和對抗運動學習控制器,實現可控的、基於物理的行人模擬,並整合多種跨尺度場景,為人感知導航演算法提供強大的基準測試。
這篇論文提出了TaskNPoint訓練協議,透過人類教練提供少量輸入(技能集、一次演示、互動視窗和目標),讓人形機器人在物理模擬環境中快速掌握動態技能。實驗在Unitree G1人形機器人上進行,成功執行了網球正反手擊球、踢足球和搬箱子等任務,且訓練時間不到一小時,無需每任務獎勵調整。
RoboTales是一個低成本機器人講故事系統,透過富有表現力的襪子木偶動作來演繹敘事。在Baxter機器人上的自主測試實現中,該系統同步敘述、手勢和嘴部動作來表演角色驅動的故事。一項初步研究表明,木偶式講故事優於僅手勢模式,獲得了更高的HRIES評分和更好的故事回憶效果,表明具身木偶表演能增強參與度和敘事理解。該系統設計模組化且平臺無關,可適配其他機械臂,並提供了一種無螢幕的被動媒體替代方案,支援未來在兒童中心學習環境中的部署。
本文提出OmniContact分層框架,核心是接觸流(CF)表示,由關鍵身體軌跡和時序二進位制接觸訊號組成。底層策略CF-Track學習統一技能庫,高層模組CF-Gen啟發式合成未來接觸流序列。在搬運箱子和推疊箱子任務中分別達到98.7%和76.5%成功率,顯著超越基線。框架支援與視覺語言模型整合,實現語義驅動的複雜操作。
本文提出了首個針對對數螺旋連續臂的形態特定閉環任務空間控制框架。透過分段肌腱驅動模型和線上雅可比誤差補償(Broyden更新和卡爾曼濾波),實現了精確魯棒的控制,並在模擬中顯著優於分段常曲率方法,適用於抓取、避障等操作。
本文提出LiMoDE,一種基於動態專家混合(MoE)的兩階段學習方案,用於解決機器人終身操作中的災難性遺忘和技能遷移問題。第一階段透過多工預訓練學習先驗知識,根據運動資訊啟用不同專家;第二階段設計終身專家適應機制,動態組合新老專家以適應新任務。在模擬和真實任務中驗證了其有效性。
本文提出RMTL(強化微任務學習),將長時操作任務分解為多個語言描述的微任務,並訓練智慧體進行切換。透過多視角VLM獎勵、逆向課程和分層策略,RMTL提供了比單提示VLM獎勵更豐富的獎勵訊號,加速學習。在Fetch操作環境中的實驗驗證了其有效性。
研究人員開發了基於物理的血液毛細血管網路模擬,利用深度強化學習訓練微型機器人透過趨化性導航。他們系統繪製了導航的物理極限,發現了禁止區域,並觀察到智慧體自主發現多種通用策略。無需重新訓練,這些智慧體即可執行毛細血管流的定向阻塞與疏通,恢復健康基準水平。
本文提出了一種名為VMTAD的全無監督即時障礙物檢測方法,專為農業機器人設計。它利用變換器架構和記憶模組處理動態場景,在油菜資料集上達到0.973檢測和0.997分割AUC,輕量版推理僅需14毫秒,兼顧高精度與即時性。
本文研究了在自我中心視覺理解中,如何透過權重剪枝實現低延遲視覺-語言模型,同時保證預測的準確性和證據基礎(雙重正確)。現有剪枝方法常保持證據定位但損害準確性,作者提出理由告知剪枝策略,在自我中心影片資料集上達到了最高準確率和雙重正確預測。
SwarmFly是一個基於MATLAB的開源無人機叢集模擬平臺,解決了現有工具維護不足、學習曲線陡峭和場景單一的問題。它支援四種叢集協調模式、外掛架構和即時地圖,並透過八項實驗驗證了編隊精度、抗風、故障恢復、續航和空域合規性。其模組化設計便於擴充套件至硬體在環測試和更大規模叢集。
本文介紹了HALO,一種用於長時程機器人控制的視覺運動策略,透過注意力機制進行記憶檢索,克服了模仿學習中的虛假相關性和錯誤累積問題。
該論文提出了一種基於因果推理的引數化控制屏障函式方法,用於解決多車互動中的安全控制問題。透過將因果推斷嵌入到引數化CBF中,該方法能夠顯式推理車輛間的相互影響,克服了現有方法中難以確定因果關係或過度保守的缺陷。基於學習到的因果關係引數化CBF,自適應安全控制器允許自車根據對周圍車輛行為的預期做出安全反應,並在多種互動密集場景中顯著提升了任務效率。該工作已被ICRA 2026接收。
RGB框架將預訓練的強化學習策略作為取樣先驗,結合模型預測路徑積分(MPPI)線上最佳化,無需重新訓練即可實現人形機器人的全身魯棒控制。在Unitree G1模擬中達到280Hz控制率,任務精度顯著提升。
AeroCast是一個機率性軌跡預測框架,結合了Transformer編碼器和混合密度網路,用於預測未來三維位移的高斯混合分佈。在混合真實與合成的四旋翼飛行器資料集上,相比基線方法,平均位移誤差和最終位移誤差降低了約50%,每個樣本推理時間僅0.1毫秒,支援機載即時部署。
一種新型室內協同物體導航資料集及框架SurveilNav,透過整合主動相機排程、聯合2D/3D地圖、基於視覺語言模型的價值估計和協同目標驗證,克服了單機器人感知範圍有限和固定攝像頭盲區的侷限。在HM3D資料集上的實驗表明,該方法在探索效率和導航成功率上均達到最優水平,有望應用於大規模搜尋、家庭環境和救援任務。
提出ADM-Fusion,一種端到端深度學習多感測器融合方法,採用自適應感測器混合專家框架和內容感知路由,動態分配感測器權重,並分離平移和旋轉分支,透過跨任務注意力機制實現資訊共享。在CARLA-LOC模擬資料集訓練並在KITTI真實資料微調,展示了模擬到現實的有效遷移,在退化條件下保持魯棒性。
本研究提出了一種用於多IMU鉸接剛體系統的擴充套件位姿估計的不變卡爾曼濾波方法。透過引入相對L擴充套件位姿這一李群表示,並結合迭代不變擴充套件卡爾曼濾波(IterIEKF),該方法有效處理了關節運動學約束,在UR5e機器人和人體腿部驗證中,均方根誤差降低至少50%。
一種名為潛序列最佳化(LSO)的新方法,透過最佳化行為基礎模型中的潛變數序列,實現了精確的物理模擬運動追蹤,並在真實人形機器人上得到驗證。
NavWM是一個統一的導航世界模型,它無縫整合了潛在世界推理、多模態動作預測和可控視覺生成。透過引入錨點基礎的多模態軌跡預測框架,模型能夠生成多樣化的動作空間,並利用視覺預見性進行魯棒閉環規劃。實驗證明,NavWM在高質量未來狀態生成和零樣本導航成功率上均取得了顯著提升。
提出DynaWM框架,透過世界模型正則化和動量目標編碼器增強雙輪足機器人在連續樓梯上的地形適應性和運動平滑性,在模擬和真實硬體上驗證了有效性。
本文提出MinInter方法,透過選擇需要最少插值的示範軌跡來生成更高質量的合成資料,從而提升模仿學習的效能。在MimicGen基準的12個任務上,MinInter顯著提高了資料生成成功率和策略成功率,尤其在接觸密集、長週期和高方差場景中表現突出。
SPACE框架提出使用笛卡爾狀態增量作為通用動作表示,結合狀態預測與自適應命令執行,解決不同機器人因動力學差異導致的行為克隆訓練和部署問題。實驗表明,該方法在跨形態、跨硬體單元及執行中動力學變化下均顯著優於直接預測控制指令的策略。
TurboMPC是一種完全在GPU上執行的可微分MPC求解器,支援多種約束和隱式積分器。透過SQP、ADMM和隱式微分等技術的結合,在模擬和實際車輛測試中分別比CPU和GPU求解器快15倍和58倍,且能擴充套件至超過8000個規劃節點。
本文介紹了將模擬到現實效能估計與賭博(來自Chen等人)和安全隨時有效推斷(來自Ramdas等人)相結合的方法。該方法利用縮放模擬器,為均值估計產生高效可靠的證書,在機器人效能測試中尤其有價值。
本文提出TOLD框架,一種即時邊級自適應方法,透過線上更新互動拓撲權重來最小化編隊畸變,相比傳統節點級控制器顯著提升魯棒性。理論分析和模擬實驗驗證了其有效性,在Crazyflie 2.0四旋翼上實現了超過62%的畸變降低。
強化學習可以訓練雙靈巧手在物理模擬中高精度地彈奏鋼琴,但高自由度手的任務獎勵或逆運動學方法常導致不自然的姿態和關節過度伸展。本文提出對抗姿勢正則化(APR),利用少量隨意的人類彈奏資料,透過對抗目標使策略的姿勢分佈與人類先驗匹配,從而產生更像人類的手形。同時,使用消費級Meta Quest 3收集併發布非結構化手部運動資料,並將其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指標及視覺質量上均顯著優於先前方法。
本文報道了2024年6月10日至14日舉行的洛倫茲中心研討會“工程化可靠自主系統”(ERAS)的成果。研討會聚焦於自主系統的驗證與確認技術、實際工程應用以及安全軟體架構,形成了一份挑戰目錄和解決方案路線圖。部分挑戰可透過現有學術方法解決,但未在工業界廣泛應用;其他挑戰仍需進一步研究。
本文提出FEARL框架,透過將策略分解為大型控制器和小型安全模組,實現了對機器人控制基礎模型的形式化驗證,在保持感知與推理能力的同時,使安全關鍵屬性可被現有工具驗證。在模擬和實體機器人上的實驗證明了該方法的有效性。