輪式四足機器人的競速:通過模型預測控制主動抑制載荷轉移
本文提出了一種結合模型預測控制(MPC)和強化學習(RL)的層次化控制框架,用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、在線MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明,主動側傾控制將平均載荷轉移率降低44%,最快圈速提升8.7%,峯值側向加速度提高21.3%至1.98 m/s²。
- 層次化控制框架結合MPC和RL,主動管理側向載荷轉移
- 機器人腿部執行器充當主動懸架,膝關節產生抗側傾扭矩
Use abstract and metadata; check individual paper license before full text.
本文提出了一種結合模型預測控制(MPC)和強化學習(RL)的層次化控制框架,用於在自主競速中管理輪式四足機器人的側向載荷轉移。該框架包括離線最優路徑生成、在線MPC規劃器以及直接作用於16個執行器的全身RL策略。實驗表明,主動側傾控制將平均載荷轉移率降低44%,最快圈速提升8.7%,峯值側向加速度提高21.3%至1.98 m/s²。
NavIsaacLab是一個基於Isaac Lab的框架,利用基於物理和逼真的場景渲染以及GPU並行模擬,為機器人導航提供實時的3D視覺反饋。它採用數據驅動方法,結合軌跡擴散模型和對抗運動學習控制器,實現可控的、基於物理的行人模擬,並整合多種跨尺度場景,為人感知導航算法提供強大的基準測試。
這篇論文提出了TaskNPoint訓練協議,通過人類教練提供少量輸入(技能集、一次演示、交互窗口和目標),讓人形機器人在物理仿真環境中快速掌握動態技能。實驗在Unitree G1人形機器人上進行,成功執行了網球正反手擊球、踢足球和搬箱子等任務,且訓練時間不到一小時,無需每任務獎勵調整。
RoboTales是一個低成本機器人講故事系統,通過富有表現力的襪子木偶動作來演繹敍事。在Baxter機器人上的自主測試實現中,該系統同步敍述、手勢和嘴部動作來表演角色驅動的故事。一項初步研究表明,木偶式講故事優於僅手勢模式,獲得了更高的HRIES評分和更好的故事回憶效果,表明具身木偶表演能增強參與度和敍事理解。該系統設計模塊化且平台無關,可適配其他機械臂,並提供了一種無屏幕的被動媒體替代方案,支持未來在兒童中心學習環境中的部署。
本文提出OmniContact分層框架,核心是接觸流(CF)表示,由關鍵身體軌跡和時序二進制接觸信號組成。底層策略CF-Track學習統一技能庫,高層模塊CF-Gen啓發式合成未來接觸流序列。在搬運箱子和推疊箱子任務中分別達到98.7%和76.5%成功率,顯著超越基線。框架支持與視覺語言模型集成,實現語義驅動的複雜操作。
本文提出了首個針對對數螺旋連續臂的形態特定閉環任務空間控制框架。通過分段肌腱驅動模型和在線雅可比誤差補償(Broyden更新和卡爾曼濾波),實現了精確魯棒的控制,並在仿真中顯著優於分段常曲率方法,適用於抓取、避障等操作。
本文提出LiMoDE,一種基於動態專家混合(MoE)的兩階段學習方案,用於解決機器人終身操作中的災難性遺忘和技能遷移問題。第一階段通過多任務預訓練學習先驗知識,根據運動信息激活不同專家;第二階段設計終身專家適應機制,動態組合新老專家以適應新任務。在模擬和真實任務中驗證了其有效性。
本文提出RMTL(強化微任務學習),將長時操作任務分解為多個語言描述的微任務,並訓練智能體進行切換。通過多視角VLM獎勵、逆向課程和分層策略,RMTL提供了比單提示VLM獎勵更豐富的獎勵信號,加速學習。在Fetch操作環境中的實驗驗證了其有效性。
研究人員開發了基於物理的血液毛細血管網絡模擬,利用深度強化學習訓練微型機器人通過趨化性導航。他們系統繪製了導航的物理極限,發現了禁止區域,並觀察到智能體自主發現多種通用策略。無需重新訓練,這些智能體即可執行毛細血管流的定向阻塞與疏通,恢復健康基準水平。
本文提出了一種名為VMTAD的全無監督實時障礙物檢測方法,專為農業機器人設計。它利用變換器架構和記憶模塊處理動態場景,在油菜數據集上達到0.973檢測和0.997分割AUC,輕量版推理僅需14毫秒,兼顧高精度與實時性。
本文研究了在自我中心視覺理解中,如何通過權重剪枝實現低延遲視覺-語言模型,同時保證預測的準確性和證據基礎(雙重正確)。現有剪枝方法常保持證據定位但損害準確性,作者提出理由告知剪枝策略,在自我中心視頻數據集上達到了最高準確率和雙重正確預測。
SwarmFly是一個基於MATLAB的開源無人機集羣仿真平台,解決了現有工具維護不足、學習曲線陡峭和場景單一的問題。它支持四種集羣協調模式、插件架構和實時地圖,並通過八項實驗驗證了編隊精度、抗風、故障恢復、續航和空域合規性。其模塊化設計便於擴展至硬件在環測試和更大規模集羣。
本文介紹了HALO,一種用於長時程機器人控制的視覺運動策略,通過注意力機制進行記憶檢索,克服了模仿學習中的虛假相關性和錯誤累積問題。
該論文提出了一種基於因果推理的參數化控制屏障函數方法,用於解決多車交互中的安全控制問題。通過將因果推斷嵌入到參數化CBF中,該方法能夠顯式推理車輛間的相互影響,克服了現有方法中難以確定因果關係或過度保守的缺陷。基於學習到的因果關係參數化CBF,自適應安全控制器允許自車根據對周圍車輛行為的預期做出安全反應,並在多種交互密集場景中顯著提升了任務效率。該工作已被ICRA 2026接收。
RGB框架將預訓練的強化學習策略作為採樣先驗,結合模型預測路徑積分(MPPI)在線優化,無需重新訓練即可實現人形機器人的全身魯棒控制。在Unitree G1仿真中達到280Hz控制率,任務精度顯著提升。
AeroCast是一個概率性軌跡預測框架,結合了Transformer編碼器和混合密度網絡,用於預測未來三維位移的高斯混合分佈。在混合真實與合成的四旋翼飛行器數據集上,相比基線方法,平均位移誤差和最終位移誤差降低了約50%,每個樣本推理時間僅0.1毫秒,支持機載實時部署。
一種新型室內協同物體導航數據集及框架SurveilNav,通過整合主動相機調度、聯合2D/3D地圖、基於視覺語言模型的價值估計和協同目標驗證,克服了單機器人感知範圍有限和固定攝像頭盲區的侷限。在HM3D數據集上的實驗表明,該方法在探索效率和導航成功率上均達到最優水平,有望應用於大規模搜索、家庭環境和救援任務。
提出ADM-Fusion,一種端到端深度學習多傳感器融合方法,採用自適應傳感器混合專家框架和內容感知路由,動態分配傳感器權重,並分離平移和旋轉分支,通過跨任務注意力機制實現信息共享。在CARLA-LOC模擬數據集訓練並在KITTI真實數據微調,展示了仿真到現實的有效遷移,在退化條件下保持魯棒性。
本研究提出了一種用於多IMU鉸接剛體系統的擴展位姿估計的不變卡爾曼濾波方法。通過引入相對L擴展位姿這一李羣表示,並結合迭代不變擴展卡爾曼濾波(IterIEKF),該方法有效處理了關節運動學約束,在UR5e機器人和人體腿部驗證中,均方根誤差降低至少50%。
一種名為潛序列優化(LSO)的新方法,通過優化行為基礎模型中的潛變量序列,實現了精確的物理模擬運動追蹤,並在真實人形機器人上得到驗證。
NavWM是一個統一的導航世界模型,它無縫集成了潛在世界推理、多模態動作預測和可控視覺生成。通過引入錨點基礎的多模態軌跡預測框架,模型能夠生成多樣化的動作空間,並利用視覺預見性進行魯棒閉環規劃。實驗證明,NavWM在高質量未來狀態生成和零樣本導航成功率上均取得了顯著提升。
提出DynaWM框架,通過世界模型正則化和動量目標編碼器增強雙輪足機器人在連續樓梯上的地形適應性和運動平滑性,在仿真和真實硬件上驗證了有效性。
本文提出MinInter方法,通過選擇需要最少插值的示範軌跡來生成更高質量的合成數據,從而提升模仿學習的性能。在MimicGen基準的12個任務上,MinInter顯著提高了數據生成成功率和策略成功率,尤其在接觸密集、長週期和高方差場景中表現突出。
SPACE框架提出使用笛卡爾狀態增量作為通用動作表示,結合狀態預測與自適應命令執行,解決不同機器人因動力學差異導致的行為克隆訓練和部署問題。實驗表明,該方法在跨形態、跨硬件單元及運行中動力學變化下均顯著優於直接預測控制指令的策略。
TurboMPC是一種完全在GPU上運行的可微分MPC求解器,支持多種約束和隱式積分器。通過SQP、ADMM和隱式微分等技術的結合,在仿真和實際車輛測試中分別比CPU和GPU求解器快15倍和58倍,且能擴展至超過8000個規劃節點。
本文介紹了將模擬到現實性能估計與賭博(來自Chen等人)和安全隨時有效推斷(來自Ramdas等人)相結合的方法。該方法利用縮放模擬器,為均值估計產生高效可靠的證書,在機器人性能測試中尤其有價值。
本文提出TOLD框架,一種實時邊級自適應方法,通過在線更新交互拓撲權重來最小化編隊畸變,相比傳統節點級控制器顯著提升魯棒性。理論分析和仿真實驗驗證了其有效性,在Crazyflie 2.0四旋翼上實現了超過62%的畸變降低。
強化學習可以訓練雙靈巧手在物理仿真中高精度地彈奏鋼琴,但高自由度手的任務獎勵或逆運動學方法常導致不自然的姿態和關節過度伸展。本文提出對抗姿勢正則化(APR),利用少量隨意的人類彈奏數據,通過對抗目標使策略的姿勢分佈與人類先驗匹配,從而產生更像人類的手形。同時,使用消費級Meta Quest 3收集併發布非結構化手部運動數據,並將其重定向到Shadow Hand。在cPSI、BSE和FAC三人性化指標及視覺質量上均顯著優於先前方法。
本文報道了2024年6月10日至14日舉行的洛倫茲中心研討會“工程化可靠自主系統”(ERAS)的成果。研討會聚焦於自主系統的驗證與確認技術、實際工程應用以及安全軟件架構,形成了一份挑戰目錄和解決方案路線圖。部分挑戰可通過現有學術方法解決,但未在工業界廣泛應用;其他挑戰仍需進一步研究。
本文提出FEARL框架,通過將策略分解為大型控制器和小型安全模塊,實現了對機器人控制基礎模型的形式化驗證,在保持感知與推理能力的同時,使安全關鍵屬性可被現有工具驗證。在模擬和實體機器人上的實驗證明了該方法的有效性。