CWI:複合人形全身模仿系統用於移動操作
本文提出CWI框架,透過解耦動捕資料的上半身操作和下半身運動,結合AMP、多批評家架構和師生蒸餾,實現人形機器人的穩定移動與靈巧操作協調。在模擬和真實LimX Oli人形機器人上驗證,表現出競爭力的效能。
近年來,人形機器人研究聚焦於實現日常任務中穩定移動與靈巧操作的協調。然而,現有全身控制器面臨重大挑戰:基於命令取樣的方法缺乏動捕資料,面臨獎勵稀疏和收斂困難;而全身動捕模仿則受限於資料集不平衡,需大量過濾和增強。針對這些問題,研究人員提出複合全身模仿(CWI)框架,透過解耦上下半身動捕資料的使用,充分發揮各自優勢。
CWI框架的核心在於策略性的資料解耦:上半身操作充分利用豐富的動捕資料集,涵蓋多樣化的操作參考;下半身運動則透過對抗性運動先驗(AMP)訓練的雙鑑別器,從專家級行走和下蹲片段中學習穩定、命令條件化的運動。這種設計避免了傳統方法中上下半身互相干擾的問題。此外,多批評家架構有效減少了移動、操作和運動風格目標之間的衝突,師生蒸餾階段則進一步將全身策略壓縮為僅需雙手姿態和速度/高度命令輸入,簡化了控制流程。
研究團隊在模擬環境和真實的LimX Oli全尺寸人形機器人上對CWI進行了評估。結果顯示,該方法在移動操作效能、全身協調性方面表現出色,並實現了無需全身動捕裝置的實用遠端操作。這一成果為人形機器人在複雜環境中執行日常任務提供了新的可能性。專案頁面及補充材料見https://cwi-ral.github.io/CWI-RAL-Webpage。