VANDERER:基於未來感知與視覺好奇心引導的擴散策略的無地圖探索
VANDERER是一種新穎的移動代理探索框架,僅使用單目攝像頭資料,透過視覺好奇心模組引導預訓練的擴散策略,無需傳統佔用地圖。在模擬環境中,它平均比NoMaD多探索13.4%的區域,並發現視覺與幾何好奇心在室外環境中的直接相關性。
研究人員提出了一種名為VANDERER的新型移動代理探索框架,旨在解決感測器受限環境下(如僅配備單目攝像頭)的自主探索難題。傳統方法依賴構建佔用地圖並最佳化未探索區域的訪問順序,但在單目視覺條件下,生成準確的佔用地圖極具挑戰性。VANDERER創新性地引入了視覺好奇心模組(Visual Curiosity Module, VCM),該模組透過一個導航世界模型預測當前視角下執行不同動作後的未來觀測結果,並利用好奇心成本(curiosity cost)對這些動作進行量化評估。這一成本訊號隨後被用於引導一個預訓練的擴散策略(diffusion policy),使其生成能夠最大化探索未知區域的連續動作序列。在多種模擬環境中的系統評估顯示,VANDERER在所有測試場景中均顯著優於現有基線方法,與當前最先進的NoMaD方法相比,其探索面積平均提高了13.4%。更重要的是,研究團隊發現室外環境中視覺好奇心與幾何好奇心之間存在直接的相關性,這意味著VANDERER能夠有效利用視覺線索來推斷環境的三維結構,從而在無需顯式深度感測器或複雜建圖演算法的情況下實現高效探索。該成果由Venkata Naren Devarakonda等四位學者共同完成,相關論文已提交至arXiv(編號2606.14879),涵蓋機器人學、計算機視覺與機器學習等多個交叉領域。VANDERER的成功為無人機、小型地面機器人等計算資源與感測器配置受限的自主系統提供了全新的探索正規化,有望在災難救援、地形勘測、農業巡查等實際場景中發揮重要作用。