SCOUT:基於不確定性引導遍歷的語義場景覆蓋
SCOUT是一個在線語義探索框架,通過將主動遍歷與概率場景圖構建相結合,使機器人能夠逐步理解環境。它利用不確定性引導的遍歷規劃器,在語義確定性增益、幾何覆蓋增益和移動成本之間取得平衡,從而實現自主的長期場景理解和更新。
近日,一篇題為《SCOUT: Semantic scene COverage via Uncertainty-guided Traversal》的論文在arXiv上發佈,提出了一種新穎的在線語義探索框架。該框架旨在解決長期運行機器人在環境理解中的關鍵問題——機器人不應僅僅訪問空間,而應逐步理解空間。
傳統3D場景圖管道通常將感知視為固定數據集的後處理階段,將場景表示與決定觀察內容的決策相分離。SCOUT通過耦合主動遍歷與概率場景圖構建,打破了這一侷限。給定先驗2D佔用地圖和帶有位姿的RGB-D觀測,SCOUT增量式地構建一個不確定性感知的3D場景圖。圖中的節點維護融合的幾何信息和開放詞彙對象標籤的後驗信念,而邊則編碼如“在...上”、“內部”、“屬於”和“旁邊”等結構關係。
這些信念被反饋給一個不確定性引導的遍歷規劃器,該規劃器通過平衡預期的語義確定性增益、幾何覆蓋增益和移動成本來選擇視角。這樣,當額外證據有意義時,機器人會重新訪問模糊對象;當場景仍不完整時,則擴展到未知自由空間。
最終系統將語義場景完整性視為操作目標,而非語義映射的被動副產品。這標誌着向能夠以最少人工干預巡邏、更新和推理變化室內環境的自主代理邁進了一步。該論文已被2026年ICRA不確定性開放世界機器人研討會接收。
SCOUT的設計考慮到了實際部署中的挑戰,例如如何在部分已知環境中高效決策,以及如何處理開放世界中的未知物體類別。通過使用開放詞彙標籤,SCOUT能夠識別未在訓練集中出現的新物體,從而增強了系統的適應性。實驗結果表明,在多個模擬和真實環境中,SCOUT在語義覆蓋率和探索效率上均優於傳統方法,為長週期自主機器人應用提供了新的可能性。