AI News HubLIVE
站内改写1 分鐘閱讀

SCOUT:基於不確定性引導遍歷的語義場景覆蓋

SCOUT是一個線上語義探索框架,透過將主動遍歷與機率場景圖構建相結合,使機器人能夠逐步理解環境。它利用不確定性引導的遍歷規劃器,在語義確定性增益、幾何覆蓋增益和移動成本之間取得平衡,從而實現自主的長期場景理解和更新。

來源arXiv Robotics作者: Junyu Mao, Sara Ayoubi, Vishnu D. Sharma, Ilija Had\v{z}i\'c, Matthew Andrews

近日,一篇題為《SCOUT: Semantic scene COverage via Uncertainty-guided Traversal》的論文在arXiv上釋出,提出了一種新穎的線上語義探索框架。該框架旨在解決長期執行機器人在環境理解中的關鍵問題——機器人不應僅僅訪問空間,而應逐步理解空間。

傳統3D場景圖管道通常將感知視為固定資料集的後處理階段,將場景表示與決定觀察內容的決策相分離。SCOUT透過耦合主動遍歷與機率場景圖構建,打破了這一侷限。給定先驗2D佔用地圖和帶有位姿的RGB-D觀測,SCOUT增量式地構建一個不確定性感知的3D場景圖。圖中的節點維護融合的幾何資訊和開放詞彙物件標籤的後驗信念,而邊則編碼如“在...上”、“內部”、“屬於”和“旁邊”等結構關係。

這些信念被反饋給一個不確定性引導的遍歷規劃器,該規劃器透過平衡預期的語義確定性增益、幾何覆蓋增益和移動成本來選擇視角。這樣,當額外證據有意義時,機器人會重新訪問模糊物件;當場景仍不完整時,則擴充套件到未知自由空間。

最終系統將語義場景完整性視為操作目標,而非語義對映的被動副產品。這標誌著向能夠以最少人工干預巡邏、更新和推理變化室內環境的自主代理邁進了一步。該論文已被2026年ICRA不確定性開放世界機器人研討會接收。

SCOUT的設計考慮到了實際部署中的挑戰,例如如何在部分已知環境中高效決策,以及如何處理開放世界中的未知物體類別。透過使用開放詞彙標籤,SCOUT能夠識別未在訓練集中出現的新物體,從而增強了系統的適應性。實驗結果表明,在多個模擬和真實環境中,SCOUT在語義覆蓋率和探索效率上均優於傳統方法,為長週期自主機器人應用提供了新的可能性。