AI News HubLIVE
站内改写

MASt3R-Nav:基於相對三維地圖的WayPixel導航

一種名為MASt3R-Nav的新型視覺導航方法,利用像素相對連通性構建幾何精確但無需全局一致性的地圖,相比傳統拓撲圖實現更強大的導航能力。

文章情報

工程師進階

要點

  • 提出像素相對連通圖作為新型地圖表示。
  • 利用三維基礎圖像匹配建立圖像間的像素對應。
  • 推導出WayPixel代價圖用於全局路徑規劃和控制器訓練。
  • 在仿真和真實場景中驗證了優越性能。

為甚麼重要

這條新聞值得關注,因為提出像素相對連通圖作為新型地圖表示。

技術影響

可能影響 Agent 架構、工具調用、工作流自動化和產品集成。

在機器人視覺導航領域,地圖表示方式是決定導航能力的關鍵因素。傳統方法主要分為兩類:一類是基於全局一致三維幾何的經典地圖,這類地圖精確但構建複雜,對計算和存儲要求高;另一類是圖像或物體級別的拓撲圖,它們捨棄了幾何理解以換取構建的簡便性,但代價是導航能力受限,往往只能執行“教-重複”式的簡單任務。為了在幾何精度和可擴展性之間取得平衡,來自多所機構的研究人員提出了MASt3R-Nav系統,其核心是一種新穎的“像素相對連通圖”(pixel-relative connectivity)表示法。

該方法受近期三維基礎圖像匹配技術的啓發,通過圖像序列中每對圖像之間的像素對應關係,在相對三維座標系下建立跨圖像連通性,從而構建地圖。具體而言,系統利用像素在各自圖像對相對座標系中的對應關係,逐步建立圖像間的連接,形成一張無需全局幾何一致性的像素級圖。在此基礎上,研究者通過近似和稀疏化圖像內部像素連通性,實現了全局路徑規劃,並進一步推導出一種名為“WayPixel代價圖”(WayPixel Costmap)的表示形式。該代價圖是一種密集的像素級代價地圖,能夠反映不同區域的導航成本。隨後,系統訓練了一個控制器,以該代價圖為條件來預測軌跡展開。

實驗結果表明,這種基於相對幾何的密集像素級代價圖,作為控制預測的條件變量,比圖像級或物體級的表示更為準確。MASt3R-Nav在四種典型的導航任務仿真中均表現出色,並在真實世界演示中驗證了其有效性。該工作已被2026年IEEE國際機器人與自動化大會(ICRA)接收。MASt3R-Nav為視覺導航提供了一種兼顧幾何精度與可擴展性的新思路,有望推動機器人自主導航技術在實際應用中的進一步發展。