AI News HubLIVE
站內改寫1 分鐘閱讀

適應群體跟隨機器人的陪伴:處理動態變化的群體形態

本文提出一種基於視覺語言模型(VLM)的適應性群體陪伴方法,使機器人能夠跟隨動態變化的人類群體。該方法利用VLM的語義推理能力推斷同伴位置、保持社交距離並理解群體動態,結合模型預測路徑積分(MPPI)控制器確保穩定性和安全性。實驗表明,該方法在成功率上提升15%,碰撞率降低25%,使用者研究認為其陪伴行為自然且符合社交規範。

來源arXiv Robotics作者: Cong-Thanh Vu, Yen-Chen Liu

近日,一篇發表在arXiv上的研究提出了一種基於視覺語言模型(VLM)的適應性群體陪伴方法,旨在讓機器人能夠更加自然地跟隨動態變化的人類群體。該研究由Cong-Thanh Vu和Yen-Chen Liu完成,已被IEEE/RSJ國際智慧機器人與系統會議(IROS 2026)接收。

在社交機器人領域,陪伴人類群體是一個關鍵能力,但人類群體通常不會保持固定的隊形,這給機器人維持自然的陪伴行為帶來了挑戰。現有方法往往難以適應群體形態的即時變化,導致機器人的行為顯得生硬或不安全。

為此,研究人員提出了一種基於VLM的框架。首先,系統檢測群體中的每個成員,並透過感知模組生成互動群體空間的視覺表示。這些視覺表示被輸入到VLM中,VLM利用其強大的語義推理能力來推斷合適的陪伴位置、維持適當的社交距離,並理解群體動態的變化。隨後,模型預測路徑積分(MPPI)控制器根據VLM的輸出規劃機器人的運動軌跡,確保穩定性和安全性。

實驗在五個不同的場景中進行了評估,包括直線行走、轉彎、分散與聚合等常見群體行為模式。與基線方法相比,該方法在成功陪伴率上提升了15%,碰撞率降低了25%。此外,一項使用者研究邀請了20名參與者對機器人的陪伴行為進行評價,結果顯示參與者普遍認為機器人產生的行為是自然且符合社交規範的。

這項研究的意義在於,它首次將視覺語言模型引入群體陪伴任務,充分利用了VLM在語義理解方面的優勢,同時結合了MPPI控制器的即時規劃能力,為社交機器人在動態群體環境中的自然互動提供了新的解決方案。未來,該技術有望應用於導覽機器人、陪伴機器人以及服務機器人等場景,提升人機協作的流暢性和安全性。