2026-06-30 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 16:23 UTC+8

事件條件診斷：被動對象狀態世界模型中的運動學、接觸和對象永久性場

本文提出了一種診斷協議，用於研究被動對象狀態世界模型中事件條件化的潛在物理結構。通過平衡的數據集（包含自由運動、碰撞和遮擋事件），評估了多種模型。結果表明，隱藏狀態支持事件機制讀取，事件上下文系統地重新加權運動學、接觸和對象永久性場，且場對齊的方向對預測具有功能敏感性。

來源arXiv Robotics作者: Yang Liu, Yuming Chen

研究人員近日提出了一種新穎的診斷協議，用於分析被動對象狀態世界模型中的潛在物理結構。該協議旨在揭示模型內部如何組織和利用物理信息，而不僅僅是預測準確度。研究團隊使用一個平衡控制生成器數據集，包含自由運動、碰撞和遮擋三種事件類型，評估了循環神經網絡、注意力機制和潛在狀態空間轉換模型在固定時間窗口預測下的表現。

實驗表明，模型的隱藏狀態能夠可靠地編碼事件機制信息。更重要的是，事件上下文會系統地重新加權運動學、接觸和對象永久性場的讀取：自由運動以運動學為主導，碰撞結合運動學和接觸結構，而遮擋則結合運動相關和對象永久性結構。時間對齊和方向一致性分析進一步揭示了場強調的階段性變化。

固定時間窗口的投影因果場效應分析顯示，抑制場對齊的方向會降低事件相關預測的準確性。其中，接觸對齊結構在碰撞接觸窗口中的證據最強，而對象永久性對齊結構在硬遮擋隱藏窗口中的證據較為有限。這些結果支持事件條件化組織和固定時間窗口的功能敏感性，但並不意味着存在顯式的物理模塊、隔離的因果電路或上下文不變的滑動窗口泛化。

該研究為理解世界模型的內在動態提供了新的視角，可能對機器人、人工智能和機器學習領域產生重要影響。相關論文已提交至arXiv，並附有代碼和數據鏈接以供進一步研究。研究人員強調，他們的診斷協議是一種通用的分析工具，可以應用於其他類型的預測模型，以揭示其內部表示的組織原則。