等變世界模型的共形軌道有效信任視界
該論文研究具有已知群對稱性的潛在世界模型的信任視界認證。透過分割共形乘法因子校準原始視界曲線,實驗表明準確等變性可將校準後的信任視界曲線沿群軌道傳輸,使得滾動誤差和信任視界在軌道上恆定。在2D和3D實驗中,等變模型在單校準區域內獲得安全且非空洞的軌道有效證書,而非等變基線需要額外代價。證書是保守的分佈審計,而非全域性可達性保證。
學習到的世界模型僅在滾動誤差可控的視界內具有實用價值。本文研究具有已知群對稱性的潛在世界模型的信任視界認證問題。作者提出了一種基於分割共形預測的方法來認證信任視界。具體而言,給定一步潛在殘差和有限時間擴充套件估計,可以形成原始視界曲線,並使用分割共形乘法因子進行校準。在可復現審計集上,共形因子γα=1.0表明原始證書在審計協議下已經保守。在50次穩定審計中,觀察到零次反保守違規,對應的違規率精確二項95%上界為5.8%。
該工作的主要結構結果是準確等變性可將校準後的信任視界曲線沿群軌道傳輸:當環境動力學、編碼器、預測器、動作變換和潛在度量滿足所描述的等變/不變條件時,滾動誤差和信任視界在軌道上保持恆定。實驗上,實現的模型表現出較小的軌道傳輸殘差,在14次軌道審計中中位數為1.1%,最大為4.1%。證書也是非空洞的,中位認證視界與實測視界之比為0.67。
一項證書級校準代價研究揭示了兩種互補機制。在對稱2D基板上,等變模型、普通模型和增強模型均可從單校準區域獲得軌道有效證書——沒有分離,因為基板已經使非等變基線近似軌道魯棒。3D偏航審計顯示了另一種機制:等變模型獲得單區域安全且非空洞的軌道有效證書,而健康的非等變基線需要付出違規、鬆弛、尖銳或多區域代價。
需要注意的是,該證書是一種保守的分佈性審計,而非全域性可達性保證。此外,在當前3D CEM-MPC行為層中,證書引導的子目標間距尚未得到確認。這項工作為在具有對稱性的環境中使用世界模型提供了可靠認證工具,並有望推動其在機器人等領域的應用。