2026-06-25 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-25 15:48 UTC+8

等变世界模型的共形轨道有效信任视界

该论文研究具有已知群对称性的潜在世界模型的信任视界认证。通过分割共形乘法因子校准原始视界曲线，实验表明准确等变性可将校准后的信任视界曲线沿群轨道传输，使得滚动误差和信任视界在轨道上恒定。在2D和3D实验中，等变模型在单校准区域内获得安全且非空洞的轨道有效证书，而非等变基线需要额外代价。证书是保守的分布审计，而非全局可达性保证。

来源arXiv Machine Learning作者: Hongbo Wang

学习到的世界模型仅在滚动误差可控的视界内具有实用价值。本文研究具有已知群对称性的潜在世界模型的信任视界认证问题。作者提出了一种基于分割共形预测的方法来认证信任视界。具体而言，给定一步潜在残差和有限时间扩展估计，可以形成原始视界曲线，并使用分割共形乘法因子进行校准。在可复现审计集上，共形因子γα=1.0表明原始证书在审计协议下已经保守。在50次稳定审计中，观察到零次反保守违规，对应的违规率精确二项95%上界为5.8%。

该工作的主要结构结果是准确等变性可将校准后的信任视界曲线沿群轨道传输：当环境动力学、编码器、预测器、动作变换和潜在度量满足所描述的等变/不变条件时，滚动误差和信任视界在轨道上保持恒定。实验上，实现的模型表现出较小的轨道传输残差，在14次轨道审计中中位数为1.1%，最大为4.1%。证书也是非空洞的，中位认证视界与实测视界之比为0.67。

一项证书级校准代价研究揭示了两种互补机制。在对称2D基板上，等变模型、普通模型和增强模型均可从单校准区域获得轨道有效证书——没有分离，因为基板已经使非等变基线近似轨道鲁棒。3D偏航审计显示了另一种机制：等变模型获得单区域安全且非空洞的轨道有效证书，而健康的非等变基线需要付出违规、松弛、尖锐或多区域代价。

需要注意的是，该证书是一种保守的分布性审计，而非全局可达性保证。此外，在当前3D CEM-MPC行为层中，证书引导的子目标间距尚未得到确认。这项工作为在具有对称性的环境中使用世界模型提供了可靠认证工具，并有望推动其在机器人等领域的应用。