等変世界モデルのための共形軌道有効信頼地平線
本論文は、既知の群対称性を持つ潜在世界モデルの信頼地平線認証を研究する。分割共形乗算因子を用いて生の地平線曲線を較正し、正確な等変性が較正された信頼地平線曲線を群軌道に沿って輸送し、ロールアウト誤差と信頼地平線が軌道で一定になることを示す。2Dおよび3D実験では、等変モデルが単一較正セクターで安全で非空虚な軌道有効証明書を取得する一方、非等変ベースラインは追加コストを負担する。証明書は保守的な分布的監査であり、グローバルな到達可能性保証ではない。
学習された世界モデルは、ロールアウト誤差が制御可能な地平線でのみ有用である。本論文では、既知の群対称性を持つ潜在世界モデルの信頼地平線認証を研究する。著者らは、分割共形予測に基づく信頼地平線認証手法を提案する。具体的には、1ステップ潜在残差と有限時間拡張推定を与えられ、生の地平線曲線を形成し、分割共形乗算因子で較正する。再現可能な監査セットでは、共形因子γα=1.0であり、生の証明書は監査プロトコルの下で既に保守的である。50回の安定監査にわたって、反保守的違反はゼロであり、違反率の正確二項95%上限は5.8%に対応する。
主要な構造的結果は、正確な等変性が較正された信頼地平線曲線を群軌道に沿って輸送することである:環境ダイナミクス、エンコーダ、予測器、アクション変換、潜在距離が述べられた等変/不変条件を満たすとき、ロールアウト誤差と信頼地平線は軌道定数となる。実験的に、実装されたモデルは小さな軌道輸送残差を示し、14回の軌道監査で中央値1.1%、最大4.1%であった。証明書はまた非空虚である(中央値の認証対測定地平線比0.67)。
証明書レベルの較正コスト調査は2つの相補的なレジームを示す。対称な2D基板上では、等変モデル、プレーンモデル、拡張モデルはすべて単一較正セクターから軌道有効となる——分離はなく、基板がすでに非等変ベースラインを概ね軌道ロバストにしているためである。3Dヨー監査はもう一方のレジームを示す:等変モデルは単一セクターの安全で非空虚な軌道有効証明書を取得する一方、健全な非等変ベースラインは違反、スラック、シャープネス、または追加セクターコストを支払う。
証明書は保守的な分布的監査であり、グローバルな到達可能性保証ではなく、現在の3D CEM-MPC行動層では証明書誘導のサブゴール間隔は確認されていない。この研究は、対称性を利用した世界モデルの信頼性認証に寄与し、ロボット工学などの分野での応用が期待される。