加速悖論:重新思考具身任務中推理速度與質量的權衡
本文提出TISED分析框架,統一多種有損推理優化技術,並揭示其在具身任務中的悖論效應:靜態任務中優化可能延長完成時間,動態任務中適度優化可提高成功率,且效果受硬件配置影響。
近年來,具身基礎模型被廣泛用於提升機器人泛化能力和任務成功率。為降低計算成本,研究者常採用量化、剪枝、異步推理等有損高效推理技術,以犧牲小幅動作質量為代價換取更低的單步延遲。然而,傳統機器學習任務多為靜態,而具身任務涉及與環境的反覆交互,其任務級性能不僅取決於單步成本,還受到閉環效應的影響——機器人每次動作的結果會改變後續狀態,從而形成反饋迴路。當前高效推理研究對此類閉環效應刻畫不足。
針對這一問題,來自Yujin Wang等七位研究者的論文《The Speedup Paradox: Rethinking Inference Speed-Quality Trade-off in Embodied Tasks》(arXiv:2606.28529,2026年6月提交,共23頁)提出了一個名為TISED(Task-level Inference Speedup Effect Decomposition)的分析框架。該框架統一了多種有損推理優化技術,並將其對靜態任務(如定點抓取)和動態任務(如跟蹤移動物體)的影響進行分解。通過理論分析和實驗驗證,研究揭示了一系列悖論效應:
首先,在靜態任務中,優化雖然降低了單步推理延遲,但可能導致機器人更頻繁地執行次優動作,反而使端到端任務完成時間延長。其次,在動態任務中,適度的有損優化可以提升任務成功率,甚至超過未優化基線,因為更低的感知延遲使機器人能夠更快適應環境變化。最後,這兩種效應的單調性和最優平衡點會隨着硬件配置(如邊緣設備與雲端)的變化而改變,意味着不存在通用的最佳優化策略。
這些發現為具身AI系統的推理優化提供了重要指導:在實際部署中,需根據任務類型和硬件條件謹慎選擇優化程度,避免陷入“加速陷阱”。該工作已被提交至cs.RO、cs.AI和cs.CV領域,相關代碼和數據預計將在後續發佈。