2026-05-28 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

$E^3$-Agent：面向边缘生成式推理的可执行与演化式资源管理智能体

本文提出$E^3$-Agent，一种面向边缘AIGC资源管理的可执行与演化式智能体。该智能体将毫秒级的路由决策与事件驱动的LLM元控制器分离，通过在线学习适应未知且时变的服务时间映射。在模拟实验中，$E^3$-Agent将平均延迟降低65%-73%，并有效抑制了语义退化下的卡顿率。

来源arXiv Machine Learning作者: Rui Bao, Yaping Sun, Zhiyong Chen, Feng Yang, Meixia Tao, Nan Li, Wenjun Zhang

边缘部署的生成式推理正在面临两个现实的挑战：每台设备上每个模型的性能在部署时往往是未知的，并且由于用户驱动的语义事件、后台负载以及设备更替，性能呈现出非平稳的特性。因此，在固定模式下离线调优的资源管理器会变得非常脆弱，且维护成本高昂。为了应对这些挑战，研究人员提出了一种名为$E^3$-Agent的可执行且演化的边缘人工智能生成内容（AIGC）资源管理智能体。

$E^3$-Agent的核心设计在于将快速路径路由器与慢速路径的LLM元控制器进行分离。快速路由器负责毫秒级的调度决策，通过轻量级的计算实现高效的路由选择。而慢速路径则由事件驱动的大语言模型元控制器构成，它通过工具接口暴露的小型显式控制面来缓解状态转移，这些控制面包括风险门控、路由器配置和快速性能校准。这种分离设计使得智能体能够从执行反馈中在线学习，并持续适应未知且时变的服务时间映射，而无需人工干预。

为了验证$E^3$-Agent的效果，研究人员在基于MLPerf设备模型测量先验的离散事件模拟器上进行了评估。实验覆盖了冷启动预热阶段以及三种动态场景：语义动态（由用户输入变化引起）、设备更替（设备加入或离开）和隐藏漂移（性能缓慢变化）。结果表明，在所有动态场景中，$E^3$-Agent将平均延迟降低了65%-73%，相比最佳静态基线，其性能与用于评估的在线全信息Oracle的差距保持在7%-10%以内。此外，在语义退化的情况下，$E^3$-Agent有效抑制了卡顿率，显著提升了用户体验。

这一成果为边缘生成式推理的资源管理提供了一种自适应、低维护成本的解决方案。它不仅解决了部署时性能未知和动态变化的问题，还通过在线学习机制避免了频繁的手动调优。未来，该智能体有望推动AIGC在边缘设备上的高效部署，为实时应用如自动驾驶、智能监控等领域带来重要价值。