$E^3$-Agent:面向边缘生成式推理的可执行与演化式资源管理智能体
本文提出$E^3$-Agent,一种面向边缘AIGC资源管理的可执行与演化式智能体。该智能体将毫秒级的路由决策与事件驱动的LLM元控制器分离,通过在线学习适应未知且时变的服务时间映射。在模拟实验中,$E^3$-Agent将平均延迟降低65%-73%,并有效抑制了语义退化下的卡顿率。
文章情报
要点
- 边缘生成式推理面临设备性能未知和动态变化挑战。
- $E^3$-Agent采用双路径架构:快速路由器+慢速LLM元控制器。
- 通过在线反馈学习,持续适应非平稳环境。
- 相比静态基线,延迟降低65%-73%,接近理论最优。
为什么重要
这条新闻值得关注,因为边缘生成式推理面临设备性能未知和动态变化挑战。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
边缘部署的生成式推理正在面临两个现实的挑战:每台设备上每个模型的性能在部署时往往是未知的,并且由于用户驱动的语义事件、后台负载以及设备更替,性能呈现出非平稳的特性。因此,在固定模式下离线调优的资源管理器会变得非常脆弱,且维护成本高昂。为了应对这些挑战,研究人员提出了一种名为$E^3$-Agent的可执行且演化的边缘人工智能生成内容(AIGC)资源管理智能体。
$E^3$-Agent的核心设计在于将快速路径路由器与慢速路径的LLM元控制器进行分离。快速路由器负责毫秒级的调度决策,通过轻量级的计算实现高效的路由选择。而慢速路径则由事件驱动的大语言模型元控制器构成,它通过工具接口暴露的小型显式控制面来缓解状态转移,这些控制面包括风险门控、路由器配置和快速性能校准。这种分离设计使得智能体能够从执行反馈中在线学习,并持续适应未知且时变的服务时间映射,而无需人工干预。
为了验证$E^3$-Agent的效果,研究人员在基于MLPerf设备模型测量先验的离散事件模拟器上进行了评估。实验覆盖了冷启动预热阶段以及三种动态场景:语义动态(由用户输入变化引起)、设备更替(设备加入或离开)和隐藏漂移(性能缓慢变化)。结果表明,在所有动态场景中,$E^3$-Agent将平均延迟降低了65%-73%,相比最佳静态基线,其性能与用于评估的在线全信息Oracle的差距保持在7%-10%以内。此外,在语义退化的情况下,$E^3$-Agent有效抑制了卡顿率,显著提升了用户体验。
这一成果为边缘生成式推理的资源管理提供了一种自适应、低维护成本的解决方案。它不仅解决了部署时性能未知和动态变化的问题,还通过在线学习机制避免了频繁的手动调优。未来,该智能体有望推动AIGC在边缘设备上的高效部署,为实时应用如自动驾驶、智能监控等领域带来重要价值。