2026-05-28 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

$E^3$-Agent：面向邊緣生成式推理的可執行與演化式資源管理智能體

本文提出$E^3$-Agent，一種面向邊緣AIGC資源管理的可執行與演化式智能體。該智能體將毫秒級的路由決策與事件驅動的LLM元控制器分離，通過在線學習適應未知且時變的服務時間映射。在模擬實驗中，$E^3$-Agent將平均延遲降低65%-73%，並有效抑制了語義退化下的卡頓率。

來源arXiv Machine Learning作者: Rui Bao, Yaping Sun, Zhiyong Chen, Feng Yang, Meixia Tao, Nan Li, Wenjun Zhang

邊緣部署的生成式推理正在面臨兩個現實的挑戰：每台設備上每個模型的性能在部署時往往是未知的，並且由於用户驅動的語義事件、後台負載以及設備更替，性能呈現出非平穩的特性。因此，在固定模式下離線調優的資源管理器會變得非常脆弱，且維護成本高昂。為了應對這些挑戰，研究人員提出了一種名為$E^3$-Agent的可執行且演化的邊緣人工智能生成內容（AIGC）資源管理智能體。

$E^3$-Agent的核心設計在於將快速路徑路由器與慢速路徑的LLM元控制器進行分離。快速路由器負責毫秒級的調度決策，通過輕量級的計算實現高效的路由選擇。而慢速路徑則由事件驅動的大語言模型元控制器構成，它通過工具接口暴露的小型顯式控制面來緩解狀態轉移，這些控制麪包括風險門控、路由器配置和快速性能校準。這種分離設計使得智能體能夠從執行反饋中在線學習，並持續適應未知且時變的服務時間映射，而無需人工干預。

為了驗證$E^3$-Agent的效果，研究人員在基於MLPerf設備模型測量先驗的離散事件模擬器上進行了評估。實驗覆蓋了冷啓動預熱階段以及三種動態場景：語義動態（由用户輸入變化引起）、設備更替（設備加入或離開）和隱藏漂移（性能緩慢變化）。結果表明，在所有動態場景中，$E^3$-Agent將平均延遲降低了65%-73%，相比最佳靜態基線，其性能與用於評估的在線全信息Oracle的差距保持在7%-10%以內。此外，在語義退化的情況下，$E^3$-Agent有效抑制了卡頓率，顯著提升了用户體驗。

這一成果為邊緣生成式推理的資源管理提供了一種自適應、低維護成本的解決方案。它不僅解決了部署時性能未知和動態變化的問題，還通過在線學習機制避免了頻繁的手動調優。未來，該智能體有望推動AIGC在邊緣設備上的高效部署，為實時應用如自動駕駛、智能監控等領域帶來重要價值。