AI News HubLIVE
站内改写1 分鐘閱讀

略讀:用於快速高效網路代理的投機執行框架

Skim是一種投機執行框架,利用網站的可預測結構繞過重量級元件,將成本降低1.9倍、延遲降低33.4%,且不損失準確性。

來源arXiv AI作者: Mike Wong, Kevin Hsieh, Suman Nath, Ravi Netravali

隨著網路代理在自動化任務中的廣泛應用,其高昂的計算成本和延遲成為主要瓶頸。當前代理通常在每個步驟中都使用最先進的模型推理、瀏覽器渲染和ReAct規劃,導致資源消耗巨大。Skim框架提出了一種投機執行方法,利用網站固有結構來規避這些重型元件。

Skim的核心洞察是,許多網站為同類查詢強制使用穩定的URL模式、答案格式和任務到軌跡的對映。因此,大多數查詢可以完全繞過重量級元件。具體來說,Skim包含一個離線分析器,它針對每個站點預先捕獲這些模式。在執行時,Skim將每個查詢與模板匹配,合成目標URL,並使用小型模型提取答案。輕量級驗證器根據查詢和模式檢查每個快速路徑的輸出;在罕見的誤判情況下,會級聯到完整代理,並由快速路徑的最終URL熱啟動以保持上游軌跡進度。

實驗結果顯示,在標準網路代理基準測試中,搭配三種骨幹代理(WebVoyager、AgentOccam、BrowserUse),Skim將中位每任務成本降低了1.9倍,延遲降低了33.4%,且未出現準確性損失。該框架的設計充分利用了網站的結構化特性,為降低代理成本提供了一種高效且實用的解決方案。