略读:用于快速高效网络代理的投机执行框架
Skim是一种投机执行框架,利用网站的可预测结构绕过重量级组件,将成本降低1.9倍、延迟降低33.4%,且不损失准确性。
随着网络代理在自动化任务中的广泛应用,其高昂的计算成本和延迟成为主要瓶颈。当前代理通常在每个步骤中都使用最先进的模型推理、浏览器渲染和ReAct规划,导致资源消耗巨大。Skim框架提出了一种投机执行方法,利用网站固有结构来规避这些重型组件。
Skim的核心洞察是,许多网站为同类查询强制使用稳定的URL模式、答案格式和任务到轨迹的映射。因此,大多数查询可以完全绕过重量级组件。具体来说,Skim包含一个离线分析器,它针对每个站点预先捕获这些模式。在运行时,Skim将每个查询与模板匹配,合成目标URL,并使用小型模型提取答案。轻量级验证器根据查询和模式检查每个快速路径的输出;在罕见的误判情况下,会级联到完整代理,并由快速路径的最终URL热启动以保持上游轨迹进度。
实验结果显示,在标准网络代理基准测试中,搭配三种骨干代理(WebVoyager、AgentOccam、BrowserUse),Skim将中位每任务成本降低了1.9倍,延迟降低了33.4%,且未出现准确性损失。该框架的设计充分利用了网站的结构化特性,为降低代理成本提供了一种高效且实用的解决方案。