2026-07-02 12:00 UTC+8站内改写2 分钟阅读更新: 2026-07-02 15:55 UTC+8

使失败安全：一种用于开放网络数据收集的受约束、可验证的代理框架

提出一种框架，将LLM生成的自由格式代码替换为类型化的JSON收集器配置，结合六类型收集器分类法、模板和效用函数约束、静态Airflow DAG执行、基于规则的质量检查和结构化反馈纠正。实验表明，在已验证任务中，框架执行阶段零LLM token消耗，且平均耗时最低。

来源arXiv AI作者: Bo Chen

大型语言模型（LLM）和智能体能够根据自然语言需求生成网络爬虫，但直接生成因依赖错误、选择器失效、模式不匹配和页面结构异构而不可靠。本文提出一个受约束且可验证的代理框架，将LLM输出从自由格式代码转变为类型化的JSON收集器配置。该框架结合了六种类型的收集器分类法、模板和效用函数约束、静态Airflow有向无环图（DAG）执行、基于规则的质量检查以及结构化反馈纠正。

该框架的核心思想是将LLM的生成能力用于设计阶段，而非执行阶段。通过将收集需求转化为类型化的JSON配置，框架能够利用六种预定义的收集器类型（如列表、单页、分页等）来覆盖常见的数据收集场景。模板和效用函数约束确保了配置的合法性和效率，而静态Airflow DAG执行则完全消除了运行时的LLM调用，从而避免了推理延迟和token消耗。在质量保证方面，框架采用基于规则的质量检查对收集结果进行验证，并通过结构化反馈循环迭代修正配置，直到满足预设的质量标准。

研究团队在138个任务上进行了实验，涵盖多种数据收集场景。结果表明，该分类法能够有效支持基于描述的需求类型化，但稳定的配置实例化还需要补充源字段、执行约束等细节，而不仅仅是初始描述。在80个独立源验证的任务上，该框架实现了零执行阶段LLM token消耗和最低的平均墙钟时间，以适中的一次性质量换取了可重用、确定且可验证的执行路径。这意味着，虽然框架在单次运行中的质量可能略低于完全由LLM驱动的方案，但其重复性和可靠性使其特别适合定期采集任务。

这些结果将框架定位为一种可重用、低成本且可验证的执行路径，适用于重复的开放网络数据采集任务。通过消除运行时的LLM调用，并采用结构化的验证和纠正机制，框架显著提升了长期数据收集的可靠性和效率。该工作为构建安全、高效的AI代理系统提供了重要参考，尤其适用于需要频繁更新数据的应用场景，如新闻聚合、价格监控和学术信息跟踪等。