2026-07-02 12:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-07-02 15:55 UTC+8

使失敗安全：一種用於開放網絡數據收集的受約束、可驗證的代理框架

提出一種框架，將LLM生成的自由格式代碼替換為類型化的JSON收集器配置，結合六類型收集器分類法、模板和效用函數約束、靜態Airflow DAG執行、基於規則的質量檢查和結構化反饋糾正。實驗表明，在已驗證任務中，框架執行階段零LLM token消耗，且平均耗時最低。

來源arXiv AI作者: Bo Chen

大型語言模型（LLM）和智能體能夠根據自然語言需求生成網絡爬蟲，但直接生成因依賴錯誤、選擇器失效、模式不匹配和頁面結構異構而不可靠。本文提出一個受約束且可驗證的代理框架，將LLM輸出從自由格式代碼轉變為類型化的JSON收集器配置。該框架結合了六種類型的收集器分類法、模板和效用函數約束、靜態Airflow有向無環圖（DAG）執行、基於規則的質量檢查以及結構化反饋糾正。

該框架的核心思想是將LLM的生成能力用於設計階段，而非執行階段。通過將收集需求轉化為類型化的JSON配置，框架能夠利用六種預定義的收集器類型（如列表、單頁、分頁等）來覆蓋常見的數據收集場景。模板和效用函數約束確保了配置的合法性和效率，而靜態Airflow DAG執行則完全消除了運行時的LLM調用，從而避免了推理延遲和token消耗。在質量保證方面，框架採用基於規則的質量檢查對收集結果進行驗證，並通過結構化反饋循環迭代修正配置，直到滿足預設的質量標準。

研究團隊在138個任務上進行了實驗，涵蓋多種數據收集場景。結果表明，該分類法能夠有效支持基於描述的需求類型化，但穩定的配置實例化還需要補充源字段、執行約束等細節，而不僅僅是初始描述。在80個獨立源驗證的任務上，該框架實現了零執行階段LLM token消耗和最低的平均牆鍾時間，以適中的一次性質量換取了可重用、確定且可驗證的執行路徑。這意味着，雖然框架在單次運行中的質量可能略低於完全由LLM驅動的方案，但其重複性和可靠性使其特別適合定期採集任務。

這些結果將框架定位為一種可重用、低成本且可驗證的執行路徑，適用於重複的開放網絡數據採集任務。通過消除運行時的LLM調用，並採用結構化的驗證和糾正機制，框架顯著提升了長期數據收集的可靠性和效率。該工作為構建安全、高效的AI代理系統提供了重要參考，尤其適用於需要頻繁更新數據的應用場景，如新聞聚合、價格監控和學術信息跟蹤等。