AI News HubLIVE
站內改寫2 分鐘閱讀

LlamaIndex 'legal-kb': 基於Index v2的代理檢索,整合retrieve、find、read和grep工具

LlamaIndex釋出了legal-kb,這是一個基於Index v2的公共參考應用,展示了代理檢索模式。該應用為AI代理提供類似檔案系統的工具集,包括混合語義搜尋、檔案查詢、內容讀取和正規表示式grep,並支援自動版本控制和視覺化引用。

來源MarkTechPost作者: Michal Sutter

LlamaIndex 釋出了 legal-kb,這是一個基於 GitHub 的公共參考應用,旨在為法律文件提供知識庫功能,底層由 LlamaIndex Index v2(即 LlamaParse 平臺)驅動。該專案展示了一種稱為“檢索工具集”(Retrieval Harness)的代理檢索模式。

與單次檢索不同,該模式為 AI 代理提供類似檔案系統的工具,使其能夠在大規模且持續更新的知識庫中自主探索以解決問題。這些工具模擬了工程師熟悉的操作:語義與關鍵詞搜尋、正規表示式 grep、檔案搜尋和檔案讀取。

legal-kb 是一個基於 TanStack Start 的 Web 應用,而非庫。使用者登入後可以建立專案、上傳檔案並與代理聊天。每個專案對應一個由 LlamaCloud 管理的 Index v2。上傳的檔案會在後臺自動解析和索引,聊天代理在每次互動中即時查詢該索引。

檢索工具集提供了持久化的資料管道,連線資料來源、索引並保持更新。在此基礎上,它向代理暴露一組工具。這些工具刻意接近檔案系統操作:代理可以列出檔案、讀取檔案、在檔案內執行 grep 或執行混合搜尋。由於工具的通用性,使用者可以將此工具集整合到自己的代理中。

代理擁有四個工具,每個工具對應 Index v2 的檢索 API:

  • retrieve:執行混合語義搜尋,支援可選的重新排序和後設資料過濾。
  • findFiles:透過精確名稱或子串搜尋檔案,自動分頁。
  • readFile:讀取檔案原始內容,支援偏移量和長度視窗。
  • grepFile:在一個檔案中匹配模式,返回字元位置。

系統提示強制了執行順序:代理必須先呼叫 findFiles 建立文件清單,然後透過 retrieve 縮小範圍,最後用 readFile 或 grepFile 確認具體措辭後再引用。

上傳遵循清晰的管道:檔案被推送到 LlamaCloud 源目錄,同時記錄到 PostgreSQL。索引同步是非同步的,UI 會輪詢狀態直至就緒。版本化基於(專案,檔名)對,重新上傳同一檔案會產生 v1、v2、v3 等版本,檢索層可以透過版本後設資料欄位過濾。

代理使用 Vercel AI SDK 6 的 ToolLoopAgent,支援 OpenAI 或 Anthropic 模型,使用者需自帶 API 金鑰。推理過程會流式輸出,Claude 模型使用擴充套件思考,OpenAI 推理模型使用中等推理努力。

答案附帶視覺化引用:每個檢索到的塊有一個短 ID(如 cite:c7f2qa),代理在回答中內聯引用,UI 渲染可點選的引用晶片,點選後開啟原始檔頁面截圖,並高亮顯示引用文本的矩形框。

與傳統的單次 RAG 相比,代理檢索工具集在多個維度上有所不同:檢索流程為多步工具迴圈而非單次向量搜尋;搜尋模式包括混合搜尋、關鍵詞和正規表示式;代理可按需讀取完整檔案;知識庫持續更新且支援版本控制;精度控制引數(如 top_k、分數閾值)暴露給使用者。

該設計針對需要代理導航大型文件集的領域,如法律和金融科技。例如,合同問題可透過代理列出檔案、檢索相關條款、grep 精確句子來回答。在盡職調查場景中,代理可以按名稱查詢檔案並逐一讀取,無需人工開啟每個 PDF。版本化策略支援隨時間追蹤變更。

legal-kb 是一個重要的參考實現,展示瞭如何將 Index v2 的檢索能力與代理框架結合,為構建高階文件問答系統提供了藍圖。