AI News HubLIVE
站內改寫2 分鐘閱讀

在36小時內構建一個法律級RAG應用

本文介紹如何利用Weaviate的Query Agent和Agent Skills庫,在短短36小時內構建一個生產就緒的端到端RAG應用,用於法律合同檢索和問答。文章詳細對比了傳統RAG與智慧代理搜尋的差異,並提供了從資料攝入到前端部署的完整架構和步驟。

法律研究因其複雜性而極具挑戰性。在數千份合同中精確找到特定條款需要極高的精確度和安全性,這使得法律領域成為RAG(檢索增強生成)的理想應用場景。然而,傳統構建方式往往需要數月的開發週期。Weaviate團隊決定挑戰這一時間線——他們利用Query Agent和Agent Skills庫,在36小時內將內部財務團隊的合同管理需求轉化為一個生產級應用。

傳統RAG系統(即樸素RAG)採用線性路徑:接收使用者輸入,生成基本查詢,對單個集合執行靜態搜尋。這在處理簡單FAQ時可行,但面對法律文件時往往力不從心。法律查詢通常不是單一維度的,需要按日期、管轄權或合同型別進行過濾。例如,詢問“2024年服務協議中的通知期”時,傳統檢索器可能因為語義相似而提取2022年的無關條款。缺乏推理層的系統無法在搜尋前應用必要的過濾器。

代理搜尋將資料庫視為一組工具而非靜態儲存。Query Agent引入了自主工作流,模擬人類法律研究員的行為:它能夠檢查集合模式以制定最佳策略,將複雜問題拆分為多個子查詢,構建結構化的過濾條件,並透過重排序子代理確保結果基於實際相關性排序。最終答案子代理利用精煉的上下文生成可靠的回答。這種對搜尋策略的推理能力正是法律和金融團隊所需的精確性。

在架構層面,首先將法律PDF透過多向量模型(配合Muvera壓縮)嵌入並攝入Weaviate。多向量模型直接編碼每一頁為視覺令牌(影像塊),保留佈局和表格;Muvera壓縮減少記憶體和延遲。合同被分為三個集合:商業協議、企業IP協議和運營協議,從而縮小搜尋範圍並允許Query Agent定向路由問題。

Query Agent支援兩種模式:搜尋模式側重於發現,檢索並重排序最相關的合同章節供人工審閱;提問模式則綜合上下文生成直接答案。結果以流式返回,並附帶源引用,既透明又減少幻覺。

構建過程極為簡潔:安裝Weaviate Agent Skills,使用快速啟動命令建立叢集,然後透過一條提示指令即可構建完整的法律合同RAG應用。應用包括前端聊天介面,支援提問並展示來源頁面。文章還提供了使用CUAD資料集的具體步驟,包括下載、分類為三個集合、定義Schema以及關鍵實現注意事項。

總之,透過代理搜尋和精心設計的架構,複雜法律應用的開發時間可以從數月壓縮到36小時。本文末尾還提供了進一步最佳化的建議,如新增搜尋頁面或資料探索器。