2026-02-26 08:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

在36小時內構建一個法律級RAG應用

本文介紹如何利用Weaviate的Query Agent和Agent Skills庫，在短短36小時內構建一個生產就緒的端到端RAG應用，用於法律合同檢索和問答。文章詳細對比了傳統RAG與智慧代理搜尋的差異，並提供了從資料攝入到前端部署的完整架構和步驟。

來源Weaviate Blog

法律研究因其複雜性而極具挑戰性。在數千份合同中精確找到特定條款需要極高的精確度和安全性，這使得法律領域成為RAG（檢索增強生成）的理想應用場景。然而，傳統構建方式往往需要數月的開發週期。Weaviate團隊決定挑戰這一時間線——他們利用Query Agent和Agent Skills庫，在36小時內將內部財務團隊的合同管理需求轉化為一個生產級應用。

傳統RAG系統（即樸素RAG）採用線性路徑：接收使用者輸入，生成基本查詢，對單個集合執行靜態搜尋。這在處理簡單FAQ時可行，但面對法律文件時往往力不從心。法律查詢通常不是單一維度的，需要按日期、管轄權或合同型別進行過濾。例如，詢問“2024年服務協議中的通知期”時，傳統檢索器可能因為語義相似而提取2022年的無關條款。缺乏推理層的系統無法在搜尋前應用必要的過濾器。

代理搜尋將資料庫視為一組工具而非靜態儲存。Query Agent引入了自主工作流，模擬人類法律研究員的行為：它能夠檢查集合模式以制定最佳策略，將複雜問題拆分為多個子查詢，構建結構化的過濾條件，並透過重排序子代理確保結果基於實際相關性排序。最終答案子代理利用精煉的上下文生成可靠的回答。這種對搜尋策略的推理能力正是法律和金融團隊所需的精確性。

在架構層面，首先將法律PDF透過多向量模型（配合Muvera壓縮）嵌入並攝入Weaviate。多向量模型直接編碼每一頁為視覺令牌（影像塊），保留佈局和表格；Muvera壓縮減少記憶體和延遲。合同被分為三個集合：商業協議、企業IP協議和運營協議，從而縮小搜尋範圍並允許Query Agent定向路由問題。

Query Agent支援兩種模式：搜尋模式側重於發現，檢索並重排序最相關的合同章節供人工審閱；提問模式則綜合上下文生成直接答案。結果以流式返回，並附帶源引用，既透明又減少幻覺。

構建過程極為簡潔：安裝Weaviate Agent Skills，使用快速啟動命令建立叢集，然後透過一條提示指令即可構建完整的法律合同RAG應用。應用包括前端聊天介面，支援提問並展示來源頁面。文章還提供了使用CUAD資料集的具體步驟，包括下載、分類為三個集合、定義Schema以及關鍵實現注意事項。

總之，透過代理搜尋和精心設計的架構，複雜法律應用的開發時間可以從數月壓縮到36小時。本文末尾還提供了進一步最佳化的建議，如新增搜尋頁面或資料探索器。