2026-02-26 08:00 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

在36小时内构建一个法律级RAG应用

本文介绍如何利用Weaviate的Query Agent和Agent Skills库，在短短36小时内构建一个生产就绪的端到端RAG应用，用于法律合同检索和问答。文章详细对比了传统RAG与智能代理搜索的差异，并提供了从数据摄入到前端部署的完整架构和步骤。

来源Weaviate Blog

法律研究因其复杂性而极具挑战性。在数千份合同中精确找到特定条款需要极高的精确度和安全性，这使得法律领域成为RAG（检索增强生成）的理想应用场景。然而，传统构建方式往往需要数月的开发周期。Weaviate团队决定挑战这一时间线——他们利用Query Agent和Agent Skills库，在36小时内将内部财务团队的合同管理需求转化为一个生产级应用。

传统RAG系统（即朴素RAG）采用线性路径：接收用户输入，生成基本查询，对单个集合执行静态搜索。这在处理简单FAQ时可行，但面对法律文档时往往力不从心。法律查询通常不是单一维度的，需要按日期、管辖权或合同类型进行过滤。例如，询问“2024年服务协议中的通知期”时，传统检索器可能因为语义相似而提取2022年的无关条款。缺乏推理层的系统无法在搜索前应用必要的过滤器。

代理搜索将数据库视为一组工具而非静态存储。Query Agent引入了自主工作流，模拟人类法律研究员的行为：它能够检查集合模式以制定最佳策略，将复杂问题拆分为多个子查询，构建结构化的过滤条件，并通过重排序子代理确保结果基于实际相关性排序。最终答案子代理利用精炼的上下文生成可靠的回答。这种对搜索策略的推理能力正是法律和金融团队所需的精确性。

在架构层面，首先将法律PDF通过多向量模型（配合Muvera压缩）嵌入并摄入Weaviate。多向量模型直接编码每一页为视觉令牌（图像块），保留布局和表格；Muvera压缩减少内存和延迟。合同被分为三个集合：商业协议、企业IP协议和运营协议，从而缩小搜索范围并允许Query Agent定向路由问题。

Query Agent支持两种模式：搜索模式侧重于发现，检索并重排序最相关的合同章节供人工审阅；提问模式则综合上下文生成直接答案。结果以流式返回，并附带源引用，既透明又减少幻觉。

构建过程极为简洁：安装Weaviate Agent Skills，使用快速启动命令创建集群，然后通过一条提示指令即可构建完整的法律合同RAG应用。应用包括前端聊天界面，支持提问并展示来源页面。文章还提供了使用CUAD数据集的具体步骤，包括下载、分类为三个集合、定义Schema以及关键实现注意事项。

总之，通过代理搜索和精心设计的架构，复杂法律应用的开发时间可以从数月压缩到36小时。本文末尾还提供了进一步优化的建议，如添加搜索页面或数据探索器。