2026-06-05 19:26 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

借助 Gemini Enterprise Agent Platform 的智能体 RAG 解锁可靠回答

Google Research 与 Google Cloud 合作推出智能体 RAG 框架，通过多智能体工作流将复杂企业查询分解，迭代搜索足够上下文后生成可靠回答。相比标准 RAG，准确性提升高达 34%。

Google Research 与 Google Cloud 近日联合发布了一项名为“智能体 RAG”（Agentic RAG）的全新检索增强生成框架，旨在解决传统 RAG 系统在处理复杂企业查询时面临的挑战。传统的单步 RAG 技术在面对跨数据源、多跳查询时往往力不从心，例如当用户询问“Project X 所用服务器的规格”时，系统可能只找到提及服务器 ID 的文档，却无法继续用该 ID 到其他数据库检索详细规格，最终只能给出不完整答案。智能体 RAG 则通过多智能体协作架构，将查询分解为多个子任务，并迭代搜索直至上下文完整，从而显著提升答案的可靠性和准确性。

该框架的核心创新在于“Sufficient Context Agent”（充分上下文代理），这一组件负责在生成最终答案前进行三轮审查：首先，检查检索到的文本片段是否包含回答所需信息；其次，评估由语言模型生成的中间草稿是否充分；最后，分析缺失哪些关键信息，并输出具体的“原因”和“反馈”日志。例如，当医生查询患者约翰·多伊的出院药物、饮食限制和过敏反应时，Sufficient Context Agent 会识别出过敏信息缺失，并指示其他代理针对“皮疹”或“不良事件”进行二次搜索，直到所有信息齐全。这一机制有效防止了模型在信息不足时“猜测”或直接给出“信息不足”的敷衍回答。

在实验验证阶段，研究团队在 FramesQA 数据集（包含 824 个查询和 2,676 个 PDF 文档）上进行了大规模评估。相比使用 Google RAG Engine 的“标准 RAG”基线，智能体 RAG 在事实性数据集上的准确率最高提升了 34%。在更具挑战性的跨语料库场景中（额外加入三个无关数据集），系统依然保持了 90.1% 的正确率，且推理延迟仅增加不到 3%。这证明该框架不仅能有效处理单一数据源，还能在多个无关数据源间自主规划检索路径，为企业的复杂数据需求提供了灵活可靠的解决方案。

目前，该智能体 RAG 功能已作为公开预览在 Gemini Enterprise Agent Platform 上正式上线。Google 表示，这一技术将帮助企业构建更可信、可追溯的 AI 系统，并期待机器学习社区基于此开发下一代可靠 AI 应用。该研究由 Cyrus Rashtchian 和 Da-Cheng Juan 主导，并与 Bo Li、Zhongjie Mao、Tiger Jin 等多位研究人员合作完成。