借助 Gemini Enterprise Agent Platform 的智能体 RAG 解锁可靠回答
Google Research 与 Google Cloud 合作推出智能体 RAG 框架,通过多智能体工作流将复杂企业查询分解,迭代搜索足够上下文后生成可靠回答。相比标准 RAG,准确性提升高达 34%。
Google Research 与 Google Cloud 近日联合发布了一项名为“智能体 RAG”(Agentic RAG)的全新检索增强生成框架,旨在解决传统 RAG 系统在处理复杂企业查询时面临的挑战。传统的单步 RAG 技术在面对跨数据源、多跳查询时往往力不从心,例如当用户询问“Project X 所用服务器的规格”时,系统可能只找到提及服务器 ID 的文档,却无法继续用该 ID 到其他数据库检索详细规格,最终只能给出不完整答案。智能体 RAG 则通过多智能体协作架构,将查询分解为多个子任务,并迭代搜索直至上下文完整,从而显著提升答案的可靠性和准确性。
该框架的核心创新在于“Sufficient Context Agent”(充分上下文代理),这一组件负责在生成最终答案前进行三轮审查:首先,检查检索到的文本片段是否包含回答所需信息;其次,评估由语言模型生成的中间草稿是否充分;最后,分析缺失哪些关键信息,并输出具体的“原因”和“反馈”日志。例如,当医生查询患者约翰·多伊的出院药物、饮食限制和过敏反应时,Sufficient Context Agent 会识别出过敏信息缺失,并指示其他代理针对“皮疹”或“不良事件”进行二次搜索,直到所有信息齐全。这一机制有效防止了模型在信息不足时“猜测”或直接给出“信息不足”的敷衍回答。
在实验验证阶段,研究团队在 FramesQA 数据集(包含 824 个查询和 2,676 个 PDF 文档)上进行了大规模评估。相比使用 Google RAG Engine 的“标准 RAG”基线,智能体 RAG 在事实性数据集上的准确率最高提升了 34%。在更具挑战性的跨语料库场景中(额外加入三个无关数据集),系统依然保持了 90.1% 的正确率,且推理延迟仅增加不到 3%。这证明该框架不仅能有效处理单一数据源,还能在多个无关数据源间自主规划检索路径,为企业的复杂数据需求提供了灵活可靠的解决方案。
目前,该智能体 RAG 功能已作为公开预览在 Gemini Enterprise Agent Platform 上正式上线。Google 表示,这一技术将帮助企业构建更可信、可追溯的 AI 系统,并期待机器学习社区基于此开发下一代可靠 AI 应用。该研究由 Cyrus Rashtchian 和 Da-Cheng Juan 主导,并与 Bo Li、Zhongjie Mao、Tiger Jin 等多位研究人员合作完成。