2026-06-08 16:25 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

谷歌研究为Gemini企业智能体平台新增智能检索增强生成，引入充分上下文智能体处理多跳查询

谷歌研究团队在Gemini企业智能体平台中引入了一种新型智能检索增强生成（Agentic RAG）框架，该框架通过充分上下文智能体（Sufficient Context Agent）反复检索，确保多源、多跳查询获得足够依据后才生成回答。在事实性数据集上，准确率比标准RAG提升高达34%。

来源MarkTechPost作者: Michal Sutter

谷歌研究团队近日宣布，已在Gemini企业智能体平台中集成一种全新的智能检索增强生成（Agentic RAG）框架，并以此为基础推出了跨语料检索（Cross-Corpus Retrieval）功能，目前该功能已进入公开预览阶段。

该框架旨在解决企业搜索中的典型痛点。传统的单步RAG系统在处理多源、多跳查询时表现不佳。例如，当用户询问“项目X中使用的服务器规格是什么？”时，系统可能找到包含服务器ID的文档，但不会进一步利用该ID去第二个数据库检索规格信息，导致回答不完整或直接返回“未找到”。

谷歌的Agentic RAG框架采用多智能体架构，通过规划、推理和与数据源的迭代交互来处理复杂查询。与标准RAG相比，该框架在事实性数据集上的准确率提升了高达34%。在测试中，谷歌研究团队还使用了内部专有数据集，报告显示该框架在领域特定任务上具备更优的 grounding 能力和推理准确性。

该框架的核心创新在于充分上下文智能体（Sufficient Context Agent）。当一个查询涉及多个数据源时，协调器（Orchestrator）会将任务分解并委派给规划智能体（Planner Agent）、查询重写智能体（Query Rewriter）和搜索分发智能体（Search Fanout Agent）。在初步检索后，充分上下文智能体会检查结果是否完整。如果发现缺失信息，它会记录具体的差距原因，并触发新一轮搜索，直到上下文完整为止。这种机制避免了模型在信息不足时猜测或过早给出“信息不足”的回答。

在基准测试中，谷歌团队使用了基于FRAMES研究论文的FramesQA数据集，包含824个查询和2,676个PDF文档。在跨语料设置下，系统需要从四个语料库中选择正确的来源进行检索，最终准确率达到了90.1%，且延迟与单语料设置相比仅增加不到3%。

该框架适用于多种企业场景，例如医疗团队整合来自不同记录系统的药物、饮食和过敏数据，工程团队在数据库中追踪服务器ID对应的规格，或财务与项目团队关联预算数据与时间线日志。跨语料设计特别适合由不同团队管理多个数据库的组织。

目前，跨语料检索功能已在Gemini企业智能体平台以公开预览形式提供。谷歌研究团队表示，未来将继续优化该框架，并探索更多应用可能。