AI News HubLIVE
站内改写2 分钟阅读

谷歌研究为Gemini企业智能体平台新增智能检索增强生成,引入充分上下文智能体处理多跳查询

谷歌研究团队在Gemini企业智能体平台中引入了一种新型智能检索增强生成(Agentic RAG)框架,该框架通过充分上下文智能体(Sufficient Context Agent)反复检索,确保多源、多跳查询获得足够依据后才生成回答。在事实性数据集上,准确率比标准RAG提升高达34%。

来源MarkTechPost作者: Michal Sutter

谷歌研究团队近日宣布,已在Gemini企业智能体平台中集成一种全新的智能检索增强生成(Agentic RAG)框架,并以此为基础推出了跨语料检索(Cross-Corpus Retrieval)功能,目前该功能已进入公开预览阶段。

该框架旨在解决企业搜索中的典型痛点。传统的单步RAG系统在处理多源、多跳查询时表现不佳。例如,当用户询问“项目X中使用的服务器规格是什么?”时,系统可能找到包含服务器ID的文档,但不会进一步利用该ID去第二个数据库检索规格信息,导致回答不完整或直接返回“未找到”。

谷歌的Agentic RAG框架采用多智能体架构,通过规划、推理和与数据源的迭代交互来处理复杂查询。与标准RAG相比,该框架在事实性数据集上的准确率提升了高达34%。在测试中,谷歌研究团队还使用了内部专有数据集,报告显示该框架在领域特定任务上具备更优的 grounding 能力和推理准确性。

该框架的核心创新在于充分上下文智能体(Sufficient Context Agent)。当一个查询涉及多个数据源时,协调器(Orchestrator)会将任务分解并委派给规划智能体(Planner Agent)、查询重写智能体(Query Rewriter)和搜索分发智能体(Search Fanout Agent)。在初步检索后,充分上下文智能体会检查结果是否完整。如果发现缺失信息,它会记录具体的差距原因,并触发新一轮搜索,直到上下文完整为止。这种机制避免了模型在信息不足时猜测或过早给出“信息不足”的回答。

在基准测试中,谷歌团队使用了基于FRAMES研究论文的FramesQA数据集,包含824个查询和2,676个PDF文档。在跨语料设置下,系统需要从四个语料库中选择正确的来源进行检索,最终准确率达到了90.1%,且延迟与单语料设置相比仅增加不到3%。

该框架适用于多种企业场景,例如医疗团队整合来自不同记录系统的药物、饮食和过敏数据,工程团队在数据库中追踪服务器ID对应的规格,或财务与项目团队关联预算数据与时间线日志。跨语料设计特别适合由不同团队管理多个数据库的组织。

目前,跨语料检索功能已在Gemini企业智能体平台以公开预览形式提供。谷歌研究团队表示,未来将继续优化该框架,并探索更多应用可能。