2026-06-08 16:25 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

谷歌研究為Gemini企業智能體平台新增智能檢索增強生成，引入充分上下文智能體處理多跳查詢

谷歌研究團隊在Gemini企業智能體平台中引入了一種新型智能檢索增強生成（Agentic RAG）框架，該框架通過充分上下文智能體（Sufficient Context Agent）反覆檢索，確保多源、多跳查詢獲得足夠依據後才生成回答。在事實性數據集上，準確率比標準RAG提升高達34%。

來源MarkTechPost作者: Michal Sutter

谷歌研究團隊近日宣佈，已在Gemini企業智能體平台中集成一種全新的智能檢索增強生成（Agentic RAG）框架，並以此為基礎推出了跨語料檢索（Cross-Corpus Retrieval）功能，目前該功能已進入公開預覽階段。

該框架旨在解決企業搜索中的典型痛點。傳統的單步RAG系統在處理多源、多跳查詢時表現不佳。例如，當用户詢問“項目X中使用的服務器規格是什麼？”時，系統可能找到包含服務器ID的文檔，但不會進一步利用該ID去第二個數據庫檢索規格信息，導致回答不完整或直接返回“未找到”。

谷歌的Agentic RAG框架採用多智能體架構，通過規劃、推理和與數據源的迭代交互來處理複雜查詢。與標準RAG相比，該框架在事實性數據集上的準確率提升了高達34%。在測試中，谷歌研究團隊還使用了內部專有數據集，報告顯示該框架在領域特定任務上具備更優的 grounding 能力和推理準確性。

該框架的核心創新在於充分上下文智能體（Sufficient Context Agent）。當一個查詢涉及多個數據源時，協調器（Orchestrator）會將任務分解並委派給規劃智能體（Planner Agent）、查詢重寫智能體（Query Rewriter）和搜索分發智能體（Search Fanout Agent）。在初步檢索後，充分上下文智能體會檢查結果是否完整。如果發現缺失信息，它會記錄具體的差距原因，並觸發新一輪搜索，直到上下文完整為止。這種機制避免了模型在信息不足時猜測或過早給出“信息不足”的回答。

在基準測試中，谷歌團隊使用了基於FRAMES研究論文的FramesQA數據集，包含824個查詢和2,676個PDF文檔。在跨語料設置下，系統需要從四個語料庫中選擇正確的來源進行檢索，最終準確率達到了90.1%，且延遲與單語料設置相比僅增加不到3%。

該框架適用於多種企業場景，例如醫療團隊整合來自不同記錄系統的藥物、飲食和過敏數據，工程團隊在數據庫中追蹤服務器ID對應的規格，或財務與項目團隊關聯預算數據與時間線日誌。跨語料設計特別適合由不同團隊管理多個數據庫的組織。

目前，跨語料檢索功能已在Gemini企業智能體平台以公開預覽形式提供。谷歌研究團隊表示，未來將繼續優化該框架，並探索更多應用可能。