谷歌研究為Gemini企業智能體平台新增智能檢索增強生成,引入充分上下文智能體處理多跳查詢
谷歌研究團隊在Gemini企業智能體平台中引入了一種新型智能檢索增強生成(Agentic RAG)框架,該框架通過充分上下文智能體(Sufficient Context Agent)反覆檢索,確保多源、多跳查詢獲得足夠依據後才生成回答。在事實性數據集上,準確率比標準RAG提升高達34%。
谷歌研究團隊近日宣佈,已在Gemini企業智能體平台中集成一種全新的智能檢索增強生成(Agentic RAG)框架,並以此為基礎推出了跨語料檢索(Cross-Corpus Retrieval)功能,目前該功能已進入公開預覽階段。
該框架旨在解決企業搜索中的典型痛點。傳統的單步RAG系統在處理多源、多跳查詢時表現不佳。例如,當用户詢問“項目X中使用的服務器規格是什麼?”時,系統可能找到包含服務器ID的文檔,但不會進一步利用該ID去第二個數據庫檢索規格信息,導致回答不完整或直接返回“未找到”。
谷歌的Agentic RAG框架採用多智能體架構,通過規劃、推理和與數據源的迭代交互來處理複雜查詢。與標準RAG相比,該框架在事實性數據集上的準確率提升了高達34%。在測試中,谷歌研究團隊還使用了內部專有數據集,報告顯示該框架在領域特定任務上具備更優的 grounding 能力和推理準確性。
該框架的核心創新在於充分上下文智能體(Sufficient Context Agent)。當一個查詢涉及多個數據源時,協調器(Orchestrator)會將任務分解並委派給規劃智能體(Planner Agent)、查詢重寫智能體(Query Rewriter)和搜索分發智能體(Search Fanout Agent)。在初步檢索後,充分上下文智能體會檢查結果是否完整。如果發現缺失信息,它會記錄具體的差距原因,並觸發新一輪搜索,直到上下文完整為止。這種機制避免了模型在信息不足時猜測或過早給出“信息不足”的回答。
在基準測試中,谷歌團隊使用了基於FRAMES研究論文的FramesQA數據集,包含824個查詢和2,676個PDF文檔。在跨語料設置下,系統需要從四個語料庫中選擇正確的來源進行檢索,最終準確率達到了90.1%,且延遲與單語料設置相比僅增加不到3%。
該框架適用於多種企業場景,例如醫療團隊整合來自不同記錄系統的藥物、飲食和過敏數據,工程團隊在數據庫中追蹤服務器ID對應的規格,或財務與項目團隊關聯預算數據與時間線日誌。跨語料設計特別適合由不同團隊管理多個數據庫的組織。
目前,跨語料檢索功能已在Gemini企業智能體平台以公開預覽形式提供。谷歌研究團隊表示,未來將繼續優化該框架,並探索更多應用可能。