AI News HubLIVE
站内改写2 分鐘閱讀

谷歌研究為Gemini企業智慧體平臺新增智慧檢索增強生成,引入充分上下文智慧體處理多跳查詢

谷歌研究團隊在Gemini企業智慧體平臺中引入了一種新型智慧檢索增強生成(Agentic RAG)框架,該框架透過充分上下文智慧體(Sufficient Context Agent)反覆檢索,確保多源、多跳查詢獲得足夠依據後才生成回答。在事實性資料集上,準確率比標準RAG提升高達34%。

來源MarkTechPost作者: Michal Sutter

谷歌研究團隊近日宣佈,已在Gemini企業智慧體平臺中整合一種全新的智慧檢索增強生成(Agentic RAG)框架,並以此為基礎推出了跨語料檢索(Cross-Corpus Retrieval)功能,目前該功能已進入公開預覽階段。

該框架旨在解決企業搜尋中的典型痛點。傳統的單步RAG系統在處理多源、多跳查詢時表現不佳。例如,當使用者詢問“專案X中使用的伺服器規格是什麼?”時,系統可能找到包含伺服器ID的文件,但不會進一步利用該ID去第二個資料庫檢索規格資訊,導致回答不完整或直接返回“未找到”。

谷歌的Agentic RAG框架採用多智慧體架構,透過規劃、推理和與資料來源的迭代互動來處理複雜查詢。與標準RAG相比,該框架在事實性資料集上的準確率提升了高達34%。在測試中,谷歌研究團隊還使用了內部專有資料集,報告顯示該框架在領域特定任務上具備更優的 grounding 能力和推理準確性。

該框架的核心創新在於充分上下文智慧體(Sufficient Context Agent)。當一個查詢涉及多個資料來源時,協調器(Orchestrator)會將任務分解並委派給規劃智慧體(Planner Agent)、查詢重寫智慧體(Query Rewriter)和搜尋分發智慧體(Search Fanout Agent)。在初步檢索後,充分上下文智慧體會檢查結果是否完整。如果發現缺失資訊,它會記錄具體的差距原因,並觸發新一輪搜尋,直到上下文完整為止。這種機制避免了模型在資訊不足時猜測或過早給出“資訊不足”的回答。

在基準測試中,谷歌團隊使用了基於FRAMES研究論文的FramesQA資料集,包含824個查詢和2,676個PDF文件。在跨語料設定下,系統需要從四個語料庫中選擇正確的來源進行檢索,最終準確率達到了90.1%,且延遲與單語料設定相比僅增加不到3%。

該框架適用於多種企業場景,例如醫療團隊整合來自不同記錄系統的藥物、飲食和過敏資料,工程團隊在資料庫中追蹤伺服器ID對應的規格,或財務與專案團隊關聯預算資料與時間線日誌。跨語料設計特別適合由不同團隊管理多個資料庫的組織。

目前,跨語料檢索功能已在Gemini企業智慧體平臺以公開預覽形式提供。谷歌研究團隊表示,未來將繼續最佳化該框架,並探索更多應用可能。