藉助 Gemini Enterprise Agent Platform 的智慧體 RAG 解鎖可靠回答
Google Research 與 Google Cloud 合作推出智慧體 RAG 框架,透過多智慧體工作流將複雜企業查詢分解,迭代搜尋足夠上下文後生成可靠回答。相比標準 RAG,準確性提升高達 34%。
Google Research 與 Google Cloud 近日聯合釋出了一項名為“智慧體 RAG”(Agentic RAG)的全新檢索增強生成框架,旨在解決傳統 RAG 系統在處理複雜企業查詢時面臨的挑戰。傳統的單步 RAG 技術在面對跨資料來源、多跳查詢時往往力不從心,例如當使用者詢問“Project X 所用伺服器的規格”時,系統可能只找到提及伺服器 ID 的文件,卻無法繼續用該 ID 到其他資料庫檢索詳細規格,最終只能給出不完整答案。智慧體 RAG 則透過多智慧體協作架構,將查詢分解為多個子任務,並迭代搜尋直至上下文完整,從而顯著提升答案的可靠性和準確性。
該框架的核心創新在於“Sufficient Context Agent”(充分上下文代理),這一元件負責在生成最終答案前進行三輪審查:首先,檢查檢索到的文本片段是否包含回答所需資訊;其次,評估由語言模型生成的中間草稿是否充分;最後,分析缺失哪些關鍵資訊,並輸出具體的“原因”和“反饋”日誌。例如,當醫生查詢患者約翰·多伊的出院藥物、飲食限制和過敏反應時,Sufficient Context Agent 會識別出過敏資訊缺失,並指示其他代理針對“皮疹”或“不良事件”進行二次搜尋,直到所有資訊齊全。這一機制有效防止了模型在資訊不足時“猜測”或直接給出“資訊不足”的敷衍回答。
在實驗驗證階段,研究團隊在 FramesQA 資料集(包含 824 個查詢和 2,676 個 PDF 文件)上進行了大規模評估。相比使用 Google RAG Engine 的“標準 RAG”基線,智慧體 RAG 在事實性資料集上的準確率最高提升了 34%。在更具挑戰性的跨語料庫場景中(額外加入三個無關資料集),系統依然保持了 90.1% 的正確率,且推理延遲僅增加不到 3%。這證明該框架不僅能有效處理單一資料來源,還能在多個無關資料來源間自主規劃檢索路徑,為企業的複雜資料需求提供了靈活可靠的解決方案。
目前,該智慧體 RAG 功能已作為公開預覽在 Gemini Enterprise Agent Platform 上正式上線。Google 表示,這一技術將幫助企業構建更可信、可追溯的 AI 系統,並期待機器學習社群基於此開發下一代可靠 AI 應用。該研究由 Cyrus Rashtchian 和 Da-Cheng Juan 主導,並與 Bo Li、Zhongjie Mao、Tiger Jin 等多位研究人員合作完成。