2026-06-05 19:26 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

藉助 Gemini Enterprise Agent Platform 的智慧體 RAG 解鎖可靠回答

Google Research 與 Google Cloud 合作推出智慧體 RAG 框架，透過多智慧體工作流將複雜企業查詢分解，迭代搜尋足夠上下文後生成可靠回答。相比標準 RAG，準確性提升高達 34%。

Google Research 與 Google Cloud 近日聯合釋出了一項名為“智慧體 RAG”（Agentic RAG）的全新檢索增強生成框架，旨在解決傳統 RAG 系統在處理複雜企業查詢時面臨的挑戰。傳統的單步 RAG 技術在面對跨資料來源、多跳查詢時往往力不從心，例如當使用者詢問“Project X 所用伺服器的規格”時，系統可能只找到提及伺服器 ID 的文件，卻無法繼續用該 ID 到其他資料庫檢索詳細規格，最終只能給出不完整答案。智慧體 RAG 則透過多智慧體協作架構，將查詢分解為多個子任務，並迭代搜尋直至上下文完整，從而顯著提升答案的可靠性和準確性。

該框架的核心創新在於“Sufficient Context Agent”（充分上下文代理），這一元件負責在生成最終答案前進行三輪審查：首先，檢查檢索到的文本片段是否包含回答所需資訊；其次，評估由語言模型生成的中間草稿是否充分；最後，分析缺失哪些關鍵資訊，並輸出具體的“原因”和“反饋”日誌。例如，當醫生查詢患者約翰·多伊的出院藥物、飲食限制和過敏反應時，Sufficient Context Agent 會識別出過敏資訊缺失，並指示其他代理針對“皮疹”或“不良事件”進行二次搜尋，直到所有資訊齊全。這一機制有效防止了模型在資訊不足時“猜測”或直接給出“資訊不足”的敷衍回答。

在實驗驗證階段，研究團隊在 FramesQA 資料集（包含 824 個查詢和 2,676 個 PDF 文件）上進行了大規模評估。相比使用 Google RAG Engine 的“標準 RAG”基線，智慧體 RAG 在事實性資料集上的準確率最高提升了 34%。在更具挑戰性的跨語料庫場景中（額外加入三個無關資料集），系統依然保持了 90.1% 的正確率，且推理延遲僅增加不到 3%。這證明該框架不僅能有效處理單一資料來源，還能在多個無關資料來源間自主規劃檢索路徑，為企業的複雜資料需求提供了靈活可靠的解決方案。

目前，該智慧體 RAG 功能已作為公開預覽在 Gemini Enterprise Agent Platform 上正式上線。Google 表示，這一技術將幫助企業構建更可信、可追溯的 AI 系統，並期待機器學習社群基於此開發下一代可靠 AI 應用。該研究由 Cyrus Rashtchian 和 Da-Cheng Juan 主導，並與 Bo Li、Zhongjie Mao、Tiger Jin 等多位研究人員合作完成。