AI News HubLIVE
站内改写2 分鐘閱讀

Amazon Bedrock AgentCore 推出網頁搜尋功能

亞馬遜 Bedrock AgentCore 網頁搜尋功能現已全面可用。該功能透過完全託管的 MCP 相容介面,讓 AI 代理能夠獲取即時網頁資訊。它基於亞馬遜自建的包含數百億文件的網頁索引,保證查詢在 AWS 內部處理,無需管理第三方 API 或憑證。

來源AWS Machine Learning Blog作者: Veda Raman

AI 代理正在改變組織發現和處理資訊的方式,但它們有一個結構性侷限:知識在訓練時固定下來。當您向僅依賴訓練資料的代理詢問今天的股價、體育比分或一小時前釋出的版本時,它無法回答。亞馬遜 Bedrock AgentCore 的網頁搜尋功能現已全面可用,彌補了這一差距。這是一個完全託管、相容模型上下文協議(MCP)的網頁搜尋能力,讓您的代理無需基礎設施開銷即可從網路獲取資訊。它作為託管目標或聯結器提供,連線到您的 AgentCore 閘道器。代理透過標準的 tools/list 呼叫發現它,並像其他 MCP 工具一樣呼叫。無需配置搜尋 API、管理出站憑證或維護結果解析程式碼。

該功能背後是亞馬遜自建的專用網頁索引,涵蓋數百億文件。亞馬遜持續重新整理索引,新內容在幾分鐘內即可反映。隱私模型確保查詢不會離開 AWS。檢索可以結合知識圖譜和針對模型上下文最佳化的語義片段提取。

將代理紮根於網路是解決知識陳舊的辦法,但許多團隊在此受阻。自行構建意味著:採購第三方搜尋 API 並管理金鑰、配額和速率限制;解析不同提供商的不一致結果格式;推理客戶查詢的去向以及資料可能如何被保留或重用;構建片段提取邏輯,使模型獲得相關段落而非原始 HTML;維護新鮮度、覆蓋範圍和質量。每一項本身都是一個專案。Amazon Bedrock AgentCore 網頁搜尋解決了所有問題。

它使用亞馬遜直接運營的網頁索引,規模達數百億文件,覆蓋長尾問題。索引持續更新,新內容在幾分鐘內可搜尋。內建知識圖譜為實體和關係提供高置信度事實,減少模型從片段推斷時的細微漂移。語義片段提取從每個網頁中提取與查詢相關的段落,以適合模型上下文的形式返回,減少花費在樣板和導航上的 token,提高引用響應的精確度。

在私有性方面,查詢完全在 AWS 基礎設施內完成。閘道器使用自己的 IAM 服務角色向後臺認證,資料路徑全程在 AWS 內部。對於有資料駐留或第三方出站顧慮的團隊,這消除了整個審查類別。

開始使用網頁搜尋工具:如果您沒有現有閘道器,請建立 AgentCore 閘道器,然後新增網頁搜尋工具目標。使用 connectorId "web-search" 將目標附加到閘道器。閘道器會快照工具模式、預配整合,並處理模式管理、引數治理、端點解析和服務認證。出站角色僅用於閘道器到達網頁搜尋後臺;入站認證透過 OAuth 或 JWT 授權器(如 Amazon Cognito)單獨處理。角色不包括 bedrock:InvokeModel,模型訪問由執行代理的身份負責。

由於網頁搜尋透過 MCP 暴露,MCP 相容框架(如 Strands、LangChain、LangGraph、CrewAI)可以自動發現和呼叫。代理呼叫 tools/list 找到 WebSearchTool,並在需要當前資訊時使用。結果以標準 MCP tools/call 信封返回:一個包含序列化 JSON 的文本內容塊,包含 id 和 observations 陣列。每個網頁索引觀察包含標題、URL、釋出日期和文本;知識圖譜觀察的標題和 URL 為 null,文本中包含結構化鍵值事實。

網頁搜尋工具與 Amazon Bedrock Knowledge Bases 互補。後者適用於企業自有資料的紮根,而網頁搜尋適用於公共網路。許多生產代理同時使用兩者。定價為每 1000 次查詢 7 美元,即用即付。完成後,刪除閘道器目標或整個閘道器即可停止計費。