AI News HubLIVE
站内改写2 分钟阅读

Amazon Bedrock AgentCore 推出网页搜索功能

亚马逊 Bedrock AgentCore 网页搜索功能现已全面可用。该功能通过完全托管的 MCP 兼容接口,让 AI 代理能够获取实时网页信息。它基于亚马逊自建的包含数百亿文档的网页索引,保证查询在 AWS 内部处理,无需管理第三方 API 或凭证。

来源AWS Machine Learning Blog作者: Veda Raman

AI 代理正在改变组织发现和处理信息的方式,但它们有一个结构性局限:知识在训练时固定下来。当您向仅依赖训练数据的代理询问今天的股价、体育比分或一小时前发布的版本时,它无法回答。亚马逊 Bedrock AgentCore 的网页搜索功能现已全面可用,弥补了这一差距。这是一个完全托管、兼容模型上下文协议(MCP)的网页搜索能力,让您的代理无需基础设施开销即可从网络获取信息。它作为托管目标或连接器提供,连接到您的 AgentCore 网关。代理通过标准的 tools/list 调用发现它,并像其他 MCP 工具一样调用。无需配置搜索 API、管理出站凭证或维护结果解析代码。

该功能背后是亚马逊自建的专用网页索引,涵盖数百亿文档。亚马逊持续刷新索引,新内容在几分钟内即可反映。隐私模型确保查询不会离开 AWS。检索可以结合知识图谱和针对模型上下文优化的语义片段提取。

将代理扎根于网络是解决知识陈旧的办法,但许多团队在此受阻。自行构建意味着:采购第三方搜索 API 并管理密钥、配额和速率限制;解析不同提供商的不一致结果格式;推理客户查询的去向以及数据可能如何被保留或重用;构建片段提取逻辑,使模型获得相关段落而非原始 HTML;维护新鲜度、覆盖范围和质量。每一项本身都是一个项目。Amazon Bedrock AgentCore 网页搜索解决了所有问题。

它使用亚马逊直接运营的网页索引,规模达数百亿文档,覆盖长尾问题。索引持续更新,新内容在几分钟内可搜索。内置知识图谱为实体和关系提供高置信度事实,减少模型从片段推断时的细微漂移。语义片段提取从每个网页中提取与查询相关的段落,以适合模型上下文的形式返回,减少花费在样板和导航上的 token,提高引用响应的精确度。

在私有性方面,查询完全在 AWS 基础设施内完成。网关使用自己的 IAM 服务角色向后台认证,数据路径全程在 AWS 内部。对于有数据驻留或第三方出站顾虑的团队,这消除了整个审查类别。

开始使用网页搜索工具:如果您没有现有网关,请创建 AgentCore 网关,然后添加网页搜索工具目标。使用 connectorId "web-search" 将目标附加到网关。网关会快照工具模式、预配集成,并处理模式管理、参数治理、端点解析和服务认证。出站角色仅用于网关到达网页搜索后台;入站认证通过 OAuth 或 JWT 授权器(如 Amazon Cognito)单独处理。角色不包括 bedrock:InvokeModel,模型访问由运行代理的身份负责。

由于网页搜索通过 MCP 暴露,MCP 兼容框架(如 Strands、LangChain、LangGraph、CrewAI)可以自动发现和调用。代理调用 tools/list 找到 WebSearchTool,并在需要当前信息时使用。结果以标准 MCP tools/call 信封返回:一个包含序列化 JSON 的文本内容块,包含 id 和 observations 数组。每个网页索引观察包含标题、URL、发布日期和文本;知识图谱观察的标题和 URL 为 null,文本中包含结构化键值事实。

网页搜索工具与 Amazon Bedrock Knowledge Bases 互补。后者适用于企业自有数据的扎根,而网页搜索适用于公共网络。许多生产代理同时使用两者。定价为每 1000 次查询 7 美元,即用即付。完成后,删除网关目标或整个网关即可停止计费。