Amazon Bedrock AgentCore Harness 现已正式上市:数分钟内从创意到生产级智能体
Amazon Bedrock AgentCore Harness 现已正式发布,允许开发者通过两次 API 调用即可创建并运行一个功能完整的智能体。该工具提供隔离的运行环境、内置记忆、工具集成、技能库以及实时追踪能力,无需编写编排代码或构建容器。
一年前,Simon Willison 给出了智能体最清晰的定义之一:LLM 智能体通过循环运行工具来实现目标。这个定义之所以被广泛接受,是因为它描述了一切生产级智能体的实际运作方式。无论是 Kiro、Amazon Q Developer、Quick Agents、Codex 还是 Claude Code,它们底层都采用相同的循环结构。但循环本身从来不是难点,真正的挑战在于围绕它的一切:选择框架、连接工具、配置沙盒计算环境、管理存储、密钥和网络、决定记忆存放位置、添加可观测性、将正确的依赖放入正确的容器。而且,本地原型设计往往相对简单:单个开发者可以在一个下午在笔记本上搭建一个智能体,但将其投入生产环境时,工作量会急剧增加。更糟糕的是,每增加一个新用例,这些开销都会成倍增加。团队想要尝试不同模型、更换工具或将智能体应用于新领域时,不得不重复相同的底层工作。瓶颈不在于智能,而在于编排和基础设施。
当我们在四月首次推出 AgentCore Harness 预览版时,我们押注于一个理念:AgentCore 原语(运行时、记忆、网关、浏览器、身份、可观测性)已经为团队提供了生产环境中运行智能体所需的一切,而他们无需每次都手动连接这些组件。Harness 将这些连接作为托管抽象处理,使其成为可配置而非构建的内容。如今,Amazon Bedrock AgentCore Harness 正式发布。只需两次 API 调用(CreateHarness 定义智能体、InvokeHarness 运行它),或在 AgentCore CLI 中快速操作,或通过控制台点击几次,数分钟内即可拥有一个运行中的智能体。它运行在独立隔离的环境中,配备文件系统和 shell,因此可以安全地读取文件、运行命令和编写代码。它能跨会话记住用户和对话,可应用指向的技能(包括 AWS 策划的目录),浏览网页,通过网关或 MCP 调用工具,并在会话中无缝切换模型提供商而无需丢失上下文。每个步骤都实时流式返回给您,并自动追踪至 Amazon CloudWatch。无需编写编排代码或构建容器,除非您希望这样做。
Harness 为您提供了什么?本质上,Harness 是智能体在生产中运行所需的一切,封装在两个 API 调用之后。您指定所需的模型、工具、技能和指令,AgentCore 则处理沙盒环境、记忆、存储、身份以及可观测性。在正式版本中,我们特别增强了模型灵活性:您可以为不同任务选择不同模型,甚至在会话中切换模型提供商,同时保持上下文。例如,您可以使用 Claude Opus 进行规划,切换到 GPT-5.5 编写代码,再切换到 Gemini 进行总结,对话持续进行。工具方面,您只需声明智能体可以使用的工具,Harness 处理连接、认证和执行。支持网关、MCP、浏览器沙盒和代码解释器。记忆功能默认提供托管式记忆,包含语义和摘要策略,30 天过期,多租户隔离。您也可以自带记忆或禁用。技能方面,正式版本引入了 AWS 技能存储库,涵盖核心技能(SDK 使用、基础设施即代码、IAM、CloudWatch、Bedrock)以及针对分析、数据库、EC2、网络、安全、无服务器和存储的服务特定工作流。只需一个 awsSkills 开关即可启用,无需任何部署。
环境方面,您可以使用默认的 Python 和 bash 环境,或通过自定义容器镜像和文件系统来定制运行时。容器镜像可打包源代码、依赖项和工具,而 InvokeAgentRuntimeCommand 允许在智能体会话内直接执行 shell 命令。Harness 还支持人类参与循环、流媒体、延迟分析等功能。正式版本还引入了基于使用量的定价模式:您只需为运行的会话付费,Harness 本身免费。综上所述,AgentCore Harness 将智能体开发从繁重的自定义构建转变为可配置的体验,让团队能够快速迭代并专注于智能体的核心功能。