AI News HubLIVE
站内改写

在 AWS 上使用 Amazon Bedrock AgentCore 构建高度可扩展的无服务器 LangGraph 多智能体系统

本文提供了一种在 AWS 上构建高度可扩展、无服务器的多智能体生成式 AI 系统的解决方案,该系统使用 LangGraph 智能体作为编排器,并与 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成。文章详细介绍了如何结合 AWS Lambda 和 AWS Step Functions 等无服务器技术来构建自动扩展、实时响应且无需管理基础设施的 LangGraph 智能体,并讨论了 LangGraph 的图执行模型如何实现确定性协调、并行处理和条件路由。此外,文章还涵盖了一个基于此架构的营销活动审核系统的实现,包括先决条件、部署步骤和清理指南。

文章情报

工程师进阶

要点

  • 结合 LangGraph、Amazon Bedrock AgentCore 和无服务器 AWS 服务,构建可投入生产的可扩展多智能体 AI 系统。
  • LangGraph 的显式图执行模型支持智能体间的确定性协调、并行处理和条件路由。
  • AgentCore Observability 提供每个智能体工作流步骤的详细可视化,AgentCore Memory 实现跨会话的上下文和记忆共享。
  • 解决方案包含一个营销活动审核系统,使用三个专业智能体并行分析内容,提供共振评分、合规验证和可操作建议。

为什么重要

这条新闻值得关注,因为结合 LangGraph、Amazon Bedrock AgentCore 和无服务器 AWS 服务,构建可投入生产的可扩展多智能体 AI 系统。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

生成式 AI 已从实验性原型迅速演进为需要在生产中可靠运行、具有可扩展性并满足实际性能约束的系统。随着组织超越演示和概念验证阶段,他们越来越多地遇到推理延迟、可扩展性、状态管理和运营可见性方面的挑战。如今,构建高性能 AI 智能体不仅需要强大的模型,还需要能够提供一致性能、跨交互保持上下文,并深入洞察智能体在生产中推理和行为的实现。

在本文中,我们提供了一种在 AWS 上使用 LangGraph 智能体作为编排器,并与 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成,构建高度可扩展的无服务器多智能体生成式 AI 系统的解决方案。

我们的方法结合了 AWS Lambda 和 AWS Step Functions 等无服务器技术来构建高度可扩展的无服务器多智能体编排。开发者可以使用这些服务构建自动扩展、实时响应事件且无需管理基础设施的 LangGraph 智能体,使其成为动态、突发性智能体工作负载的理想选择。通过结合这些服务,您可以编排复杂的多工具智能体工作流,实现持久状态管理、重试和精细成本控制。

LangGraph 的显式图执行模型支持智能体之间的确定性协调、并行处理和条件路由,使复杂的多智能体工作流更易于推理和调试。通过将编排逻辑与智能体行为分离,您可以独立添加、删除或演进专业智能体,同时保持清晰、可审计的执行路径。这对于需要可预测行为、可扩展性和对多智能体推理进行结构化控制的生产系统尤其有价值。

AgentCore Observability 通过提供每个调用的详细可见性,扩展了这些功能,捕获了跨分布式无服务器组件的模型输入/输出、延迟和工具链指标。AgentCore Memory 的集成记忆服务使智能体能够在会话间维护短期对话上下文和长期知识。

解决方案概览

我们的基于 LangGraph 和 AgentCore 的无服务器多智能体编排系统是一个由生成式 AI 驱动的多智能体营销活动审核系统,它使用不同角色协调人工审核,使营销活动能够真实地与目标受众产生共鸣,同时保持法律合规和品牌标准。该系统由三个专业 AI 智能体组成,并行分析营销活动:角色审核智能体从不同人口统计角度审核内容并提供共振评分;验证智能体检查法律合规和品牌指南遵循情况;最终智能体将反馈综合为可操作建议。用户通过 React 前端上传活动文档,该前端还轮询结果并在可用时显示审核。

我们使用 LangGraph 实现编排器和专业智能体,将系统建模为有状态执行图。每个节点代表一个离散的智能体功能——角色审核、合规验证和反馈综合——边定义了这些步骤之间的控制流。编排器作为监督图实现,路由执行、触发专业智能体的并行分支,并收集其输出进行最终聚合。LangGraph 编排器和专业智能体一起打包为 Docker 容器。

我们使用 AWS Lambda 作为 AWS 中的无服务器托管运行时,使 Strands 智能体自动扩展、实时响应事件并消除基础设施管理。我们的编排器通过 Amazon API Gateway 提供 REST 接口展示其功能。

我们的智能体实现使用 AgentCore Observability 提供每个智能体工作流步骤的详细可视化,使开发者能够检查执行路径、审计中间输出并调试性能瓶颈。在 AgentCore Observability 中,我们在 Amazon CloudWatch 中提供实时可见性,包括操作性能仪表板和关键指标遥测,如跟踪、会话数、延迟、持续时间、标记使用和错误率。

我们使用 AgentCore Memory 实现两个关键用例:跨多个智能体运行提供上下文和共享记忆的多智能体共享内存,以及支持多轮对话。您可以扩展此实现以提供 AI 助手自然语言界面,因为我们的实现使用 AgentCore Memory 内置支持存储对话状态和历史。

先决条件

完成以下先决条件:

  • 在 Amazon Bedrock 中验证模型访问。本解决方案使用 Amazon Bedrock 上的 Anthropic Claude 4.5 Sonnet。
  • 安装 AWS 命令行界面 (AWS CLI)。
  • 安装 AWS SAM CLI v1.100.0+。
  • 安装 Docker v20.x+。
  • 安装 Node.js v18.x+。
  • 安装 Python v3.11+。

依赖项

我们的 Strands Agents 实现具有以下依赖项,打包在 Dockerfile 中:

  • langchain>=0.2.0
  • langgraph==0.3.31
  • langgraph-prebuilt~=0.1.8
  • langgraph-sdk~=0.1.61
  • langchain-aws>=0.2.18
  • langchain_tavily
  • requests
  • bedrock-agentcore
  • boto3

部署解决方案

您可以从我们的 GitHub 仓库下载解决方案。按照以下步骤(也记录在 GitHub 仓库的 README 中)在您的 AWS 环境中部署和访问解决方案:

**步骤 1:** 克隆仓库。 **步骤 2:** 配置 AWS 凭证。 **步骤 3:** 设置 Amazon DynamoDB 角色表。 **步骤 4:** 构建 AWS SAM 应用程序。 **步骤 5:** 引导部署基础设施。 **步骤 6:** 获取部署输出。 **步骤 8:** 配置前端环境。 **步骤 9:** 构建和部署前端。 **步骤 10:** 访问应用程序。

清理

为避免重复收费,在尝试解决方案后清理您的账户:删除 CloudFormation 堆栈和 DynamoDB 表。

结论

在本文中,我们展示了如何结合 LangGraph、Amazon Bedrock AgentCore 和无服务器 AWS 服务,帮助团队构建高度可扩展、可投入生产的多智能体生成式 AI 系统。通过使用 LangGraph 的显式图执行模型进行编排,以及基于 AWS Lambda 的运行时进行执行,开发者可以协调复杂、并行的智能体工作流,具有确定性控制流、自动扩展和最小的运营开销。集成的 AgentCore Memory 和 Observability 解决了实际智能体部署中最常见的两个挑战——状态管理和可见性——通过在智能体运行间提供共享、持久的上下文,并深入洞察智能体行为、性能和成本。

这些能力共同形成了一种在 AWS 上构建企业级 AI 智能体的可重复架构模式。无论您是实施营销活动审核系统、数字助手还是其他多智能体推理工作流,这种方法都允许您将编排与执行解耦,根据需求弹性扩展,并保持对智能体推理和交互的完全透明。通过使用 LangGraph 进行结构化编排以及 Amazon Bedrock AgentCore 进行托管运行时、记忆和可观测性,您可以自信地从实验原型转向可靠、可扩展的生产级生成式 AI 系统。