2026-06-02 23:45 UTC+8站内改写3 分钟阅读更新: 2026-06-30 21:03 UTC+8

Baz如何利用Amazon Bedrock AgentCore提升AI代码审查准确性

本文介绍了Baz如何使用Amazon Bedrock和Amazon Bedrock AgentCore构建其Spec Review代理，通过自动化代码审查流程，结合Figma设计规格和Jira功能需求，实现端到端的验证，减少缺陷并加快合并速度。

来源AWS Machine Learning Blog作者: Itay Atas

文章情报

工程师进阶

要点

Baz的Spec Review代理通过多代理架构，结合静态代码分析和动态浏览器验证，自动检查代码是否符合设计规格和功能需求。
使用Amazon Bedrock AgentCore的浏览器工具在临时环境中交互，进行DOM检查、事件模拟和视觉测试。
该方案将验证提前到开发周期早期，自动在Pull Request时执行，减少人工验证工作量，缺陷减少达50%，合并时间缩减30-70%。

为什么重要

这条新闻值得关注，因为Baz的Spec Review代理通过多代理架构，结合静态代码分析和动态浏览器验证，自动检查代码是否符合设计规格和功能需求。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

本面板由 AI 生成，经人工审核。

代码审查长期以来一直是手动且低效的，因为代码与产品之间存在固有的脱节。开发人员可以审查代码是否编译通过并正常工作，但无法验证它是否满足了所有功能和设计要求。过去，QA团队需要花费数小时手动点击预览环境，以确保功能按预期表现，并且需要更多时间来使实现与设计意图保持一致。这种手动验证拖慢了交付速度，引入了不一致，并增加了回归的可能性。随着开发团队速度的提升，Baz希望自动化这一缺失的验证层，将意图、行为和实现整合到一个审查工作流中。

本文介绍了Baz如何利用Amazon Bedrock和Amazon Bedrock AgentCore构建其Spec Review代理。我们将涵盖架构决策、实现细节以及他们通过利用这些AWS服务自动化代码审查流程所取得的业务成果。

Baz试图解决的关键问题

Baz旨在超越传统的仅差异审查，转向验证功能是否满足预期的产品需求。早期，Baz发现团队在审查时往往关注语法而非行为，导致诸如“它工作吗？”、“它符合规格吗？”、“它按预期表现吗？”等关键问题被推迟到后期手动回答。代码与产品意图之间的这种差距拖慢了团队速度，造成了设计不一致，并且严重依赖未文档化的QA内部知识。Baz通过构建能够评估代码以及实际交付体验的代理来弥补这一差距。

解决方案概述

Baz Spec Review代理编排了一个复杂的多阶段验证流程：在触发（通过webhook或手动调用）时，它并发查询Figma（通过MCP）和Jira（通过REST API）以聚合全面的需求工件，涵盖技术、产品和设计规格。然后，系统生成独立的子代理工作者（每个需求一个），负责验证该需求。此子代理通过源代码仓库进行代码检查，并结合使用Amazon Bedrock AgentCore浏览器工具进行动态运行时验证。子代理与临时环境交互，进行DOM检查、事件模拟和视觉测试，以确保部署的实现与Figma设计规范和功能需求相匹配，通过AWS原生编排实现从规格到实现生命周期的端到端验证。

下图展示了Spec Reviewer架构，这是Baz和AWS的联合解决方案，能够在代码审查工作流中自动进行设计和产品验证。整个代理流程由通过Amazon Bedrock提供服务的大型语言模型驱动，为整个管道提供可扩展且安全的AI推理。流程始于GitHub webhook在新Pull Request上触发，将流量通过Application Load Balancer (ALB)和Network Load Balancer (NLB)路由到Amazon EKS集群。Baz Platform作为中央编排层，协调多代理审查过程。

在Amazon EKS集群内，Baz的Spec Review代理将验证工作流分解为专门的子代理。Specification Subagent由Amazon Bedrock驱动，摄取来自Figma的视觉规格和来自Jira的功能规格，然后将其分解为离散的需求——视觉需求（如间距、颜色和组件层次结构）和功能需求（如验收标准和用户故事意图）。

Implementation Subagents是此架构的核心。这些由Amazon Bedrock驱动的代理根据提取的规格进行深度代码分析，但它们的独特之处在于与Amazon Bedrock AgentCore浏览器使用能力的集成。Implementation Subagents不仅依赖静态代码分析，还可以在实时预览环境中渲染实际实现，并视觉验证UI是否与预期的Figma设计匹配，功能是否按Jira中指定的表现运行。这种代码理解与基于浏览器的验证相结合，使Baz能够捕获传统代码审查工具完全忽略的差异。

报告生成器将来自所有子代理的发现整合成一份连贯的审查摘要。审查完成后，发现会被分发到适当的渠道：评论直接发布到GitHub PR，通知发送到Slack以便团队可见性，识别出的问题可以自动链接回Jira进行跟踪和解决。

Baz如何使用Amazon Bedrock AgentCore应对这些挑战

Amazon Bedrock AgentCore成为构建能够验证真实产品行为的AI代码审查员的基础。其安全、隔离、无服务器的浏览器会话允许Spec Reviewer代理打开预览环境，浏览功能，并像用户一样检查UI行为。通过结合Amazon Bedrock AgentCore运行时（运行与工单系统集成的MCP服务器）、Amazon Bedrock AgentCore浏览器工具以及轻量级自动化和上下文模块，Baz Reviewer可以比较实时行为和代码与工单和设计规格，而无需任何浏览器基础设施或自定义编排。Amazon Bedrock AgentCore的隔离、沙箱和可观测性帮助Baz扩展多个MCP服务器，并允许代理安全可靠地执行全栈验证。

利用Amazon Bedrock实现智能代码审查

Amazon Bedrock驱动Spec Reviewer代理背后的推理和决策层，使其能够解释需求、理解设计意图，并评估在浏览器中观察到的行为的相关性。通过使用Amazon Bedrock托管基础模型，代理可以综合规格上下文，分析UI状态，并生成关于功能是否满足期望的精确、可操作的结论。Amazon Bedrock为生产级代理工作流提供了所需的可靠性、安全性和可扩展性，允许Baz将复杂的解释和验证逻辑卸载到高性能LLM，同时将浏览器执行隔离在AgentCore内。这种组合使得审查员能够弥合意图与实际构建之间的差距。

结论

Baz Spec Review代理展示了Amazon Bedrock和Amazon Bedrock AgentCore如何使组织能够自动化以前需要大量手动工作的产品验证工作流。通过利用Amazon Bedrock基础模型进行需求解释和决策，结合AgentCore的安全浏览器自动化能力，Baz创建了一个在整个开发生命周期中验证实现是否符合规格的解决方案，将报告的缺陷减少多达50%，合并时间缩短30-70%。

采用Spec Review的客户报告称，手动产品验证工作显著减少，功能验证提前到开发周期中，并在Pull Request时自动执行。团队报告审查更快，回归更少，并且在合并前对变更符合需求的信心更高。