BazがAmazon Bedrock AgentCoreを使用してAIエージェントコードレビューの精度を向上させた方法
この記事では、BazがAmazon BedrockとAmazon Bedrock AgentCoreを使用してSpec Reviewエージェントを構築し、コードレビュープロセスを自動化する方法について説明します。アーキテクチャの決定、実装の詳細、およびAWSサービスを活用して達成したビジネス成果について取り上げます。
コードレビューは長い間手動で非効率的でした。コードと製品の間には固有のギャップがあるためです。開発者はコードがコンパイルされ正常に動作するかどうかをレビューできましたが、それがすべての機能要件や設計要件を満たしているかどうかを確認することはできませんでした。過去には、QAチームがプレビュー環境を手動でクリックしながら機能が期待通りに動作するか確認し、実装を設計意図に合わせるためにさらに時間を費やしていました。この手動検証は納品を遅らせ、一貫性を欠き、リグレッションの可能性を高めていました。開発チームの速度が上がるにつれて、Bazはこの欠落した検証レイヤーを自動化し、意図、動作、実装を単一のレビューワークフローに統合したいと考えました。
この記事では、BazがAmazon BedrockとAmazon Bedrock AgentCoreを使用してSpec Reviewエージェントを構築した方法について説明します。アーキテクチャの決定、実装の詳細、およびこれらのAWSサービスを活用してコードレビュープロセスを自動化することで達成したビジネス成果について取り上げます。
Bazが解決しようとした主要な問題
Bazは、従来の差分のみのレビューを超えて、機能が意図された製品要件を満たしているかどうかを検証することを目指しています。初期の段階で、Bazはチームが構文ではなく動作に焦点を当てたレビューに苦労していることを認識しました。そのため、「動作するか」「仕様に合っているか」「意図した通りに動作するか」といった重要な質問は、手動で後半に回答されることになりました。コードと製品意図の間のこのギャップはチームの速度を低下させ、設計の不一致を生み出し、文書化されていないQAの内部知識に大きく依存する結果となりました。Bazは、コードだけでなく実際に提供されたエクスペリエンスを評価できるエージェントを構築することで、このギャップを埋めようとしました。
ソリューションの概要
Baz Spec Reviewエージェントは、洗練された多段階検証パイプラインを orchestrate します。トリガー(Webhookまたは手動呼び出し)により、Figma(MCP経由)とJira(REST API経由)に同時にクエリを実行し、技術、製品、設計の仕様にわたる包括的な要件成果物を集約します。その後、システムは独立したサブエージェントワーカーを生成し(要件ごとに1つ)、その要件の検証を担当します。このサブエージェントは、ソースコードリポジトリを介したコードチェックと、Amazon Bedrock AgentCoreブラウザツールを使用した動的ランタイム検証を組み合わせます。サブエージェントは一時的な環境と対話し、DOM検査、イベントシミュレーション、ビジュアルテストを実行して、デプロイされた実装がFigmaの設計仕様と動作要件の両方に一致することを確認し、AWSネイティブオーケストレーションを通じて仕様から実装までのライフサイクル全体にわたるエンドツーエンドの検証を提供します。
次の図は、BazとAWSの共同ソリューションであるSpec Reviewerアーキテクチャを示しています。これにより、コードレビューワークフロー内で設計と製品の検証を自動化できます。エージェントフロー全体は、Amazon Bedrockを介して提供される大規模言語モデルによって駆動され、パイプライン全体でスケーラブルでセキュアなAI推論を提供します。フローは、GitHubのWebhookが新しいプルリクエストでトリガーされ、Application Load Balancer (ALB) と Network Load Balancer (NLB) を経由してAmazon EKSクラスターにトラフィックをルーティングするところから始まります。Baz Platformが中央オーケストレーションレイヤーとして機能し、マルチエージェントレビュープロセスを調整します。
Amazon EKSクラスター内で、BazのSpec Reviewエージェントは検証ワークフローを専門のサブエージェントに分割します。Specification SubagentはAmazon Bedrockを搭載し、Figmaからのビジュアル仕様とJiraからの機能仕様を取り込み、それらを個別の要件(間隔、色、コンポーネント階層などのビジュアル要件、および受け入れ基準やユーザーストーリーの意図などの機能要件)に分解します。
Implementation Subagentsはこのアーキテクチャの中核です。これらのAmazon Bedrock搭載エージェントは、抽出された仕様に対して深いコード分析を実行しますが、それらを際立たせているのはAmazon Bedrock AgentCoreブラウザ使用機能との統合です。静的コード分析のみに依存するのではなく、Implementation Subagentsはライブプレビュー環境で実際の実装をレンダリングし、UIが意図されたFigmaデザインと一致し、機能がJiraで指定された通りに動作するかを視覚的に検証できます。このコード理解とブラウザベースの検証の組み合わせにより、Bazは従来のコードレビューツールでは完全に見逃される差異をキャッチできます。
Report Generatorは、すべてのサブエージェントからの発見を一貫したレビューサマリーに統合します。レビューが完了すると、発見事項は適切なチャネルに配布されます。コメントはGitHub PRに直接投稿され、通知はチームの可視性のためにSlackに送信され、特定された問題は追跡と解決のためにJiraに自動的にリンクされます。
BazがAmazon Bedrock AgentCoreを実装してこれらの課題に取り組んだ方法
Amazon Bedrock AgentCoreは、実際の製品動作を検証できるAIコードレビューアを構築するための基盤となりました。その安全で分離されたサーバーレスブラウザセッションにより、Spec Reviewerエージェントはプレビュー環境を開き、機能をナビゲートし、ユーザーと同じようにUIの動作を検査できます。Amazon Bedrock AgentCoreランタイム(チケッティングシステムと統合するMCPサーバーを実行)、Amazon Bedrock AgentCoreブラウザツール、および軽量な自動化とコンテキストモジュールを組み合わせることで、Baz Reviewerはブラウザインフラストラクチャやカスタムオーケストレーションを必要とせずに、ライブの動作とコードをチケットや設計仕様と比較できます。Amazon Bedrock AgentCoreの分離、サンドボックス化、および可観測性により、Bazは複数のMCPサーバーをスケールし、エージェントが安全かつ確実にフルスタック検証を大規模に実行できます。
Amazon Bedrockによるインテリジェントコードレビューの実現
Amazon Bedrockは、Spec Reviewerエージェントの背後にある推論と意思決定レイヤーを駆動し、要件の解釈、設計意図の理解、ブラウザで観察された動作の関連性の評価を可能にします。Amazon Bedrockマネージドファンデーションモデルを使用することで、エージェントは仕様コンテキストを統合し、UI状態を分析し、機能が期待を満たしているかどうかについて正確で実用的な結論を生成できます。Amazon Bedrockは、プロダクショングレードのエージェントワークフローに必要な信頼性、セキュリティ、スケーラビリティを提供し、Bazは複雑な解釈と検証ロジックを高性能LLMにオフロードしながら、ブラウザ実行をAgentCore内で分離したままにできます。この組み合わせにより、レビューアは意図されたものと実際に構築されたものとのギャップを埋めることができます。
結論
Baz Spec Reviewエージェントは、Amazon BedrockとAmazon Bedrock AgentCoreが、従来は多大な手作業を必要とした製品検証ワークフローを組織が自動化する方法を示しています。Amazon Bedrockファンデーションモデルを要件解釈と意思決定に活用し、AgentCoreのセキュアなブラウザ自動化機能と組み合わせることで、Bazは開発ライフサイクル全体で実装が仕様に適合しているかを検証するソリューションを作成し、報告されるバグを最大50%、マージ時間を30~70%削減しました。
Spec Reviewerを採用したお客様は、手動の製品検証作業が大幅に削減され、機能検証が開発サイクルの早い段階に移行し、プルリクエスト時に自動的に実行されるようになったと報告しています。チームはレビューの迅速化、リグレッションの減少、およびマージ前に変更が要件を満たしていることへの信頼性の向上を報告しています。