2026-06-08站内改写3 分で読了更新: 2026-06-08

AIエージェントスタック（2026年版）

この記事はPaolo Perroneのブログからの転載で、2024年版のAIエージェントスタック図を更新し、2026年版の6つのレイヤー（モデルと推論、プロトコルとツール、メモリと知識、フレームワークとSDK、評価と可観測性など）を紹介。MCPの標準化、推論モデルの進化、メモリの第一級市民化などの変化を強調し、各レイヤーの評価アドバイスを提供。

ソースO'Reilly AI & ML Radar著者: Paolo Perrone

記事インテリジェンス

エンジニア中級

要点

AIエージェントスタックは2024年から2026年にかけて大きく変化し、MCPが標準プロトコルになり、推論モデルがエージェントの能力を変えた。
6つのレイヤーは、モデルと推論、プロトコルとツール、メモリと知識、フレームワークとSDK、評価と可観測性など。
記事はシンプルに始め、特定の問題が発生した場合のみ複雑さを追加するようアドバイス。

重要な理由

このニュースが重要なのは、AIエージェントスタックは2024年から2026年にかけて大きく変化し、MCPが標準プロトコルになり、推論モデルがエージェントの能力を変えたためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

AIエージェントスタック（2026年版）完全アップデート

この記事は、Paolo Perrone氏のAI Engineer Substackに掲載された記事を許可を得て転載したものです。記事は、多くのチームがAIエージェントを過度に複雑にしていると指摘します。例えば、カスタマーサポートチャットボットチームがLangGraphを選んだ結果、3週間で14ノードの状態グラフ、カスタムチェックポイント、リトライロジックを構築しましたが、実際にはOpenAI SDKの50行のスクリプトと2つのMCPサーバーで同じことができたはずです。問題は、問題が本当に必要とするレイヤーをマッピングしなかったことです。

2024年11月、Lettaが公開したAIエージェントスタック図は、多くのエンジニアリングチームのデフォルトリファレンスとなりました。しかし、14ヶ月が経過し、状況は大きく変わりました。MCPは存在せず、メモリはベクトルデータベースのサブセットとして扱われ、プロバイダーネイティブのエージェントSDKはなく、評価（Eval）は地図上にすらありませんでした。2026年のスタックは6つのレイヤーで構成され、そのうち少なくとも3つは2024年には存在していませんでした。

この記事では、シンプルに始め、特定の問題が発生した場合にのみ複雑さを追加することを推奨します。エージェントのコアは「思考-行動-観察」のループです。このスタックはLLMスタックではなく、本番環境でエージェントを信頼性高く動作させるためのインフラストラクチャです。

3つの重要な変化が地図を書き換えました：MCPによるツール接続の標準化、推論モデルによるエージェントの自律能力の変化、そしてメモリが第一級のアーキテクチャプリミティブになったことです。

各レイヤーを評価する際には、3つの質問を自問します：管理すべき状態はどの程度か？ベンダーロックインをどの程度許容できるか？デモから本番への移行はどの程度難しいか？

以下、下から上に各レイヤーを説明します。

レイヤー1：モデルと推論。このレイヤーはコモディティ化が進んでいます。o1、o3、DeepSeek R1などの推論モデルがエージェントの計画能力を変えました。オープンウェイトモデルの品質差は縮まり、現在はクローズドソースでプロトタイプを作り、オープンウェイトでデプロイするパターンが一般的です。ベンダーロックインはクローズドAPIで高く、オープンウェイトで低い。

レイヤー2：プロトコルとツール。MCPが標準となり、月間9700万ダウンロード、OpenAI、Google、Microsoftに採用されました。ブラウザ自動化ツールのBrowser Useも急成長。セキュリティは未解決の問題で、82%のMCPサーバーがパストラバーサル、67%がコードインジェクションに対して脆弱。ベンダーロックインは低いが、セキュリティガバナンスが課題。

レイヤー3：メモリと知識。2024年には「ベクトルDBを選んでRAG」でしたが、2026年にはメモリは3つの階層（コンテキスト状態、ベクトル検索、セッションを超えた永続メモリ）を持つ第一級のプリミティブです。コンテキストエンジニアリングがプロンプトエンジニアリングに取って代わりました。pgvectorがデフォルト選択となり、GraphRAGが登場。

レイヤー4：フレームワークとSDK。主要AIラボはそれぞれ独自のエージェントSDKを提供。LangGraphはグラフベースのオーケストレーションリーダーだが、「自作」派も増加。アドバイス：エージェントがモデルと数個のツールを呼び出すだけなら、LangGraphは不要。プロバイダSDKと数個のツール呼び出しで十分。

レイヤー5：評価と可観測性。このレイヤーは2024年にはほとんど存在しませんでしたが、今では重要に。トレース、スコアリング、回帰検出。

レイヤー6：ガードレール（原文では詳述されていないが、概要に登場）。セキュリティやガバナンスが課題。

記事は「正直な見解」として、ほとんどのチームがメモリやフレームワークを過度に複雑にしていると指摘します。Postgresの会話履歴と構造化システムプロンプトから始め、履歴がコンテキスト制限を超えた場合のみベクトル検索を追加し、エージェントがセッションをまたいで学習する必要がある場合のみエージェントメモリ管理を追加することを推奨します。

この記事は、本番環境でAIエージェントを構築するエンジニア向けの包括的かつ実用的なガイドとなっています。