Envoy AI Gateway 1.0 – 安定した本番環境対応のAIゲートウェイ
Envoy AI Gateway 1.0 は、CNCFのEnvoy GatewayをベースにしたオープンソースAIゲートウェイの初の安定版一般提供リリースです。コントロールプレーンAPIの安定性を約束し、16のAIプロバイダーをサポートし、MCPゲートウェイ、マルチモーダル、エンタープライズ向け可観測性を備えています。
Envoy AI Gateway プロジェクトは本日、バージョン1.0の正式リリースを発表しました。これはCNCFのEnvoy Gateway上に構築されたオープンソースAIゲートウェイの初めての安定版一般提供リリースです。
2025年2月にv0.1をリリースしてから16か月、多くのリリースを経て、業界全体のメンテナーと採用者のコミュニティに支えられ、プロジェクトは1.0のマイルストーンに到達しました。1.0は、ユーザーがEnvoy AI Gateway上に自信を持って構築できることを意味します。安定したコントロールプレーンAPIを提供し、世界最大の企業で本番トラフィックを支える実績のあるEnvoy基盤上で動作します。
1.0の核心は安定性です。プロジェクトは、重大なセキュリティ問題がない限り安定APIを決して壊さず、必要な場合には移行パスを提供することを約束します。具体的には、安定したCRD(AIGatewayRoute、AIServiceBackend、BackendSecurityPolicyなど)、予測可能なアップグレード、文書化された移行手順が含まれます。これにより、企業は移動する標的に賭けることなく、単一のプロバイダーに依存しないAIゲートウェイを標準化できます。
v0.1から1.0への進化は顕著です。AIプロバイダーは2から16に増加し、プロバイダー間のリクエスト/レスポンス変換をサポート。APIサーフェスはチャット、補完、埋め込み、画像生成、オーディオ、OpenAI Responses APIをカバー。MCP(モデルコンテキストプロトコル)ゲートウェイを新たに搭載し、サーバーの多重化、ツールルーティングとフィルタリング、きめ細かい認可を実現。マルチモーダル入力(画像、オーディオ、ビデオ)をサポート。可観測性はOpenTelemetryトレーシング、OpenInference、GenAIトークンメトリクス、推論トークンの個別計上などを含む。マルチテナンシーとルーティングはホスト名ベースのルーティング、モデル仮想化、クォータ認識レート制限を提供。
1.0の主な機能:単一のOpenAI互換エンドポイントですべてのプロバイダーにアクセス可能。ゲートウェイがプロバイダー固有の変換、認証、ルーティングを処理。アプリケーションコードを変更せずにプロバイダーを切り替えたり混在させたりできる。プロバイダー認証はBackendSecurityPolicyで一元管理され、APIキー、AWS、Azure、GCPのクラウドネイティブIDをサポート。MCPゲートウェイはエージェント時代に対応し、複数のMCPサーバーを集約、ツールをルーティング・フィルタリングし、CELベースの細かい認可を実施。エンタープライズ向け可観測性はトークン認識メトリクス、OpenTelemetryトレーシング、推論トークンの個別計上を内蔵。Kubernetes Gateway APIとGateway API Inference Extension上に構築されており、Envoy Gatewayのアドオン層として機能し、既存のデプロイと運用方法を変更しない。
1.0は真にクロスインダストリーのコミュニティの成果です。メンテナーはTetrate、Bloomberg、Tencent、Netflix、Nutanixから参加し、LY Corporation、Alan by Comma Softなどの組織からのフィードバックが反映されています。今後のロードマップには、専用のMCPBackend CRD、より深いMCP認可、完全なクォータ認識ルーティング、さらなるプロバイダー変換パスとマルチモーダルサポートの拡張が含まれます。ロードマップはコミュニティ主導で進められます。
Envoy AI Gateway 1.0は現在入手可能です。詳細なリリースノート、API変更、アップグレードガイダンスについては、プロジェクトのリリースノートページをご覧ください。