AI News HubLIVE
站内改写2 分钟阅读

Envoy AI Gateway 1.0 正式发布——稳定、生产就绪的AI网关

Envoy AI Gateway 1.0 是首个稳定通用发行版,基于CNCF的Envoy Gateway构建,承诺控制平面API稳定,支持16个AI提供商,提供MCP网关、多模态、企业级可观测性等功能。

来源Hacker News AI作者: zoltano

Envoy AI Gateway 项目今日宣布正式发布1.0版本——这是基于CNCF Envoy Gateway构建的开源AI网关的第一个稳定通用发行版。

自2025年2月发布v0.1以来,经过16个月和多个版本的迭代,在跨行业维护者和采用者社区的支持下,项目终于达到1.0里程碑。1.0意味着用户可以放心地在Envoy AI Gateway上构建应用:它提供了承诺保持稳定的控制平面API,运行在已经在全球最大公司生产环境中经过验证的Envoy基础之上。

1.0版本的核心理念是稳定性。项目承诺不会破坏稳定API,除非存在严重安全问题,且任何必要变更都会提供迁移路径。具体而言,包括:稳定的CRD(如AIGatewayRoute、AIServiceBackend、BackendSecurityPolicy等),可预测的升级策略,以及文档化的迁移方案。这满足了企业对于标准化、供应商无关的AI网关的期望。

从v0.1到1.0,功能大幅扩展:AI提供商从2个增至16个,支持跨提供商请求/响应翻译;API覆盖聊天、补全、嵌入、图像生成、音频以及OpenAI Responses API;新增MCP网关,支持服务器多路复用、工具路由与过滤及细粒度授权;多模态支持图像、音频和视频输入;可观测性方面引入OpenTelemetry tracing、OpenInference、GenAI令牌度量等;多租户和路由支持基于主机名的路由、模型虚拟化和配额感知速率限制。

1.0的关键特性包括:单一API对接所有提供商,应用程序只需连接一个OpenAI兼容端点,网关负责提供商特定的翻译、认证和路由,支持A/B测试、渐进式迁移和避免供应商锁定。提供商认证通过BackendSecurityPolicy集中管理,支持API密钥、AWS、Azure和GCP云原生身份。MCP网关为代理时代设计,可聚合多个MCP服务器、过滤工具并执行基于CEL的细粒度授权。企业级可观测性内置令牌感知度量、OpenTelemetry tracing和推理令牌单独核算。此外,项目基于Kubernetes Gateway API和Gateway API Inference扩展构建,是Envoy Gateway的附加层,不改变现有部署和运维方式。

1.0版本是跨行业社区合作的成果,维护者来自Tetrate、Bloomberg、腾讯、Netflix和Nutanix,并得到LY Corporation、Alan by Comma Soft等组织的反馈。项目未来路线图包括专用MCPBackend CRD、更深度的MCP授权、更完善的配额感知路由、更多的提供商翻译路径和多模态支持。这一切由社区驱动。

Envoy AI Gateway 1.0现已可用,详细的发行说明、API变更和升级指南请访问项目发布说明页面。