2026-04-20 21:00 UTC+8站内改写3 分钟阅读更新: 2026-06-27 08:25 UTC+8

我们内部构建的AI工程栈——基于我们交付的平台

Cloudflare 的 R&D 部门中有 93% 在使用基于自身平台构建的 AI 编码工具。过去一个月，AI Gateway 处理了 2018 万次请求和 2413.7 亿 tokens，Workers AI 处理了 515 亿 tokens。内部堆栈包括零信任认证、集中路由、MCP 服务器门户、AI 代码审查器以及知识图谱等组件，所有组件都运行在 Cloudflare 发货的产品上。

来源Cloudflare AI Blog作者: Ayush Thakur

文章情报

工程师进阶

要点

Cloudflare 内部有 3,683 名活跃用户使用 AI 编码工具，占公司 60%，R&D 部门占 93%。
AI Gateway 每月处理 2018 万次请求，2413.7 亿 tokens；Workers AI 处理 515 亿输入 tokens。
架构包括平台层（AI Gateway、Workers AI、MCP 门户）、知识层（Backstage 服务目录、AGENTS.md）和执行层（AI 代码审查器、工程规范）。
背景代理（Background Agents）是下一步演进，使用 Durable Objects 和 Agents SDK 实现云端长时间运行。

为什么重要

这条新闻值得关注，因为Cloudflare 内部有 3,683 名活跃用户使用 AI 编码工具，占公司 60%，R&D 部门占 93%。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

本面板由 AI 生成，经人工审核。

Cloudflare 近日详细介绍了其内部 AI 工程栈的构建过程，该栈完全基于公司自身发货的平台产品。过去三十天内，93% 的研发部门使用了由内部基础设施支持的 AI 编码工具。这一项目始于十一个月前，由名为 iMARS 的特别团队负责，旨在将 AI 深度集成到工程栈中。目前，已有 3,683 名内部用户（占全公司 60%）积极使用 AI 编码工具，研发部门采用率达 93%。数据方面，过去一个月 AI Gateway 处理了 2018 万次请求和 2413.7 亿 tokens，Workers AI 处理了 515 亿输入 tokens 和 3.61 亿输出 tokens。开发者速度显著提升，合并请求的季度环比增长前所未有。

架构分为三层：平台层、知识层和执行层。平台层包括 Cloudflare Access 的零信任认证、AI Gateway 的集中式 LLM 路由和成本跟踪、以及 Workers AI 的同网络推理。MCP 服务器门户通过单次 OAuth 聚合了 13 个生产 MCP 服务器，暴露 182 多个工具，并支持 Code Mode 以减少上下文窗口的 token 开销。知识层基于 Backstage 服务目录，跟踪 2,055 个服务、228 个 API 和依赖关系图。团队还开发了 AGENTS.md 系统，为每个仓库生成结构化上下文文件，帮助编码代理理解代码库的约定和边界。执行层包括 AI 代码审查器，集成到 GitLab CI 中对每个合并请求进行自动审查，并引用工程规范（Codex）中的具体规则。

所有这些组件都是 Cloudflare 已发货的产品，并在 Agents Week 期间得到重大更新。例如，Workers AI 上运行的 Kimi K2.5 模型以极低成本处理安全代理每天 70 亿 tokens 的任务。未来，团队正开发背景代理，利用 Durable Objects 和 Agents SDK 实现云端长时间运行会话，执行克隆仓库、运行测试和开启合并请求等任务。Sandbox SDK 已在 Agents Week 期间正式发布。Cloudflare 强调，内部栈的成功在于各层紧密集成，从路由代理 Worker 到发现端点再到配置即代码。用户只需一个命令即可完成全部设置，无需手动配置 API 密钥或 MCP 服务器连接。这种架构使得为 3,000 多名工程师更新工具像一次 wrangler deploy 一样简单。

在平台层，代理 Worker 使用 Hono 框架处理认证、路由和模型目录更新。它每小时从 models.dev 获取最新模型列表并缓存到 Workers KV，自动对每个模型应用零数据保留。用户通过 cloudflared 登录获取 JWT，Worker 将用户邮箱映射为匿名 UUID 以便成本跟踪，而 AI Gateway 仅见 UUID。MCP 门户中的每个服务器基于 McpAgent 和 workers-oauth-provider，通过单一 monorepo 管理，添加新服务器只需复制现有框架并修改封装的 API。Code Mode 将 GitLab MCP 服务器的 34 个工具简化为两个门户级工具 portal_codemode_search 和 portal_codemode_execute，将每请求 token 开销从 15,000 大幅降低。

知识层中，Backstage 包含 2,055 个服务、228 个 API、1,302 个数据库等实体，通过 13 个工具供 MCP 代理查询服务所有权和依赖关系。AGENTS.md 生成器处理了约 3,900 个仓库，它从 Backstage 提取元数据，分析仓库结构（语言、构建系统、测试框架、目录布局），然后映射到工程规范标准，由模型生成结构化文档并通过合并请求供团队审查。AI 代码审查器可检测仓库变化并提示更新 AGENTS.md。

执行层的 AI 代码审查器覆盖所有仓库，使用多智能体协调器将 MR 分为 trivial、lite 或 full 风险等级，并委托给代码质量、安全、规范合规、文档、性能等专门智能体。每个智能体通过 AI Gateway 访问模型，从中心仓库拉取 Codex 规则，并读取仓库的 AGENTS.md 获取上下文。审查输出按安全、代码质量、性能等分类，每个发现标注严重级别（关键、重要、建议或可选瑕疵），并引用具体 Codex 规则 ID。Workers AI 处理约 15% 的审查流量，主要用于文档审查，Kimi K2.5 在此类任务中性价比极高。前沿模型如 Opus 4.6 和 GPT 5.4 负责安全敏感和架构复杂的审查。过去三十天，所有标准 CI 仓库均实现 100% AI 代码审查覆盖，AI Gateway 处理了 5.47M 请求和 24.77B tokens。

工程规范系统（Codex）通过多阶段 AI 蒸馏输出规则集和智能体技能，技能采用渐进式披露和嵌套层次结构。工程师可在本地使用，如询问 Rust 错误处理或 TypeScript 合规性。网络防火墙团队已使用多智能体共识流程审计 rampartd，每个要求获评 COMPLIANT、PARTIAL 或 NON-COMPLIANT 并附具体违规细节和修复步骤，将原来数周的人工工作简化为结构化可重复过程。

背景代理是下一步演进，使用 Durable Objects 和 Agents SDK 实现云端长时间运行会话，无需担心超时。Sandbox SDK 提供隔离环境用于克隆、构建和测试。整个努力代表十一个月来对代码编写、审查、标准执行和安全变更交付方式的重新思考，每一层都运行在客户使用的同一产品上。