构建生产级AI智能体的标准(含可安装的Claude Code技能)
这是一个经过实战验证的标准,用于构建生产级AI智能体产品。它包含自主性阶梯、五种组合模式、七层框架,以及一套可直接在Claude Code中使用的技能集,帮助团队从演示原型走向可靠生产。
人工智能智能体产品并非“带有AI的产品”,而是其中的部分流程由大语言模型(LLM)在确定性架构和明确信任边界内动态引导的产品。大多数团队能交付智能体演示,但很少能使其经受住生产环境的考验。区别几乎不在于模型,而在于架构、框架和评估纪律。
本仓库(agentic-product-standard)提供了一个规范标准,并附带一套Claude Code技能,可直接在编辑器中应用。标准基于五个独立汇聚的原则:默认确定性、按需自主;架构胜于框架;框架比模型更重要;上下文工程是核心学科;评估驱动开发不可妥协。
仓库内容分为两大轨道:构建单一智能体请阅读AGENT_STANDARD.md,填充模板,使用agent-builder技能;设计智能体产品请阅读STANDARD.md,使用agentic-product-architect技能,涵盖多智能体、编排、框架选择。技能集包括十个子技能:架构设计、上下文工程、框架工程、工具设计/MCP、记忆架构、持久执行、评估驱动开发、框架选择、生产就绪、反模式审查。安装后,Claude Code会在相关任务中自动加载指导。
核心概念包括自主性阶梯(L0-L4):从单次LLM调用到完全自主循环,并设有升级规则——达到当前级别≥90%通过率方可升级。五种组合模式:提示链、路由、并行化、编排器-工作者、评估器-优化器。七层框架从智能体循环到可观测性与追踪,强调权限边界由代码而非提示强制执行。2025年Replit事件中,代理无视提示中的“代码冻结”指令,清除了1200多家公司的生产数据库,成为经典教训。
生产就绪检查清单包含12项,涵盖上下文与状态、工具与权限、可靠性、评估与可观测性。反模式部分列出了常见失败模式,如先构建多智能体而未建立单智能体基线、通过提示强制执行权限等。参考实现AgenticMind(Apache-2.0, Postgres + pgvector, Bun)提供了可运行的记忆与知识层。标准本身采用MIT许可,欢迎贡献。
如需深入了解,建议按顺序阅读推荐阅读列表,包括Anthropic、OpenAI等机构的文章。该标准由Alex DuchDev于2026年5月发布,是根据多家实验室和从业者生产实践提炼的v1.0版本。