2026-05-25 08:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

驾驭、脚手架与值得厘清的AI智能体术语

本文旨在厘清AI智能体领域中常被混淆的术语，如“harness”（执行层）与“scaffold”（行为定义层）的区别，并解释模型、智能体、工具使用、子智能体等概念，同时涵盖训练相关术语。

在人工智能领域飞速发展的今天，新术语的涌现速度往往超过共识的形成。尤其是在AI智能体（Agent）领域，“harness”和“scaffold”等词汇被广泛使用却缺乏统一定义，给新手甚至资深从业者带来困惑。本文基于ICLR 2026上的讨论，旨在系统梳理这些核心概念，为读者提供一个清晰的思维模型。

首先，模型（Model）指的是底层的语言模型（LLM），如Claude、Qwen、GPT等。它仅接收文本并生成文本，本身不具备记忆或循环能力。模型可以表达调用工具的意图，但需要外部系统来实际执行。将模型包裹在脚手架（scaffold）和执行层（harness）中后，它就变成了一个智能体。

脚手架（Scaffold）是围绕模型的行为定义层，包括系统提示（system prompt）、工具描述、输出解析方式以及跨步骤的记忆管理（上下文管理）。它决定了模型如何“看”世界并采取行动，无论是在训练阶段还是推理阶段。一些产品如Claude Code和Codex将整个非模型部分统称为“harness”，但严格来说，scaffold和harness有明确分工：scaffold提供指令和格式，harness负责执行循环。

执行层（Harness）是智能体内部的核心执行组件：它负责调用模型、处理模型发出的工具调用请求、决定何时停止运行。Harness工程是设计这一层的学科，包括停止条件、错误处理和安全护栏。在评估场景中，它表现为评估执行层（eval harness），运行固定场景记录指标而非更新权重。社区常用公式：智能体 = 模型 + 执行层。

智能体（Agent）源自强化学习，在LLM语境下扩展为“模型加上使其能循环行动的所有组件”。一个编码智能体的具体例子：系统提示、工具描述和输出格式构成脚手架；调用模型、处理工具调用并决定何时停止的循环是执行层。因此，两个使用相同底层模型的产品可能因执行层设计不同而体验迥异。

上下文工程（Context Engineering）涉及设计智能体上下文窗口的内容：每一步模型看到什么、系统提示、工具描述、对话历史、检索知识等。这不是一次性决策，而是运行中持续管理的过程。短期记忆（上下文窗口内）和长期记忆（跨会话持久化）都是其组成部分。

策略（Policy）定义了智能体在各种情况下的行为概率。在LLM系统中，部分策略嵌入模型权重，部分由脚手架和执行层决定。策略不是智能体，后者是包含策略在内的完整系统。

工具使用（Tool Use）使智能体能够调用API、代码解释器、数据库等外部资源。模型以结构化格式表达工具调用意图，现代推理API将其作为一等对象处理：执行层接收调用并路由到正确函数，结果反馈回上下文继续循环。

技能（Skills）是可复用的结构化知识包，用于完成多步骤任务。与单个工具不同，技能封装了达成目标所需的一切（如“调查bug、形成假设、编写修复”），可跨智能体迁移并按需加载。子智能体（Sub-agents）是可由其他智能体调用的独立智能体，拥有自己的模型和脚手架，能独立推理并返回结果。

训练方面，强化学习环境（RL Environment）是智能体交互的有状态对象，接收动作并更新状态后返回观察。训练器（Trainer）（如TRL的GRPOTrainer）运行多轮智能体回合，根据评分结果更新模型权重。轨迹/展开（Rollout）是一次完整的智能体运行记录，包含所见、所为和获得的奖励。奖励（Reward）可以是可验证的（测试通过/失败）、学习的（人类偏好、LLM评判）、稀疏的（回合末单一分数）或密集的（每步分数）。评分规则（Rubrics）将奖励分解为带权重的多个维度。

总之，精准理解这些术语的细微差别，对于构建、部署和优化AI智能体系统至关重要。本文鼓励读者在实践中不断精确定义，并欢迎反馈以共同完善这个术语体系。