AI News HubLIVE
站内改写

驾驭、脚手架与值得厘清的AI智能体术语

本文旨在厘清AI智能体领域中常被混淆的术语,如“harness”(执行层)与“scaffold”(行为定义层)的区别,并解释模型、智能体、工具使用、子智能体等概念,同时涵盖训练相关术语。

文章情报

工程师进阶

要点

  • AI智能体=模型+执行层(harness),其中harness负责调用模型和处理工具调用。
  • Scaffold是围绕模型的行为定义层,包括系统提示、工具描述等。
  • 上下文工程、策略、技能和子智能体是智能体系统的关键组成部分。
  • 训练涉及强化学习环境、训练器、轨迹和奖励等概念。

为什么重要

这条新闻值得关注,因为AI智能体=模型+执行层(harness),其中harness负责调用模型和处理工具调用。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

在人工智能领域飞速发展的今天,新术语的涌现速度往往超过共识的形成。尤其是在AI智能体(Agent)领域,“harness”和“scaffold”等词汇被广泛使用却缺乏统一定义,给新手甚至资深从业者带来困惑。本文基于ICLR 2026上的讨论,旨在系统梳理这些核心概念,为读者提供一个清晰的思维模型。

首先,**模型**(Model)指的是底层的语言模型(LLM),如Claude、Qwen、GPT等。它仅接收文本并生成文本,本身不具备记忆或循环能力。模型可以表达调用工具的意图,但需要外部系统来实际执行。将模型包裹在脚手架(scaffold)和执行层(harness)中后,它就变成了一个智能体。

**脚手架(Scaffold)**是围绕模型的行为定义层,包括系统提示(system prompt)、工具描述、输出解析方式以及跨步骤的记忆管理(上下文管理)。它决定了模型如何“看”世界并采取行动,无论是在训练阶段还是推理阶段。一些产品如Claude Code和Codex将整个非模型部分统称为“harness”,但严格来说,scaffold和harness有明确分工:scaffold提供指令和格式,harness负责执行循环。

**执行层(Harness)**是智能体内部的核心执行组件:它负责调用模型、处理模型发出的工具调用请求、决定何时停止运行。Harness工程是设计这一层的学科,包括停止条件、错误处理和安全护栏。在评估场景中,它表现为评估执行层(eval harness),运行固定场景记录指标而非更新权重。社区常用公式:智能体 = 模型 + 执行层。

**智能体(Agent)**源自强化学习,在LLM语境下扩展为“模型加上使其能循环行动的所有组件”。一个编码智能体的具体例子:系统提示、工具描述和输出格式构成脚手架;调用模型、处理工具调用并决定何时停止的循环是执行层。因此,两个使用相同底层模型的产品可能因执行层设计不同而体验迥异。

**上下文工程(Context Engineering)**涉及设计智能体上下文窗口的内容:每一步模型看到什么、系统提示、工具描述、对话历史、检索知识等。这不是一次性决策,而是运行中持续管理的过程。短期记忆(上下文窗口内)和长期记忆(跨会话持久化)都是其组成部分。

**策略(Policy)**定义了智能体在各种情况下的行为概率。在LLM系统中,部分策略嵌入模型权重,部分由脚手架和执行层决定。策略不是智能体,后者是包含策略在内的完整系统。

**工具使用(Tool Use)**使智能体能够调用API、代码解释器、数据库等外部资源。模型以结构化格式表达工具调用意图,现代推理API将其作为一等对象处理:执行层接收调用并路由到正确函数,结果反馈回上下文继续循环。

**技能(Skills)**是可复用的结构化知识包,用于完成多步骤任务。与单个工具不同,技能封装了达成目标所需的一切(如“调查bug、形成假设、编写修复”),可跨智能体迁移并按需加载。**子智能体(Sub-agents)**是可由其他智能体调用的独立智能体,拥有自己的模型和脚手架,能独立推理并返回结果。

训练方面,**强化学习环境(RL Environment)**是智能体交互的有状态对象,接收动作并更新状态后返回观察。**训练器(Trainer)**(如TRL的GRPOTrainer)运行多轮智能体回合,根据评分结果更新模型权重。**轨迹/展开(Rollout)**是一次完整的智能体运行记录,包含所见、所为和获得的奖励。**奖励(Reward)**可以是可验证的(测试通过/失败)、学习的(人类偏好、LLM评判)、稀疏的(回合末单一分数)或密集的(每步分数)。评分规则(Rubrics)将奖励分解为带权重的多个维度。

总之,精准理解这些术语的细微差别,对于构建、部署和优化AI智能体系统至关重要。本文鼓励读者在实践中不断精确定义,并欢迎反馈以共同完善这个术语体系。