xAI 在 Grok Build 中推出 /goal,为多步骤编码任务提供长时间运行的自主执行并内置验证
xAI 在 Grok Build 终端编码代理中推出了 /goal 模式,支持长时间运行的自主任务执行。用户只需给出一个目标,代理会规划步骤、执行进度检查并验证结果,直至任务完成。该功能适用于大型代码迁移、重构、依赖升级等多步骤任务,并提供了状态查看、暂停、恢复和清除等控制命令,需要 SuperGrok 或 X Premium Plus 订阅。
xAI 近日在 Grok Build(其终端编码代理)中推出了名为 /goal 的新模式,旨在实现长时间运行的自主任务执行。用户只需交给代理一个较大的实现任务,即可放手让代理自主工作。
传统的编码会话通常需要反复执行和验证:用户给出提示,代理执行操作,用户再验证每一步。而 /goal 改变了这一循环:代理会持续工作,直到任务完成并通过验证。验证方式可以包括审查代码、检查网页或执行脚本。该模式通过一个命令和可见的进度检查清单来封装自主性。
什么是 /goal?
/goal 是 Grok Build 内部的一种模式,而非独立产品。Grok Build 是 xAI 面向软件工程的编码代理和命令行工具(CLI),它针对本地代码库运行,读取文件并执行命令。Grok Build 已具备多种代理特性:计划模式(在批准前阻止编辑)、将大型工作委托给并行运行的专门子代理、读取 AGENTS.md、插件、钩子、技能和 MCP 服务器等。MCP 是一种连接代理与外部工具和数据的协议。
使用该功能需要 SuperGrok 或 X Premium Plus 订阅。用户通过一条命令安装 CLI,登录账户后即可调用 /goal。该模式专为任务交接设计:用户描述一个目标,代理负责处理多步骤工作。
长时间运行执行的重要性
代理获得的是一个目标,而不仅仅是单次提示。它会规划步骤、执行、观察结果,并在现实与计划不符时重新规划。这就是“观察-规划-行动”循环。其代价是可观察性:长时间运行会产生许多需要监控的操作。/goal 通过进度检查清单和控制命令来应对这一问题。
/goal 的工作原理
用户在 Grok Build 会话中(而非系统 shell)通过一行命令设定目标。例如:
/goal 将认证模块迁移到新 API
Grok Build 会为该目标规划方法,将其分解为进度检查清单,然后逐一执行清单项。运行期间用户仍可发送额外指令。任务完成后,面板会切换为“完成”,每个检查项都会显示为已勾选。
关键细节:验证步骤
值得注意的是验证步骤。/goal 不会在编写代码后停止,而是继续直到任务完成并验证。根据 xAI 的说法,验证可以采取三种形式:代理审查生成的代码、检查网页以确认行为、或执行脚本进行测试。这对于自主运行至关重要:仅在编辑文件的代理可能在没有验证结果有效时报告成功。内置验证确保代理在完成前测试自身输出。
用例示例
模块迁移是主要示例。/goal 迁移认证模块覆盖了多文件更改,任务冗长、机械且可测试。其他适用的任务包括:重构服务后运行测试套件以确保绿色构建;添加端点后检查渲染页面是否有运行时错误;升级依赖、执行构建并修复中断;跨文件移植配置后运行脚本验证。每个任务都更适合自主目标而非快速单行编辑。收益在于工作可以跨越多个原本需要监督的步骤。
控制长时间运行的目标
/goal 提供了监控和控制的命令,均在 Grok Build 会话中输入:
/goal status – 查看实时进度面板 /goal pause – 暂停工作,保留目标 /goal resume – 从停止处继续 /goal clear – 完全丢弃目标,重新开始
这些控制对于无人值守运行很重要。用户可以在代理自主编辑文件和执行脚本时随时暂停或丢弃目标。
与其他工具比较
与 Claude Code、OpenAI Codex CLI 和 Cursor Agent Mode 等终端编码代理相比,/goal 增加了明确的、可操控的目标对象。其命名生命周期命令和内置验证步骤是新增的部分。具体对比维度包括:交接模型(一行目标对象 vs 对话式任务列表)、进度视图(自动检查清单 + 实时面板 vs 内部待办列表)、控制命令(status/pause/resume/clear vs 中断和重新提示)、验证(运行直到完成并验证 vs 仅在指示时运行测试)、运行位置(终端 TUI/headless/ACP vs 终端或IDE集成),以及访问方式(SuperGrok/X Premium Plus 订阅 vs 订阅或API)。
关键要点
– /goal 在 Grok Build 终端代理中运行长时间自主任务。 – 它规划方法、构建检查清单、执行并验证直到完成。 – 验证可包括审查代码、检查网页或执行脚本。 – status、pause、resume 和 clear 控制实时运行。 – 需要 SuperGrok 或 X Premium Plus 订阅。
社区反应
欲了解技术细节,请查阅相关文档。欢迎关注我们的 Twitter,加入 15 万+ 机器学习 SubReddit 并订阅我们的新闻通讯。现在也可以加入我们的 Telegram 频道。如需合作推广 GitHub 仓库、Hugging Face 页面、产品发布或网络研讨会等,请联系我们。