2026-06-16站内改写2 分钟阅读更新: 2026-06-16

记住，不要重读：面向令牌高效自主实验的有状态ReAct智能体

该研究将自主实验模式重构为基于LangGraph的有状态ReAct智能体，通过持久化状态避免每次迭代重建上下文，在超参数调优和代码优化任务中分别减少90%和52%的令牌消耗，同时保持优化质量。

来源arXiv Machine Learning作者: Faramarz Jabbarvaziri

近日，一篇题为《记住，不要重读：面向令牌高效自主实验的有状态ReAct智能体》的论文（arXiv:2606.14945）在机器学习领域引起了广泛关注。该论文由Faramarz Jabbarvaziri撰写，于2026年6月12日提交至arXiv，属于机器学习（cs.LG）类别。论文针对自主实验（autoresearch）模式中的令牌消耗问题提出了一个创新的解决方案。

传统的自主实验模式依赖大语言模型（LLM）反复修改代码以优化某个目标指标。然而，这种无状态设计每次迭代都需要从零开始重建实验上下文，导致每次迭代的令牌成本为O(n)，总成本达到O(n²)。随着迭代次数的增加，这一成本变得难以承受。为了解决这一瓶颈，作者将模式重构为基于LangGraph的有状态ReAct智能体。该智能体通过类型化的持久化状态携带实验历史，并利用工具调用接口在不同迭代之间传递信息，从而将每次迭代的令牌成本降低至O(1)。

研究团队在两个典型的基准任务上评估了该方法的性能。第一个任务是超参数调优，共进行15次迭代，每次迭代的观察数据量较小。在该任务中，有状态智能体仅消耗2,492个令牌，而无状态方法消耗24,465个，节省了90%的令牌。第二个任务是代码性能优化，共进行40次迭代，每次迭代包含完整的源代码和基准测试结果，数据量较大。在该任务中，有状态智能体消耗627K个令牌，而无状态方法消耗1,275K个，节省了52%的令牌。更重要的是，两种方法在优化质量上表现相当，说明有状态设计并未牺牲性能。

这种令牌削减是结构性的：无状态智能体每次迭代需要重新读取全部历史，成本随迭代线性增长；而有状态智能体只需在固定大小的对话窗口内操作，成本恒定。论文详细描述了架构的各个组成部分，包括状态设计、工具接口和对话管理，使从业者能够将其应用到自己的自主实验工作流中。这一成果对于需要大量迭代优化的领域（如机器学习模型调优和算法性能改进）具有重要价值，有望显著降低计算成本并提高实验效率。