AI News HubLIVE
站内改写2 分钟阅读

记住,不要重读:面向令牌高效自主实验的有状态ReAct智能体

该研究将自主实验模式重构为基于LangGraph的有状态ReAct智能体,通过持久化状态避免每次迭代重建上下文,在超参数调优和代码优化任务中分别减少90%和52%的令牌消耗,同时保持优化质量。

来源arXiv Machine Learning作者: Faramarz Jabbarvaziri

近日,一篇题为《记住,不要重读:面向令牌高效自主实验的有状态ReAct智能体》的论文(arXiv:2606.14945)在机器学习领域引起了广泛关注。该论文由Faramarz Jabbarvaziri撰写,于2026年6月12日提交至arXiv,属于机器学习(cs.LG)类别。论文针对自主实验(autoresearch)模式中的令牌消耗问题提出了一个创新的解决方案。

传统的自主实验模式依赖大语言模型(LLM)反复修改代码以优化某个目标指标。然而,这种无状态设计每次迭代都需要从零开始重建实验上下文,导致每次迭代的令牌成本为O(n),总成本达到O(n²)。随着迭代次数的增加,这一成本变得难以承受。为了解决这一瓶颈,作者将模式重构为基于LangGraph的有状态ReAct智能体。该智能体通过类型化的持久化状态携带实验历史,并利用工具调用接口在不同迭代之间传递信息,从而将每次迭代的令牌成本降低至O(1)。

研究团队在两个典型的基准任务上评估了该方法的性能。第一个任务是超参数调优,共进行15次迭代,每次迭代的观察数据量较小。在该任务中,有状态智能体仅消耗2,492个令牌,而无状态方法消耗24,465个,节省了90%的令牌。第二个任务是代码性能优化,共进行40次迭代,每次迭代包含完整的源代码和基准测试结果,数据量较大。在该任务中,有状态智能体消耗627K个令牌,而无状态方法消耗1,275K个,节省了52%的令牌。更重要的是,两种方法在优化质量上表现相当,说明有状态设计并未牺牲性能。

这种令牌削减是结构性的:无状态智能体每次迭代需要重新读取全部历史,成本随迭代线性增长;而有状态智能体只需在固定大小的对话窗口内操作,成本恒定。论文详细描述了架构的各个组成部分,包括状态设计、工具接口和对话管理,使从业者能够将其应用到自己的自主实验工作流中。这一成果对于需要大量迭代优化的领域(如机器学习模型调优和算法性能改进)具有重要价值,有望显著降低计算成本并提高实验效率。