2026-06-12站内改写1 分钟阅读更新: 2026-06-12

Arbor：树搜索作为自主代理的认知层

Arbor是一个多代理框架，将结构化树搜索作为自主代理的认知层，用于大规模有状态动作空间。在全栈LLM推理优化中，相比供应商优化基线，实现了高达193%的吞吐量-延迟帕累托改进，并且硬件无关、可重复。

来源arXiv AI作者: Neha Prakriya, Chaojun Hou, Zheng Gong, Huasha Zhao, Xi Zhao, Mou Li, Zhenyu Gu, Emad Barsoum

Arbor是一个创新的多智能体框架，其核心思想是将结构化树搜索作为自主智能体的认知层，特别适用于需要在大规模有状态动作空间中运行的场景。传统的自主优化系统通常针对孤立目标进行无状态评估，而Arbor则维护一个显式的评分假设搜索树，作为所有智能体之间的共享工作记忆。该搜索树随着每次测量不断进化，将失败视为诊断信号来重新引导后续探索，并在先前成功改变瓶颈分布时进行扩展。这一机制使得多个智能体能够协同工作，避免重复探索，并有效利用历史信息。

研究者们在全栈LLM推理优化任务上验证了Arbor的有效性。LLM推理优化是一个极其复杂的领域，传统上需要工程团队在应用、框架、编译器、内核和硬件等多个层面进行协调优化。Arbor引入了两种关键智能体：编排智能体（Orchestrator）负责将优化任务委派给推理栈中各领域的专家智能体，而批评智能体（Critic）则通过根本原因分析、内省和测量验证来确保系统稳定性。这种制衡架构防止了任一智能体单方面控制系统，从而保证了优化过程的稳健性。智能体的能力被分解为硬技能（领域专业知识）和软技能（协调协议，决定贡献如何组合），这使得Arbor能够支持完全自主的多日优化活动。

实验结果表明，Arbor在吞吐量和延迟的帕累托改进上，相比供应商优化的基线实现了高达193%的提升。相比之下，没有该框架的单一智能体仅能实现33%的吞吐量提升，并且在几小时内就发生不可恢复的崩溃。Arbor还能够泛化到多代硬件平台，运行间方差在2个百分点以内，证明了其硬件无关性和可重复性。这项研究展示了将树搜索作为认知层在复杂优化任务中的巨大潜力，为未来的自主智能体系统提供了新的设计思路。