AI News HubLIVE
站内改写1 分钟阅读

Arbor:树搜索作为自主代理的认知层

Arbor是一个多代理框架,将结构化树搜索作为自主代理的认知层,用于大规模有状态动作空间。在全栈LLM推理优化中,相比供应商优化基线,实现了高达193%的吞吐量-延迟帕累托改进,并且硬件无关、可重复。

来源arXiv AI作者: Neha Prakriya, Chaojun Hou, Zheng Gong, Huasha Zhao, Xi Zhao, Mou Li, Zhenyu Gu, Emad Barsoum

Arbor是一个创新的多智能体框架,其核心思想是将结构化树搜索作为自主智能体的认知层,特别适用于需要在大规模有状态动作空间中运行的场景。传统的自主优化系统通常针对孤立目标进行无状态评估,而Arbor则维护一个显式的评分假设搜索树,作为所有智能体之间的共享工作记忆。该搜索树随着每次测量不断进化,将失败视为诊断信号来重新引导后续探索,并在先前成功改变瓶颈分布时进行扩展。这一机制使得多个智能体能够协同工作,避免重复探索,并有效利用历史信息。

研究者们在全栈LLM推理优化任务上验证了Arbor的有效性。LLM推理优化是一个极其复杂的领域,传统上需要工程团队在应用、框架、编译器、内核和硬件等多个层面进行协调优化。Arbor引入了两种关键智能体:编排智能体(Orchestrator)负责将优化任务委派给推理栈中各领域的专家智能体,而批评智能体(Critic)则通过根本原因分析、内省和测量验证来确保系统稳定性。这种制衡架构防止了任一智能体单方面控制系统,从而保证了优化过程的稳健性。智能体的能力被分解为硬技能(领域专业知识)和软技能(协调协议,决定贡献如何组合),这使得Arbor能够支持完全自主的多日优化活动。

实验结果表明,Arbor在吞吐量和延迟的帕累托改进上,相比供应商优化的基线实现了高达193%的提升。相比之下,没有该框架的单一智能体仅能实现33%的吞吐量提升,并且在几小时内就发生不可恢复的崩溃。Arbor还能够泛化到多代硬件平台,运行间方差在2个百分点以内,证明了其硬件无关性和可重复性。这项研究展示了将树搜索作为认知层在复杂优化任务中的巨大潜力,为未来的自主智能体系统提供了新的设计思路。