Arbor: 自律エージェントの認知層としての木探索
Arborは、大規模な状態を持つアクション空間で自律エージェントの認知層として構造化木探索を導入するマルチエージェントフレームワークです。フルスタックLLM推論最適化で検証され、ベンダー最適化ベースラインと比較して最大193%のスループット-レイテンシ・パレート改善を達成し、批評エージェントが安定性を確保します。
Arborは、大規模な状態を持つアクション空間において自律エージェントの認知層として構造化木探索を導入する革新的なマルチエージェントフレームワークです。従来の自律最適化システムは、孤立したターゲットに対して状態を持たない評価を行っていましたが、Arborはスコア付き仮説の明示的な探索木を維持し、これをエージェント間の共有ワーキングメモリとして機能させます。この木は各測定ごとに進化し、失敗を診断信号として扱ってその後の探索を再形成し、過去の成功がボトルネック分布を変化させるにつれて拡張されます。これにより、エージェントは協調して効率的に最適化を進めることができます。
研究者らは、フルスタックLLM推論最適化タスクでArborの有効性を検証しました。この分野は、アプリケーション、フレームワーク、コンパイラ、カーネル、ハードウェアスタックにわたるエンジニアリングチームの協調作業を従来必要としてきました。Arborは、推論スタック全体のドメイン専門家にタスクを委任して最適化を推進するオーケストレーターエージェントと、根本原因分析、内省、測定検証を通じて安定性を守る批評エージェントを組み合わせています。このチェック・アンド・バランスアーキテクチャにより、どちらのエージェントも一方的にシステムを制御できず、安定した最適化が可能です。エージェントの能力はハードスキル(ドメイン専門知識)とソフトスキル(貢献の構成方法を決定する調整プロトコル)に分解され、完全自律的な数日間のキャンペーンを実現します。
実験結果によると、Arborはベンダー最適化ベースラインと比較してスループット-レイテンシのパレート改善を最大193%達成しました。一方、フレームワークなしの単一エージェントはスループットが33%向上しただけで、数時間以内に回復不能なクラッシュを起こしました。Arborは複数世代のハードウェアプラットフォームに一般化でき、実行間のばらつきは2パーセントポイント以内であり、この手法がハードウェア非依存で再現可能であることを示しています。この研究は、木探索を認知層として利用することで複雑な最適化問題に取り組む新たな可能性を示しており、将来の自律エージェントシステムの設計に重要な示唆を与えます。