覚えておいて、再読み込みは不要:トークン効率的な自律実験のためのステートフルReActエージェント
本研究は、従来の無状態自律実験パターンを、LangGraphを用いたステートフルReActエージェントに再構築し、毎回の反復でコンテキストを再構築する必要性を排除。ハイパーパラメータ調整で90%、コード最適化で52%のトークン削減を達成しつつ、最適化品質を維持する。
最近、arXivに投稿された論文「覚えておいて、再読み込みは不要:トークン効率的な自律実験のためのステートフルReActエージェント」(arXiv:2606.14945)は、自律実験におけるトークン消費を大幅に削減する革新的なアプローチを提案しています。著者はFaramarz Jabbarvaziriで、2026年6月12日に提出され、機械学習(cs.LG)分野に分類されています。
自律実験(autoresearch)パターンは、大規模言語モデル(LLM)がコードを反復的に修正して目標指標を最適化するものですが、その無状態設計は毎回の反復で実験コンテキストをゼロから再構築するため、反復あたりのトークンコストがO(n)、総コストがO(n²)に達します。この非効率性を解決するため、著者らはLangGraphを使用したステートフルReActエージェントを開発しました。このエージェントは型付きの永続状態を用いて実験履歴を保持し、ツール呼び出しインターフェースを介して反復間で情報を引き継ぐことで、反復あたりのコストをO(1)に抑えます。
評価は2つのベンチマークで行われました。1つ目はハイパーパラメータ調整(15反復、各反復の観測データは小規模)で、ステートフルエージェントは2,492トークンしか消費せず、無状態の24,465トークンから90%削減しました。2つ目はコード性能最適化(40反復、各反復には完全なソースコードとベンチマーク結果が含まれる)で、ステートフルエージェントは627Kトークン、無状態は1,275Kトークンと52%削減し、最適化品質は同等でした。
このトークン削減は構造的なものです。無状態エージェントは毎回全履歴を再読み込みするため反復ごとにO(n)のコストがかかるのに対し、ステートフルエージェントは固定サイズの会話ウィンドウ内で動作し、コストはO(1)です。論文ではアーキテクチャの詳細が十分に説明されており、実践者は自身のワークフローにステートフル自律実験エージェントを実装することができます。この成果は、機械学習モデルのチューニングやアルゴリズム最適化など、多くの反復を必要とするタスクにおいて大きな価値を持ち、計算コストの削減と実験効率の向上に寄与することが期待されます。
さらに、論文ではLangGraphを用いた具体的な実装方法が示されており、型付き永続状態とツール呼び出しインターフェースの設計が詳述されています。これにより、研究者やエンジニアは容易に自身の自律実験パイプラインに統合できるでしょう。