2026-05-26 13:00 UTC+9サイト内リライト2 分で読了更新: 2026-06-30 22:03 UTC+9

LLM-AutoSciLab: LLMを用いた能動的実験による閉ループ科学発見

本論文では、仮説生成と仮説条件付き実験選択およびメカニズム精緻化を組み合わせた閉ループフレームワークLLM-AutoSciLabを提案する。このフレームワークは、もっともらしい仮説を反復的に提案し、情報量の多い実験を選択して仮説を区別または精緻化し、結果に基づいて状態を更新する。ActiveSciBenchベンチマーク（57の酵素動力学タスクと45の遺伝子制御ネットワークタスクから構成）を導入。NewtonBenchで67.6%、ActiveSciBench-Chemで35.1%の記号的正確率、ActiveSciBench-GRNで31.1%の正確なグラフ復元を達成し、サンプル効率は最強の競合ベースラインより2～5倍高い。

ソースarXiv Machine Learning著者: Sanchit Kabra, Nikhil Abhyankar, Saaketh Desai, Prasad Iyer, Chandan K Reddy

科学発見は仮説がデータ収集を導き、観測が仮説空間を洗練する閉ループプロセスである。しかし、既存の手法の多くは発見を固定データセット上の教師あり学習に還元しており、限られた観測から複数の妥当なメカニズムが導かれても局所的適合に留まり一般化に失敗するという問題があった。この課題に対処するため、研究チームはLLM-AutoSciLabを提案した。これは、仮説生成と仮説条件付き実験選択およびメカニズム精緻化を結合した閉ループフレームワークである。

LLM-AutoSciLabは、受動的にデータを収集するのではなく、もっともらしい仮説を反復的に提案し、それらを区別または洗練するための情報量の多い実験を能動的に選択する。各実験の結果はシステム状態の更新に用いられ、次の仮説と実験の選択を導く。この能動的学習アプローチにより、データ効率が大幅に向上し、無情報な実験によるリソースの浪費を防ぐ。

フレームワークの評価のために、研究者らはActiveSciBenchを新たに導入した。このベンチマークは、57の酵素動力学タスクからなるActiveSciBench-Chemと、45の遺伝子制御ネットワークタスクからなるActiveSciBench-GRNの2つのデータセットで構成される。これらのタスクは、適応的な実験設計、変数選択、真のメカニズムの復元を必要とする予算制約付きの発見プロセスをモデル化している。

実験結果は、LLM-AutoSciLabが複数のベンチマークで従来手法を上回ることを示した。NewtonBenchでは記号的正確率67.6%、ActiveSciBench-Chemでは35.1%、ActiveSciBench-GRNでは正確なグラフ復元率31.1%を達成。さらに、仮説主導の実験設計により、サンプル効率は最強の競合ベースラインと比較して2～5倍向上した。これは、同じ実験予算の下でLLM-AutoSciLabがより迅速に正しい科学メカニズムを発見できることを意味する。

研究チームは、関連コードとデータをGitHubで公開しており、この分野のさらなる研究発展を促進する。LLM-AutoSciLabの成功は、LLMと能動学習を組み合わせることで科学発見を加速する大きな可能性を示しており、生物学から化学に至るまで、多くの分野での実験設計に変革をもたらすことが期待される。