AI神経科学の構築:原子からビットへ
この記事では、AI科学者エージェントを用いて神経科学の研究を加速するビジョンを探る。著者は、脳のアトラス、デジタルツインの構築、および実際の被験者による検証を組み合わせることで、研究効率を大幅に向上できると指摘する。また、資金提供者が優先すべきプロジェクトの種類についても提言している。
神経科学は、大学の小規模ラボによって推進され、緻密に進行します。ポスドクや大学院生が10年かけてプロジェクトを遂行することも珍しくありません。この研究は、神経変性疾患の治療や知能の理解の種を提供する可能性があります。どのように神経科学を加速できるでしょうか?
AI科学者エージェント——文献を読み、仮説を生成し、データを読み、分析コードを書き、実験を設計するシステム——を使って脳と行動を研究できれば、直接あるいはアトラスやデジタルツインにコンパイルすることで、神経科学を大幅に加速できる可能性があります。『Machines of Loving Grace』でDario Amodeiは、高度なAIがデータセンター内の天才たちの国のように振る舞い、知能の科学を構築し、すべての神経精神疾患を治すために急速な進歩を遂げると述べています。これらは高尚な目標ですが、そのエッセイはどのように到達するかを教えてくれません。ここでは、AI神経科学を構築する方法と資金提供者が優先すべきことを描きます。
AI科学者は、すでに形になりつつあるAI科学者エージェントの特別なインスタンスです。2026年5月のNature誌は、生物医学科学で経験的ソフトウェアの作成と仮説検証に使用される3つのシステムを特集しました。大まかに言えば、これらのシステムは、コンテキスト、メモリ、スキルへのアクセスを管理するエージェントハーネスを備えたLLMです。それらはClaude CodeやOpenAI Codexのようなコーディングエージェントと同様にアーキテクチャされており、最終成果物はソフトウェアやウェブサイトではなく、分析から得られた洞察です。
現在、AI科学者の自律性は限られていますが、LLMの能力が成長するにつれて、コーディングエージェントで見られたように、より有能になると予想されます。しかし、神経科学に高度に特化したスキルを構築するには、基本的なボトルネックが残ります。これには、ベースモデルのスループットに合わせるために、単一ラボの範囲を超えるデータとソフトウェア工学が必要になるでしょう。
AI科学者は科学分野で比較的汎用的ですが、調査する対象が異なります。従来の神経科学者とAI神経科学者の対象は脳と行動です。コードや数学のような検証可能な領域とは異なり、エージェントは仮説を迅速かつ安価にテストできますが、脳と行動に関する実験の実行は高価です。進歩するためには、脳と行動の研究を可能な限り原子の世界からビットの世界に移す必要があります。つまり、アトラスの収集、デジタルツインの構築、そして実際の被験者での仮説駆動型実験によるループの閉鎖です。
静的データセットがAI神経科学者にとって有用であるためには、アトラスのレベルに達する必要があります。つまり、高カバレッジで高エントロピーの脳地図であり、元の実験デザイナーが予想した以上の疑問に答えられるものです。自然シーンデータセット、Allen Brain Cell Atlas、FlyWireは、それぞれfMRI、トランスクリプトミクス、コネクトミクスにおける最近の例です。これらのデータセットは完全性を念頭に収集され、それぞれのドメインの代表的なサンプル(FlyWireの場合は完全なドメイン)を含んでいます。FAIR原則に従って配布され、高度に注釈が付けられ、オープンプラットフォームで配布され、サンプルコードとプログラムによるアクセスが提供されます。
静的データセットだけでは、仮説実験を実行できません。そのためには、データをデジタルツインにコンパイルして、異なる入力や条件がシステムにどのように影響するかを予測できるようにする必要があります。神経科学では、このデジタルツインは通常、神経データを模倣するように直接訓練されたニューラルネット、またはデータによってアンカーされた生物物理シミュレーションです。ここでの重要な指標は予測妥当性です。つまり、関心のある値に対するツインの予測と実際の生物における同じ現象との相関であり、理想的には分布外で測定されます。
安価な実験プロキシは無数の介入をふるいにかけることを可能にしますが、予測妥当性が高い場合にのみ有効です。薬物発見では、Scannellら(2022)は、予測妥当性(Spearman ρ、0から1の値)を0.1向上させることが、数桁多くの化合物をスキャンするよりも優れていると主張しています。高い予測妥当性を持つモデルを目指すべきであり、これは因果操作を含む大量の高エントロピーデータをモデルにフィッティングすることで達成できます。
従来の神経科学者を、クラウドで実行される疲れを知らないAI神経科学者に置き換えても、従来の被験者での従来の実験は速くなりません。実際、ボトルネックはデータ分析からデータ収集に移ります。実際の被験者での真のスピードアップを見るために、2つの経路が予見されます。AI神経科学者が、実際の被験者で実行するより良い、より識別力のある実験を考案すること、あるいは実験室の自動化を通じてAI神経科学者がより速く実験を実行することです。今後数年間は、仮説駆動型の実際の被験者実験がボトルネックであり続けるでしょう。これらの貴重なリソースを、アトラスとデジタルツインに基づいてAI神経科学者が行った予測の検証に集中させるべきであり、これによりより良いモデルを生み出す好循環が生まれます。
今後数年間でAI神経科学がどのように進歩するかというこのモデルを考慮すると、資金提供者はバリューチェーンにおける高レバレッジポイントに注意を向けるべきです。すなわち、アトラスのレベルに達するデータ、アトラス構築のためのより良い神経技術、より良いデジタルツイン、より良いベンチマークです。ポストAGIの未来を計画するということは、広範な結果を考慮することを意味し、ギザギザのフロンティアの異なるセクションが予測不可能な順序で崩れるでしょう。何よりも、優れたプロジェクトには、研究の“味”と呼ばれるものに導かれた長期的なビジョンがあります。