2026-06-20站内改写2 分で読了更新: 2026-06-20

ヒトゲノムの絡み合う物理性がAIを困惑させる理由

ヒトゲノムは単純な設計図やアルゴリズムではなく、転写因子、エンハンサー、クロマチンループ、エピジェネティック修飾などの複雑なメカニズムを通じて遺伝子発現を制御する、複雑で動的な三次元構造です。この複雑さは、単純な入出力関係を前提とするAIモデルにとって困難を引き起こします。

ソースHacker News AI著者: tzury

記事インテリジェンス

エンジニア上級

要点

ヒトゲノムは設計図ではなく、絡み合った動的な物理的実体です。
ゲノムのわずか2%がタンパク質をコードし、残りは複雑な調節に関与しています。
Evo 2やAlphaGenomeのようなAIモデルは、ゲノムの微妙な調節ロジックを捉えるのに苦労するかもしれません。
遺伝子調節を理解するには、クロマチンの三次元構造とエピジェネティックマークの研究が必要です。

重要な理由

このニュースが重要なのは、ヒトゲノムは設計図ではなく、絡み合った動的な物理的実体ですためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

1950年代にDNAの分子構造が解明されて以来、多くの生物学者はDNAを生命の秘密として称賛してきました。彼らはゲノム（生物の細胞内の遺伝情報）を設計図やコード、あるいはコンピュータと見なしてきました。しかし、研究が進むにつれて、ヒトゲノムは近づくほど難しくなるパズルであることが明らかになりました。2003年に完了したヒトゲノム計画により、ゲノムのわずか2％がタンパク質をコードする遺伝子で構成されていることが示されました。残りの98％はかつて「ジャンクDNA」と考えられていましたが、現在では遺伝子調節に重要な役割を果たすことがわかっています。

遺伝子調節は、いつ、どこで、どのように遺伝子が発現するかを決定します。筋肉、脳、皮膚など、体内の異なる細胞タイプはすべて同じDNAから作られますが、異なる遺伝子発現パターンによって機能分化を実現します。このプロセスには、転写因子、エンハンサー、クロマチンループ、エピジェネティック修飾などが関与し、高度に動的で局所的な制御ネットワークを形成します。

従来の見解では、転写因子は鍵のようにDNA上の特定の結合部位に結合して転写を開始するとされていました。しかし、ヒトなどの複雑な生物では、転写因子の結合特異性は低く、通常は組み合わせて機能し、「OR」論理ではなく「AND」論理を生み出します。エンハンサーは転写因子の集積点ですが、ヒトゲノムには数百万ものエンハンサーが存在する可能性があり、各遺伝子は複数のエンハンサーによって制御され、各エンハンサーも複数の遺伝子に影響を与える可能性があります。さらに困惑させるのは、多くのエンハンサーが標的遺伝子から数百万塩基対離れた領域に位置し、クロマチンループによってのみ接触できることです。

クロマチンの三次元構造は遺伝子調節の中心です。コヒーシンなどのタンパク質によるループ押し出しにより、DNAはトポロジカル会合ドメイン（TAD）を形成し、共調節される遺伝子をまとめます。クロマチンは凝縮したヘテロクロマチン（通常はサイレンシング）と緩いユークロマチン（通常は活性）に分かれます。さらに、エピジェネティック修飾（ヒストン修飾やDNAメチル化など）はクロマチンのパッケージングを変化させ、遺伝子のアクセシビリティに影響を与えます。これらの修飾は細胞分裂時にもコピーされ、「記憶」を形成します。

Evo 2、Genos、AlphaGenomeなどのAIモデルは、大量のゲノムデータを学習し、DNA配列の差異が生物学的プロセスに与える影響を予測しようとしています。しかし、これらのモデルは通常、ゲノムを線形コードと仮定し、その物理的な三次元構造や動的な変化を無視しています。例えば、クロマチンループの一過性、転写凝集体の液-液相分離特性、細胞間の調節の不均一性をシミュレートすることは困難です。生物学者は、ゲノムは絡み合った物理的実体であり、その挙動は空間的・時間的複雑相互作用に依存するため、現在のAIの単純化した仮定の範囲を超えていると指摘しています。

結論として、ヒトゲノムの調節の複雑さは、パターン認識に基づくAI手法では生命の働きを真に理解できない可能性があることを示しています。この謎を解くには、三次元ゲノム学、動力学、エピジェネティクスの新しい視点を統合する必要があり、単により強力な計算モデルだけでは不十分でしょう。