AI News HubLIVE
站内改写2 分で読了

ヒトゲノムの絡み合う物理性がAIを困惑させる理由

ヒトゲノムは単純な設計図やアルゴリズムではなく、転写因子、エンハンサー、クロマチンループ、エピジェネティック修飾などの複雑なメカニズムを通じて遺伝子発現を制御する、複雑で動的な三次元構造です。この複雑さは、単純な入出力関係を前提とするAIモデルにとって困難を引き起こします。

ソースHacker News AI著者: tzury

1950年代にDNAの分子構造が解明されて以来、多くの生物学者はDNAを生命の秘密として称賛してきました。彼らはゲノム(生物の細胞内の遺伝情報)を設計図やコード、あるいはコンピュータと見なしてきました。しかし、研究が進むにつれて、ヒトゲノムは近づくほど難しくなるパズルであることが明らかになりました。2003年に完了したヒトゲノム計画により、ゲノムのわずか2%がタンパク質をコードする遺伝子で構成されていることが示されました。残りの98%はかつて「ジャンクDNA」と考えられていましたが、現在では遺伝子調節に重要な役割を果たすことがわかっています。

遺伝子調節は、いつ、どこで、どのように遺伝子が発現するかを決定します。筋肉、脳、皮膚など、体内の異なる細胞タイプはすべて同じDNAから作られますが、異なる遺伝子発現パターンによって機能分化を実現します。このプロセスには、転写因子、エンハンサー、クロマチンループ、エピジェネティック修飾などが関与し、高度に動的で局所的な制御ネットワークを形成します。

従来の見解では、転写因子は鍵のようにDNA上の特定の結合部位に結合して転写を開始するとされていました。しかし、ヒトなどの複雑な生物では、転写因子の結合特異性は低く、通常は組み合わせて機能し、「OR」論理ではなく「AND」論理を生み出します。エンハンサーは転写因子の集積点ですが、ヒトゲノムには数百万ものエンハンサーが存在する可能性があり、各遺伝子は複数のエンハンサーによって制御され、各エンハンサーも複数の遺伝子に影響を与える可能性があります。さらに困惑させるのは、多くのエンハンサーが標的遺伝子から数百万塩基対離れた領域に位置し、クロマチンループによってのみ接触できることです。

クロマチンの三次元構造は遺伝子調節の中心です。コヒーシンなどのタンパク質によるループ押し出しにより、DNAはトポロジカル会合ドメイン(TAD)を形成し、共調節される遺伝子をまとめます。クロマチンは凝縮したヘテロクロマチン(通常はサイレンシング)と緩いユークロマチン(通常は活性)に分かれます。さらに、エピジェネティック修飾(ヒストン修飾やDNAメチル化など)はクロマチンのパッケージングを変化させ、遺伝子のアクセシビリティに影響を与えます。これらの修飾は細胞分裂時にもコピーされ、「記憶」を形成します。

Evo 2、Genos、AlphaGenomeなどのAIモデルは、大量のゲノムデータを学習し、DNA配列の差異が生物学的プロセスに与える影響を予測しようとしています。しかし、これらのモデルは通常、ゲノムを線形コードと仮定し、その物理的な三次元構造や動的な変化を無視しています。例えば、クロマチンループの一過性、転写凝集体の液-液相分離特性、細胞間の調節の不均一性をシミュレートすることは困難です。生物学者は、ゲノムは絡み合った物理的実体であり、その挙動は空間的・時間的複雑相互作用に依存するため、現在のAIの単純化した仮定の範囲を超えていると指摘しています。

結論として、ヒトゲノムの調節の複雑さは、パターン認識に基づくAI手法では生命の働きを真に理解できない可能性があることを示しています。この謎を解くには、三次元ゲノム学、動力学、エピジェネティクスの新しい視点を統合する必要があり、単により強力な計算モデルだけでは不十分でしょう。