AI News HubLIVE
站内改写2 分鐘閱讀

人類基因組纏繞的物理特性為何可能讓AI困惑

人類基因組並非簡單的藍圖或算法,而是一個複雜、動態的三維結構,通過轉錄因子、增強子、染色質環和表觀遺傳修飾等精細機制調控基因表達。這種複雜性對假設簡單輸入輸出關係的AI模型構成了挑戰。

來源Hacker News AI作者: tzury

自20世紀50年代DNA分子結構被揭示以來,許多生物學家將DNA視為生命的秘密。他們將基因組(生物細胞中存儲的遺傳信息)解讀為藍圖、代碼或計算機。然而,隨着研究的深入,人類基因組更像是一個拼圖,越接近越困難。2003年完成的人類基因組計劃顯示,僅有約2%的基因組由編碼蛋白質的基因組成,其餘98%曾被認為是“垃圾DNA”,但現在發現它們參與基因調控的關鍵過程。

基因調控決定了哪些基因在何時、何地以及如何表達。人體中不同類型的細胞(如肌肉、腦、皮膚)均源自相同的DNA,但通過不同的基因表達模式實現功能分化。這一過程涉及轉錄因子、增強子、染色質環和表觀遺傳修飾等多種機制,它們相互作用,形成一個高度動態和局部的調控網絡。

傳統觀點認為,轉錄因子像鑰匙一樣與DNA上的特定結合位點結合,啓動轉錄。但在人類等複雜生物中,轉錄因子的結合特異性較低,且通常以組合形式發揮作用,產生“與”邏輯而非簡單的“或”邏輯。增強子是轉錄因子的聚集點,但人類基因組中可能存在數百萬個增強子,每個基因可能受多個增強子調控,而每個增強子也可能影響多個基因。更令人困惑的是,許多增強子位於距離目標基因數百萬個核苷酸之外的遠端區域,通過染色質環化才能與基因接觸。

染色質的三維結構是基因調控的核心。通過凝聚素(cohesin)等蛋白質的環擠壓作用,DNA形成拓撲關聯結構域(TAD),將共調控的基因聚集在一起。染色質還分為緊密的異染色質(通常沉默)和鬆散的常染色質(通常活躍)。此外,表觀遺傳標記(如組蛋白修飾和DNA甲基化)可以改變染色質的包裝狀態,從而影響基因的可及性。這些標記在細胞分裂時也會被複制,形成一種“記憶”。

AI模型如Evo 2、Genos和AlphaGenome被訓練處理大量基因組數據,試圖預測DNA序列差異對生物學過程的影響。然而,這些模型通常假設基因組是一個線性代碼,忽略了其物理三維結構和動態變化。例如,它們難以模擬染色質環的瞬時性、轉錄聚集體的液-液相分離特性,以及不同細胞間調控的異質性。生物學家指出,基因組更像是一個糾纏的物理實體,其行為依賴於空間和時間上的複雜相互作用,這超出了當前AI的簡化假設。

總之,人類基因組的調控複雜性可能使得基於模式識別的AI方法無法真正理解生命的運作。要破解這一謎題,需要整合三維基因組學、動力學和表觀遺傳學的新視角,而不僅僅是更強大的計算模型。