藉助AI解釋與實驗,深入理解大腦
微軟研究院與合作者提出生成式因果測試(GCT),將黑箱模型轉化為可驗證的假設,揭示大腦特定區域對語言中不同概念的響應。
近年來,大型語言模型(LLM)在預測大腦對語言的反應方面表現出色,但其內部機制難以解讀,阻礙了科學理解。微軟研究院聯合加州大學伯克利分校、加州大學舊金山分校及哥倫比亞大學,提出生成式因果測試(GCT),旨在將黑箱模型轉化為可讀且可驗證的科學理論。
GCT分為兩步:首先,從預測單個腦區或體素的模型中提取最關鍵的短語,並由LLM總結為簡短的文字解釋,例如“食物準備”或“地點名稱”。隨後進入驗證階段,LLM根據這些解釋編寫全新的故事,讓受試者在功能磁共振成像(fMRI)掃描儀中聆聽。如果目標腦區對這些故事的響應顯著高於基線,則證明解釋正確。
實驗表明,GCT不僅確認了已知的腦區選擇性(如位置區域對應“地點”),還能區分相鄰但功能不同的區域。例如,壓後皮層(RSC)對專有地名(如“東京”)反應更強,而非一般位置。更令人興奮的是,GCT發現前額葉皮層中存在多個微小的“微區域”,分別對對話(如“説”和“告訴”)、時鐘時間(如“一點鐘”)和數值測量(如“50英尺”)高度敏感,這些發現此前從未被報道。
GCT的意義超越神經科學:它展示了黑箱模型並非科學解釋的終點,而是可以蒸餾出可實驗驗證的假説。這一“生成-驗證”循環有望加速大腦圖譜繪製,併為其他領域提供借鑑——當預測模型超過人類理解時,我們仍能通過恰當框架重建理論。該研究已發表於《自然·神經科學》。