2026-06-18站内改写1 分鐘閱讀更新: 2026-06-18

如果AI有意識，那麼《帝國時代II》也有意識

微軟研究員透過用山羊在《帝國時代II》中構建一個簡單的神經網路，論證將LLM擬人化的荒謬，呼籲更嚴謹地評估AI能力。

來源Hacker News AI作者: chipotle_coyote

微軟人工智慧研究員Adrian de Wynter近日發表了一篇頗具顛覆性的論文，標題為《如果大語言模型具備人類屬性，那麼《帝國時代II》也具備》。他在經典即時戰略遊戲《帝國時代II》中，利用遊戲自帶的場景編輯器，透過“山羊”作為訊號載體，搭建了一個最基本的1位感知機——這是神經網路的簡化版本，與驅動ChatGPT、Claude等大語言模型的底層技術同源。

De Wynter在接受404 Media採訪時表示，他的目的並非真的認為遊戲具有意識，而是以此諷刺當前業界和公眾對大語言模型的過度擬人化傾向。“這篇論文的核心在於，從形式上證明我們太容易將機器擬人化了，”他說，“有時我們對LLM能力的宣稱過於武斷。”他指出，他在《帝國時代II》中演示的感知機，與支撐現代AI的神經網路在本質上是相同的，只是複雜度不同。如果僅因為ChatGPT能生成類似人類的對話就認為它有意識，那麼按同樣邏輯，遊戲中的山羊和關卡也應當被視為具有智慧。

De Wynter還調查了近兩年315篇電腦科學論文，發現其中57%的論文在實驗設計階段就預設LLM具備人類特質，例如焦慮或道德感。他認為這種先入為主的假設從根本上影響了測試集設計、結果解讀乃至零假設，最終扭曲了研究結論。“我們應當停止因為LLM用自然語言訓練就假設它們像人類一樣思考，”De Wynter說，“我們需要做的是看清它們的本來面目，而不是我們期望的樣子。”

為了進一步佐證觀點，De Wynter強調，人們之所以覺得LLM有智慧，很大程度上是因為聊天介面模擬了人類對話。他指出，如果把同樣一個模型隱藏在《帝國時代II》的複雜關卡背後，擬人感就會消失。他呼籲AI公司應當明確披露模型的本性，並透過技術手段防止使用者過度情感依賴。然而他也承認，在商業層面，擬人化是有效的營銷手段——OpenAI、Anthropic等公司的高管屢屢暗示其模型具有意識，儘管整個行業仍在鉅額虧損中掙扎。