AI News HubLIVE
站内改写1 分鐘閱讀

如果AI有意識,那麼《帝國時代II》也有意識

微軟研究員透過用山羊在《帝國時代II》中構建一個簡單的神經網路,論證將LLM擬人化的荒謬,呼籲更嚴謹地評估AI能力。

來源Hacker News AI作者: chipotle_coyote

微軟人工智慧研究員Adrian de Wynter近日發表了一篇頗具顛覆性的論文,標題為《如果大語言模型具備人類屬性,那麼《帝國時代II》也具備》。他在經典即時戰略遊戲《帝國時代II》中,利用遊戲自帶的場景編輯器,透過“山羊”作為訊號載體,搭建了一個最基本的1位感知機——這是神經網路的簡化版本,與驅動ChatGPT、Claude等大語言模型的底層技術同源。

De Wynter在接受404 Media採訪時表示,他的目的並非真的認為遊戲具有意識,而是以此諷刺當前業界和公眾對大語言模型的過度擬人化傾向。“這篇論文的核心在於,從形式上證明我們太容易將機器擬人化了,”他說,“有時我們對LLM能力的宣稱過於武斷。”他指出,他在《帝國時代II》中演示的感知機,與支撐現代AI的神經網路在本質上是相同的,只是複雜度不同。如果僅因為ChatGPT能生成類似人類的對話就認為它有意識,那麼按同樣邏輯,遊戲中的山羊和關卡也應當被視為具有智慧。

De Wynter還調查了近兩年315篇電腦科學論文,發現其中57%的論文在實驗設計階段就預設LLM具備人類特質,例如焦慮或道德感。他認為這種先入為主的假設從根本上影響了測試集設計、結果解讀乃至零假設,最終扭曲了研究結論。“我們應當停止因為LLM用自然語言訓練就假設它們像人類一樣思考,”De Wynter說,“我們需要做的是看清它們的本來面目,而不是我們期望的樣子。”

為了進一步佐證觀點,De Wynter強調,人們之所以覺得LLM有智慧,很大程度上是因為聊天介面模擬了人類對話。他指出,如果把同樣一個模型隱藏在《帝國時代II》的複雜關卡背後,擬人感就會消失。他呼籲AI公司應當明確披露模型的本性,並透過技術手段防止使用者過度情感依賴。然而他也承認,在商業層面,擬人化是有效的營銷手段——OpenAI、Anthropic等公司的高管屢屢暗示其模型具有意識,儘管整個行業仍在鉅額虧損中掙扎。