2026-06-18站内改写1 分钟阅读更新: 2026-06-18

如果AI有意识，那么《帝国时代II》也有意识

微软研究员通过用山羊在《帝国时代II》中构建一个简单的神经网络，论证将LLM拟人化的荒谬，呼吁更严谨地评估AI能力。

来源Hacker News AI作者: chipotle_coyote

微软人工智能研究员Adrian de Wynter近日发表了一篇颇具颠覆性的论文，标题为《如果大语言模型具备人类属性，那么《帝国时代II》也具备》。他在经典即时战略游戏《帝国时代II》中，利用游戏自带的场景编辑器，通过“山羊”作为信号载体，搭建了一个最基本的1位感知机——这是神经网络的简化版本，与驱动ChatGPT、Claude等大语言模型的底层技术同源。

De Wynter在接受404 Media采访时表示，他的目的并非真的认为游戏具有意识，而是以此讽刺当前业界和公众对大语言模型的过度拟人化倾向。“这篇论文的核心在于，从形式上证明我们太容易将机器拟人化了，”他说，“有时我们对LLM能力的宣称过于武断。”他指出，他在《帝国时代II》中演示的感知机，与支撑现代AI的神经网络在本质上是相同的，只是复杂度不同。如果仅因为ChatGPT能生成类似人类的对话就认为它有意识，那么按同样逻辑，游戏中的山羊和关卡也应当被视为具有智慧。

De Wynter还调查了近两年315篇计算机科学论文，发现其中57%的论文在实验设计阶段就默认LLM具备人类特质，例如焦虑或道德感。他认为这种先入为主的假设从根本上影响了测试集设计、结果解读乃至零假设，最终扭曲了研究结论。“我们应当停止因为LLM用自然语言训练就假设它们像人类一样思考，”De Wynter说，“我们需要做的是看清它们的本来面目，而不是我们期望的样子。”

为了进一步佐证观点，De Wynter强调，人们之所以觉得LLM有智慧，很大程度上是因为聊天界面模拟了人类对话。他指出，如果把同样一个模型隐藏在《帝国时代II》的复杂关卡背后，拟人感就会消失。他呼吁AI公司应当明确披露模型的本性，并通过技术手段防止用户过度情感依赖。然而他也承认，在商业层面，拟人化是有效的营销手段——OpenAI、Anthropic等公司的高管屡屡暗示其模型具有意识，尽管整个行业仍在巨额亏损中挣扎。