AI News HubLIVE
站内改写1 分钟阅读

如果AI有意识,那么《帝国时代II》也有意识

微软研究员通过用山羊在《帝国时代II》中构建一个简单的神经网络,论证将LLM拟人化的荒谬,呼吁更严谨地评估AI能力。

来源Hacker News AI作者: chipotle_coyote

微软人工智能研究员Adrian de Wynter近日发表了一篇颇具颠覆性的论文,标题为《如果大语言模型具备人类属性,那么《帝国时代II》也具备》。他在经典即时战略游戏《帝国时代II》中,利用游戏自带的场景编辑器,通过“山羊”作为信号载体,搭建了一个最基本的1位感知机——这是神经网络的简化版本,与驱动ChatGPT、Claude等大语言模型的底层技术同源。

De Wynter在接受404 Media采访时表示,他的目的并非真的认为游戏具有意识,而是以此讽刺当前业界和公众对大语言模型的过度拟人化倾向。“这篇论文的核心在于,从形式上证明我们太容易将机器拟人化了,”他说,“有时我们对LLM能力的宣称过于武断。”他指出,他在《帝国时代II》中演示的感知机,与支撑现代AI的神经网络在本质上是相同的,只是复杂度不同。如果仅因为ChatGPT能生成类似人类的对话就认为它有意识,那么按同样逻辑,游戏中的山羊和关卡也应当被视为具有智慧。

De Wynter还调查了近两年315篇计算机科学论文,发现其中57%的论文在实验设计阶段就默认LLM具备人类特质,例如焦虑或道德感。他认为这种先入为主的假设从根本上影响了测试集设计、结果解读乃至零假设,最终扭曲了研究结论。“我们应当停止因为LLM用自然语言训练就假设它们像人类一样思考,”De Wynter说,“我们需要做的是看清它们的本来面目,而不是我们期望的样子。”

为了进一步佐证观点,De Wynter强调,人们之所以觉得LLM有智慧,很大程度上是因为聊天界面模拟了人类对话。他指出,如果把同样一个模型隐藏在《帝国时代II》的复杂关卡背后,拟人感就会消失。他呼吁AI公司应当明确披露模型的本性,并通过技术手段防止用户过度情感依赖。然而他也承认,在商业层面,拟人化是有效的营销手段——OpenAI、Anthropic等公司的高管屡屡暗示其模型具有意识,尽管整个行业仍在巨额亏损中挣扎。