AI News HubLIVE
站内改写1 分钟阅读

这个AI知道答案,但不理解问题

几十年来,心理学家一直在争论人类思维能否用统一理论解释。一个名为Centaur的AI模型曾声称能模拟160种认知任务,但新研究表明它可能只是过拟合,并非真正理解。

几十年来,心理学家一直争论人类的心灵能否用一个统一的理论来解释,还是需要将记忆、注意力等功能分开研究。现在,人工智能也加入了这场辩论,为探索思维的运作机制提供了新途径。

2025年7月,一项发表在《自然》杂志上的研究介绍了一个名为“Centaur”的AI模型。该模型基于标准的大语言模型构建,并利用心理学实验数据进行微调,旨在模拟人类的认知行为。据报道,Centaur在160项任务中表现出色,包括决策、执行控制和其他心理过程。这些结果引起了广泛关注,被视为朝着更全面地复制人类思维的AI系统迈出的可能一步。

然而,最近发表在《国家科学开放》上的一项研究对这些说法提出了质疑。浙江大学的研究人员认为,Centaur表面上的成功可能源于过拟合。换句话说,该模型可能并非理解任务,而是学会了识别训练数据中的模式并重现预期答案。

为了检验这一想法,研究人员设计了几种新的评估场景。在一个实验中,他们将原本描述具体心理任务的多个选择提示替换为“请选择选项A”的指令。如果模型真正理解任务,它应该始终选择选项A。但Centaur却依然选择了原始数据集中的“正确选项”。这种行为表明,模型并没有理解问题的含义,而是依靠习得的统计模式来“猜测”答案。研究人员将此比作一个通过死记硬背考试格式而取得好成绩、但实际上并未理解材料的学生。

这些发现凸显了评估大语言模型能力时需要谨慎。虽然这些系统能够高效地拟合数据,但其“黑箱”特性使得人们难以知道它们是如何得出输出的。这可能导致幻觉或误解等问题。精心设计且多样化的测试对于判断一个模型是否真正具备其看似展示的技能至关重要。

尽管Centaur被描述为一个能够模拟认知的模型,但它最大的局限似乎在于语言理解。具体来说,它在识别和回应问题背后的意图方面存在困难。该研究指出,实现真正的语言理解可能是开发更完整地模拟人类认知的AI系统所面临的最重要挑战之一。