AI News HubLIVE
站內改寫1 分鐘閱讀

這個AI知道答案,但不理解問題

幾十年來,心理學家一直在爭論人類思維能否用統一理論解釋。一個名為Centaur的AI模型曾聲稱能模擬160種認知任務,但新研究表明它可能只是過擬合,並非真正理解。

幾十年來,心理學家一直爭論人類的心靈能否用一個統一的理論來解釋,還是需要將記憶、注意力等功能分開研究。現在,人工智能也加入了這場辯論,為探索思維的運作機制提供了新途徑。

2025年7月,一項發表在《自然》雜誌上的研究介紹了一個名為“Centaur”的AI模型。該模型基於標準的大語言模型構建,並利用心理學實驗數據進行微調,旨在模擬人類的認知行為。據報道,Centaur在160項任務中表現出色,包括決策、執行控制和其他心理過程。這些結果引起了廣泛關注,被視為朝着更全面地複製人類思維的AI系統邁出的可能一步。

然而,最近發表在《國家科學開放》上的一項研究對這些説法提出了質疑。浙江大學的研究人員認為,Centaur表面上的成功可能源於過擬合。換句話説,該模型可能並非理解任務,而是學會了識別訓練數據中的模式並重現預期答案。

為了檢驗這一想法,研究人員設計了幾種新的評估場景。在一個實驗中,他們將原本描述具體心理任務的多個選擇提示替換為“請選擇選項A”的指令。如果模型真正理解任務,它應該始終選擇選項A。但Centaur卻依然選擇了原始數據集中的“正確選項”。這種行為表明,模型並沒有理解問題的含義,而是依靠習得的統計模式來“猜測”答案。研究人員將此比作一個通過死記硬背考試格式而取得好成績、但實際上並未理解材料的學生。

這些發現凸顯了評估大語言模型能力時需要謹慎。雖然這些系統能夠高效地擬合數據,但其“黑箱”特性使得人們難以知道它們是如何得出輸出的。這可能導致幻覺或誤解等問題。精心設計且多樣化的測試對於判斷一個模型是否真正具備其看似展示的技能至關重要。

儘管Centaur被描述為一個能夠模擬認知的模型,但它最大的侷限似乎在於語言理解。具體來説,它在識別和回應問題背後的意圖方面存在困難。該研究指出,實現真正的語言理解可能是開發更完整地模擬人類認知的AI系統所面臨的最重要挑戰之一。