畢馬威AI報告遭質疑:僅5%引用正確,成AI幻覺“活教材”
畢馬威(KPMG)2025年10月發佈的代理式AI報告被指存在大量虛假引用和事實錯誤。分析公司GPTZero稱,報告45條引用中僅5條正確,部分案例研究完全捏造。畢馬威已撤下報告並展開調查。
畢馬威(KPMG)在2025年10月發佈了一份題為《全體驗:在代理式AI時代重新定義卓越》的報告,旨在闡述代理式AI的奇妙之處。然而,這份報告近日被指成為了AI技術一項不太受歡迎的特性的演示——即憑空捏造事實。
研究機構GPTZero聲稱,對該報告的取證審查發現,其45條引用中僅有5條正確指向了所引來源,其餘引用要麼被篡改、存在誤導,要麼部分捏造或過於模糊而無法核實。GPTZero將這種現象稱為“氛圍引用”(vibe citing),類似於“氛圍編碼”(vibe coding),即生成式AI似乎將真實來源的片段拼湊在一起,編造標題或生成看起來令人信服的參考文獻,直到有人真正點擊它們。
GPTZero還指出,報告中近一半的事實性聲明是虛假的、缺乏支持或歸因於錯誤來源。一些聲稱展示代理式AI前沿部署的案例研究尤為“富有創意”。例如,報告提到瑞銀、瑞士聯邦鐵路和倫敦交通局採用了代理式AI,但GPTZero表示,支撐這些案例研究的來源要麼無法證實報告的説法,要麼包含削弱其可靠性的改動和釋義。
更具體的例子出現在報告第42頁:作者聲稱阿聯酋航空採用了一款名為Sara的移動聊天機器人,可以與乘客直接對話並更改航班。但GPTZero指出,這完全是錯誤的——Sara實際上是阿聯酋航空在2023年引入的實體機器人助手,並非聊天機器人,且不具備更改航班預訂的能力。
此外,報告還出現了與畢馬威自身研究相矛盾的情況。報告援引的數據稱55%的CEO將AI列為最優先投資項,而畢馬威同期發佈的2025年CEO展望中該數字實際為71%。
事件曝光後,畢馬威已從部分網站上撤下該報告,並啓動內部調查以查明報告是如何發佈的。畢馬威國際發言人表示:“畢馬威嚴肅對待其發佈內容的準確性和完整性。該報告已被撤回,我們正在審查其發佈的相關情況。我們要求所有員工遵守AI使用準則,包括人工監督以驗證內容和核實獨立來源。”
值得注意的是,諮詢行業此前已有類似問題。去年,德勤因一份由納税人資助的報告中出現了AI生成內容而被迫退還澳大利亞政府款項。這些事件再次引發了人們對諮詢公司在AI工具使用上責任感的質疑,尤其是在它們經常警告客户注意AI幻覺的背景下。正如GPTZero所言,畢馬威可能剛剛進行了一場“現場演示”。