AI News HubLIVE
站内改写1 分鐘閱讀

大語言模型不知其所不知:透過跨模型歸因分歧檢測臨床表格資料中的認知盲點

本研究比較了Qwen 2.5 7B和XGBoost在臨床預測任務中的表現,透過歸因分歧分析揭示了四個重要發現:LLM的口頭置信度在認識論上是空洞的,存在逆向難度效應,少樣本示例和SHAP特徵證據的結合可顯著提升準確率,且跨模型校準器能有效降低校準誤差。

來源arXiv AI作者: Akshat Dasula, Prasanna Desikan, Jaideep Srivastava

大語言模型(LLM)越來越多地被應用於結構化臨床資料,但它們能否識別自身知識在這些任務中的侷限性仍是一個未解之謎。一篇被EIML@ICML 2026接收的論文透過跨模型歸因分歧(Cross-Model Attribution Divergence)的方式研究了這一問題,旨在減少結構化任務中的認知不確定性。研究者將Qwen 2.5 7B與XGBoost在一個預測任務上進行了比較,透過歸因分歧分析得出了四項關鍵發現。

首先,LLM的口頭置信度在認識論上是空洞的:無論準確率是49%還是75.3%,它都輸出近乎恆定的數值(0.856–0.937),實際上追蹤的是提示格式而非預測質量。其次,LLM表現出逆向難度效應:當XGBoost以99%的正確率判斷時,LLM的準確率下降至64.8%;但當XGBoost中等不確定時,LLM的表現與之相當(73.8%對73.1%)。第三,少樣本示例和SHAP匯出的特徵證據是正交且超可加的干預措施:它們將歸因分歧得分(ADS)從1.54降至0.38,並在無需訓練的情況下將準確率從49%提升至75.3%。第四,一個利用歸因分歧訊號判斷LLM可靠性的跨模型校準器,將預期校準誤差從0.254降至0.080,用患者特定的可靠性估計取代了無資訊量的口頭置信度,且無需訪問模型內部或重複推理。

研究者將這些發現框定為LLM在結構化資料上的冷啟動問題,並勾勒出一條通往真正認知自我意識的路徑。該論文的作者包括Akshat Dasula等,於2026年6月17日提交至arXiv(編號2606.19509),並被EIML@ICML 2026接收。該研究為臨床應用中LLM的可靠部署提供了重要啟示,特別是在需要模型自知之明的場景下。