LLMは知らないことを知らない:臨床テーブルデータにおけるクロスモデル帰属発散による認識論的ブラインドスポットの検出
Qwen 2.5 7BとXGBoostを臨床予測タスクで比較した研究により、LLMの言語化された信頼度は認識論的に空虚であり、逆難易度効果が存在し、少数ショットとSHAP特徴量の組み合わせが精度を向上させ、クロスモデルキャリブレータがキャリブレーション誤差を低減することが明らかになった。
大規模言語モデル(LLM)は構造化臨床データへの応用が進んでいるが、そのようなタスクにおいて自身の知識の限界を認識できるかどうかは未解明のままである。EIML@ICML 2026で採択された本論文では、クロスモデル帰属発散(Cross-Model Attribution Divergence)の観点からこの問題を研究し、構造化タスクにおける認識論的不確実性の低減を目指している。研究者らは、Qwen 2.5 7BとXGBoostを予測タスクで比較し、帰属発散分析を通じて4つの重要な発見を報告している。
第一に、LLMの言語化された信頼度は認識論的に空虚である:精度が49%であろうと75.3%であろうと、ほぼ一定の値(0.856~0.937)を出力し、実際には予測品質ではなくプロンプト形式を追跡している。第二に、LLMは逆難易度効果を示す:XGBoostが99%正解する場合、LLMの精度は64.8%に低下するが、XGBoostが中程度の不確実性の場合には同等の精度(73.8%対73.1%)を示す。第三に、少数ショット例とSHAP由来の特徴量は直交し、超加法的な介入効果を持つ:帰属不一致スコア(ADS)を1.54から0.38に低減し、訓練なしで精度を49%から75.3%に向上させる。第四に、帰属発散信号を用いてLLMの信頼性を判断するクロスモデルキャリブレータは、期待キャリブレーション誤差を0.254から0.080に低減し、モデル内部へのアクセスや反復推論を必要とせずに、情報量のない言語化された信頼度を患者固有の信頼性推定に置き換える。
研究者らはこれらの知見を、構造化データにおけるLLMのコールドスタート問題として位置づけ、真の認識論的自己認識への道筋を示している。本論文はAkshat Dasulaらによるもので、2026年6月17日にarXiv(番号2606.19509)に提出され、EIML@ICML 2026に採択された。この研究は、臨床応用におけるLLMの信頼性向上に貢献し、特にモデルが自身の限界を認識することが求められる場面で重要な示唆を与える。