臨床バイオマーカーを用いた説明可能な機械学習によるアルツハイマー病の早期検出:ADNIデータセットを用いたマルチクラス分類研究
新しい研究では、XGBoostモデルとADNIデータセットの8つの臨床指標を用いて、正常認知、軽度認知障害、アルツハイマー病の3クラス分類を高精度で実現し、マクロAUC 0.982、SHAP値による説明可能性を達成した。
アルツハイマー病(AD)は進行性の神経変性疾患であり、世界中で5500万人以上が罹患している。早期かつ正確な検出は病状の進行を遅らせるために極めて重要であるが、日常的な臨床評価から正常認知(NC)、軽度認知障害(MCI)、ADを区別することは依然として課題である。今回、arXivに発表された研究では、説明可能な機械学習手法を用いて、アルツハイマー病神経画像イニシアチブ(ADNI)の8つの臨床特徴量に基づくXGBoost分類器を構築し、高精度な3クラス分類を実現した。
使用された特徴量は、MMSE(ミニメンタルステート検査)、CDR Global(臨床認知症評価尺度全体スコア)、CDR-SB(CDRボックス合計)、MoCA(モントリオール認知評価)、FAQ(機能活動質問票)、年齢、性別、教育年数である。ハイパーパラメータはOptunaで最適化(50試行)され、クラス不均衡はSMOTEで対処された。モデル性能はマクロAUC-ROC、マクロF1、均衡精度、Cohenのκ係数で評価され、SHAP値により特徴量の説明可能性が提供された。
データセットは1641名のベースライン被験者(NC 608名、MCI 767名、AD 266名)で構成された。5分割交差検証では、平均マクロAUC 0.983(SD 0.007)、精度0.944(SD 0.006)、マクロF1 0.929(SD 0.008)を記録。ホールドアウトテストセット(n=247)では、マクロAUC 0.982(95%信頼区間:0.965-0.995)、精度0.943、均衡精度0.932、マクロF1 0.927、Cohenのκ係数0.909を達成した。これらの結果は、モデルが3クラスを高精度に識別できることを示している。
SHAP分析により、CDR GlobalがNCとMCIの分類において最も重要な予測因子であり、CDR-SBとMMSEがAD分類を共同で駆動することが明らかになった。このパターンは臨床的に妥当であり、CDR Globalは認知障害の重症度評価に、CDR-SBとMMSEはより包括的な認知機能評価に用いられることと一致する。研究者らは、これらの結果がモデルの臨床的有効性を支持し、医師に解釈可能な診断根拠を提供すると述べている。
本研究の意義は、日常的な臨床評価に基づく説明可能な機械学習モデルが、ほぼ完全な3クラスAD検出を達成した点にある。将来的には、音声バイオマーカーをフレームワークに統合し、マルチモーダル検出システムを構築することで、早期診断の精度と信頼性をさらに向上させる計画である。この研究は、ADの早期検出における効率的で解釈可能な機械学習手法の可能性を示しており、臨床実践への応用が期待される。