2026-06-04 12:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

利用臨牀生物標誌物的可解釋機器學習早期檢測阿爾茨海默病：基於ADNI數據集的多分類研究

一項新研究利用XGBoost模型和八種常規臨牀指標，在ADNI數據集上實現了對正常認知、輕度認知障礙和阿爾茨海默病的高精度三分類檢測，宏AUC達到0.982，並通過SHAP值提供了可解釋性。

來源arXiv Machine Learning作者: Afshan Hashmi

阿爾茨海默病（AD）是一種進行性神經退行性疾病，全球超過5500萬人受其影響。早期準確的檢測對於延緩疾病進展、改善患者生活質量至關重要。然而，從常規臨牀評估中區分正常認知（NC）、輕度認知障礙（MCI）和AD仍然是一個挑戰。近日，一篇發表在arXiv上的研究提出了一種基於可解釋機器學習的方法，利用XGBoost分類器和來自阿爾茨海默病神經影像學倡議（ADNI）的八項臨牀特徵，實現了高精度的三分類檢測。

該研究使用的特徵包括簡易精神狀態檢查（MMSE）、臨牀痴呆評定量表（CDR）整體評分、CDR評分盒總和（CDR-SB）、蒙特利爾認知評估（MoCA）、功能活動問卷（FAQ）、年齡、性別和教育水平。研究者採用Optuna進行超參數優化（50次試驗），並通過SMOTE技術處理類別不平衡問題。模型性能通過宏AUC-ROC、宏F1、平衡準確率和Cohen's kappa進行評估，同時使用SHAP值提供特徵級別的可解釋性。

數據集包含1641名基線受試者（608名NC、767名MCI、266名AD）。在五折交叉驗證中，模型平均宏AUC為0.983（標準差0.007），準確率0.944（標準差0.006），宏F1為0.929（標準差0.008）。在獨立的測試集（n=247）上，宏AUC達到0.982（95%置信區間：0.965-0.995），準確率0.943，平衡準確率0.932，宏F1為0.927，Cohen's kappa為0.909。這些結果表明，模型在區分三個類別上具有極高的準確性。

SHAP分析揭示了臨牀合理的特徵重要性模式：CDR整體評分是區分NC和MCI的主要預測因子，而CDR-SB和MMSE共同驅動AD的分類。這一發現與臨牀實踐相符，因為CDR整體評分常用於評估認知障礙的嚴重程度，而CDR-SB和MMSE則更全面地反映認知功能。研究者指出，這些結果不僅驗證了模型的臨牀有效性，也為醫生提供了可解釋的診斷依據。

該研究的意義在於，基於常規臨牀評估即可實現近乎完美的三分類檢測，具有重要的臨牀應用潛力。未來，研究者計劃將語音生物標誌物納入框架，構建多模態檢測系統，進一步提升早期診斷的準確性和可靠性。綜上所述，這項研究為AD的早期檢測提供了一種高效、可解釋的機器學習方法，有望在臨牀實踐中得到廣泛應用。