利用臨牀生物標誌物的可解釋機器學習早期檢測阿爾茨海默病:基於ADNI數據集的多分類研究
一項新研究利用XGBoost模型和八種常規臨牀指標,在ADNI數據集上實現了對正常認知、輕度認知障礙和阿爾茨海默病的高精度三分類檢測,宏AUC達到0.982,並通過SHAP值提供了可解釋性。
阿爾茨海默病(AD)是一種進行性神經退行性疾病,全球超過5500萬人受其影響。早期準確的檢測對於延緩疾病進展、改善患者生活質量至關重要。然而,從常規臨牀評估中區分正常認知(NC)、輕度認知障礙(MCI)和AD仍然是一個挑戰。近日,一篇發表在arXiv上的研究提出了一種基於可解釋機器學習的方法,利用XGBoost分類器和來自阿爾茨海默病神經影像學倡議(ADNI)的八項臨牀特徵,實現了高精度的三分類檢測。
該研究使用的特徵包括簡易精神狀態檢查(MMSE)、臨牀痴呆評定量表(CDR)整體評分、CDR評分盒總和(CDR-SB)、蒙特利爾認知評估(MoCA)、功能活動問卷(FAQ)、年齡、性別和教育水平。研究者採用Optuna進行超參數優化(50次試驗),並通過SMOTE技術處理類別不平衡問題。模型性能通過宏AUC-ROC、宏F1、平衡準確率和Cohen's kappa進行評估,同時使用SHAP值提供特徵級別的可解釋性。
數據集包含1641名基線受試者(608名NC、767名MCI、266名AD)。在五折交叉驗證中,模型平均宏AUC為0.983(標準差0.007),準確率0.944(標準差0.006),宏F1為0.929(標準差0.008)。在獨立的測試集(n=247)上,宏AUC達到0.982(95%置信區間:0.965-0.995),準確率0.943,平衡準確率0.932,宏F1為0.927,Cohen's kappa為0.909。這些結果表明,模型在區分三個類別上具有極高的準確性。
SHAP分析揭示了臨牀合理的特徵重要性模式:CDR整體評分是區分NC和MCI的主要預測因子,而CDR-SB和MMSE共同驅動AD的分類。這一發現與臨牀實踐相符,因為CDR整體評分常用於評估認知障礙的嚴重程度,而CDR-SB和MMSE則更全面地反映認知功能。研究者指出,這些結果不僅驗證了模型的臨牀有效性,也為醫生提供了可解釋的診斷依據。
該研究的意義在於,基於常規臨牀評估即可實現近乎完美的三分類檢測,具有重要的臨牀應用潛力。未來,研究者計劃將語音生物標誌物納入框架,構建多模態檢測系統,進一步提升早期診斷的準確性和可靠性。綜上所述,這項研究為AD的早期檢測提供了一種高效、可解釋的機器學習方法,有望在臨牀實踐中得到廣泛應用。