利用临床生物标志物的可解释机器学习早期检测阿尔茨海默病:基于ADNI数据集的多分类研究
一项新研究利用XGBoost模型和八种常规临床指标,在ADNI数据集上实现了对正常认知、轻度认知障碍和阿尔茨海默病的高精度三分类检测,宏AUC达到0.982,并通过SHAP值提供了可解释性。
阿尔茨海默病(AD)是一种进行性神经退行性疾病,全球超过5500万人受其影响。早期准确的检测对于延缓疾病进展、改善患者生活质量至关重要。然而,从常规临床评估中区分正常认知(NC)、轻度认知障碍(MCI)和AD仍然是一个挑战。近日,一篇发表在arXiv上的研究提出了一种基于可解释机器学习的方法,利用XGBoost分类器和来自阿尔茨海默病神经影像学倡议(ADNI)的八项临床特征,实现了高精度的三分类检测。
该研究使用的特征包括简易精神状态检查(MMSE)、临床痴呆评定量表(CDR)整体评分、CDR评分盒总和(CDR-SB)、蒙特利尔认知评估(MoCA)、功能活动问卷(FAQ)、年龄、性别和教育水平。研究者采用Optuna进行超参数优化(50次试验),并通过SMOTE技术处理类别不平衡问题。模型性能通过宏AUC-ROC、宏F1、平衡准确率和Cohen's kappa进行评估,同时使用SHAP值提供特征级别的可解释性。
数据集包含1641名基线受试者(608名NC、767名MCI、266名AD)。在五折交叉验证中,模型平均宏AUC为0.983(标准差0.007),准确率0.944(标准差0.006),宏F1为0.929(标准差0.008)。在独立的测试集(n=247)上,宏AUC达到0.982(95%置信区间:0.965-0.995),准确率0.943,平衡准确率0.932,宏F1为0.927,Cohen's kappa为0.909。这些结果表明,模型在区分三个类别上具有极高的准确性。
SHAP分析揭示了临床合理的特征重要性模式:CDR整体评分是区分NC和MCI的主要预测因子,而CDR-SB和MMSE共同驱动AD的分类。这一发现与临床实践相符,因为CDR整体评分常用于评估认知障碍的严重程度,而CDR-SB和MMSE则更全面地反映认知功能。研究者指出,这些结果不仅验证了模型的临床有效性,也为医生提供了可解释的诊断依据。
该研究的意义在于,基于常规临床评估即可实现近乎完美的三分类检测,具有重要的临床应用潜力。未来,研究者计划将语音生物标志物纳入框架,构建多模态检测系统,进一步提升早期诊断的准确性和可靠性。综上所述,这项研究为AD的早期检测提供了一种高效、可解释的机器学习方法,有望在临床实践中得到广泛应用。