2026-06-04 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

利用临床生物标志物的可解释机器学习早期检测阿尔茨海默病：基于ADNI数据集的多分类研究

一项新研究利用XGBoost模型和八种常规临床指标，在ADNI数据集上实现了对正常认知、轻度认知障碍和阿尔茨海默病的高精度三分类检测，宏AUC达到0.982，并通过SHAP值提供了可解释性。

来源arXiv Machine Learning作者: Afshan Hashmi

阿尔茨海默病（AD）是一种进行性神经退行性疾病，全球超过5500万人受其影响。早期准确的检测对于延缓疾病进展、改善患者生活质量至关重要。然而，从常规临床评估中区分正常认知（NC）、轻度认知障碍（MCI）和AD仍然是一个挑战。近日，一篇发表在arXiv上的研究提出了一种基于可解释机器学习的方法，利用XGBoost分类器和来自阿尔茨海默病神经影像学倡议（ADNI）的八项临床特征，实现了高精度的三分类检测。

该研究使用的特征包括简易精神状态检查（MMSE）、临床痴呆评定量表（CDR）整体评分、CDR评分盒总和（CDR-SB）、蒙特利尔认知评估（MoCA）、功能活动问卷（FAQ）、年龄、性别和教育水平。研究者采用Optuna进行超参数优化（50次试验），并通过SMOTE技术处理类别不平衡问题。模型性能通过宏AUC-ROC、宏F1、平衡准确率和Cohen's kappa进行评估，同时使用SHAP值提供特征级别的可解释性。

数据集包含1641名基线受试者（608名NC、767名MCI、266名AD）。在五折交叉验证中，模型平均宏AUC为0.983（标准差0.007），准确率0.944（标准差0.006），宏F1为0.929（标准差0.008）。在独立的测试集（n=247）上，宏AUC达到0.982（95%置信区间：0.965-0.995），准确率0.943，平衡准确率0.932，宏F1为0.927，Cohen's kappa为0.909。这些结果表明，模型在区分三个类别上具有极高的准确性。

SHAP分析揭示了临床合理的特征重要性模式：CDR整体评分是区分NC和MCI的主要预测因子，而CDR-SB和MMSE共同驱动AD的分类。这一发现与临床实践相符，因为CDR整体评分常用于评估认知障碍的严重程度，而CDR-SB和MMSE则更全面地反映认知功能。研究者指出，这些结果不仅验证了模型的临床有效性，也为医生提供了可解释的诊断依据。

该研究的意义在于，基于常规临床评估即可实现近乎完美的三分类检测，具有重要的临床应用潜力。未来，研究者计划将语音生物标志物纳入框架，构建多模态检测系统，进一步提升早期诊断的准确性和可靠性。综上所述，这项研究为AD的早期检测提供了一种高效、可解释的机器学习方法，有望在临床实践中得到广泛应用。