AI News HubLIVE
站内改写1 分钟阅读

加速度计衍生的数字生物标志物用于心脏代谢风险:具有不确定性量化的人群代表性表格基准

本研究利用NHANES 2003-2006数据,构建了包含1,381名成年人的加速度计心脏代谢基准,评估了三种表格学习方法(岭回归、XGBoost和TabPFN v2)预测糖化血红蛋白、甘油三酯和C反应蛋白的性能。TabPFN v2整体表现最佳,但甘油三酯预测能力有限。同时,通过分割共形预测评估了预测区间的覆盖公平性,发现总体覆盖达标,但亚组间存在差异。

来源arXiv Machine Learning作者: Federico Felizzi

一项新的研究引入了NHANES加速度计心脏代谢基准,该基准源自美国国家健康与营养调查(NHANES)2003-2006年的数据,包含1,381名成年人。这些受试者佩戴了臀部加速度计,并提供了空腹实验室生物标志物(包括糖化血红蛋白HbA1c、空腹甘油三酯和C反应蛋白CRP)、膳食摄入信息和人体测量数据。该基准的独特之处在于,它不仅涵盖了加速度计衍生的活动表型,还整合了生活方式协变量,如饮食和身体质量指数,旨在反映真实世界临床数据中的复杂调查抽样、人口统计学过采样和子组公平性问题。现有基准往往忽略这些关键方面。

研究评估了三种表格学习方法:岭回归、XGBoost和基础模型TabPFN v2。TabPFN v2是一种基于Transformer架构的预训练模型,专为处理表格数据设计。结果显示,TabPFN v2在预测HbA1c和CRP方面表现最佳,R²值分别达到0.156和0.383,显著优于其他方法。然而,所有模型在预测空腹甘油三酯时均表现不佳,R²值低于0.05。这一结果与已知的遗传因素主导甘油三酯水平的观点一致,提示活动表型和生活方式因素可能无法充分捕捉其变异。

除了预测性能,研究还应用了分割共形预测方法,生成无分布假设的90%预测区间,并评估了按性别和种族/民族划分的亚组覆盖公平性。边际覆盖分析显示,对于CRP和HbA1c,预测区间的实际覆盖接近90%的目标值;但对于甘油三酯,覆盖水平低于目标。在亚组层面,研究发现了局部覆盖不足的现象:例如,墨西哥裔美国参与者的HbA1c预测区间覆盖偏低,这表明边际保证可能无法确保所有子组的临床公平性。这种差距突显了在模型评估中纳入条件覆盖分析的重要性。

该研究的代码和数据已在GitHub上公开(https://github.com/felizzi/nhanes-accel-cardiometabolic-benchmark),为数字生物标志物在临床风险预测中的应用提供了新的基准,并强调了在模型评估中纳入不确定性量化和公平性分析的必要性。