AI News HubLIVE
站內改寫1 分鐘閱讀

加速度計衍生的數字生物標誌物用於心臟代謝風險:具有不確定性量化的人羣代表性表格基準

本研究利用NHANES 2003-2006數據,構建了包含1,381名成年人的加速度計心臟代謝基準,評估了三種表格學習方法(嶺迴歸、XGBoost和TabPFN v2)預測糖化血紅蛋白、甘油三酯和C反應蛋白的性能。TabPFN v2整體表現最佳,但甘油三酯預測能力有限。同時,通過分割共形預測評估了預測區間的覆蓋公平性,發現總體覆蓋達標,但亞組間存在差異。

來源arXiv Machine Learning作者: Federico Felizzi

一項新的研究引入了NHANES加速度計心臟代謝基準,該基準源自美國國家健康與營養調查(NHANES)2003-2006年的數據,包含1,381名成年人。這些受試者佩戴了臀部加速度計,並提供了空腹實驗室生物標誌物(包括糖化血紅蛋白HbA1c、空腹甘油三酯和C反應蛋白CRP)、膳食攝入信息和人體測量數據。該基準的獨特之處在於,它不僅涵蓋了加速度計衍生的活動表型,還整合了生活方式協變量,如飲食和身體質量指數,旨在反映真實世界臨牀數據中的複雜調查抽樣、人口統計學過採樣和子組公平性問題。現有基準往往忽略這些關鍵方面。

研究評估了三種表格學習方法:嶺迴歸、XGBoost和基礎模型TabPFN v2。TabPFN v2是一種基於Transformer架構的預訓練模型,專為處理表格數據設計。結果顯示,TabPFN v2在預測HbA1c和CRP方面表現最佳,R²值分別達到0.156和0.383,顯著優於其他方法。然而,所有模型在預測空腹甘油三酯時均表現不佳,R²值低於0.05。這一結果與已知的遺傳因素主導甘油三酯水平的觀點一致,提示活動表型和生活方式因素可能無法充分捕捉其變異。

除了預測性能,研究還應用了分割共形預測方法,生成無分佈假設的90%預測區間,並評估了按性別和種族/民族劃分的亞組覆蓋公平性。邊際覆蓋分析顯示,對於CRP和HbA1c,預測區間的實際覆蓋接近90%的目標值;但對於甘油三酯,覆蓋水平低於目標。在亞組層面,研究發現了局部覆蓋不足的現象:例如,墨西哥裔美國參與者的HbA1c預測區間覆蓋偏低,這表明邊際保證可能無法確保所有子組的臨牀公平性。這種差距突顯了在模型評估中納入條件覆蓋分析的重要性。

該研究的代碼和數據已在GitHub上公開(https://github.com/felizzi/nhanes-accel-cardiometabolic-benchmark),為數字生物標誌物在臨牀風險預測中的應用提供了新的基準,並強調了在模型評估中納入不確定性量化和公平性分析的必要性。