加速度計由来のデジタルバイオマーカーによる心臓代謝リスク評価:不確実性定量化を伴う人口代表性テーブルベンチマーク
本研究は、NHANES 2003-2006のデータを用いて、1,381人の成人を対象とした加速度計心臓代謝ベンチマークを構築し、3つのテーブル学習手法(リッジ回帰、XGBoost、TabPFN v2)で糖化ヘモグロビン、中性脂肪、C反応性タンパク質の予測性能を評価しました。TabPFN v2が最も良い成績を示しましたが、中性脂肪の予測は困難でした。また、分割共形予測を用いて予測区間のカバレッジ公平性を評価し、全体的には目標を達成するものの、サブグループ間で差異があることを明らかにしました。
新しい研究により、NHANES加速度計心臓代謝ベンチマークが導入されました。このベンチマークは、米国国民健康栄養調査(NHANES)2003-2006年のデータに基づいて構築され、1,381人の成人が参加しています。参加者は腰部に加速度計を装着し、空腹時検査バイオマーカー(糖化ヘモグロビンHbA1c、空腹時中性脂肪、C反応性タンパク質CRP)、食事摂取量、人体計測データを提供しました。このベンチマークの特徴は、加速度計から得られた活動表現型に加えて、食事や体格指数などのライフスタイル共変量を統合している点です。これにより、実際の臨床データに見られる複雑な標本調査、人口統計学的オーバーサンプリング、サブグループの公平性といった特性を反映することを目指しています。既存のベンチマークはこれらの側面を見落としがちです。
研究では、リッジ回帰、XGBoost、基盤モデルTabPFN v2の3つのテーブル学習手法を評価しました。TabPFN v2はTransformerアーキテクチャに基づく事前学習モデルで、テーブルデータ専用に設計されています。結果として、TabPFN v2がHbA1cとCRPの予測において最も優れた性能を示し、R²値はそれぞれ0.156と0.383でした。一方、空腹時中性脂肪の予測はすべてのモデルで困難であり、R²値は0.05未満でした。この結果は、中性脂肪レベルが遺伝的要因に強く支配されているという既知の知見と一致しており、活動表現型やライフスタイル要因だけではその変動を十分に捉えられないことを示唆しています。
予測性能に加えて、研究では分割共形予測を適用し、分布に依存しない90%予測区間を生成しました。そして、性別および人種/民族別のサブグループにおけるカバレッジの公平性を評価しました。マージナルカバレッジ分析では、CRPとHbA1cの予測区間が90%目標に近いカバレッジを達成した一方、中性脂肪は目標を下回りました。サブグループレベルでは、局所的なカバレッジ不足が観察されました。例えば、メキシコ系米国人参加者のHbA1c予測区間でのカバレッジが低く、マージナルな保証と臨床的公平性に必要な条件付きカバレッジとの間にギャップがあることが明らかになりました。このギャップは、モデル評価に条件付きカバレッジ分析を組み込む重要性を浮き彫りにしています。
この研究のコードとデータはGitHub(https://github.com/felizzi/nhanes-accel-cardiometabolic-benchmark)で公開されており、デジタルバイオマーカーの臨床リスク予測における新たなベンチマークを提供します。また、不確実性の定量化と公平性分析をモデル評価に組み込む必要性を強調しています。