2026-06-03 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

ChatHealthAI：将电子健康记录表示与大语言模型对齐以实现基于临床的推理

ChatHealthAI是一个多模态推理框架，通过任务感知重采样器将预训练的EHR基础模型的结构化表示与冻结的大语言模型语义空间对齐，从而在保留预测性能的同时实现可解释的自然语言临床推理。在EHRSHOT基准的三个临床预测任务上，该框架在保持竞争性预测性能的同时，显著提升了推理质量和可解释性。

来源arXiv AI作者: Bo-Hong Wang, Baicheng Peng, Ruilin Wang, Jun Bai, Ziyang Song, Yue Li

大型语言模型（LLM）在临床决策支持中展现出强大的自然语言推理能力，但在建模结构化的纵向电子健康记录（EHR）方面存在困难。这是因为EHR数据通常以结构化表格形式存在，而LLM擅长处理非结构化文本。另一方面，专门的EHR基础模型能够从大量患者数据中学习预测性的表示，但其推理过程缺乏语言层面的可解释性，难以被临床医生理解。为了弥合这一差距，来自多家机构的研究人员提出了ChatHealthAI，一个多模态推理框架，能够将EHR基础模型的结构化患者表示与冻结的LLM的语义空间进行对齐，从而实现基于临床的自然语言推理。

ChatHealthAI的核心创新在于一个任务感知重采样器，该模块能够根据具体的预测任务，从EHR基础模型提取的表示中筛选出最相关的信息，并将其转换为LLM可以理解的令牌序列。通过这种方式，系统能够整合纵向患者表示与经过细化的临床事件描述，从而在保持患者预测准确性的同时，生成可解释的临床推理过程。研究人员在EHRSHOT基准测试的三个临床预测任务上评估了ChatHealthAI：死亡率预测、住院时间预测和诊断预测。实验结果表明，ChatHealthAI在预测性能上与当前最先进的模型持平，但在推理质量和可解释性方面有显著提升。例如，在死亡率预测任务中，ChatHealthAI能够生成包含具体临床原因（如心脏病发作、感染等）的自然语言解释，而不仅仅是输出风险分数。

这些发现突显了将EHR基础模型与预训练LLM相结合用于可解释临床预测的巨大潜力。ChatHealthAI为医疗AI领域提供了一种新的范式，使得临床决策支持系统能够同时利用结构化数据的预测能力和语言模型的推理能力。未来，研究者计划进一步优化重采样器的效率，并在更大规模的数据集上验证框架的泛化能力。此外，将ChatHealthAI集成到现有电子健康记录系统中，有望在临床实践中提升诊断和预测的透明度和可靠性，帮助医生做出更明智的决策。