Traj-Evolve:用于肺癌早期检测的患者轨迹建模的自进化多智能体系统
本文介绍Traj-Evolve,一个自进化的多智能体系统,通过经验池(ExPool)和多智能体强化学习(MARL)从纵向电子健康记录中建模患者轨迹,在肺癌预测任务上超越9个强基线。实验表明,ExPool提升特异性,MARL提升灵敏度,两者互补。
在肺癌早期检测中,从纵向电子健康记录(EHR)中建模患者轨迹是一项关键任务,但面临数据稀疏、噪声大和长上下文多模态序列的挑战。现有的基于大语言模型的多智能体系统通过分工处理长上下文,但往往孤立地分析每个患者,未能模仿临床医生利用类似病例积累经验的推理方式。为此,研究者提出了Traj-Evolve,一种自进化的多智能体系统,通过两种互补的进化机制来提升建模能力。
第一个机制是经验池(ExPool),一种非参数记忆模块。它通过拒绝采样存储推理轨迹,并在推理时检索与当前患者最相似的过往案例,作为少样本上下文提供给智能体。这种检索增强了系统对罕见模式的泛化能力。第二个机制是多智能体强化学习(MARL),通过奖励排序的微调参数化地优化智能体之间以及智能体与记忆的协作。具体来说,系统包含一个管理智能体和多个工作智能体,管理智能体负责协调,工作智能体负责时间序列推理。
为了统一两种机制,作者提出了留一法交叉检索策略。在训练时,每个患者被排除在ExPool之外,用其他患者训练;在推理时则使用完整ExPool。这使得训练和推理阶段的检索增强行为保持一致。
实验基于长达五年的多模态EHR数据,在肺癌预测任务上评估Traj-Evolve。结果显示,它在整体人群和具有挑战性的从不吸烟人群上均超越了9个强基线模型。进一步分析揭示了三个关键发现:第一,随着ExPool规模增大,最优检索策略从多样性检索转向特异性检索;第二,在MARL训练中,管理智能体的预测损失快速收敛,而工作智能体的时间推理能力随着更多已验证患者的加入持续提升;第三,两种机制在预测风险上互补:ExPool提升特异性(减少假阳性),而MARL提升灵敏度(提高真阳性率)。
Traj-Evolve为人工智能驱动的临床决策支持提供了一个新的范例,展示了如何通过记忆和协作进化来模拟临床经验积累。未来工作可探索将系统应用于其他疾病领域,并进一步优化检索与强化学习的交互。