2026-06-30 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 16:19 UTC+8

RADIANT-PET：结合大语言模型与强化学习的PET/CT病变分割推理增强框架

RADIANT-PET是一个新颖的推理增强框架，它将高灵敏度体素级分割模型与基于大语言模型（LLM）的病变级别裁决相结合，用于PET/CT成像中的准确病变分割。通过形态学描述和临床报告上下文，LLM可区分真正的病变与生理性假阳性，并利用组相对策略优化（GRPO）进行强化学习微调。在AutoPET和OSU测试集上，该方法显著优于纯图像基线，尤其在整合放射学报告时提升最大。

来源arXiv Computer Vision作者: Jiasheng Wang, Tanun Jitwatcharakomol, Piyawadee Jongpradubgiat, Simeng Zhu

在肿瘤学中，PET/CT成像的精确病变分割对于诊断和治疗至关重要，但生理性示踪剂摄取和伪影常常模拟恶性信号，导致假阳性。针对这一挑战，研究团队提出了RADIANT-PET框架，该框架创新性地将高灵敏度体素级分割模型与大语言模型（LLM）的病变级推理相结合。

RADIANT-PET的工作流程分为两个阶段。首先，采用一个刻意宽松的分割阶段生成候选摄取区域，确保高召回率。然后，将这些候选区域转换为结构化的文本描述，包括摄取强度、形态以及局部和全局解剖背景。接着，LLM作为裁决者，将每个候选分类为真正病变或假阳性，并可选地利用放射学报告作为额外的临床上下文。

为了进一步增强LLM的推理能力，研究团队采用组相对策略优化（GRPO）对本地LLM进行强化学习优化。奖励机制基于正确的病变分类和解剖位置一致性，从而使模型不仅识别病变，还能确保其解剖位置的合理性。

在AutoPET和俄亥俄州立大学（OSU）测试队列上的实验结果显示，RADIANT-PET在各项指标上持续优于强大的纯图像基线。当提供放射学报告时，性能提升最为显著，这表明语言信息可以弥补视觉信息的不足。总体而言，该研究证明了基于LLM的病变级推理为传统分割方法添加了新的推理层，有效抑制了生理性假阳性，并使体素级预测与临床解释保持一致。该项目代码已在GitHub上开源，地址为https://github.com/jwang-580/RADIANT-PET。

此外，研究者还分析了不同候选描述策略和LLM设计选择的影响。通过消融实验，他们发现将解剖背景信息纳入文本描述对于提升分类性能至关重要。GRPO强化学习相比直接微调带来了更稳定的改进，特别是在处理罕见病变和解剖变异时。这些发现为将语言推理融入医学图像分析提供了实用指导。