2026-06-30 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 16:19 UTC+8

RADIANT-PET：結合大語言模型與強化學習的PET/CT病變分割推理增強框架

RADIANT-PET是一個新穎的推理增強框架，它將高靈敏度體素級分割模型與基於大語言模型（LLM）的病變級別裁決相結合，用於PET/CT成像中的準確病變分割。透過形態學描述和臨床報告上下文，LLM可區分真正的病變與生理性假陽性，並利用組相對策略最佳化（GRPO）進行強化學習微調。在AutoPET和OSU測試集上，該方法顯著優於純影像基線，尤其在整合放射學報告時提升最大。

來源arXiv Computer Vision作者: Jiasheng Wang, Tanun Jitwatcharakomol, Piyawadee Jongpradubgiat, Simeng Zhu

在腫瘤學中，PET/CT成像的精確病變分割對於診斷和治療至關重要，但生理性示蹤劑攝取和偽影常常模擬惡性訊號，導致假陽性。針對這一挑戰，研究團隊提出了RADIANT-PET框架，該框架創新性地將高靈敏度體素級分割模型與大語言模型（LLM）的病變級推理相結合。

RADIANT-PET的工作流程分為兩個階段。首先，採用一個刻意寬鬆的分割階段生成候選攝取區域，確保高召回率。然後，將這些候選區域轉換為結構化的文本描述，包括攝取強度、形態以及區域性和全域性解剖背景。接著，LLM作為裁決者，將每個候選分類為真正病變或假陽性，並可選地利用放射學報告作為額外的臨床上下文。

為了進一步增強LLM的推理能力，研究團隊採用組相對策略最佳化（GRPO）對本地LLM進行強化學習最佳化。獎勵機制基於正確的病變分類和解剖位置一致性，從而使模型不僅識別病變，還能確保其解剖位置的合理性。

在AutoPET和俄亥俄州立大學（OSU）測試佇列上的實驗結果顯示，RADIANT-PET在各項指標上持續優於強大的純影像基線。當提供放射學報告時，效能提升最為顯著，這表明語言資訊可以彌補視覺資訊的不足。總體而言，該研究證明了基於LLM的病變級推理為傳統分割方法新增了新的推理層，有效抑制了生理性假陽性，並使體素級預測與臨床解釋保持一致。該專案程式碼已在GitHub上開源，地址為https://github.com/jwang-580/RADIANT-PET。

此外，研究者還分析了不同候選描述策略和LLM設計選擇的影響。透過消融實驗，他們發現將解剖背景資訊納入文本描述對於提升分類效能至關重要。GRPO強化學習相比直接微調帶來了更穩定的改進，特別是在處理罕見病變和解剖變異時。這些發現為將語言推理融入醫學影像分析提供了實用指導。