AI News HubLIVE
站內改寫1 分鐘閱讀

RADIANT-PET:結合大語言模型與強化學習的PET/CT病變分割推理增強框架

RADIANT-PET是一個新穎的推理增強框架,它將高靈敏度體素級分割模型與基於大語言模型(LLM)的病變級別裁決相結合,用於PET/CT成像中的準確病變分割。透過形態學描述和臨床報告上下文,LLM可區分真正的病變與生理性假陽性,並利用組相對策略最佳化(GRPO)進行強化學習微調。在AutoPET和OSU測試集上,該方法顯著優於純影像基線,尤其在整合放射學報告時提升最大。

來源arXiv Computer Vision作者: Jiasheng Wang, Tanun Jitwatcharakomol, Piyawadee Jongpradubgiat, Simeng Zhu

在腫瘤學中,PET/CT成像的精確病變分割對於診斷和治療至關重要,但生理性示蹤劑攝取和偽影常常模擬惡性訊號,導致假陽性。針對這一挑戰,研究團隊提出了RADIANT-PET框架,該框架創新性地將高靈敏度體素級分割模型與大語言模型(LLM)的病變級推理相結合。

RADIANT-PET的工作流程分為兩個階段。首先,採用一個刻意寬鬆的分割階段生成候選攝取區域,確保高召回率。然後,將這些候選區域轉換為結構化的文本描述,包括攝取強度、形態以及區域性和全域性解剖背景。接著,LLM作為裁決者,將每個候選分類為真正病變或假陽性,並可選地利用放射學報告作為額外的臨床上下文。

為了進一步增強LLM的推理能力,研究團隊採用組相對策略最佳化(GRPO)對本地LLM進行強化學習最佳化。獎勵機制基於正確的病變分類和解剖位置一致性,從而使模型不僅識別病變,還能確保其解剖位置的合理性。

在AutoPET和俄亥俄州立大學(OSU)測試佇列上的實驗結果顯示,RADIANT-PET在各項指標上持續優於強大的純影像基線。當提供放射學報告時,效能提升最為顯著,這表明語言資訊可以彌補視覺資訊的不足。總體而言,該研究證明了基於LLM的病變級推理為傳統分割方法新增了新的推理層,有效抑制了生理性假陽性,並使體素級預測與臨床解釋保持一致。該專案程式碼已在GitHub上開源,地址為https://github.com/jwang-580/RADIANT-PET。

此外,研究者還分析了不同候選描述策略和LLM設計選擇的影響。透過消融實驗,他們發現將解剖背景資訊納入文本描述對於提升分類效能至關重要。GRPO強化學習相比直接微調帶來了更穩定的改進,特別是在處理罕見病變和解剖變異時。這些發現為將語言推理融入醫學影像分析提供了實用指導。