使用整流流變壓器擴展胸部X光片生成基礎模型
研究人員推出了首個十億參數級別的胸部X光片生成基礎模型,擁有超過13億參數,在包含120萬張X光片和臨牀專家指導元數據的異構數據集上訓練了1.6萬億tokens。該模型支持對多個患者亞羣、採集視圖和十餘種病理的可控生成與編輯,生成的X光片在臨牀專家看來與真實圖像無異,顯著提升了合成逼真度。
來源arXiv Computer Vision作者: Fabio De Sousa Ribeiro, Emma A. M. Stanley, Charles Jones, Tian Xia, Dominic C. Marshall, Laurent Renard Trich\'e, Christopher V. Cosgriff, Panagiotis Dimitrakopoulos, Sotirios A. Tsaftaris, Ben Glocker
來自arXiv的一篇新論文介紹了首個十億參數級別的胸部X光片生成基礎模型。該模型基於整流流變換器架構,擁有超過13億參數,並在一個精心整理的大型數據集上進行了訓練,該數據集包含120萬張X光片以及由臨牀專家指導的元數據,總計訓練了1.6萬億tokens。
現有的放射學AI模型常常在不同患者亞羣、醫療機構和採集設置之間泛化能力不足,導致實際臨牀應用受限。這項研究通過可控、高保真的胸部X光片合成,為多樣化臨牀數據集和評估診斷模型的魯棒性提供了新途徑。
該模型不僅支持根據人口統計亞羣、採集視圖和多種病理條件生成X光片,還允許對現有圖像進行編輯修改。研究者聲稱,該模型在合成逼真度上顯著超越了當前最先進水平,生成的圖像在臨牀專家評估中與真實X光片無法區分。
這一成果標誌着生成式AI在醫學影像領域的重要進步,有望改善數據多樣性,並幫助構建更可靠的診斷系統。論文由Fabio De Sousa Ribeiro等人提交,於2026年6月17日發佈,並提供項目頁面供進一步參考。