AI News HubLIVE
站内改写1 分鐘閱讀

使用整流流變壓器擴充套件胸部X光片生成基礎模型

研究人員推出了首個十億引數級別的胸部X光片生成基礎模型,擁有超過13億引數,在包含120萬張X光片和臨床專家指導後設資料的異構資料集上訓練了1.6萬億tokens。該模型支援對多個患者亞群、採集檢視和十餘種病理的可控生成與編輯,生成的X光片在臨床專家看來與真實影像無異,顯著提升了合成逼真度。

來源arXiv Computer Vision作者: Fabio De Sousa Ribeiro, Emma A. M. Stanley, Charles Jones, Tian Xia, Dominic C. Marshall, Laurent Renard Trich\'e, Christopher V. Cosgriff, Panagiotis Dimitrakopoulos, Sotirios A. Tsaftaris, Ben Glocker

來自arXiv的一篇新論文介紹了首個十億引數級別的胸部X光片生成基礎模型。該模型基於整流流變換器架構,擁有超過13億引數,並在一個精心整理的大型資料集上進行了訓練,該資料集包含120萬張X光片以及由臨床專家指導的後設資料,總計訓練了1.6萬億tokens。

現有的放射學AI模型常常在不同患者亞群、醫療機構和採集設定之間泛化能力不足,導致實際臨床應用受限。這項研究透過可控、高保真的胸部X光片合成,為多樣化臨床資料集和評估診斷模型的魯棒性提供了新途徑。

該模型不僅支援根據人口統計亞群、採集檢視和多種病理條件生成X光片,還允許對現有影像進行編輯修改。研究者聲稱,該模型在合成逼真度上顯著超越了當前最先進水平,生成的影像在臨床專家評估中與真實X光片無法區分。

這一成果標誌著生成式AI在醫學影像領域的重要進步,有望改善資料多樣性,並幫助構建更可靠的診斷系統。論文由Fabio De Sousa Ribeiro等人提交,於2026年6月17日釋出,並提供專案頁面供進一步參考。