RareDxR1:超越人工標註的罕見病自主醫療推理
RareDxR1是一種端到端的推理中心型大語言模型,可直接從非結構化臨牀筆記中進行開放域罕見病診斷。它通過知識內化和自主進化學習,繞過傳統基於流水線的表型提取或檢索增強生成方法的侷限,並採用反思增強推理採樣和雙級課程強化學習來提升診斷準確性。實驗表明,RareDxR1在多個基準測試中達到了最先進的水平。
近日,研究人員提出了一種名為RareDxR1的新型大語言模型,旨在直接根據非結構化臨牀筆記進行罕見病的開放域診斷。罕見病的鑑別診斷是一項艱鉅的臨牀任務,需要醫生從複雜、非結構化的患者症狀中識別出精確的表型,並在龐大的搜索空間中進行復雜的推理。然而,現有的AI方法通常依賴於基於流水線的表型提取或檢索增強生成(RAG),這些方法由於預定義本體、檢索瓶頸和缺乏診斷邏輯而導致關鍵信息丟失。
為了應對這些挑戰,RareDxR1採用了一種端到端的訓練框架,通過協同知識內化和自主進化學習,繞過了對結構化表型和封閉集決策的依賴。該模型將零散的罕見病知識直接深度內化到模型參數中,從而克服了RAG和表型限制。研究團隊設計了一種漸進式訓練流程,首先通過知識內化使模型掌握海量罕見病知識,然後通過自主進化學習讓模型在模擬診斷環境中不斷自我改進。這種雙階段策略使得模型能夠從失敗中學習,逐步提升診斷能力。
此外,為了彌合模型生成與專家推理之間的差距,研究團隊提出了反思增強推理採樣(RERS)策略。該策略通過從失敗中學習來合成專家級的診斷軌跡,且無需人工標註。具體來説,RERS首先讓模型對病例進行初步診斷,然後對比正確結果,分析錯誤原因,並生成包含反思過程的診斷軌跡。這些軌跡隨後被用於強化學習,使模型能夠模仿專家的推理過程。同時,還引入了一種雙級課程強化學習方法,用於逐步掌握罕見病診斷:第一級課程聚焦於常見罕見病的識別,第二級課程則挑戰更罕見、更復雜的病例。
實驗結果顯示,RareDxR1在多個基準測試中達到了最先進的準確率,包括在DDXPlus、RareDis和CustomRare等數據集上的評估。與傳統的RAG方法和基於表型提取的模型相比,RareDxR1在診斷準確性上提升了顯著幅度,特別是在處理非結構化文本和罕見病例時表現出色。這一成果標誌着開放域罕見病診斷領域的一項重大突破,證明了無需人工標註、直接從臨牀筆記中學習診斷推理的可行性。研究團隊表示,他們的代碼和數據集將公開發布,以促進該領域的進一步研究。該論文已被2026年IEEE國際多媒體與博覽會(ICME)接收。