AI News HubLIVE
站内改写

OncoAgent:一種用於隱私保護腫瘤臨床決策支援的雙層多智慧體框架

OncoAgent是一個開源、隱私保護的腫瘤臨床決策支援系統。它採用雙層大語言模型架構(9B快速模型和27B深度推理模型)、多智慧體LangGraph拓撲、糾正性RAG流程(涵蓋70餘項NCCN和ESMO指南)以及三層反射安全驗證器。系統透過複雜性評分路由查詢,在AMD Instinct MI300X上微調,實現了56倍的吞吐量加速,並支援本地部署以確保資料主權。

文章情報

工程師進階

要點

  • 開源、隱私保護的腫瘤決策支援系統,支援本地部署。
  • 雙層LLM架構:9B快速模型和27B深度推理模型,透過複雜性評分路由。
  • 多智慧體LangGraph拓撲,8個節點實現臨床推理分解。
  • 零PHI策略和四層安全架構,確保合規性和安全性。

為什麼重要

這條新聞值得關注,因為開源、隱私保護的腫瘤決策支援系統,支援本地部署。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

OncoAgent是一個創新的開源臨床決策支援系統,專為腫瘤學設計,旨在解決現有AI系統在隱私、準確性和可部署性方面的關鍵問題。該系統由OncoAgent研究團隊開發,結合了雙層微調大語言模型(LLM)架構、最先進的多智慧體LangGraph拓撲、基於70餘項NCCN和ESMO指南的四階段糾正性RAG流程,以及三層反射安全驗證器,嚴格執行零受保護健康資訊(PHI)政策。

OncoAgent的核心設計原則包括架構分解、基於檢索的生成和硬體主權。臨床推理被分解為八個專門的LangGraph節點,每個節點具有有限且可審計的功能。所有模型輸出都透過檢索管道與精選的向量知識庫錨定,並設有顯式的相關性門控。完整的推理和訓練棧原生執行在AMD Instinct MI300X上,使用ROCm和開源框架,使醫院能夠在無需資料外流的情況下進行部署。

系統透過一個加權加法複雜性評分器來路由臨床查詢。該評分器考慮癌症型別、分期、突變和既往治療等因素,將查詢分配給9B引數的速度最佳化模型(第一層)或27B的深度推理模型(第二層)。兩個模型均透過QLoRA在包含266,854個真實和合成腫瘤病例的語料庫上進行微調,使用Unsloth框架在AMD Instinct MI300X硬體上完成。序列打包技術使全資料集微調僅需約50分鐘,相比基於API的生成實現了56倍的吞吐量加速。

OncoAgent的安全和隱私框架包括一個專門的零PHI編輯節點,在文本到達任何LLM之前識別並替換受保護的健康資訊。四層安全架構分別在檢索層、生成層和部署層實施,確保即使單層失效也不會影響整體安全態勢。對於高複雜性或低置信度的輸出,系統設有強制的人機互動(HITL)中斷點。

臨床介面採用即時流式Gradio應用程式,以ChatGPT風格的對話佈局呈現,提供會話控制、KPI面板、證據來源選項卡以及即時代理推理更新。該介面遵循WCAG 2.1 AA標準,確保可訪問性。

實驗結果令人印象深刻:糾正性RAG管道的文件評分成功率達100%,平均RAG置信度分數超過2.3;複雜性路由正確識別了需要深度推理的複雜案例;訓練吞吐量顯著提升;所有八個編譯節點和六個模組測試套件均透過驗證。

OncoAgent證明了在遵守嚴格隱私法規的同時,實現最先進的多智慧體臨床AI是可行的。其完全開源、可本地部署的特性,為醫療機構提供了一種無需依賴專有云API的解決方案,從而保護患者資料主權。