AI News HubLIVE
站内改写

OncoAgent:一種用於隱私保護腫瘤臨牀決策支持的雙層多智能體框架

OncoAgent是一個開源、隱私保護的腫瘤臨牀決策支持系統。它採用雙層大語言模型架構(9B快速模型和27B深度推理模型)、多智能體LangGraph拓撲、糾正性RAG流程(涵蓋70餘項NCCN和ESMO指南)以及三層反射安全驗證器。系統通過複雜性評分路由查詢,在AMD Instinct MI300X上微調,實現了56倍的吞吐量加速,並支持本地部署以確保數據主權。

文章情報

工程師進階

要點

  • 開源、隱私保護的腫瘤決策支持系統,支持本地部署。
  • 雙層LLM架構:9B快速模型和27B深度推理模型,通過複雜性評分路由。
  • 多智能體LangGraph拓撲,8個節點實現臨牀推理分解。
  • 零PHI策略和四層安全架構,確保合規性和安全性。

為甚麼重要

這條新聞值得關注,因為開源、隱私保護的腫瘤決策支持系統,支持本地部署。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

OncoAgent是一個創新的開源臨牀決策支持系統,專為腫瘤學設計,旨在解決現有AI系統在隱私、準確性和可部署性方面的關鍵問題。該系統由OncoAgent研究團隊開發,結合了雙層微調大語言模型(LLM)架構、最先進的多智能體LangGraph拓撲、基於70餘項NCCN和ESMO指南的四階段糾正性RAG流程,以及三層反射安全驗證器,嚴格執行零受保護健康信息(PHI)政策。

OncoAgent的核心設計原則包括架構分解、基於檢索的生成和硬件主權。臨牀推理被分解為八個專門的LangGraph節點,每個節點具有有限且可審計的功能。所有模型輸出都通過檢索管道與精選的向量知識庫錨定,並設有顯式的相關性門控。完整的推理和訓練棧原生運行在AMD Instinct MI300X上,使用ROCm和開源框架,使醫院能夠在無需數據外流的情況下進行部署。

系統通過一個加權加法複雜性評分器來路由臨牀查詢。該評分器考慮癌症類型、分期、突變和既往治療等因素,將查詢分配給9B參數的速度優化模型(第一層)或27B的深度推理模型(第二層)。兩個模型均通過QLoRA在包含266,854個真實和合成腫瘤病例的語料庫上進行微調,使用Unsloth框架在AMD Instinct MI300X硬件上完成。序列打包技術使全數據集微調僅需約50分鐘,相比基於API的生成實現了56倍的吞吐量加速。

OncoAgent的安全和隱私框架包括一個專門的零PHI編輯節點,在文本到達任何LLM之前識別並替換受保護的健康信息。四層安全架構分別在檢索層、生成層和部署層實施,確保即使單層失效也不會影響整體安全態勢。對於高複雜性或低置信度的輸出,系統設有強制的人機交互(HITL)中斷點。

臨牀界面採用實時流式Gradio應用程序,以ChatGPT風格的對話佈局呈現,提供會話控制、KPI面板、證據來源選項卡以及實時代理推理更新。該界面遵循WCAG 2.1 AA標準,確保可訪問性。

實驗結果令人印象深刻:糾正性RAG管道的文檔評分成功率達100%,平均RAG置信度分數超過2.3;複雜性路由正確識別了需要深度推理的複雜案例;訓練吞吐量顯著提升;所有八個編譯節點和六個模塊測試套件均通過驗證。

OncoAgent證明了在遵守嚴格隱私法規的同時,實現最先進的多智能體臨牀AI是可行的。其完全開源、可本地部署的特性,為醫療機構提供了一種無需依賴專有云API的解決方案,從而保護患者數據主權。