2026-05-09站内改写

OncoAgent：一種用於隱私保護腫瘤臨床決策支援的雙層多智慧體框架

OncoAgent是一個開源、隱私保護的腫瘤臨床決策支援系統。它採用雙層大語言模型架構（9B快速模型和27B深度推理模型）、多智慧體LangGraph拓撲、糾正性RAG流程（涵蓋70餘項NCCN和ESMO指南）以及三層反射安全驗證器。系統透過複雜性評分路由查詢，在AMD Instinct MI300X上微調，實現了56倍的吞吐量加速，並支援本地部署以確保資料主權。

文章情報

工程師進階

要點

開源、隱私保護的腫瘤決策支援系統，支援本地部署。
雙層LLM架構：9B快速模型和27B深度推理模型，透過複雜性評分路由。
多智慧體LangGraph拓撲，8個節點實現臨床推理分解。
零PHI策略和四層安全架構，確保合規性和安全性。

為什麼重要

這條新聞值得關注，因為開源、隱私保護的腫瘤決策支援系統，支援本地部署。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

OncoAgent是一個創新的開源臨床決策支援系統，專為腫瘤學設計，旨在解決現有AI系統在隱私、準確性和可部署性方面的關鍵問題。該系統由OncoAgent研究團隊開發，結合了雙層微調大語言模型（LLM）架構、最先進的多智慧體LangGraph拓撲、基於70餘項NCCN和ESMO指南的四階段糾正性RAG流程，以及三層反射安全驗證器，嚴格執行零受保護健康資訊（PHI）政策。

OncoAgent的核心設計原則包括架構分解、基於檢索的生成和硬體主權。臨床推理被分解為八個專門的LangGraph節點，每個節點具有有限且可審計的功能。所有模型輸出都透過檢索管道與精選的向量知識庫錨定，並設有顯式的相關性門控。完整的推理和訓練棧原生執行在AMD Instinct MI300X上，使用ROCm和開源框架，使醫院能夠在無需資料外流的情況下進行部署。

系統透過一個加權加法複雜性評分器來路由臨床查詢。該評分器考慮癌症型別、分期、突變和既往治療等因素，將查詢分配給9B引數的速度最佳化模型（第一層）或27B的深度推理模型（第二層）。兩個模型均透過QLoRA在包含266,854個真實和合成腫瘤病例的語料庫上進行微調，使用Unsloth框架在AMD Instinct MI300X硬體上完成。序列打包技術使全資料集微調僅需約50分鐘，相比基於API的生成實現了56倍的吞吐量加速。

OncoAgent的安全和隱私框架包括一個專門的零PHI編輯節點，在文本到達任何LLM之前識別並替換受保護的健康資訊。四層安全架構分別在檢索層、生成層和部署層實施，確保即使單層失效也不會影響整體安全態勢。對於高複雜性或低置信度的輸出，系統設有強制的人機互動（HITL）中斷點。

臨床介面採用即時流式Gradio應用程式，以ChatGPT風格的對話佈局呈現，提供會話控制、KPI面板、證據來源選項卡以及即時代理推理更新。該介面遵循WCAG 2.1 AA標準，確保可訪問性。

實驗結果令人印象深刻：糾正性RAG管道的文件評分成功率達100%，平均RAG置信度分數超過2.3；複雜性路由正確識別了需要深度推理的複雜案例；訓練吞吐量顯著提升；所有八個編譯節點和六個模組測試套件均透過驗證。

OncoAgent證明了在遵守嚴格隱私法規的同時，實現最先進的多智慧體臨床AI是可行的。其完全開源、可本地部署的特性，為醫療機構提供了一種無需依賴專有云API的解決方案，從而保護患者資料主權。