2026-05-09站内改写

OncoAgent：一種用於隱私保護腫瘤臨牀決策支持的雙層多智能體框架

OncoAgent是一個開源、隱私保護的腫瘤臨牀決策支持系統。它採用雙層大語言模型架構（9B快速模型和27B深度推理模型）、多智能體LangGraph拓撲、糾正性RAG流程（涵蓋70餘項NCCN和ESMO指南）以及三層反射安全驗證器。系統通過複雜性評分路由查詢，在AMD Instinct MI300X上微調，實現了56倍的吞吐量加速，並支持本地部署以確保數據主權。

文章情報

工程師進階

要點

開源、隱私保護的腫瘤決策支持系統，支持本地部署。
雙層LLM架構：9B快速模型和27B深度推理模型，通過複雜性評分路由。
多智能體LangGraph拓撲，8個節點實現臨牀推理分解。
零PHI策略和四層安全架構，確保合規性和安全性。

為甚麼重要

這條新聞值得關注，因為開源、隱私保護的腫瘤決策支持系統，支持本地部署。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

OncoAgent是一個創新的開源臨牀決策支持系統，專為腫瘤學設計，旨在解決現有AI系統在隱私、準確性和可部署性方面的關鍵問題。該系統由OncoAgent研究團隊開發，結合了雙層微調大語言模型（LLM）架構、最先進的多智能體LangGraph拓撲、基於70餘項NCCN和ESMO指南的四階段糾正性RAG流程，以及三層反射安全驗證器，嚴格執行零受保護健康信息（PHI）政策。

OncoAgent的核心設計原則包括架構分解、基於檢索的生成和硬件主權。臨牀推理被分解為八個專門的LangGraph節點，每個節點具有有限且可審計的功能。所有模型輸出都通過檢索管道與精選的向量知識庫錨定，並設有顯式的相關性門控。完整的推理和訓練棧原生運行在AMD Instinct MI300X上，使用ROCm和開源框架，使醫院能夠在無需數據外流的情況下進行部署。

系統通過一個加權加法複雜性評分器來路由臨牀查詢。該評分器考慮癌症類型、分期、突變和既往治療等因素，將查詢分配給9B參數的速度優化模型（第一層）或27B的深度推理模型（第二層）。兩個模型均通過QLoRA在包含266,854個真實和合成腫瘤病例的語料庫上進行微調，使用Unsloth框架在AMD Instinct MI300X硬件上完成。序列打包技術使全數據集微調僅需約50分鐘，相比基於API的生成實現了56倍的吞吐量加速。

OncoAgent的安全和隱私框架包括一個專門的零PHI編輯節點，在文本到達任何LLM之前識別並替換受保護的健康信息。四層安全架構分別在檢索層、生成層和部署層實施，確保即使單層失效也不會影響整體安全態勢。對於高複雜性或低置信度的輸出，系統設有強制的人機交互（HITL）中斷點。

臨牀界面採用實時流式Gradio應用程序，以ChatGPT風格的對話佈局呈現，提供會話控制、KPI面板、證據來源選項卡以及實時代理推理更新。該界面遵循WCAG 2.1 AA標準，確保可訪問性。

實驗結果令人印象深刻：糾正性RAG管道的文檔評分成功率達100%，平均RAG置信度分數超過2.3；複雜性路由正確識別了需要深度推理的複雜案例；訓練吞吐量顯著提升；所有八個編譯節點和六個模塊測試套件均通過驗證。

OncoAgent證明了在遵守嚴格隱私法規的同時，實現最先進的多智能體臨牀AI是可行的。其完全開源、可本地部署的特性，為醫療機構提供了一種無需依賴專有云API的解決方案，從而保護患者數據主權。