2026-05-09站内改写

OncoAgent：一种用于隐私保护肿瘤临床决策支持的双层多智能体框架

OncoAgent是一个开源、隐私保护的肿瘤临床决策支持系统。它采用双层大语言模型架构（9B快速模型和27B深度推理模型）、多智能体LangGraph拓扑、纠正性RAG流程（涵盖70余项NCCN和ESMO指南）以及三层反射安全验证器。系统通过复杂性评分路由查询，在AMD Instinct MI300X上微调，实现了56倍的吞吐量加速，并支持本地部署以确保数据主权。

文章情报

工程师进阶

要点

开源、隐私保护的肿瘤决策支持系统，支持本地部署。
双层LLM架构：9B快速模型和27B深度推理模型，通过复杂性评分路由。
多智能体LangGraph拓扑，8个节点实现临床推理分解。
零PHI策略和四层安全架构，确保合规性和安全性。

为什么重要

这条新闻值得关注，因为开源、隐私保护的肿瘤决策支持系统，支持本地部署。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

OncoAgent是一个创新的开源临床决策支持系统，专为肿瘤学设计，旨在解决现有AI系统在隐私、准确性和可部署性方面的关键问题。该系统由OncoAgent研究团队开发，结合了双层微调大语言模型（LLM）架构、最先进的多智能体LangGraph拓扑、基于70余项NCCN和ESMO指南的四阶段纠正性RAG流程，以及三层反射安全验证器，严格执行零受保护健康信息（PHI）政策。

OncoAgent的核心设计原则包括架构分解、基于检索的生成和硬件主权。临床推理被分解为八个专门的LangGraph节点，每个节点具有有限且可审计的功能。所有模型输出都通过检索管道与精选的向量知识库锚定，并设有显式的相关性门控。完整的推理和训练栈原生运行在AMD Instinct MI300X上，使用ROCm和开源框架，使医院能够在无需数据外流的情况下进行部署。

系统通过一个加权加法复杂性评分器来路由临床查询。该评分器考虑癌症类型、分期、突变和既往治疗等因素，将查询分配给9B参数的速度优化模型（第一层）或27B的深度推理模型（第二层）。两个模型均通过QLoRA在包含266,854个真实和合成肿瘤病例的语料库上进行微调，使用Unsloth框架在AMD Instinct MI300X硬件上完成。序列打包技术使全数据集微调仅需约50分钟，相比基于API的生成实现了56倍的吞吐量加速。

OncoAgent的安全和隐私框架包括一个专门的零PHI编辑节点，在文本到达任何LLM之前识别并替换受保护的健康信息。四层安全架构分别在检索层、生成层和部署层实施，确保即使单层失效也不会影响整体安全态势。对于高复杂性或低置信度的输出，系统设有强制的人机交互（HITL）中断点。

临床界面采用实时流式Gradio应用程序，以ChatGPT风格的对话布局呈现，提供会话控制、KPI面板、证据来源选项卡以及实时代理推理更新。该界面遵循WCAG 2.1 AA标准，确保可访问性。

实验结果令人印象深刻：纠正性RAG管道的文档评分成功率达100%，平均RAG置信度分数超过2.3；复杂性路由正确识别了需要深度推理的复杂案例；训练吞吐量显著提升；所有八个编译节点和六个模块测试套件均通过验证。

OncoAgent证明了在遵守严格隐私法规的同时，实现最先进的多智能体临床AI是可行的。其完全开源、可本地部署的特性，为医疗机构提供了一种无需依赖专有云API的解决方案，从而保护患者数据主权。