AI News HubLIVE
站内改写

OncoAgent:一种用于隐私保护肿瘤临床决策支持的双层多智能体框架

OncoAgent是一个开源、隐私保护的肿瘤临床决策支持系统。它采用双层大语言模型架构(9B快速模型和27B深度推理模型)、多智能体LangGraph拓扑、纠正性RAG流程(涵盖70余项NCCN和ESMO指南)以及三层反射安全验证器。系统通过复杂性评分路由查询,在AMD Instinct MI300X上微调,实现了56倍的吞吐量加速,并支持本地部署以确保数据主权。

文章情报

工程师进阶

要点

  • 开源、隐私保护的肿瘤决策支持系统,支持本地部署。
  • 双层LLM架构:9B快速模型和27B深度推理模型,通过复杂性评分路由。
  • 多智能体LangGraph拓扑,8个节点实现临床推理分解。
  • 零PHI策略和四层安全架构,确保合规性和安全性。

为什么重要

这条新闻值得关注,因为开源、隐私保护的肿瘤决策支持系统,支持本地部署。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

OncoAgent是一个创新的开源临床决策支持系统,专为肿瘤学设计,旨在解决现有AI系统在隐私、准确性和可部署性方面的关键问题。该系统由OncoAgent研究团队开发,结合了双层微调大语言模型(LLM)架构、最先进的多智能体LangGraph拓扑、基于70余项NCCN和ESMO指南的四阶段纠正性RAG流程,以及三层反射安全验证器,严格执行零受保护健康信息(PHI)政策。

OncoAgent的核心设计原则包括架构分解、基于检索的生成和硬件主权。临床推理被分解为八个专门的LangGraph节点,每个节点具有有限且可审计的功能。所有模型输出都通过检索管道与精选的向量知识库锚定,并设有显式的相关性门控。完整的推理和训练栈原生运行在AMD Instinct MI300X上,使用ROCm和开源框架,使医院能够在无需数据外流的情况下进行部署。

系统通过一个加权加法复杂性评分器来路由临床查询。该评分器考虑癌症类型、分期、突变和既往治疗等因素,将查询分配给9B参数的速度优化模型(第一层)或27B的深度推理模型(第二层)。两个模型均通过QLoRA在包含266,854个真实和合成肿瘤病例的语料库上进行微调,使用Unsloth框架在AMD Instinct MI300X硬件上完成。序列打包技术使全数据集微调仅需约50分钟,相比基于API的生成实现了56倍的吞吐量加速。

OncoAgent的安全和隐私框架包括一个专门的零PHI编辑节点,在文本到达任何LLM之前识别并替换受保护的健康信息。四层安全架构分别在检索层、生成层和部署层实施,确保即使单层失效也不会影响整体安全态势。对于高复杂性或低置信度的输出,系统设有强制的人机交互(HITL)中断点。

临床界面采用实时流式Gradio应用程序,以ChatGPT风格的对话布局呈现,提供会话控制、KPI面板、证据来源选项卡以及实时代理推理更新。该界面遵循WCAG 2.1 AA标准,确保可访问性。

实验结果令人印象深刻:纠正性RAG管道的文档评分成功率达100%,平均RAG置信度分数超过2.3;复杂性路由正确识别了需要深度推理的复杂案例;训练吞吐量显著提升;所有八个编译节点和六个模块测试套件均通过验证。

OncoAgent证明了在遵守严格隐私法规的同时,实现最先进的多智能体临床AI是可行的。其完全开源、可本地部署的特性,为医疗机构提供了一种无需依赖专有云API的解决方案,从而保护患者数据主权。