2026-06-09站内改写2 分钟阅读更新: 2026-06-09

PathoSage：通过经验感知的智能体工作流实现病理学多源证据裁定

PathoSage是一个三阶段框架，用于病理学中的分块级多模态推理。它通过结构化证据审议独立评估来自不同工具的异质证据，进行冲突分析，并在全新上下文中生成最终判断，以减少锚定偏差。同时引入无需训练的Beta-Bernoulli经验系统，利用连续信用分配建模工具的长期可靠性。实验表明，PathoSage有效缓解了视觉问答中的幻觉问题和分类器之间的分歧，显著优于现有最强病理学多模态大语言模型及智能体基线方法。

来源arXiv AI作者: Chengyang Zhang, Wenchuan Zhang, Bo Li, Mengran Li, Bob Zhang, Yuhao Yi, Hong Bu, Jiancheng Lv

近年来，多模态大语言模型（MLLMs）和智能体工作流在计算病理学领域展现出巨大潜力，但可靠的补丁级推理仍是重大挑战。端到端的病理学MLLM常常出现形态特征幻觉，而现有的智能体系统通常将各类工具的输出与检索知识简单地合并到共享上下文之中，导致决策极易受到冲突证据和上下文污染的干扰。针对这一瓶颈，来自学术界的研究团队提出了PathoSage——一个创新的三阶段框架，旨在为补丁级病理学多模态推理提供清晰、可靠且可解释的证据处理流程。

PathoSage的核心架构将推理过程严格拆分为三个独立阶段：知识检索、证据收集与证据裁定。在知识检索阶段，系统从外部知识库中提取相关病理学先验知识；证据收集阶段则调用包括分类器、视觉问答（VQA）模型等多种专业化工具，获取关于组织病理图像块的异质性证据。最关键的是第三阶段——证据裁定，它通过名为“结构化证据审议”（Structured Evidence Deliberation）的组件独立处理所有收集到的证据。该组件逐条审视来自不同工具的输出，进行精细的冲突分析，并在一个全新的、不受先前上下文干扰的语境中生成最终判断。这种设计有效避免了传统方法中常见的锚定偏差，即模型过度依赖最初看到的证据或上下文。

除了结构化的裁决流程，PathoSage还引入了一种无需额外训练的Beta-Bernoulli经验系统。该系统通过连续信用分配机制来建模每类工具在长期使用中的可靠性：每当工具的输出被验证为正确或错误时，其对应的Beta分布参数就会相应更新，从而形成基于历史表现的信誉度评估。更重要的是，系统会为未来工具的使用构建相似性加权的先验概率，即对于与历史任务相似的新任务，具有良好过往记录的工具会获得更高的信任权重。这一机制使得整个框架能够根据实际表现动态调整对工具输出的依赖程度，而不需要繁重的再训练过程。

在广泛的实验验证中，PathoSage展示了显著的优势。研究者将其与多种当前最强的病理学专用MLLM以及智能体基线进行了对比，评估任务涵盖VQA幻觉抑制和分类器分歧协调。结果表明，PathoSage在多个指标上均实现了最优性能：VQA幻觉率大幅下降，不同分类器之间对同一图像块的诊断不一致性也得到有效缓解。这些成果有力证明了明确的证据裁定机制与可靠性感知的工具建模是构建稳健病理学智能体的两大关键要素。

PathoSage的提出为计算病理学领域带来了全新的方法论视角。它不仅解决了现有方法在证据融合和决策可解释性方面的短板，还为未来在实际临床环境中辅助病理学家进行更准确、更一致的诊断提供了坚实的技术基础。随着该框架的进一步优化和推广，有望显著提升人工智能辅助病理诊断的可靠性和临床接受度。