Melanoscope AI移动皮肤镜临床决策支持系统的临床验证
一项针对Melanoscope AI移动皮肤镜临床决策支持系统的前瞻性单中心临床验证显示,该系统在176名患者中与专家评估的一致率为88.6%,未出现假阴性,特异性为88.3%。研究开发了级联深度学习模型的定量可解释性评估方法和三区患者分诊算法,为资源有限地区的皮肤癌筛查提供了可重复、可解释的决策支持。
文章情报
要点
- Melanoscope AI系统在176名患者中实现88.6%的专家一致率,且对5例恶性病变无假阴性。
- 特异性为88.3%,3例黑色素瘤和2例基底细胞癌经组织学确认。
- 通过注意力图可视化(IoU评估)和三区分诊算法增强了模型可解释性和标准化分诊。
为什么重要
这条新闻值得关注,因为Melanoscope AI系统在176名患者中实现88.6%的专家一致率,且对5例恶性病变无假阴性。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
近期,一项发表于arXiv的研究对Melanoscope AI移动皮肤镜临床决策支持系统(CDSS)进行了前瞻性单中心临床验证。该系统旨在解决俄罗斯地区皮肤科医生短缺导致的皮肤癌筛查覆盖率不足问题,通过移动设备辅助早期检测恶性皮肤病变。
研究团队开发了一种用于级联深度学习模型的定量可解释性评估方法,并设计了三区患者分诊算法。该方法采用两阶段级联分类对皮肤镜图像进行处理,并利用注意力图可视化技术(对ViT和Swin模型使用注意力展开,对ConvNeXt和EfficientNetV2使用Grad-CAM)生成激活图。通过基于IoU的定量一致性评估,比较激活图与专家标注的吻合度。
验证试验在俄罗斯奥廖尔地区的四次“黑色素瘤日”活动中进行(2025年6月至2026年4月),共纳入176名患者。结果显示,系统与专家评估的一致率为88.6%,在5例恶性病变中未出现假阴性(95% CI: 47.8%-100%),特异性为88.3%。组织学确认了3例黑色素瘤和2例基底细胞癌,另有6例发育不良痣被纳入随访。
在可解释性方面,各模型的平均IoU分别为:ViT 0.69、Swin 0.64、ConvNeXt 0.53、EfficientNetV2 0.51。分诊阈值设置为P=0.50。研究得出结论,该系统无假阴性且特异性较高,支持用于筛查。集成的级联分类、注意力图可视化、IoU评估和三区分诊算法提供了可重复、可解释的临床决策支持,并可根据不同资源水平进行调整。该研究为移动AI系统在皮肤科筛查中的应用提供了重要证据。