Melanoscope AI移動皮膚鏡臨牀決策支持系統的臨牀驗證
一項針對Melanoscope AI移動皮膚鏡臨牀決策支持系統的前瞻性單中心臨牀驗證顯示,該系統在176名患者中與專家評估的一致率為88.6%,未出現假陰性,特異性為88.3%。研究開發了級聯深度學習模型的定量可解釋性評估方法和三區患者分診算法,為資源有限地區的皮膚癌篩查提供了可重複、可解釋的決策支持。
文章情報
要點
- Melanoscope AI系統在176名患者中實現88.6%的專家一致率,且對5例惡性病變無假陰性。
- 特異性為88.3%,3例黑色素瘤和2例基底細胞癌經組織學確認。
- 通過注意力圖可視化(IoU評估)和三區分診算法增強了模型可解釋性和標準化分診。
為甚麼重要
這條新聞值得關注,因為Melanoscope AI系統在176名患者中實現88.6%的專家一致率,且對5例惡性病變無假陰性。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
近期,一項發表於arXiv的研究對Melanoscope AI移動皮膚鏡臨牀決策支持系統(CDSS)進行了前瞻性單中心臨牀驗證。該系統旨在解決俄羅斯地區皮膚科醫生短缺導致的皮膚癌篩查覆蓋率不足問題,通過移動設備輔助早期檢測惡性皮膚病變。
研究團隊開發了一種用於級聯深度學習模型的定量可解釋性評估方法,並設計了三區患者分診算法。該方法採用兩階段級聯分類對皮膚鏡圖像進行處理,並利用注意力圖可視化技術(對ViT和Swin模型使用注意力展開,對ConvNeXt和EfficientNetV2使用Grad-CAM)生成激活圖。通過基於IoU的定量一致性評估,比較激活圖與專家標註的吻合度。
驗證試驗在俄羅斯奧廖爾地區的四次“黑色素瘤日”活動中進行(2025年6月至2026年4月),共納入176名患者。結果顯示,系統與專家評估的一致率為88.6%,在5例惡性病變中未出現假陰性(95% CI: 47.8%-100%),特異性為88.3%。組織學確認了3例黑色素瘤和2例基底細胞癌,另有6例發育不良痣被納入隨訪。
在可解釋性方面,各模型的平均IoU分別為:ViT 0.69、Swin 0.64、ConvNeXt 0.53、EfficientNetV2 0.51。分診閾值設置為P=0.50。研究得出結論,該系統無假陰性且特異性較高,支持用於篩查。集成的級聯分類、注意力圖可視化、IoU評估和三區分診算法提供了可重複、可解釋的臨牀決策支持,並可根據不同資源水平進行調整。該研究為移動AI系統在皮膚科篩查中的應用提供了重要證據。