大型AI模型在口腔医疗中的应用:从通用系统到领域专用基础模型
一项系统综述将口腔医疗中的大型AI模型分为语言生成、判别视觉基础和口腔专用基础三大类,基于97项研究指出它们互补但面临幻觉、数据稀缺和缺乏标准化评估等挑战。
口腔疾病影响着全球约35亿人,然而大型人工智能模型在口腔医疗领域的临床潜力尚未得到充分探索。近日,一项遵循PRISMA-ScR指南的系统综述对这一领域进行了全面梳理。研究者检索了PubMed、Google Scholar、Scopus和arXiv四个数据库,经独立双人筛选后,最终纳入2020年至2026年间发表的97项研究,并提出一个二维分类框架,按架构范式和口腔专业化程度对模型进行归类。
综述将模型划分为三大类别:语言生成模型、判别视觉基础模型和口腔专用基础模型。语言生成模型在临床推理、执照考试和患者沟通等文本类任务中表现优异,但在依赖图像的诊断任务中结果不稳定。经过改写的SAM和CLIP变体在牙齿分割和病变检测上取得了强劲成绩。而口腔专用模型如DentVFM、DentVLM和OralGPT,则在复杂的多模态任务中展现出最强性能。值得注意的是,将多种模型整合进结构化流水线的方法始终优于单一模型。
研究还观察到一种数据不对称现象:口腔领域的预训练几乎完全集中在视觉域,这反映了大规模口腔文本语料库的稀缺性。作者指出,通用模型和口腔专用模型扮演着互补角色,最有效的系统往往在流水线中结合两者。要实现安全自主的临床部署,仍需克服三大障碍:生成模型中的幻觉问题、有限的口腔标注数据集,以及标准化临床评估基准的缺失。