基于策略即代码搜索的医疗机制:应对战略性提供者响应
现有AI医疗基准固定了提供者响应,无法评估机制产生的均衡。该研究将医院机制设计重新定义为语言模型的程序合成,通过多智能体模拟器Medi-Sim和进化代码搜索,实现了消除过度编码、减少拒绝并保留大部分资金的可解释混合目标程序。
在医疗保健领域,机制设计从来不是孤立存在的——它总是与提供者的战略性回应紧密交织。然而,现有的医疗AI基准测试往往假设提供者的行为是固定不变的,因而无法评估一个机制在均衡状态下实际产生的效果。这种局限可能导致我们对政策影响的判断出现严重偏差。
针对这一问题,一项发表于2026年的研究提出了一种全新的方法:将医院机制设计重新定义为语言模型的程序合成。具体来说,研究人员定义了类型化、可检查的规则程序,这些程序由一个名为Medi-Sim的多智能体模拟器执行并评分。Medi-Sim包含了五种战略性提供者渠道:编码(coding)、选择(selection)、延迟(delay)、努力(effort)和分诊(triage),能够模拟提供者在不同激励下的复杂行为。
通过激励扫描,研究团队重现了健康经济学中的经典现象。例如,在利润压力下,提供者倾向于进行“过度编码”(up-coding)——即把患者归类到更昂贵的诊断类别以获取更多报销;同时他们也会选择低复杂度的患者,因为治疗成本更低、利润更高。更令人警惕的是,研究还发现了“古德哈特漂移”(Goodhart-style drift):当测量指标与实际结果脱节时,绩效指标可能与真实结果呈负相关,从而导致系统性的扭曲。
一个关键的发现是压力迁移现象。研究人员通过单一的审计杠杆——关闭编码渠道——发现低复杂度患者的选择竟然翻倍以上。这意味着,当一种策略被堵住时,提供者会迅速转向其他方式来实现其目标,这种连锁反应在传统基准测试中完全被忽略了。
为了应对这些挑战,研究团队利用LLM引导的进化代码搜索,在相同的规则程序空间中自动合成了一种可解释的混合目标程序。这一程序巧妙地平衡了多个目标:它完全消除了过度编码,将患者拒绝率减半,同时保留了大部分以利润为导向的基线资金。换言之,它实现了效率与公平的兼顾,而这一切都是通过自动化设计完成的。
这项研究的意义不仅在于提供了一种评估医疗机制的新工具,更在于它通过实际模拟揭示了政策调整的潜在副作用。未来,这种方法有望应用于更广泛的医疗政策制定中,帮助决策者提前预见并提供者响应带来的复杂影响,从而设计出更加稳健和有效的政策。