2026-06-01 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

基于策略即代码搜索的医疗机制：应对战略性提供者响应

现有AI医疗基准固定了提供者响应，无法评估机制产生的均衡。该研究将医院机制设计重新定义为语言模型的程序合成，通过多智能体模拟器Medi-Sim和进化代码搜索，实现了消除过度编码、减少拒绝并保留大部分资金的可解释混合目标程序。

来源arXiv AI作者: Zihan Wang, Xiang Xu, Hongyuan Zha, Wenhao Li

在医疗保健领域，机制设计从来不是孤立存在的——它总是与提供者的战略性回应紧密交织。然而，现有的医疗AI基准测试往往假设提供者的行为是固定不变的，因而无法评估一个机制在均衡状态下实际产生的效果。这种局限可能导致我们对政策影响的判断出现严重偏差。

针对这一问题，一项发表于2026年的研究提出了一种全新的方法：将医院机制设计重新定义为语言模型的程序合成。具体来说，研究人员定义了类型化、可检查的规则程序，这些程序由一个名为Medi-Sim的多智能体模拟器执行并评分。Medi-Sim包含了五种战略性提供者渠道：编码（coding）、选择（selection）、延迟（delay）、努力（effort）和分诊（triage），能够模拟提供者在不同激励下的复杂行为。

通过激励扫描，研究团队重现了健康经济学中的经典现象。例如，在利润压力下，提供者倾向于进行“过度编码”（up-coding）——即把患者归类到更昂贵的诊断类别以获取更多报销；同时他们也会选择低复杂度的患者，因为治疗成本更低、利润更高。更令人警惕的是，研究还发现了“古德哈特漂移”（Goodhart-style drift）：当测量指标与实际结果脱节时，绩效指标可能与真实结果呈负相关，从而导致系统性的扭曲。

一个关键的发现是压力迁移现象。研究人员通过单一的审计杠杆——关闭编码渠道——发现低复杂度患者的选择竟然翻倍以上。这意味着，当一种策略被堵住时，提供者会迅速转向其他方式来实现其目标，这种连锁反应在传统基准测试中完全被忽略了。

为了应对这些挑战，研究团队利用LLM引导的进化代码搜索，在相同的规则程序空间中自动合成了一种可解释的混合目标程序。这一程序巧妙地平衡了多个目标：它完全消除了过度编码，将患者拒绝率减半，同时保留了大部分以利润为导向的基线资金。换言之，它实现了效率与公平的兼顾，而这一切都是通过自动化设计完成的。

这项研究的意义不仅在于提供了一种评估医疗机制的新工具，更在于它通过实际模拟揭示了政策调整的潜在副作用。未来，这种方法有望应用于更广泛的医疗政策制定中，帮助决策者提前预见并提供者响应带来的复杂影响，从而设计出更加稳健和有效的政策。