2026-06-01 12:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

基於策略即代碼搜索的醫療機制：應對戰略性提供者響應

現有AI醫療基準固定了提供者響應，無法評估機制產生的均衡。該研究將醫院機制設計重新定義為語言模型的程序合成，通過多智能體模擬器Medi-Sim和進化代碼搜索，實現了消除過度編碼、減少拒絕並保留大部分資金的可解釋混合目標程序。

來源arXiv AI作者: Zihan Wang, Xiang Xu, Hongyuan Zha, Wenhao Li

在醫療保健領域，機制設計從來不是孤立存在的——它總是與提供者的戰略性回應緊密交織。然而，現有的醫療AI基準測試往往假設提供者的行為是固定不變的，因而無法評估一個機制在均衡狀態下實際產生的效果。這種侷限可能導致我們對政策影響的判斷出現嚴重偏差。

針對這一問題，一項發表於2026年的研究提出了一種全新的方法：將醫院機制設計重新定義為語言模型的程序合成。具體來説，研究人員定義了類型化、可檢查的規則程序，這些程序由一個名為Medi-Sim的多智能體模擬器執行並評分。Medi-Sim包含了五種戰略性提供者渠道：編碼（coding）、選擇（selection）、延遲（delay）、努力（effort）和分診（triage），能夠模擬提供者在不同激勵下的複雜行為。

通過激勵掃描，研究團隊重現了健康經濟學中的經典現象。例如，在利潤壓力下，提供者傾向於進行“過度編碼”（up-coding）——即把患者歸類到更昂貴的診斷類別以獲取更多報銷；同時他們也會選擇低複雜度的患者，因為治療成本更低、利潤更高。更令人警惕的是，研究還發現了“古德哈特漂移”（Goodhart-style drift）：當測量指標與實際結果脱節時，績效指標可能與真實結果呈負相關，從而導致系統性的扭曲。

一個關鍵的發現是壓力遷移現象。研究人員通過單一的審計槓桿——關閉編碼渠道——發現低複雜度患者的選擇竟然翻倍以上。這意味着，當一種策略被堵住時，提供者會迅速轉向其他方式來實現其目標，這種連鎖反應在傳統基準測試中完全被忽略了。

為了應對這些挑戰，研究團隊利用LLM引導的進化代碼搜索，在相同的規則程序空間中自動合成了一種可解釋的混合目標程序。這一程序巧妙地平衡了多個目標：它完全消除了過度編碼，將患者拒絕率減半，同時保留了大部分以利潤為導向的基線資金。換言之，它實現了效率與公平的兼顧，而這一切都是通過自動化設計完成的。

這項研究的意義不僅在於提供了一種評估醫療機制的新工具，更在於它通過實際模擬揭示了政策調整的潛在副作用。未來，這種方法有望應用於更廣泛的醫療政策制定中，幫助決策者提前預見並提供者響應帶來的複雜影響，從而設計出更加穩健和有效的政策。