2026-07-02 04:21 UTC+8站內改寫2 分鐘閱讀更新: 2026-07-02 04:31 UTC+8

通過醫療AI視角解讀智能體設計模式

作者通過閲讀Anthropic的《構建有效AI智能體》指南，重新審視了常見的智能體工程模式，並將其應用於醫療健康領域。核心發現是：醫療AI的自主性應建立在可驗證性之上——結構化數據（如FHIR）使任務可驗證，從而允許更高自主性；而涉及臨牀判斷的任務仍需人類參與。文章強調了簡單優於複雜、透明優於抽象的原則，並指出評估（evals）是衡量“足夠好”的關鍵。

來源Hacker News AI作者: adjks

作者在閲讀Anthropic的《構建有效AI智能體》指南後，重新思考了智能體設計模式在醫療健康領域的應用。該指南簡潔優雅，強調了簡單優於複雜、透明優於抽象的核心原則。作者將LLM視為擁有工具、記憶和檢索能力的初級開發者，需要在設計上保持克制，避免過度複雜化。

文章首先探討了工作流模式的潛在應用：提示鏈可用於從語音生成臨牀文檔或轉化臨牀試驗標準；路由模式可應用於醫療問答分流，將複雜或模糊的問題轉交給人類。然而，作者發現後續模式似乎只是路由的變體，於是將焦點轉向了可驗證性這一關鍵問題。

Anthropic首席執行官Dario Amodei曾指出，編程之所以成為AI輔助的首個灘頭陣地，是因為其可驗證性。這促使作者重新審視FHIR（快速醫療互操作性資源）標準——標準化、結構化的JSON格式使其本身可驗證，進而使某些醫療問題也變得可驗證。

基於此，作者將問題重新定向：哪些醫療健康用例是實際可驗證的？

並行化模式可將自由文本轉換為FHIR資源，通過並行子調用驗證生成JSON的結構、代碼和編碼值。編排器-工作者模式可聚合多源健康記錄，由編排器協調各工作者拉取並標準化數據，最終合成一致的患者畫像。

評估者-優化者模式被作者深入探討。該模式最適合具有明確質量標準且LLM可自行提供反饋的場景。最清晰的例子是去標識化：生成器生成臨牀筆記的脱敏版本，評估器掃描殘留的受保護健康信息（PHI），循環直至完全乾淨。臨牀編碼也具有相同模式。但一旦反饋需要臨牀判斷（如安全性），循環則必須開放給人類。這反映了醫療AI並非同質化高風險，而是存在一個光譜，評估者-優化者模式恰好適用於低風險、可自我驗證的一端。

關於智能體模式，作者區分了兩個極端：涉及臨牀決策的智能體絕不能脱離人類監督運行，因為動作空間開放，後果涉及健康安全；但數據協調智能體可完全自主，特別是在使用FHIR等標準化格式時。這比編排器-工作者更進一步，自主性體現在智能體自主決定獲取什麼數據、解決衝突並持續迭代，直到數據一致。關鍵在於輸出仍是結構化且可檢查的，因此自主性安全可控。

最終結論是：醫療AI的自主性並非固定模式清單，而是通過可驗證性贏得的梯度。結構化的醫療數據（如FHIR、數據協調）是可驗證的，可驗證的部分可由智能體掌控；臨牀判斷部分則保留給人類，並非因為智能體無法觸及，而是因為我們尚未能充分衡量其可靠性。評估（evals）是回答“足夠好”這一問題的關鍵，將在後續文章中深入探討。