医療におけるエージェント型AI:MIRAとAIMEの能力拡大
Nature誌に掲載された2つの論文が、医療におけるエージェント型AIの進展を示す。MIRAシステムは救急部門でエンドツーエンドの患者管理を実現し、診断精度で人間の医師を上回った。AIMEシステムは外来患者の長期管理において非劣性または優位性を示した。限界はあるものの、医療AIが支援から自律管理へと移行する兆しとなっている。
最近、2つの注目すべき研究がNature誌に掲載され、自律型AIエージェント(agentic AI)が医療の領域に応用され始めたことを示しました。これらのシステムは、従来の狭い範囲の診断支援を超え、患者の完全な管理と治療計画の立案を目指しています。
MIRA(Medical Intelligent Reasoning Agent)は、ドイツのJacob Kather氏らが開発したシステムで、病院の電子カルテに組み込まれ、救急部門における患者の評価から行動計画までを自律的に行います。500件の実際の救急症例を用いた検証では、患者エージェントと医師AIエージェントが対話し、病歴、身体所見、検査、画像、薬剤、手術などを順次決定しました。その結果、MIRAの全体的な診断精度は87.8%に達し、4人の認定医の78.1%を上回りました。特に膵炎(95.2% vs 78.6%)や虫垂炎(100% vs 88%)で顕著でした。治療面では、MIRAは腹腔鏡下虫垂切除術などの手技を正しく選択する割合が53.5%(医師38.3%)と優れ、薬剤の99.8%が適応と安全性に適合していました。また、不要な画像検査を減らし、臨床ガイドラインへの準拠度が35%向上しました。
一方、AIME(Articial Intelligence Medical Examiner)は、GoogleのMike Schaekermann氏らが開発し、外来患者の長期的な管理に焦点を当てています。このシステムは、高速なシステム1思考(対話エージェント)と低速なシステム2思考(管理エージェント)の2つのエージェントで構成されます。100人の患者を対象に、3回の外来診療(各約2日間隔)をシミュレーションし、21人のプライマリケア医と比較しました。AIMEはアンサンブル精緻化(Ensemble Refinement)を用いて4つの治療計画からコンセンサスを導き出し、そのプロセスは約80秒で完了しました。3回目の診療では、AIMEの管理計画の評価スコアが98%(医師81%)、治療の正確性が95%(67%)、ガイドライン準拠が100%(86%)と、医師を上回る結果を示しました。
しかし、両研究には多くの限界があります。どちらもテキストベースであり、患者の非言語的コミュニケーションや実際の画像検査のレビューは含まれていません。使用された症例はクリーンなデータセットから選ばれており、現実の医療でよく見られる不完全なデータや矛盾は再現されていません。MIRAの対話は20ターンに制限され、AIMEは患者役の俳優を使用しました。また、カバーされた診療科や疾患の範囲も限られています。
こうした限界にもかかわらず、これらの研究は医療AIの可能性を示しています。MIRAの診断精度の向上や薬剤選択の正確さは印象的であり、経済的なインセンティブに左右されない運営は望ましい特性です。AIMEの長期管理における記憶と効率性は、現在の医療システムが抱える問題を解決する可能性があります。ただし、AIがガイドラインに過度に準拠することは、個々の患者の事情を考慮する医療の芸術を損なうリスクも指摘されています。
著者のEric Topol氏は、これらの研究はシミュレーションの範囲内での前進に過ぎないとしながらも、AIの能力向上が速いことを踏まえ、近い将来に実際の医療に応用される可能性を示唆しています。そのためには、AI単独、人間の医師単独、両者の組み合わせの3つの戦略を比較するランダム化比較試験が理想的だと述べています。