2026-05-28 13:00 UTC+9サイト内リライト1 分で読了更新: 2026-06-30 22:03 UTC+9

RAG-Coding：構造化された外部知識を活用したLLM医療コード化の強化

RAG-Codingは、4つの大規模言語モデル（LLM）エージェントを調整し、外部知識源（公式コード一覧やガイドラインなど）に基づいて意思決定を行う自動化されたICD-10-CMコード化手法です。MDACEデータセットでは、最良のLLMベースラインと比較してマイクロF1で8〜13%、マクロF1で2〜8%向上しました。最先端の事前学習モデルPLM-ICDと比較すると、RAG-Codingはマイクロ再現率が11%高い一方、PLM-ICDはマイクロ精度が6%高く、両者のF1は同等です。アブレーション実験により外部知識の重要性が確認されました。また、2025年ガイドラインに基づいて専門家が再注釈したMDACE-2025データセットを公開し、より細かいコードラベルでの評価を可能にしました。

ソースarXiv Computational Linguistics著者: Yidong Gan, David D. Nguyen, Yang Lin, Peter Zhong, Thanh Vu, Long Duong, Yuan-Fang Li

記事インテリジェンス

エンジニア上級

要点

RAG-Codingは4つのLLMエージェントと外部知識源を活用し、ICD-10-CMコード化の精度を向上させる。
MDACEデータセットで最良LLMベースラインをマイクロF1で8〜13%、マクロF1で2〜8%上回る。
PLM-ICDと比較してRAG-Codingはマイクロ再現率が高いが精度は劣り、総合F1は同等。
2025年ガイドラインに基づき再注釈されたMDACE-2025データセットを公開。

重要な理由

このニュースが重要なのは、RAG-Codingは4つのLLMエージェントと外部知識源を活用し、ICD-10-CMコード化の精度を向上させるためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

最近、arXivに投稿された論文「RAG-Coding: Enhancing LLM Medical Coding with Structured External Knowledge」では、自動化されたICD-10-CMコーディングのための新しい手法が提案されました。この手法は、4つの大規模言語モデル（LLM）エージェントを調整し、外部知識源（公式コード一覧やガイドラインなど）に基づいてコーディングの判断を行います。これにより、コーディングの精度と臨床コンプライアンスが向上します。MDACEデータセットでの実験結果によると、RAG-Codingは既存の最良LLMベースラインを上回り、マイクロF1スコアで8〜13%、マクロF1スコアで2〜8%の改善を示しました。現在最も先進的な事前学習言語モデル手法であるPLM-ICDと比較すると、RAG-Codingはマイクロ再現率で11%高いものの、マイクロ精度では6%低く、マイクロおよびマクロF1は概ね同等でした。研究チームはアブレーション実験を通じて各コンポーネントの貢献を検証し、外部知識が性能向上の鍵であることを確認しました。手法の発表に加えて、研究チームはMDACE-2025データセットも公開しました。これは元のMDACEを更新したもので、2025年最新のICD-10-CMガイドラインに基づいて専門家が再注釈を施し、より細かいコードラベルを提供しています。これにより、現在の臨床基準に沿った評価が可能になります。本研究は、自動医療コーディングの進歩を促すだけでなく、厳格な知識準拠が必要な医療シナリオへのLLM応用に新たな道を開くものです。