AI News HubLIVE
サイト内リライト2 分で読了

家庭用短い動画から臨床グレードの自閉症行動スコアリングを実現するマルチモーダル大規模言語モデルの微調整

研究者らは、低ランク適応を用いて400件の臨床医評価済み家庭動画でGemini 2.5 Proを微調整し、評価者間信頼性と自閉症診断精度において有意な改善を達成、臨床医のパフォーマンスに匹敵または上回りました。このアプローチは、自閉症評価におけるスケーラブルな行動特徴抽出を可能にします。

ソースarXiv Computer Vision著者: Mohammadmahdi Honarmand, Parnian Azizian, Aaron Kline, Kae Nurge, Zerin Nasrin Tumpa, Saimourya Surabhi, Kaitlyn Dunlap, Yang Qian, Ali Kargarandehkordi, Sameer Neupane, Peter Washington, Dennis P. Wall

自閉症スペクトラム障害(ASD)は、米国の子供31人に1人が罹患している神経発達障害であり、診断年齢の中央値は4歳を超えることが知られています。早期診断と介入の重要性が認識される一方で、専門医による評価は時間とコストがかかるため、多くの子供が適切な支援を受けられずにいます。近年、人工知能技術を用いて家庭動画などの観察データから行動スコアリングを行う研究が進んでいます。

最新の研究では、マルチモーダル大規模言語モデルを微調整することで、臨床グレードの自閉症行動スコアリングを実現する手法が提案されました。研究チームは、低ランク適応(LoRA)法を用いてGoogleのGemini 2.5 Proを効率的に微調整しました。使用したデータは400本の臨床医評価済み家庭動画で、訓練対象は事前に信頼性が確認された30の行動特徴のみに限定されています。これらの特徴は、社会的相互作用、コミュニケーションパターン、反復行動など、ASD診断に重要な領域をカバーしています。

99人の保留児童(ASD 49人、神経典型的発達50人)を用いた評価では、モデルは顕著な性能を示しました。臨床医との評価者間信頼性(特徴ごとの重み付きCohen's kappa)は全体で40%向上し(p<0.001)、評価可能な28特徴のうち27特徴で改善が見られました。さらに、ゼロショット能力として直接ASD診断を試みたところ、F1スコアは53%向上し(p<0.001)、臨床医の成績に匹敵またはそれを上回る結果となりました。

微調整後の大規模言語モデルから抽出された行動特徴を分類器に入力するパイプラインも構築されました。このパイプラインは、すべてのテスト経路において臨床医によるスコアリング入力と同等の性能を示し、77%の精度(95%信頼区間:68-85%)と86%のAUC(95%信頼区間:78-92%)を達成しました。この結果は、微調整されたマルチモーダル大規模言語モデルが、自閉症評価においてスケーラブルな行動特徴抽出器として機能することを示しています。

本研究の意義は、専門医へのアクセスが限られている地域や家庭でも、短い家庭動画をアップロードするだけで信頼性の高い初期スクリーニングが可能になる点にあります。将来的には、スマートフォンアプリケーションに統合され、より広範な利用が期待されます。ただし、研究チームは、より多様な集団での検証や、長期的な追跡調査による有効性確認が必要であると指摘しています。この技術は、早期発見と早期介入の促進に貢献する可能性を秘めています。