反因果ドメイン汎化:ラベルなしデータの活用
この論文は、特に結果が観測された共変量を引き起こす反因果設定におけるドメイン汎化問題を研究しています。著者らは、複数の環境からのラベルなしデータを利用して、共変量の平均と共分散の変動に対するモデルの感度を正則化する2つの手法を提案し、最悪ケースの最適性保証を提供しています。物理システムと生理信号データセットで実証性能を示しています。
機械学習において、ドメイン汎化(Domain Generalization)は、新しい未知の環境にデプロイされた際に、データ分布の変化に対してロバストな予測モデルを学習することを目的としています。従来の手法は通常、複数のラベル付きトレーニング環境を必要としますが、実際にはラベル付きデータが不足していることが多く、適用が制限されます。この課題に対し、AppleとETHチューリッヒの研究者らは、反因果設定におけるドメイン汎化に取り組み、ラベルなしデータを活用する革新的な手法を提案しました。
反因果設定とは、結果変数が観測された共変量を引き起こす構造を指します。例えば、医療診断では、疾患(結果)が特定の症状(共変量)を引き起こすことがあります。この構造の下では、環境摂動は共変量に影響を与えますが、結果には伝播しません。そのため、モデルのこれらの摂動に対する感度を正則化することで、汎化性能を向上させることができます。重要なのは、摂動方向の推定にはラベルが不要であるため、複数の環境からのラベルなしデータを活用できる点です。
本論文では、2つの正則化手法を提案しています。第一の手法は共変量の平均の変動に対するモデルの感度を罰則化し、第二の手法は共変量の共分散の変動に対する感度を罰則化します。著者らは、特定の環境クラスの下でこれらの手法が最悪ケースの最適性保証を持つことを理論的に証明しました。さらに、制御された物理システム(例えば、シミュレートされた回路)と生理信号データセット(例えば、心電図)を用いた実験により、提案手法の有効性を実証しています。ラベルなしデータのみを使用しても、新しい環境でのモデルの性能が大幅に向上することが示されました。
この論文は、2023年の国際会議ICLRのワークショップ「Trustworthy Machine Learning for Healthcare Workshop」で採択されました。研究チームには、AppleのSorawit Saengkyongam、Andrew C. Miller、Christina Heinze-Deml、ETHチューリッヒのJonas Peters、Nicolai Meinshausen、そしてJuan L. Gamellaが含まれています。本研究は、ラベルが不足している条件下でのロバストなドメイン汎化を実現する新たな方向性を示しており、特に医療など信頼性が重視される分野での応用が期待されます。今後、この手法はより多くの反因果構造を持つ実世界の問題に拡張され、機械学習の実用化を促進するでしょう。