光学・合成開口レーダ画像における洪水検出のためのトポロジー情報を活用したニューラルネットワーク
本研究は、位相的データ解析を組み込んだニューラルネットワーク手法を提案し、洪水検出の精度と解釈可能性を向上させる。SEN12-FLOODデータセットを用いて、画像から抽出した位相的特徴をニューラルネットワークに統合し、位相的記述子が単独で意味のある洪水シグナルを伝達し、既存ネットワークのロバスト性と解釈可能性を高めることを示す。
洪水は世界中で頻発する自然災害であり、迅速かつ正確な検出は緊急対応と人的・経済的損失の軽減に不可欠です。衛星データの利用拡大と人工知能の進歩により環境ハザードの監視は強化されましたが、雲が光学衛星画像を遮るため、多くの洪水イベントの検出は依然として困難です。この問題に対し、RambourらはSEN12-FLOODデータセットを導入し、ResNet-50畳み込みニューラルネットワークバックボーンで画像ごとの特徴を抽出した後、ゲート付き回帰ユニット(GRU)ネットワークに入力することで、時系列情報が単一画像ベースラインと比較して精度を大幅に向上させることを示しました。最近では、Chamatidisらがビジョントランスフォーマーが一般的な畳み込みアーキテクチャと組み合わせても優れた性能を発揮できることを示しています。しかし、これらのモデルは通常不透明なブラックボックスとして機能し、特にリモートセンシングのような安全クリティカルな領域では、その決定境界、学習済み特徴、内部推論の解釈が困難です。
対照的に、位相的データ解析(TDA)はデータの大域的な構造的特徴を捉える数学的に厳密な枠組みを提供します。TDAは複雑な画像、特に幾何学的に解釈可能な構造を持つ画像(洪水はその代表例)の解析に有力なツールとして登場しました。本研究では、Sophia LiらがオープンソースのSEN12-FLOODデータセットを用いて、洪水検出のための位相的記述子を体系的に評価します。具体的には、画像のパーシステントホモロジー(持続的ホモロジー)特徴、例えばベッティ数やパーシステンス図を計算し、これらの位相的記述子を追加の入力として既存の畳み込みネットワークやトランスフォーマーネットワークに供給します。その結果、位相的記述子が単独で意味のある洪水シグナルを伝達し、既存のネットワークを補完して、よりロバストで解釈可能な洪水検出システムを実現できることが示されました。実験は光学、SAR、およびそれらの融合といった複数のセンサー組み合わせで行われ、位相的強化モデルはIoU(Intersection over Union)とF1スコアの両方で向上を示し、特に雲に覆われた地域や複雑な地形で顕著でした。さらに、位相的特徴の決定への寄与を可視化することでモデルの解釈可能性が高まり、安全クリティカルな応用に新たな道を開きます。このアプローチは検出性能を向上させるだけでなく、幾何学的先験知識を深層学習モデルに組み込む効果的な方法を示しています。