AI News HubLIVE
站内改写1 分で読了

Plan2Map:計画記録から文書に基づく地理空間境界再構成のためのマルチモーダルベンチマーク

Plan2Mapは、英国の計画記録から地理空間境界を再構成するための208ケースのマルチモーダルベンチマークです。研究者らはGeoPlanAgentシステムを提案し、証拠抽出、位置特定、地図登録、境界セグメンテーション、投影、検証の各ステップでタスクを分解し、平均IoU 0.736、中央値IoU 0.904を達成しました。

ソースarXiv Computer Vision著者: Fabian Degen, Oishi Deb, Jindong Gu, Junchi Yu, Samuele Marro, Philip Torr, Jialin Yu

計画記録は地理的領域に対する制限を定義しますが、そのソース文書は多くの場合、機械可読な境界ではなく間接的な空間的証拠しか提供しません。この問題に対処するため、研究者らはPlan2Mapを導入しました。これは、英国の計画記録から文書に基づく地理空間境界再構成のための208ケースのマルチモーダルベンチマークです。システムはソース計画文書のみを入力として、通知テキスト、スケジュール、地図プレート、地図ラベル、境界注釈から有効な地理空間境界を再構成する必要があり、参照GeoJSONは採点のために保持されます。

この課題に取り組むため、研究チームはGeoPlanAgentシステムを提案しました。このシステムは文書駆動型の地理空間ツール・イン・ザ・ループアーキテクチャを採用し、タスクを証拠抽出、位置特定、地図登録、境界セグメンテーション、投影、検証の6つのステップに分解します。Plan2Mapでの評価では、GeoPlanAgentは平均IoU 0.736、中央値IoU 0.904を達成し、予測の67.8%が0.8以上のIoUを示しました。これは直接的なVLM-to-GeoJSONベースラインを大幅に上回る結果です。

診断分析によると、直接VLM予測は依然として信頼性が低く、残存する誤差は位置特定と地図登録に集中しています。また、教師あり境界セグメンテーションはピクセルレベルのマスク品質を大幅に向上させました。Plan2Mapは、公共計画記録からのマルチモーダル地理空間再構成のための具体的なテストベッドを提供します。プロジェクトページも公開されています。