AI News HubLIVE
站内改写2 分鐘閱讀

Biomazon:亞馬遜盆地三維森林結構與生物量建模的多模態數據集

Biomazon是一個20米分辨率的多模態基準數據集,覆蓋亞馬遜盆地,結合GEDI RH和AGBD目標與多傳感器預測因子,用於聯合預測整個GEDI RH剖面和地上生物量密度。該數據集提供了標準化的空間劃分和評估協議,並建立了基線框架,通過消融研究評估不同backbone、模態貢獻和輔助嵌入的效果。Biomazon旨在推動熱帶森林結構一致性和結構-生物量建模的研究。

來源arXiv Computer Vision作者: Sayan Mandal, Rocco Sedona, Simon Besnard, Mikhail Urbazaev, Morris Riedel, Ehsan Zandi, Gabriele Cavallaro

準確且空間明晰的熱帶森林結構表徵對於碳核算和生態系統監測至關重要。然而,現有的機器學習方法大多僅預測冠層頂部高度代理(如RH95或RH98)或地上生物量密度(AGBD)作為獨立的標量目標,忽視了森林垂直結構作為一個有序剖面的學習。這種簡化的方法難以捕捉森林的完整三維結構,導致碳儲量估算和生態模型的不確定性。當前領域亟需一個機器學習就緒的多模態基準,用於聯合預測完整的GEDI RH剖面和AGBD,並評估強制RH百分位數之間物理一致排序的方法。

為填補這一空白,由Sayan Mandal等六位研究人員組成的團隊推出了Biomazon數據集——一個覆蓋亞馬遜盆地、空間分辨率為20米的多模態基準數據集。該數據集將GEDI激光雷達的RH剖面和AGBD目標與多傳感器預測因子相結合,包括Sentinel-1/2雷達和光學影像、ALOS-2 PALSAR-2雷達數據、Copernicus數字高程模型(DEM)、Dynamic World土地利用/土地覆蓋分類以及AlphaEarth嵌入特徵。數據集採用了標準化的空間劃分和評估協議,確保不同方法之間的公平比較。

在基線框架方面,研究團隊採用了一個共享編碼器-解碼器結構,並配以任務特定的預測頭部。他們開展了一系列全面的消融研究,考察了(i)不同的backbone架構和模型規模、(ii)各模態的貢獻程度以及(iii)在獨立和融合設置下輔助嵌入的使用效果。研究分別報告了單目標和聯合目標的結果,以量化統一訓練協議下不同任務之間的權衡。

通過與現有網格化產品(包括GEDI L4D提供的RH10-RH98和AGBD數據)在匹配的時間尺度上進行區域對齊比較,研究團隊進一步將基線性能置於實際應用背景下進行考量。Biomazon數據集連同其附帶的評估協議和基線結果,為未來在結構一致的RH剖面預測和熱帶森林結構-生物量建模方面的工作樹立了參考基準。該數據集和相關代碼預計將在論文正式發表後公開發布,有望推動該領域的進一步發展,併為全球碳核算和生態系統監測提供更準確的數據支持。