Biomazon:亚马逊盆地三维森林结构与生物量建模的多模态数据集
Biomazon是一个20米分辨率的多模态基准数据集,覆盖亚马逊盆地,结合GEDI RH和AGBD目标与多传感器预测因子,用于联合预测整个GEDI RH剖面和地上生物量密度。该数据集提供了标准化的空间划分和评估协议,并建立了基线框架,通过消融研究评估不同backbone、模态贡献和辅助嵌入的效果。Biomazon旨在推动热带森林结构一致性和结构-生物量建模的研究。
准确且空间明晰的热带森林结构表征对于碳核算和生态系统监测至关重要。然而,现有的机器学习方法大多仅预测冠层顶部高度代理(如RH95或RH98)或地上生物量密度(AGBD)作为独立的标量目标,忽视了森林垂直结构作为一个有序剖面的学习。这种简化的方法难以捕捉森林的完整三维结构,导致碳储量估算和生态模型的不确定性。当前领域亟需一个机器学习就绪的多模态基准,用于联合预测完整的GEDI RH剖面和AGBD,并评估强制RH百分位数之间物理一致排序的方法。
为填补这一空白,由Sayan Mandal等六位研究人员组成的团队推出了Biomazon数据集——一个覆盖亚马逊盆地、空间分辨率为20米的多模态基准数据集。该数据集将GEDI激光雷达的RH剖面和AGBD目标与多传感器预测因子相结合,包括Sentinel-1/2雷达和光学影像、ALOS-2 PALSAR-2雷达数据、Copernicus数字高程模型(DEM)、Dynamic World土地利用/土地覆盖分类以及AlphaEarth嵌入特征。数据集采用了标准化的空间划分和评估协议,确保不同方法之间的公平比较。
在基线框架方面,研究团队采用了一个共享编码器-解码器结构,并配以任务特定的预测头部。他们开展了一系列全面的消融研究,考察了(i)不同的backbone架构和模型规模、(ii)各模态的贡献程度以及(iii)在独立和融合设置下辅助嵌入的使用效果。研究分别报告了单目标和联合目标的结果,以量化统一训练协议下不同任务之间的权衡。
通过与现有网格化产品(包括GEDI L4D提供的RH10-RH98和AGBD数据)在匹配的时间尺度上进行区域对齐比较,研究团队进一步将基线性能置于实际应用背景下进行考量。Biomazon数据集连同其附带的评估协议和基线结果,为未来在结构一致的RH剖面预测和热带森林结构-生物量建模方面的工作树立了参考基准。该数据集和相关代码预计将在论文正式发表后公开发布,有望推动该领域的进一步发展,并为全球碳核算和生态系统监测提供更准确的数据支持。