关注残差差距:现实世界偏差下的概率降尺度
概率降尺度是大气科学和气候建模中的关键任务,通常采用均值-残差框架。然而,该方法在现实应用中常产生有偏和欠分散的集合。研究表明,根本原因是残差目标指定错误:训练时的残差分布与测试时因降尺度偏差而需要的分布系统性地不同。为此,提出ReMatch(残差分布匹配),通过低维PCA空间中的最优传输对齐训练残差分布至测试状态。在合成基准和真实HRRR-ERA5风场降尺度任务上,ReMatch显著减少了欠分散,改进了校准,并优于多种强基线。
概率降尺度是大气科学和气候建模中的一个核心挑战,其目标是根据粗分辨率输入模拟高分辨率场的条件分布。一种广泛使用的范式是将问题分解为确定性均值预测器与随机残差生成器。虽然这一均值-残差方法在理想化场景中表现良好,但在现实应用中常常产生有偏和欠分散的集合,即集合的变异性不足以捕捉真实的不确定性。这一问题是否仅仅源于通用的预测不确定性校准失误?在最近的一项研究中,研究人员揭示了更根本的原因:残差目标指定错误(residual target misspecification)。具体来说,由于降尺度过程中固有的偏差,训练阶段诱导出的残差分布与测试阶段所需的残差分布存在系统性差异。
为了解决这一差距,研究者提出了ReMatch(Residual Distribution Matching,残差分布匹配)。ReMatch的核心思想是通过低维主成分分析(PCA)空间中的最优传输(optimal transport)技术,将训练残差分布对齐到测试状态下的分布。这种方法保留了均值-残差框架的统计优势,同时减少了随机生成器所看到的残差目标在训练与测试之间的不匹配。
在实验中,研究团队首先在可控的合成基准上测试,设置不同水平的偏差,然后在真实的HRRR-ERA5风场降尺度任务上进行验证。结果表明,ReMatch显著降低了模型的欠分散程度,改进了集合的校准性能(通过标准差比SSR和连续排名概率评分CRPS衡量),并且超越了多个强基线模型,包括标准均值-残差模型及其变体,以及最先进的超分辨率模型。该研究的代码已公开在GitHub上,为后续研究提供了可复现的基础。