介绍AIMIP:人工智能天气与气候模型比较项目
AIMIP是一个新的开放基准和数据集,用于评估人工智能气候模型,显示它们在历史气候指标上可以与传统模型媲美甚至更优,但在长期变暖趋势和未见过的气候情景方面仍难以可靠地泛化。
AIMIP(AI模型比较项目)是一项由Ai2领导的社区合作计划,旨在为AI气候模型建立严格的评估标准。该项目汇集了NVIDIA、Google Research等多个研究团队,共同设计了一套基准实验和数据集,用于比较不同AI系统在统一输出和评估标准下的表现。
AI气候模型基于AI天气预报的快速发展,利用ERA5历史气象数据训练,能够在极低的计算成本下模拟气候。然而,与短期天气预测不同,长期气候模拟面临独特挑战,如处理海洋和冰面变化、评估多种温室气体排放情景等。传统气候模型通过物理方程模拟数十年至数世纪的气候,但计算需求极高,只有少数机构能负担。AIMIP的诞生正是为了填补AI模型缺乏标准化评估框架的空白。
AIMIP第一阶段设计了一个基准实验,要求模型以月度和日度频率预测1979-2024年全球大气状态,训练数据仅限于1979-2014年的ERA5观测,留出最后十年作为测试。模型需输出温度、湿度、风速等七个大气层变量以及地表温度、降水等。参与机构包括Ai2、ArchesWeather、NVIDIA、华盛顿大学、马里兰大学和Google Research,共提交了八个模型模拟。
评估结果显示,AI模型在模拟平均历史气候模式上表现出色,误差仅为传统物理模型的一半。但在捕捉训练期外的长期变暖趋势时,模型表现参差不齐:有些准确跟踪了趋势,有些则明显低估。此外,模型在厄尔尼诺响应、逐日变化和全球海洋瞬时增温2-4摄氏度的极端场景下,预测结果出现显著分歧,部分甚至产生物理上不合理的结果。这表明AI模型在泛化到未见情景方面仍存在根本性挑战。
AIMIP Phase 1数据集通过德国气候计算中心(DKRZ)托管,并计划发布至地球系统网格联盟(ESGF),以方便气候科学界广泛使用。该项目的成果揭示了AI气候模型的核心问题:必须能够稳健响应多种气候情景。未来阶段可能扩展至耦合海洋和海冰模拟、更广泛的温室气体排放路径以及更复杂的输出需求。
AIMIP为AI气候模型的评估提供了坚实基础,有助于比较不同方法并识别需要改进的领域。研究人员希望,随着AI气候模型的持续进步,该项目能推动更可靠、更高效的气候预测工具的发展。