2026-05-13 16:00 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

介绍AIMIP：人工智能天气与气候模型比较项目

AIMIP是一个新的开放基准和数据集，用于评估人工智能气候模型，显示它们在历史气候指标上可以与传统模型媲美甚至更优，但在长期变暖趋势和未见过的气候情景方面仍难以可靠地泛化。

AIMIP（AI模型比较项目）是一项由Ai2领导的社区合作计划，旨在为AI气候模型建立严格的评估标准。该项目汇集了NVIDIA、Google Research等多个研究团队，共同设计了一套基准实验和数据集，用于比较不同AI系统在统一输出和评估标准下的表现。

AI气候模型基于AI天气预报的快速发展，利用ERA5历史气象数据训练，能够在极低的计算成本下模拟气候。然而，与短期天气预测不同，长期气候模拟面临独特挑战，如处理海洋和冰面变化、评估多种温室气体排放情景等。传统气候模型通过物理方程模拟数十年至数世纪的气候，但计算需求极高，只有少数机构能负担。AIMIP的诞生正是为了填补AI模型缺乏标准化评估框架的空白。

AIMIP第一阶段设计了一个基准实验，要求模型以月度和日度频率预测1979-2024年全球大气状态，训练数据仅限于1979-2014年的ERA5观测，留出最后十年作为测试。模型需输出温度、湿度、风速等七个大气层变量以及地表温度、降水等。参与机构包括Ai2、ArchesWeather、NVIDIA、华盛顿大学、马里兰大学和Google Research，共提交了八个模型模拟。

评估结果显示，AI模型在模拟平均历史气候模式上表现出色，误差仅为传统物理模型的一半。但在捕捉训练期外的长期变暖趋势时，模型表现参差不齐：有些准确跟踪了趋势，有些则明显低估。此外，模型在厄尔尼诺响应、逐日变化和全球海洋瞬时增温2-4摄氏度的极端场景下，预测结果出现显著分歧，部分甚至产生物理上不合理的结果。这表明AI模型在泛化到未见情景方面仍存在根本性挑战。

AIMIP Phase 1数据集通过德国气候计算中心（DKRZ）托管，并计划发布至地球系统网格联盟（ESGF），以方便气候科学界广泛使用。该项目的成果揭示了AI气候模型的核心问题：必须能够稳健响应多种气候情景。未来阶段可能扩展至耦合海洋和海冰模拟、更广泛的温室气体排放路径以及更复杂的输出需求。

AIMIP为AI气候模型的评估提供了坚实基础，有助于比较不同方法并识别需要改进的领域。研究人员希望，随着AI气候模型的持续进步，该项目能推动更可靠、更高效的气候预测工具的发展。