介紹AIMIP:人工智能天氣與氣候模型比較項目
AIMIP是一個新的開放基準和數據集,用於評估人工智能氣候模型,顯示它們在歷史氣候指標上可以與傳統模型媲美甚至更優,但在長期變暖趨勢和未見過的氣候情景方面仍難以可靠地泛化。
AIMIP(AI模型比較項目)是一項由Ai2領導的社區合作計劃,旨在為AI氣候模型建立嚴格的評估標準。該項目彙集了NVIDIA、Google Research等多個研究團隊,共同設計了一套基準實驗和數據集,用於比較不同AI系統在統一輸出和評估標準下的表現。
AI氣候模型基於AI天氣預報的快速發展,利用ERA5歷史氣象數據訓練,能夠在極低的計算成本下模擬氣候。然而,與短期天氣預測不同,長期氣候模擬面臨獨特挑戰,如處理海洋和冰面變化、評估多種温室氣體排放情景等。傳統氣候模型通過物理方程模擬數十年至數世紀的氣候,但計算需求極高,只有少數機構能負擔。AIMIP的誕生正是為了填補AI模型缺乏標準化評估框架的空白。
AIMIP第一階段設計了一個基準實驗,要求模型以月度和日度頻率預測1979-2024年全球大氣狀態,訓練數據僅限於1979-2014年的ERA5觀測,留出最後十年作為測試。模型需輸出温度、濕度、風速等七個大氣層變量以及地表温度、降水等。參與機構包括Ai2、ArchesWeather、NVIDIA、華盛頓大學、馬里蘭大學和Google Research,共提交了八個模型模擬。
評估結果顯示,AI模型在模擬平均歷史氣候模式上表現出色,誤差僅為傳統物理模型的一半。但在捕捉訓練期外的長期變暖趨勢時,模型表現參差不齊:有些準確跟蹤了趨勢,有些則明顯低估。此外,模型在厄爾尼諾響應、逐日變化和全球海洋瞬時增温2-4攝氏度的極端場景下,預測結果出現顯著分歧,部分甚至產生物理上不合理的結果。這表明AI模型在泛化到未見情景方面仍存在根本性挑戰。
AIMIP Phase 1數據集通過德國氣候計算中心(DKRZ)託管,並計劃發佈至地球系統網格聯盟(ESGF),以方便氣候科學界廣泛使用。該項目的成果揭示了AI氣候模型的核心問題:必須能夠穩健響應多種氣候情景。未來階段可能擴展至耦合海洋和海冰模擬、更廣泛的温室氣體排放路徑以及更復雜的輸出需求。
AIMIP為AI氣候模型的評估提供了堅實基礎,有助於比較不同方法並識別需要改進的領域。研究人員希望,隨着AI氣候模型的持續進步,該項目能推動更可靠、更高效的氣候預測工具的發展。