DeepMind的最新气象预测模型GenCast,以其卓越的性能再次荣登《Nature》杂志。该模型能在短短8分钟内完成长达15天的气象预测,无论是常规天气还是极端气象事件,都能进行精准分析。在与全球顶尖的中期天气预报系统ENS的对比中,GenCast在97.2%的情况下展现出更优的表现,这标志着机器学习在气象预测领域的巨大飞跃。
GenCast与DeepMind之前推出的GraphCast模型不同,后者专注于确定性预测,而GenCast则致力于探究天气变化的概率性。两款模型均已开源,GenCast基于扩散模型构建,其分辨率达到0.25度的经纬度(赤道地区约合28×28公里),将地球表面划分为超过百万个网格。每个网格覆盖80多个地表和大气变量,每次预测涉及的数据量可达数千万甚至上亿条。
在1320种不同的实验条件下,GenCast在97.2%的任务中都展现出比ENS更高的准确率。DeepMind的研究人员Ilan Price表示:“我们的成果显示,通过机器学习,我们不仅赶上了基于物理的模型,还实现了超越。”
传统的天气预报依赖于数值天气预报(NWP)算法,通过求解模拟大气动力学的方程来实现。然而,随着集合预报的兴起,气象机构开始生成多个基于NWP的结果,以模拟各种可能的天气情景。GenCast同样采用集合预报的方法,但其背后的原理是人工智能,而非传统的NWP。
ENS是目前最先进的集合预报系统,由欧洲中期天气预报中心(ECMWF)开发,未来将被整合进其确定性预报系统HRES。但在与AI系统的较量中,即便是这种顶尖的传统方法也未能占上风。DeepMind团队利用未包含在训练数据中的真实历史数据(2019年),设置了1320种实验条件,涉及不同的物理变量、预报时长和垂直高度。结果显示,在97.2%的场景中,GenCast的CRPS(连续排名概率分数)都显著优于ENS。
对于高温、大风等极端天气事件,GenCast的预报相对经济价值(REV)在大多数情况下也显著优于ENS。此外,GenCast在区域风电应用测试中也展现了卓越的预测能力。利用全球发电厂数据库中的5344个风电场位置和装机容量信息,GenCast在7天内的风电功率预报CRPS和REV均显著优于ENS。
GenCast的预测速度同样令人印象深刻,完成一次15天的预测仅需约8分钟,相较于ENS需要的数小时,效率大幅提升。GenCast基于扩散模型,通过采样条件残差Z(t)进行去噪,得到预测结果,并以此计算新的残差作为下一步的输入,从而将预测时间延伸。去噪过程由Transformer完成,编码器将物理状态场从经纬度网格映射到细化的二十面体网格,自注意力机制关注邻域内的所有节点,捕捉天气特征,最终解码器将结果映射回原始分辨率。
GenCast的训练基于1979至2018年的ERA5再分析数据集,数据间隔12小时,分辨率0.25°。预训练阶段数据被降采样至1°分辨率,使用5次细化的二十面体网格,训练200万步,耗时约3.5天。之后,模型使用原始0.25度分辨率数据和6次细化的二十面体网格进行微调,共计64000步,耗时约1.5天。
如同去年的GraphCast,GenCast的代码和模型权重也已开源。DeepMind计划发布GenCast生成的实时和历史预报结果,为研究者提供更多资源。