科百科
当前位置: 首页 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率(英伟达用傅里叶模型实现前所未有天气预报准确率)

时间:2023-05-31 作者: 小编 阅读量: 2 栏目名: 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率机器之心报道机器之心编辑部英伟达在天气预报上放出了「大招」现代数值天气预报(numericalweatherprediction,NWP)可以追溯到1920年代当今,数值天气预报已经无处不在,并且为交。

机器之心报道

机器之心编辑部

英伟达在天气预报上放出了「大招」。

现代数值天气预报(numerical weather prediction, NWP)可以追溯到 1920 年代。当今,数值天气预报已经无处不在,并且为交通、物流、农业和能源生产等关键部门的经济规划做出了贡献。准确的天气预报通过提前通知极端事件挽救了无数人的生命。

过去几十年,天气预报的质量一直在稳步提高。最早的单点动态建模数值天气预报是由英国科学家 Lewis Fry Richardson 在 1922 年使用计算尺和对数表计算得出的,并用六周时间计算出 6 小时(6-hour)的大气预报。到了 1950 年代,早期的电子计算机极大地提高了预测速度,使得运行预测的计算速度足够快,从而有助于未来天气预测。除了更好的计算能力之外,通过更深入地了解小尺度过程的物理特性和更高质量的大气观测,来更好地参数化小尺度过程,从而改进天气预报效果。

与 SOTA NWP 模型相比,数据驱动的深度学习模型在成本上低了数个量级,因此现在研究人员越来越有兴趣开发这类方法来预测天气。许多研究都试图通过建立数据驱动的模型来预测大气的规模环流,并且要么在气候模型输出、大气环流模型(GCM)、再分析产品,或者结合气候模型输出和再分析产品进行训练。数据驱动的模型通过克服 NWP 模型中存在的模型偏差,以及通过以较低的计算成本生成用于概率预测和数据同化的大型集合,因而在改进天气预报方面具有巨大潜力。

大多数据驱动的天气模型使用低分辨率数据来训练,通常是 Rasp and Thuerey [2021b]中的 5.625° 分辨率或者 Weyn et al. [2020] 中的 2° 分辨率。这些先验尝试在预测一些粗粒度、低分辨率大气变量方面取得了很好的效果。然而,粗化过程会导致关键的细粒度物理信息的丢失。要使数据驱动模型真正具有影响力,它们生成的预报的分辨率必须与当前 SOTA 数值天气模型相同或更高,分辨率大约在 0.1°。

在近日的一篇论文中,英伟达、劳伦斯伯克利国家实验室、密歇根大学安娜堡分校、莱斯大学等机构的研究者开发了一种基于傅里叶的神经网络预测模型 FourCastNet,它能以 0.25° 的分辨率生成关键天气变量的全球数据驱动预测,相当于赤道附近大约 30×30 km 的空间分辨率和 720×1440 像素的全球网格大小。这使得我们首次能够与欧洲中期天气预报中心(ECMWF)的高分辨率综合预测系统(IFS)模型进行直接比较。

论文地址:htTPs://arxiv.org/pdf/2202.11214.pdf

FourCastNet 在节点小时(node-hour)基础上比传统 NWP 模型快约 45,000 倍。FourCastNet 这种数量级的加速以及在高分辨率下前所未有的准确性,使得它能够以很低的成本生成超大规模集合预测。FourCastNet 极大地改善了概率天气预报的效果,使用它可以在几秒钟内生成对飓风、大气层河流和极端降水等事件的大规模集合预报,从而可以实现更及时、更明智的灾难响应。

此外,FourCastNet 对近地表风速的可靠、快速和低廉预测可以改善陆海风电场的风能资源规划。训练 FourCastNet 所需的能量大约等于使用 IFS 模型生成 10 天预测所需的能量(50 个成员)。然而,一旦经过训练,FourCastNet 生成预测所需的能量比 IFS 模型少 12,000 倍。研究者希望 FourCastNet 只训练一次,并且后续微调的能耗可以忽略不计。

在实现技术上,FourCastNet 使用基于傅里叶变换的token混合方法 [Guibas et al., 2022] 和ViT骨干 [Dosovitskiy et al., 2021]。这一方法基于最近的的傅里叶神经算子,该算子以分辨率不变的方式学习,并在建模流体动力学等具有挑战性的偏微分方程中取得了成功。此外,他们选择 ViT 骨干的原因是它能够很好地建模长程依赖。ViT 和基于傅里叶的 token 方法混合生成了 SOTA 高分辨率模型,它可以解析细粒度的特征,并能够很好地随分辨率和数据集大小扩展。研究者表示,这一方法能够以真正前所未有的高分辨率训练高保真数据驱动的模型。

训练模型

欧洲中期天气预报中心(ECMWF)提供了一个公开可用的综合数据集 ERA5,该研究使用 ERA5 来训练 FourCastNet。他们专注于两个大气变量,即(1)距离地球表面 10m 处的风速和(2)6 小时总降水量,除此以外,该研究还预测了其他几个变量,包括几个不同垂直高度的位势高度、温度、风速和相对湿度,一些近地表变量,如地面气压和平均海平面气压以等。

FourCastNet模型

为了生成高分辨率预测,研究采用自适应傅里叶神经算子 (Adaptive Fourier Neural Operator,AFNO) 模型。这种神经网络架构专为高分辨率输入而设计,并将深度学习(DL)最新关键进展综合到一个模型中。也就是说,FourCastNet 结合了 傅里叶神经算子 (FNO) ,该方法已被证明在建模具有挑战性的 PDE 系统方面表现良好,并且还具有强大的 ViT 主干。

目前,研究者已经提出了几种降低计算复杂度的 ViT 变体,然而,AFNO 模型的独特之处在于它将混合操作构建为连续的全局卷积,在傅里叶域中通过 FFT 有效实现,这允许灵活且可扩展地建模跨空间和通道维度的依赖关系。通过这样的设计,空间混合复杂度降低到 O(N log N),其中 N 是图像 patch 或 token 的数量。这种缩放使 AFNO 模型非常适合 0.25° 分辨率的高分辨率数据,以及进行未来更高分辨率的研究。

模型的计算流程:首先将 720 × 1440 lat-lon 网格上的输入变量投影到 patch 的 2D 网格 (h × w)(patch大小为 p × p,例如 p = 8),每个 patch 表示为一个 d 维 token。然后,将 patch 序列连同位置编码一起馈送到一系列 AFNO 层。

训练

该研究主要关注预测地表风速和降水,但复杂的大气系统包含多个变量之间的强非线性相互作用,例如温度、地面气压、湿度、从地球表面到平流层的水分含量等。为了模拟这些相互作用,该研究选择了一些变量(表 1)来表示大气的瞬时状态。

该研究将 ERA5 数据集分为三组,即训练、验证和测试数据集。训练数据集由 1979 年至 2015 年的数据组成,验证数据集包含 2016 年和 2017 年的数据,测试数据集包含 2018 年及以后的数据。

该研究使用张量 X(k∆t) 表示变量,其中k为时间指数,∆t 为训练数据集中连续快照之间的时间间隔,研究将 ERA5 数据集视为真值,用 X_true(k∆t) 表示真值变量,∆t 固定在 6 小时。训练包括预训练和微调两个阶段:

  • 预训练阶段,采用训练数据集以有监督的方式训练 AFNO 模型,使其学习从 X(k) 到 X(k1) 的映射;
  • 微调阶段,该研究从之前训练好的模型开始对模型进行优化,即模型首先从输入 X(k) 生成输出 X(k1),然后模型使用输出 X(k1) 作为输入,并生成输出 X(k2)。通过比较 X(k1) 和 X(k2) 与训练数据中各自的真值来计算训练损失,并使用这两个训练损失的总和来优化模型。

整个训练过程是在 64 个 Nvidia A100 GPU 的集群上完成,端到端训练大约需要 16 小时。

降水模型

ERA5 re-analysis 数据集中的总降水量(total precipitation,TP)是一个变量,表示通过降雨和降雪落到地球表面的累积液态和冰冻水。该研究将总降水量作为诊断变量,并用 p(kΔt) 表示。用于训练主干模型的数据集(20 个变量)不包括总降水量这个变量。相反,研究者训练一个单独的 AFNO 模型 ,使用主干模型输出来诊断 T P,如图 2(c) 所示。这种方法将降水建模的困难与预测大气状态的一般任务脱离。此外,一旦经过训练,诊断 TP 模型可能会与其他预测模型(传统的 NWP 或数据驱动的预测)结合使用。

用于从主干输出诊断降水的模型具有相同的基本 AFNO 架构,此外还具有额外的 2D 卷积层和 ReLU 激活,用于强制执行非负降水输出。由于主干模型以 6 小时为增量进行预测,因此该研究训练诊断降水模型来预测 6 小时累积的总降水量。

实验结果

下图1定性地展示了 FourCastNet 模型以 0.25°-lat-long 的分辨率预测全球地表风速的能力。其中,使用风速的纬向和经向分量计算地表风速的大小,即

。下图1显示了使用FourCastNet生成的提前96小时的说明性全球近地表风速预测。研究者重点介绍了预测的已解析和准确跟踪的关键高分辨率细节,包括超级台风山竹(Mangkhut,2018年)和向美国东海岸进发的三个命名气旋(Florence、Issac和Helene)。

其中,图 1(a) 显示了模型初始化时的风速。图 1(b) 显示了提前 96 小时的模型预测(上)和当时相应的真实风速(下)。可以看到,FourCastNet 模型能够提前 96 个小时预测风速,并且具有出色的保真度和正确的精细尺度(fine-scale)特征。

值得注意的是,图1说明了一个名为山竹的超级台风的形成和轨迹的预测情况,该台风在大约 10° N、210° W 的初始位置开始形成。该模型以惊人的保真度定性地预测了该台风的增强及其在 4 天内的轨迹。这表明 FourCastNet 模型能够很好地预测台风等天气现象的形成和移动轨迹。

该研究使用来自样本外测试数据集的初始条件初始化 FourCastNet 模型。基于此初始条件,模型可以在推理模式下自由运行 16 个时间步长,如下图 2(d) 所示。

相比于台风,降水存在间歇性和随机性,因此预测降水被认为是一项极其困难的任务。下图 3 展示了 FourCastNet 模型预测全球总降水量的能力。图 3(a) 为初始化的降水条件,图 3(b) 是提前 36 个小时的模型预测和实际情况的对比。该图以美国西海岸局部区域的降水为例,突出了 FourCastNet 模型以极高的精度解析和预测局部降水的能力。研究者观察到 FourCastNet 在捕获短期高分辨率降水特征方面性能出色,这对预测极端天气事件具有重大意义。值得注意的是,这是第一次成功利用深度学习模型进行大规模降水预测。

接下来,研究者进一步探讨了开发深度学习模型来预测飓风的潜在效用。飓风作为一种具有巨大破坏潜力的极端天气事件。构建快速可用、计算成本低廉的大气预警模型对于减轻生命和财产损失损失非常重要,同时这类模型也需要更严格的要求以避免错误预测。下图 4 展示了 FourCastNet 在预测迅速多变的飓风方面的强大能力。

除了台风和降水,FourCastNet 模型还能够预测大气层河流( atmospheric river)的形成和演变。下图5显示了一个于 2018 年 4 月最终登陆北加州海岸线的大气层河流的预测情况。

此外,FourCastNet 在量化技巧方面也有很大的优势,比 IFS 更佳。对于 ACC 和 RMSE 两项指标,FourCastNet 在更短的时间(约 48 小时或更短)内获得了比 IFS 更好的性能。并且 FourCastNet 仅使用了 IFS 模型完整变量集的一部分,并且计算成本也低了很多。

集成是数值天气预测的重要组成部分,FourCastNet 使用大型集成带来的性能提升如下图所示。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

    推荐阅读
  • 唐三重生最后成神了没(举贤不避亲的唐三重生后)

    终极斗罗最后一册的内容已经更新完毕,小舞陨落后,唐三选择了转世重生。虽然终极斗罗30册并没有交代唐三重生的细节,但是唐三在临走前却交代了诸多事宜给后代和其他神界领导者。为了让自己的儿子和儿媳继承毁灭神王和生命神王的神位,他提出了举贤不避亲。况且二人还是夫妻,唐三将神位传给他们也算是没有辜负毁灭之神和生命女神的嘱托。因此个人以为,唐三并不会将修罗神和海神的神位让给他人继承,而是会留给小舞和自己。

  • 部编四年级语文上册21课古诗三首(部编版四年级语文上册古诗三首课文解析)

    《古诗三首》收录在人教四年级语文上册教材,需要掌握:19个汉字。明确学习目标1、有感情地朗读课文,背诵课文,默写《题西林壁》。与其父苏洵、其弟苏辙并称“三苏”。梅花和雪花相互竞争,都认为自己是最具早春特色的,而且互不认输,这就将早春的梅花与雪花之美别出心裁、生动活泼地表现出来了。

  • 高一语文必修二知识梳理(高一语文必修二知识点整理)

    1945年在苏门达腊被日寇杀害,1952年被中央人民政府追认为革命烈士。1921年第一部小说集《沉沦》问世,1923年《春风沉醉的晚上》、《薄奠》。著有散文集《海星》《竹刀》《囚绿记》等,译著有《罗亭》《鲁宾逊漂流记》等。开创了我国古代诗歌的现实主义创作传统。②相当于“而”。⑤为,成为,引申为充当,充作。引申为承担,承受。

  • 赛鲸电脑桌怎么样(赛鲸床上电脑桌使用感受)

    赛鲸在设计方面与德国Patzak,spinn等多家设计学院合作,设计追求完美,在结构和工艺方面获得多项专利。赛鲸电脑桌设计的三大特点是超易用、超耐用、超稳固。赛鲸电脑桌一个动作完成桌面角度调节。德国设计的支架结构,采用轻钢架。靠结构控制力度和状态,赛鲸电脑桌的耐用性增强。

  • 最强蜗牛吃蘑菇任务攻略(蘑菇有多少种)

    最强蜗牛吃蘑菇任务攻略获得蘑菇的方法:蘑菇宝箱,蘑菇园,每日任务,馆长的头盔,地球晚宴转盘,解锁蜗牛壳,白蝌蚪礼包,氪金礼包。每食用一定数量后可额外增加食盒容量。生命蘑菇,食用后可额外获得四维加成。

  • 啵乐乐韩国进口饮料(韩国进口啵乐乐饮料新品)

    九日冰祖食品出品的啵乐乐牛奶盒装含乳饮料目前已获得啵乐乐品牌正版授权,由山东冰祖食品股份有限公司独家代理。当然,除了可爱爆棚的卡通形象,更重要的是啵乐乐饮料的优异品质。除此之外,啵乐乐牛奶含乳饮料富含人体所需要的各种营养,同时富含维生素A、维生素B1等多种元素。啵乐乐大牌饮品,线下线上均有售目前,啵乐乐牛奶含乳饮料已经问鼎各大市场渠道,备受年轻消费者喜爱。

  • 病毒感染可以引起贫血(这种细菌感染会引发贫血等血液病)

    相关研究表明,幽门螺旋杆菌与某些血液疾病的发生是密切相关的,比如说不明原因的缺铁性贫血。我们说贫血的患者啊,有幽门螺旋杆菌的患者感染率明显高于未感染的患者。再有就是许多研究发现,根除幽门螺旋杆菌后特发性血小板减少性紫癜患者的血小板数会明显增多,并伴随血清血小板抗体,IgG水平的下降,幽门螺旋杆菌可能是部分特发性或者是原发性血小板减少症的这种疾病的致病因素之一。

  • 很甜的小短句(36句微信超火的情话短句)

    36句微信超火的情话短句❤️想牵着你的手给各位来宾敬酒❤️我什么都知道但还是想听你娓娓道来❤️我家的狗挺喜欢你的随我❤️你主动找我的时候我激动的都能做完整套广播体操❤️你是我最爱的宝贝给我甜甜的草莓牛奶也不换❤️不许说我嘴硬。

  • 一年级家长每天需要做什么(一年级家长开学最该做什么)

    就拿小学一年级新生来说,一部分是学区或摇号或其它渠道进了心仪的学校,遂了愿,满心欢喜;一部分是各种原因找找拖拖不情愿进了备份学校,心不甘,心绪惆怅。孩子学习成绩的好坏大多数来自家长的教与养,家长对孩子的教养跟上,孩子会很好。还有就是一定要记得我们上学的目的是什么,让孩子喜欢学习,学会学习,最终学有所成,这才是重中之重,是核心。所以家长在孩子成长上学会抓重点,才能保证孩子的教育正确。

  • 少儿春晚嘉年华演出(2023嘉佳卡通华夏少年少儿春晚特邀小主持人刘思琳)

    活动以权威性、广泛性为原则,旨在向全省范围内选拔具有优秀潜质的未来之星,具有积极向上风貌的儿童优秀节目和演员,最终登上《华夏少年》少儿春节联欢晚会的舞台,通过嘉佳卡通卫视的播出展示给全国人民。哈喽大拇指语言艺术特邀优秀小主持人刘思琳同学,经过严格选拔,入选嘉佳卡通《华夏少年》少儿春节联欢晚会的主持人。据悉,嘉佳卡通卫视《华夏少年》少儿春节联欢晚会将于2023年1月21日播出。