科百科
当前位置: 首页 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率(英伟达用傅里叶模型实现前所未有天气预报准确率)

时间:2023-05-31 作者: 小编 阅读量: 2 栏目名: 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率机器之心报道机器之心编辑部英伟达在天气预报上放出了「大招」现代数值天气预报(numericalweatherprediction,NWP)可以追溯到1920年代当今,数值天气预报已经无处不在,并且为交。

机器之心报道

机器之心编辑部

英伟达在天气预报上放出了「大招」。

现代数值天气预报(numerical weather prediction, NWP)可以追溯到 1920 年代。当今,数值天气预报已经无处不在,并且为交通、物流、农业和能源生产等关键部门的经济规划做出了贡献。准确的天气预报通过提前通知极端事件挽救了无数人的生命。

过去几十年,天气预报的质量一直在稳步提高。最早的单点动态建模数值天气预报是由英国科学家 Lewis Fry Richardson 在 1922 年使用计算尺和对数表计算得出的,并用六周时间计算出 6 小时(6-hour)的大气预报。到了 1950 年代,早期的电子计算机极大地提高了预测速度,使得运行预测的计算速度足够快,从而有助于未来天气预测。除了更好的计算能力之外,通过更深入地了解小尺度过程的物理特性和更高质量的大气观测,来更好地参数化小尺度过程,从而改进天气预报效果。

与 SOTA NWP 模型相比,数据驱动的深度学习模型在成本上低了数个量级,因此现在研究人员越来越有兴趣开发这类方法来预测天气。许多研究都试图通过建立数据驱动的模型来预测大气的规模环流,并且要么在气候模型输出、大气环流模型(GCM)、再分析产品,或者结合气候模型输出和再分析产品进行训练。数据驱动的模型通过克服 NWP 模型中存在的模型偏差,以及通过以较低的计算成本生成用于概率预测和数据同化的大型集合,因而在改进天气预报方面具有巨大潜力。

大多数据驱动的天气模型使用低分辨率数据来训练,通常是 Rasp and Thuerey [2021b]中的 5.625° 分辨率或者 Weyn et al. [2020] 中的 2° 分辨率。这些先验尝试在预测一些粗粒度、低分辨率大气变量方面取得了很好的效果。然而,粗化过程会导致关键的细粒度物理信息的丢失。要使数据驱动模型真正具有影响力,它们生成的预报的分辨率必须与当前 SOTA 数值天气模型相同或更高,分辨率大约在 0.1°。

在近日的一篇论文中,英伟达、劳伦斯伯克利国家实验室、密歇根大学安娜堡分校、莱斯大学等机构的研究者开发了一种基于傅里叶的神经网络预测模型 FourCastNet,它能以 0.25° 的分辨率生成关键天气变量的全球数据驱动预测,相当于赤道附近大约 30×30 km 的空间分辨率和 720×1440 像素的全球网格大小。这使得我们首次能够与欧洲中期天气预报中心(ECMWF)的高分辨率综合预测系统(IFS)模型进行直接比较。

论文地址:htTPs://arxiv.org/pdf/2202.11214.pdf

FourCastNet 在节点小时(node-hour)基础上比传统 NWP 模型快约 45,000 倍。FourCastNet 这种数量级的加速以及在高分辨率下前所未有的准确性,使得它能够以很低的成本生成超大规模集合预测。FourCastNet 极大地改善了概率天气预报的效果,使用它可以在几秒钟内生成对飓风、大气层河流和极端降水等事件的大规模集合预报,从而可以实现更及时、更明智的灾难响应。

此外,FourCastNet 对近地表风速的可靠、快速和低廉预测可以改善陆海风电场的风能资源规划。训练 FourCastNet 所需的能量大约等于使用 IFS 模型生成 10 天预测所需的能量(50 个成员)。然而,一旦经过训练,FourCastNet 生成预测所需的能量比 IFS 模型少 12,000 倍。研究者希望 FourCastNet 只训练一次,并且后续微调的能耗可以忽略不计。

在实现技术上,FourCastNet 使用基于傅里叶变换的token混合方法 [Guibas et al., 2022] 和ViT骨干 [Dosovitskiy et al., 2021]。这一方法基于最近的的傅里叶神经算子,该算子以分辨率不变的方式学习,并在建模流体动力学等具有挑战性的偏微分方程中取得了成功。此外,他们选择 ViT 骨干的原因是它能够很好地建模长程依赖。ViT 和基于傅里叶的 token 方法混合生成了 SOTA 高分辨率模型,它可以解析细粒度的特征,并能够很好地随分辨率和数据集大小扩展。研究者表示,这一方法能够以真正前所未有的高分辨率训练高保真数据驱动的模型。

训练模型

欧洲中期天气预报中心(ECMWF)提供了一个公开可用的综合数据集 ERA5,该研究使用 ERA5 来训练 FourCastNet。他们专注于两个大气变量,即(1)距离地球表面 10m 处的风速和(2)6 小时总降水量,除此以外,该研究还预测了其他几个变量,包括几个不同垂直高度的位势高度、温度、风速和相对湿度,一些近地表变量,如地面气压和平均海平面气压以等。

FourCastNet模型

为了生成高分辨率预测,研究采用自适应傅里叶神经算子 (Adaptive Fourier Neural Operator,AFNO) 模型。这种神经网络架构专为高分辨率输入而设计,并将深度学习(DL)最新关键进展综合到一个模型中。也就是说,FourCastNet 结合了 傅里叶神经算子 (FNO) ,该方法已被证明在建模具有挑战性的 PDE 系统方面表现良好,并且还具有强大的 ViT 主干。

目前,研究者已经提出了几种降低计算复杂度的 ViT 变体,然而,AFNO 模型的独特之处在于它将混合操作构建为连续的全局卷积,在傅里叶域中通过 FFT 有效实现,这允许灵活且可扩展地建模跨空间和通道维度的依赖关系。通过这样的设计,空间混合复杂度降低到 O(N log N),其中 N 是图像 patch 或 token 的数量。这种缩放使 AFNO 模型非常适合 0.25° 分辨率的高分辨率数据,以及进行未来更高分辨率的研究。

模型的计算流程:首先将 720 × 1440 lat-lon 网格上的输入变量投影到 patch 的 2D 网格 (h × w)(patch大小为 p × p,例如 p = 8),每个 patch 表示为一个 d 维 token。然后,将 patch 序列连同位置编码一起馈送到一系列 AFNO 层。

训练

该研究主要关注预测地表风速和降水,但复杂的大气系统包含多个变量之间的强非线性相互作用,例如温度、地面气压、湿度、从地球表面到平流层的水分含量等。为了模拟这些相互作用,该研究选择了一些变量(表 1)来表示大气的瞬时状态。

该研究将 ERA5 数据集分为三组,即训练、验证和测试数据集。训练数据集由 1979 年至 2015 年的数据组成,验证数据集包含 2016 年和 2017 年的数据,测试数据集包含 2018 年及以后的数据。

该研究使用张量 X(k∆t) 表示变量,其中k为时间指数,∆t 为训练数据集中连续快照之间的时间间隔,研究将 ERA5 数据集视为真值,用 X_true(k∆t) 表示真值变量,∆t 固定在 6 小时。训练包括预训练和微调两个阶段:

  • 预训练阶段,采用训练数据集以有监督的方式训练 AFNO 模型,使其学习从 X(k) 到 X(k1) 的映射;
  • 微调阶段,该研究从之前训练好的模型开始对模型进行优化,即模型首先从输入 X(k) 生成输出 X(k1),然后模型使用输出 X(k1) 作为输入,并生成输出 X(k2)。通过比较 X(k1) 和 X(k2) 与训练数据中各自的真值来计算训练损失,并使用这两个训练损失的总和来优化模型。

整个训练过程是在 64 个 Nvidia A100 GPU 的集群上完成,端到端训练大约需要 16 小时。

降水模型

ERA5 re-analysis 数据集中的总降水量(total precipitation,TP)是一个变量,表示通过降雨和降雪落到地球表面的累积液态和冰冻水。该研究将总降水量作为诊断变量,并用 p(kΔt) 表示。用于训练主干模型的数据集(20 个变量)不包括总降水量这个变量。相反,研究者训练一个单独的 AFNO 模型 ,使用主干模型输出来诊断 T P,如图 2(c) 所示。这种方法将降水建模的困难与预测大气状态的一般任务脱离。此外,一旦经过训练,诊断 TP 模型可能会与其他预测模型(传统的 NWP 或数据驱动的预测)结合使用。

用于从主干输出诊断降水的模型具有相同的基本 AFNO 架构,此外还具有额外的 2D 卷积层和 ReLU 激活,用于强制执行非负降水输出。由于主干模型以 6 小时为增量进行预测,因此该研究训练诊断降水模型来预测 6 小时累积的总降水量。

实验结果

下图1定性地展示了 FourCastNet 模型以 0.25°-lat-long 的分辨率预测全球地表风速的能力。其中,使用风速的纬向和经向分量计算地表风速的大小,即

。下图1显示了使用FourCastNet生成的提前96小时的说明性全球近地表风速预测。研究者重点介绍了预测的已解析和准确跟踪的关键高分辨率细节,包括超级台风山竹(Mangkhut,2018年)和向美国东海岸进发的三个命名气旋(Florence、Issac和Helene)。

其中,图 1(a) 显示了模型初始化时的风速。图 1(b) 显示了提前 96 小时的模型预测(上)和当时相应的真实风速(下)。可以看到,FourCastNet 模型能够提前 96 个小时预测风速,并且具有出色的保真度和正确的精细尺度(fine-scale)特征。

值得注意的是,图1说明了一个名为山竹的超级台风的形成和轨迹的预测情况,该台风在大约 10° N、210° W 的初始位置开始形成。该模型以惊人的保真度定性地预测了该台风的增强及其在 4 天内的轨迹。这表明 FourCastNet 模型能够很好地预测台风等天气现象的形成和移动轨迹。

该研究使用来自样本外测试数据集的初始条件初始化 FourCastNet 模型。基于此初始条件,模型可以在推理模式下自由运行 16 个时间步长,如下图 2(d) 所示。

相比于台风,降水存在间歇性和随机性,因此预测降水被认为是一项极其困难的任务。下图 3 展示了 FourCastNet 模型预测全球总降水量的能力。图 3(a) 为初始化的降水条件,图 3(b) 是提前 36 个小时的模型预测和实际情况的对比。该图以美国西海岸局部区域的降水为例,突出了 FourCastNet 模型以极高的精度解析和预测局部降水的能力。研究者观察到 FourCastNet 在捕获短期高分辨率降水特征方面性能出色,这对预测极端天气事件具有重大意义。值得注意的是,这是第一次成功利用深度学习模型进行大规模降水预测。

接下来,研究者进一步探讨了开发深度学习模型来预测飓风的潜在效用。飓风作为一种具有巨大破坏潜力的极端天气事件。构建快速可用、计算成本低廉的大气预警模型对于减轻生命和财产损失损失非常重要,同时这类模型也需要更严格的要求以避免错误预测。下图 4 展示了 FourCastNet 在预测迅速多变的飓风方面的强大能力。

除了台风和降水,FourCastNet 模型还能够预测大气层河流( atmospheric river)的形成和演变。下图5显示了一个于 2018 年 4 月最终登陆北加州海岸线的大气层河流的预测情况。

此外,FourCastNet 在量化技巧方面也有很大的优势,比 IFS 更佳。对于 ACC 和 RMSE 两项指标,FourCastNet 在更短的时间(约 48 小时或更短)内获得了比 IFS 更好的性能。并且 FourCastNet 仅使用了 IFS 模型完整变量集的一部分,并且计算成本也低了很多。

集成是数值天气预测的重要组成部分,FourCastNet 使用大型集成带来的性能提升如下图所示。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

    推荐阅读
  • 太荒初境柯栎锤龙位置介绍

    太荒初境柯栎锤龙位置在哪?很多玩家还不清楚这个怪的位置在哪里,其实大荒就有,只是比较的稀少,刷新的不是很多,下面一起来看一下本站小编带来的太荒初境柯栎锤龙位置介绍。玩家需要击杀柯栎锤龙这个怪,才有可能掉落素材。大荒左上角有,左上角有有个山丘,沿着路一圈都是,运气好一圈下来能整10个。该攻略收集整理自网络,如果您是原作者需要署名,请联系我们。

  • 阐述风水在阳台装修中的注意事项(阐述风水在阳台装修中的注意哪些事项)

    阐述风水在阳台装修中的注意事项阳台不能面对大门。在不影响生活动作的前提下,厨房四个阳台之间放一个屏风或柜子作为隔断。尖角的出现不利于房屋的运输,要尽可能避开或请风水大师根据房屋具体情况进行化解。如果窗户正好遇到直,这样的格局和气场对居民的运势非常不利。而且容易被噪音干扰,不利于健康。最好的办法是去掉阳台,与客厅、厨房、卧室等融为一体,然后做隔断和隔音处理。

  • 芋圆怎么做才又滑又q弹(你学会了吗)

    下面内容希望能帮助到你,我们来一起看看吧!芋圆怎么做才又滑又q弹我们在制作芋圆时首先要将香芋、红薯等食材煮烂,然后放入碗中捣成泥。并要趁热分次加入木薯粉,木薯粉和食材的比例要控制在1:2,并且可以在比较干的食材里适量加点温水。然后将食材和木薯粉充分的揉合在一起,要保证最后的面团不粘手,但也不能太干。然后将面团搓条、切段并撒上一层淀粉防粘,然后开水下锅煮熟,最后将它捞起并冷水过凉,这样就可以了。

  • 街霸2为什么那么经典(街霸2原型大收集)

    但在某次侦查时,李万青神秘失踪,香港警方万般无奈,于是,派李红龙前往日本横滨调查。红龙抵达日本,得知哥哥的失踪与商人角崎重臣有关。角崎以普通商贸作掩护,暗中进行毒品走私活动,手下更豢养一批来自世界各地不同流派的格斗高手。得知红龙到来,角崎派出爪牙追杀。1681年,德川幕府的第一代将军德川家康的女婿池田辉政又重建城堡并扩大成今日的规模,一直完美保存至今。

  • 乔振宇古装四大美人(乔振宇所扮演的古装角色第一波)

    《新女驸马》是根据民间黄梅戏《女驸马》改编拍摄的电视剧,于2001年出品,2003年正式播出。平心而论,剧中乔振宇饰演的东方胜也许不如《雪花女神龙》的欧阳明日出名。《七剑下天山》天山七剑之首、天山派第一代掌门凌未风。而《浣花洗剑录》之后,谢霆锋、乔振宇、钟欣潼等人都各自飞黄腾达《少年讼师纪晓岚》反派角色杨乃文。杨乃文在剧中眉清目秀,玉树临风,英俊潇洒的清装扮相,完全不像杀人犯。

  • 怎样清理微信朋友圈读过的内容(如何删去微信朋友圈里面的内容)

    怎样清理微信朋友圈读过的内容?其实很简单,下面我们就来看看有哪些方法吧,接下来我们就来聊聊关于怎样清理微信朋友圈读过的内容?怎样清理微信朋友圈读过的内容微信朋友圈随着微信使用人群的越来越多,很多的微商、各种链接、活动等等都大量涌入其中,真的很令人心烦,那么我们怎么清理或者删除这些朋友圈呢?

  • 虎头蜂,是什么 虎头蜂是什么样子的

    “虎头蜂”是大型胡峰的俗称,因为胡蜂的头大像老虎,且非常凶猛。虎头蜂是完全变态发育昆虫,要经历卵、幼虫、蛹、成蜂四个阶段,是典型的社会性昆虫,每群蜂均由雌蜂、雄蜂和职蜂组成。

  • 路由器连接了光猫无法正常使用(路由器常见故障及解决方法)

    路由器连接了光猫无法正常使用目前三大运营商的宽带用户规模早已超过4亿户,平均算下来几乎每家每户都安装了固网宽带。如果左邻右舍都是这种状态就是大面积的故障,只能等运营商代维处理,稍后就会恢复正常。设备不在线联系代维换设备,设备掉电重启光猫后还是闪换设备,数据没正常下发还是联系代维。如果指示灯全部正常,这就是掉线,掉线频繁联系代维换设备。

  • 牛肉粉毛利达到多少才合理(餐饮知识-嫩肉粉)

    餐饮知识-嫩肉粉嫩肉粉又称嫩肉晶,其主要作用在于利用蛋白酶对肉中的弹性蛋白和胶原蛋白进行部分水解,使肉类制品口感达到嫩而不韧、味美鲜香的效果由于其嫩化速度快且效果明显,因此目前已广泛应用于餐饮行业但一些师傅对它仍然心。

  • 2022沧州肃宁县高考温馨提示

    根据教育部和河北省招生委员会安排部署,2022年高考将于6月7日——9日进行。为确保按时参加高考,已在我县参加高考报名,但因学习、培训等原因目前仍滞留在外省、市、县的考生,需尽快返回报名地备考,防止因疫情原因影响考生参考。