科百科
当前位置: 首页 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率(英伟达用傅里叶模型实现前所未有天气预报准确率)

时间:2023-05-31 作者: 小编 阅读量: 2 栏目名: 科技资讯

英伟达用傅里叶模型实现前所未有天气预报准确率机器之心报道机器之心编辑部英伟达在天气预报上放出了「大招」现代数值天气预报(numericalweatherprediction,NWP)可以追溯到1920年代当今,数值天气预报已经无处不在,并且为交。

机器之心报道

机器之心编辑部

英伟达在天气预报上放出了「大招」。

现代数值天气预报(numerical weather prediction, NWP)可以追溯到 1920 年代。当今,数值天气预报已经无处不在,并且为交通、物流、农业和能源生产等关键部门的经济规划做出了贡献。准确的天气预报通过提前通知极端事件挽救了无数人的生命。

过去几十年,天气预报的质量一直在稳步提高。最早的单点动态建模数值天气预报是由英国科学家 Lewis Fry Richardson 在 1922 年使用计算尺和对数表计算得出的,并用六周时间计算出 6 小时(6-hour)的大气预报。到了 1950 年代,早期的电子计算机极大地提高了预测速度,使得运行预测的计算速度足够快,从而有助于未来天气预测。除了更好的计算能力之外,通过更深入地了解小尺度过程的物理特性和更高质量的大气观测,来更好地参数化小尺度过程,从而改进天气预报效果。

与 SOTA NWP 模型相比,数据驱动的深度学习模型在成本上低了数个量级,因此现在研究人员越来越有兴趣开发这类方法来预测天气。许多研究都试图通过建立数据驱动的模型来预测大气的规模环流,并且要么在气候模型输出、大气环流模型(GCM)、再分析产品,或者结合气候模型输出和再分析产品进行训练。数据驱动的模型通过克服 NWP 模型中存在的模型偏差,以及通过以较低的计算成本生成用于概率预测和数据同化的大型集合,因而在改进天气预报方面具有巨大潜力。

大多数据驱动的天气模型使用低分辨率数据来训练,通常是 Rasp and Thuerey [2021b]中的 5.625° 分辨率或者 Weyn et al. [2020] 中的 2° 分辨率。这些先验尝试在预测一些粗粒度、低分辨率大气变量方面取得了很好的效果。然而,粗化过程会导致关键的细粒度物理信息的丢失。要使数据驱动模型真正具有影响力,它们生成的预报的分辨率必须与当前 SOTA 数值天气模型相同或更高,分辨率大约在 0.1°。

在近日的一篇论文中,英伟达、劳伦斯伯克利国家实验室、密歇根大学安娜堡分校、莱斯大学等机构的研究者开发了一种基于傅里叶的神经网络预测模型 FourCastNet,它能以 0.25° 的分辨率生成关键天气变量的全球数据驱动预测,相当于赤道附近大约 30×30 km 的空间分辨率和 720×1440 像素的全球网格大小。这使得我们首次能够与欧洲中期天气预报中心(ECMWF)的高分辨率综合预测系统(IFS)模型进行直接比较。

论文地址:htTPs://arxiv.org/pdf/2202.11214.pdf

FourCastNet 在节点小时(node-hour)基础上比传统 NWP 模型快约 45,000 倍。FourCastNet 这种数量级的加速以及在高分辨率下前所未有的准确性,使得它能够以很低的成本生成超大规模集合预测。FourCastNet 极大地改善了概率天气预报的效果,使用它可以在几秒钟内生成对飓风、大气层河流和极端降水等事件的大规模集合预报,从而可以实现更及时、更明智的灾难响应。

此外,FourCastNet 对近地表风速的可靠、快速和低廉预测可以改善陆海风电场的风能资源规划。训练 FourCastNet 所需的能量大约等于使用 IFS 模型生成 10 天预测所需的能量(50 个成员)。然而,一旦经过训练,FourCastNet 生成预测所需的能量比 IFS 模型少 12,000 倍。研究者希望 FourCastNet 只训练一次,并且后续微调的能耗可以忽略不计。

在实现技术上,FourCastNet 使用基于傅里叶变换的token混合方法 [Guibas et al., 2022] 和ViT骨干 [Dosovitskiy et al., 2021]。这一方法基于最近的的傅里叶神经算子,该算子以分辨率不变的方式学习,并在建模流体动力学等具有挑战性的偏微分方程中取得了成功。此外,他们选择 ViT 骨干的原因是它能够很好地建模长程依赖。ViT 和基于傅里叶的 token 方法混合生成了 SOTA 高分辨率模型,它可以解析细粒度的特征,并能够很好地随分辨率和数据集大小扩展。研究者表示,这一方法能够以真正前所未有的高分辨率训练高保真数据驱动的模型。

训练模型

欧洲中期天气预报中心(ECMWF)提供了一个公开可用的综合数据集 ERA5,该研究使用 ERA5 来训练 FourCastNet。他们专注于两个大气变量,即(1)距离地球表面 10m 处的风速和(2)6 小时总降水量,除此以外,该研究还预测了其他几个变量,包括几个不同垂直高度的位势高度、温度、风速和相对湿度,一些近地表变量,如地面气压和平均海平面气压以等。

FourCastNet模型

为了生成高分辨率预测,研究采用自适应傅里叶神经算子 (Adaptive Fourier Neural Operator,AFNO) 模型。这种神经网络架构专为高分辨率输入而设计,并将深度学习(DL)最新关键进展综合到一个模型中。也就是说,FourCastNet 结合了 傅里叶神经算子 (FNO) ,该方法已被证明在建模具有挑战性的 PDE 系统方面表现良好,并且还具有强大的 ViT 主干。

目前,研究者已经提出了几种降低计算复杂度的 ViT 变体,然而,AFNO 模型的独特之处在于它将混合操作构建为连续的全局卷积,在傅里叶域中通过 FFT 有效实现,这允许灵活且可扩展地建模跨空间和通道维度的依赖关系。通过这样的设计,空间混合复杂度降低到 O(N log N),其中 N 是图像 patch 或 token 的数量。这种缩放使 AFNO 模型非常适合 0.25° 分辨率的高分辨率数据,以及进行未来更高分辨率的研究。

模型的计算流程:首先将 720 × 1440 lat-lon 网格上的输入变量投影到 patch 的 2D 网格 (h × w)(patch大小为 p × p,例如 p = 8),每个 patch 表示为一个 d 维 token。然后,将 patch 序列连同位置编码一起馈送到一系列 AFNO 层。

训练

该研究主要关注预测地表风速和降水,但复杂的大气系统包含多个变量之间的强非线性相互作用,例如温度、地面气压、湿度、从地球表面到平流层的水分含量等。为了模拟这些相互作用,该研究选择了一些变量(表 1)来表示大气的瞬时状态。

该研究将 ERA5 数据集分为三组,即训练、验证和测试数据集。训练数据集由 1979 年至 2015 年的数据组成,验证数据集包含 2016 年和 2017 年的数据,测试数据集包含 2018 年及以后的数据。

该研究使用张量 X(k∆t) 表示变量,其中k为时间指数,∆t 为训练数据集中连续快照之间的时间间隔,研究将 ERA5 数据集视为真值,用 X_true(k∆t) 表示真值变量,∆t 固定在 6 小时。训练包括预训练和微调两个阶段:

  • 预训练阶段,采用训练数据集以有监督的方式训练 AFNO 模型,使其学习从 X(k) 到 X(k1) 的映射;
  • 微调阶段,该研究从之前训练好的模型开始对模型进行优化,即模型首先从输入 X(k) 生成输出 X(k1),然后模型使用输出 X(k1) 作为输入,并生成输出 X(k2)。通过比较 X(k1) 和 X(k2) 与训练数据中各自的真值来计算训练损失,并使用这两个训练损失的总和来优化模型。

整个训练过程是在 64 个 Nvidia A100 GPU 的集群上完成,端到端训练大约需要 16 小时。

降水模型

ERA5 re-analysis 数据集中的总降水量(total precipitation,TP)是一个变量,表示通过降雨和降雪落到地球表面的累积液态和冰冻水。该研究将总降水量作为诊断变量,并用 p(kΔt) 表示。用于训练主干模型的数据集(20 个变量)不包括总降水量这个变量。相反,研究者训练一个单独的 AFNO 模型 ,使用主干模型输出来诊断 T P,如图 2(c) 所示。这种方法将降水建模的困难与预测大气状态的一般任务脱离。此外,一旦经过训练,诊断 TP 模型可能会与其他预测模型(传统的 NWP 或数据驱动的预测)结合使用。

用于从主干输出诊断降水的模型具有相同的基本 AFNO 架构,此外还具有额外的 2D 卷积层和 ReLU 激活,用于强制执行非负降水输出。由于主干模型以 6 小时为增量进行预测,因此该研究训练诊断降水模型来预测 6 小时累积的总降水量。

实验结果

下图1定性地展示了 FourCastNet 模型以 0.25°-lat-long 的分辨率预测全球地表风速的能力。其中,使用风速的纬向和经向分量计算地表风速的大小,即

。下图1显示了使用FourCastNet生成的提前96小时的说明性全球近地表风速预测。研究者重点介绍了预测的已解析和准确跟踪的关键高分辨率细节,包括超级台风山竹(Mangkhut,2018年)和向美国东海岸进发的三个命名气旋(Florence、Issac和Helene)。

其中,图 1(a) 显示了模型初始化时的风速。图 1(b) 显示了提前 96 小时的模型预测(上)和当时相应的真实风速(下)。可以看到,FourCastNet 模型能够提前 96 个小时预测风速,并且具有出色的保真度和正确的精细尺度(fine-scale)特征。

值得注意的是,图1说明了一个名为山竹的超级台风的形成和轨迹的预测情况,该台风在大约 10° N、210° W 的初始位置开始形成。该模型以惊人的保真度定性地预测了该台风的增强及其在 4 天内的轨迹。这表明 FourCastNet 模型能够很好地预测台风等天气现象的形成和移动轨迹。

该研究使用来自样本外测试数据集的初始条件初始化 FourCastNet 模型。基于此初始条件,模型可以在推理模式下自由运行 16 个时间步长,如下图 2(d) 所示。

相比于台风,降水存在间歇性和随机性,因此预测降水被认为是一项极其困难的任务。下图 3 展示了 FourCastNet 模型预测全球总降水量的能力。图 3(a) 为初始化的降水条件,图 3(b) 是提前 36 个小时的模型预测和实际情况的对比。该图以美国西海岸局部区域的降水为例,突出了 FourCastNet 模型以极高的精度解析和预测局部降水的能力。研究者观察到 FourCastNet 在捕获短期高分辨率降水特征方面性能出色,这对预测极端天气事件具有重大意义。值得注意的是,这是第一次成功利用深度学习模型进行大规模降水预测。

接下来,研究者进一步探讨了开发深度学习模型来预测飓风的潜在效用。飓风作为一种具有巨大破坏潜力的极端天气事件。构建快速可用、计算成本低廉的大气预警模型对于减轻生命和财产损失损失非常重要,同时这类模型也需要更严格的要求以避免错误预测。下图 4 展示了 FourCastNet 在预测迅速多变的飓风方面的强大能力。

除了台风和降水,FourCastNet 模型还能够预测大气层河流( atmospheric river)的形成和演变。下图5显示了一个于 2018 年 4 月最终登陆北加州海岸线的大气层河流的预测情况。

此外,FourCastNet 在量化技巧方面也有很大的优势,比 IFS 更佳。对于 ACC 和 RMSE 两项指标,FourCastNet 在更短的时间(约 48 小时或更短)内获得了比 IFS 更好的性能。并且 FourCastNet 仅使用了 IFS 模型完整变量集的一部分,并且计算成本也低了很多。

集成是数值天气预测的重要组成部分,FourCastNet 使用大型集成带来的性能提升如下图所示。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

    推荐阅读
  • 卡卡退役后还会看足球吗(卡卡随基普乔格跑完柏林全马)

    在9月25日进行的2022柏林马拉松赛上,37岁的肯尼亚名将基普乔格以2小时1分9秒的成绩夺冠,并创造了全新的世界纪录。后半程,卡卡的速度有所下降,但最终以3小时38分06秒完赛的成绩,在业余马拉松选手中还是算相当不错的。而且,这次卡卡参加柏林马拉松也有为父亲打气、鼓劲的原因。2016年镇江马拉松,李铁又以1小时45分的成绩完成半马比赛。

  • 学校预防新冠肺炎防控知识(复课防控小知识)

    对其它地区返校师生要做好体温监测及症状筛查。高校应设置集中隔离医学观察区,对来自或经停湖北以及疫情高发地区的师生和被判定为密切接触者进行集中医学观察。要配合辖区疾病预防控制中心做好疑似或确诊病例的流行病学调查、密切接触者排查。在辖区疾病预防控制中心和中小学卫生保健科的工作人员指导下进行消毒。所使用消毒剂应在有效期内。

  • 按部就班造句(按部就班造句一年级)

    7、即使是您认为应该按部就班,直截了当的技术决策,也会有政治参杂其中,特别是您处于决定是否批准购买某企业工具的职位。

  • 15分钟快速退烧(我娃快速退烧)

    我娃快速退烧昨天晚上10点半才回家,刚回到家里,老人家就说,娃发烧了,我赶紧到房里看娃,发现他还在被窝里打冷战急忙用手探他额头,哇!挺烫的,问他哪里不舒服?头疼头晕发热发冷������,用探热针测出来事38.9℃。

  • 产后怎么缩阴效果好

    运动法阴道本身有一定的修复功能,产后出现的扩张现象在产后3个月即可恢复。产后妈妈可以通过一些锻炼来加强弹性的恢复,促进阴道紧实。练习骨盆运动女人半蹲,两膝微屈,两足分开60厘米左右,两手叉腰。吸气,将骨盆前推;呼气,将骨盆拉回,同时臀部尽量向后撅起。练习展腿运动女人运动躯干、大腿时,腹压作用于阴道,产生快感,同时阴道口开张,利于局部气血通畅。女人坐姿,两手后撑,左腿屈立,右腿屈膝外展,平放垫上。

  • 手机新浪微博怎么取消关注(手机新浪微博如何取消关注)

    以下内容希望对你有帮助!手机新浪微博怎么取消关注打开新浪微博手机客户端,点击页面底部“我”菜单,在展开的页面中,点击“关注”选项。打开微博账号当前关注的用户之后,点击“关注的人”菜单按钮。接下来,可以看到当前已经关注的用户,想要取消关注的话,点击“已关注”按钮,在弹出的对话框中,点击“确定”按钮即可。

  • 广州人口(广州的介绍)

    广州人口广州人口数量:1530.59万人。广州是首批国家历史文化名城,广府文化的发祥地,从秦朝开始一直是郡治、州治、府治的所在地,华南地区的政治、军事、经济、文化和科教中心。广州被全球权威机构GaWC评为世界一线城市,每年举办的中国进出口商品交易会吸引了大量客商以及大量外资企业、世界500强企业的投资,国家高新技术企业达8700多家,总量居全国前三,集结了全省80%的高校、70%的科技人员,在校大学生总量居全国第一。

  • 夏天的租房市场(北京租房夏理银)

    2012年2月,女儿参加“国考”被录取到了国家机关。7月,接通知到单位报到上班。也就是说,租户与房东并无直接联系。我们签订的租期为一年,中介先收一个月的房租即3600元为中介费,另外还要一次性地交付“押二付三”的费用。所谓“押二付三”,就是将两个月的房租作为押金,另预付三个月的房租。如果合同到期双方无什么纠纷时则押金退回。合同签订后我们和中介按合同上的内容对室内设施进行查看清点,完毕后中介将钥匙交付我们。

  • 麻酱秋葵的做法凉拌(简单版凉拌(麻酱秋葵的做法)

    以下内容大家不妨参考一二希望能帮到您!麻酱秋葵的做法凉拌原料:秋葵、橄榄油、盐、芝麻酱、大蒜。秋葵洗干净入煮锅焯水后捞出沥干水。大蒜碎放入碗中加盐。加橄榄油搅拌均匀成芝麻酱汁。秋葵放入盘中,添加芝麻酱汁,稍加搅拌即可享用。

  • 稍的拼音和组词(稍的拼音和组词是怎样的)

    稍的拼音和组词稍的拼音和组词:稍许、稍微、稍纵即逝、稍稍、稍麦、脱稍、手稍、稍地、花稍、枝稍、稍伯、秩稍、稍芟、稍房、稍子、稍麻寺、稍属、眼稍、稍杀、稍问、四稍、稍黩筐篚、稍安勿躁、稍倾、上稍、俸稍、稍麄胆壮、稍长胆壮、乡稍、稍迁、拉稍寺、头稍自领、竿稍、稍绿、稍挽稍、稍侵、饩稍、稍天、奉稍、没下稍。稍有shāo和shào两种读音。作shāo时本义为禾末,引申为略微。作shào时〔~息〕军事或体操的口令。