MindSpore AI科学计算系列 | MetNet3融合稀疏站点数据，实现提前24h天气预报

背景

准确预测未来几分钟到几周的天气是一项基本的科学挑战。目前，绝大部分气象机构采用传统数值模式进行天气预报，这些数值模式是基于大气的物理模型进行构建的，但同时这些模式本身也会受到计算成本的限制。深度神经网络为天气变化建模提供了另一种范式，一旦模型训练完成，神经网络可以在不到一秒的时间内做出预报，同时兼备非常高的时间分辨率和空间分辨率。与此同时，AI模型还可以直接从大气观测数据中进行训练，以此获得更贴近观测的预测效果。

2023年6月，谷歌研究院与DeepMind合作发布了最新的天气模型MetNet-3，与之前的MetNet和MetNet-2相比，MetNet-3的预报时效从8小时、12小时提升到了24小时，并且增加了预报变量，同时扩大了预报范围。

1、****方法与实验

在近期大量涌现的AI气象预报模型中，如Graphcast、盘古气象大模型，均采用再分析数据作为训练样本，即通过背景场与观测同化后的数据。相较于这些中期预报模型，MetNet-3选择引入一部分大气观测数据来进行模型的训练和评估。然而观测数据与再分析数据不同的是，观测数据来源多样且异构，数据存在不同程度的稀疏性。为了融合大气观测数据（稀疏点状数据），MetNet-3采取了一种Densification方式，这种方法将数据同化与模拟预测直接在AI模型中进行融合，Densification的过程如图1所示。

图1 Densification训练方式

Densification的目的是利用站点观测数据，预测所有位置上的基础气象要素。首先将所有站点取80%作为训练站点，20%作为验证站点，这20%的站点是不参与训练的，只参与精度验证；在实际训练中，随机mask25%的站点，然后输出所有训练站点的气象要素，并计算loss；然后在模型验证阶段，会把所有的训练站点都输进去，在所有验证站点上验证精度。最后在模型推理阶段，模型将所有的站点都作为输入，输入全部位置的预测值。

MetNet-3整体网络架构如图2所示，MetNet-3选择Unet作为backbone，由于数据集部分包含了两种分辨率，因此在Unet输入中，首先输入4km分辨率的数据，并在一次DownSample后加入8km分辨率数据，实现两种分辨率数据的融合。其次，MetNet-3在Unet中加入了MaxVit模块，主要考虑利用grid attention来捕捉一些全局信息。模型最终有三个输出，在4km的分辨率下会输出600多个同化的基础要素和稀疏的站点数据。在模型的最终输出层，数据会UpSample到1km的降水数据上。值得注意的是，模型虽然会输出同化结果作为loss用来约束整个模型，但是模型的评估里并不会考虑这些要素的预测质量。

图2 MetNet-3模型架构

另外，实验也发现如果同时训练这些变量，降水的预报质量和其他地面要素的预报质量会存在trade off，因此MetNet-3采取的训练策略是先减少OMO的损失权重训练降水要素，然后在把权重扩大100倍来进行模型微调。

2、结论与感谢

MetNet-3是一种新型的AI天气预报模型，可以对核心天气变量进行提前24小时的预报，其性能优于最先进的数值模式。目前MetNet-3已投入运行，可生成实时12小时降水预报，这些预报现已在与天气相关的Google产品中提供服务。

往期回顾

MindSpore AI科学计算系列 | 化学深度学习模型ChemGPT的性能评估公式拟合

MindSpore AI科学计算系列 | GNN-MoM基于昇思MindSpore Elec的图残差学习电磁求解器

MindSpore AI科学计算系列 | VAE基于MindSpore Elec的特征域MT反演，提升大地电磁反演的精度和分辨率

MindSpore AI科学计算系列 | Allegro提升昇思分子势能预测准确性，将上线MindSpore Chemistry

标签：人工智能

本文转载自: https://blog.csdn.net/Kenji_Shinji/article/details/136070539
版权归原作者 昇思MindSpore 所有，如有侵权，请联系我们删除。

MindSpore AI科学计算系列 | MetNet3融合稀疏站点数据，实现提前24h天气预报

发表评论

“MindSpore AI科学计算系列 | MetNet3融合稀疏站点数据，实现提前24h天气预报”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航