DeepMind大模型登Science:1分钟预测10天天气数据 90%指标超越人类最强模型
谷歌DeepMind实验室推出的天气预测大模型,已在Science杂志发表。
只需要不到1分钟,它就能直接预测出未来10天的天气。
准确度上,它在90%的指标上超越了最先进的人类系统,在AI气象模型中属首次!
DeepMind的这个气象模型名叫GraphCast,目前已经开源。
它的分辨率为0.25度经度/纬度(在赤道处约为28 x 28公里),而目前的最高分辨率为1度。
这样的分辨率相当于将地球表面分割成了超过100万个网格,而每个网格又可以产生数百条预测数据,总计数量达到了上亿规模。
不同于传统的预测方式,GraphCast预测主要依靠数据中的规律进行预报,而不使用人类建立的物理方程。
相比于人类最准确的HRES预报,GraphCast在1380个测试指标中,90%的预测结果都更为准确。
如果把预测范围限制在对流层,GraphCast击败HRES的指标比例更是高达99.7%。
YC上有网友表示,用“impressive”已经不足以形容这项成果了。
那么,GraphCast的预测表现具体是怎样的呢?
90%指标超越人类最好方法
在划分出的100万多个网格上,GraphCast划分出的每个网格都能够产生227条预测数据。
其中包括了37个不同高度上,每个高度的6个大气变量(包括比湿度、风速和风向以及温度等)。
在地球表面,GraphCast还可以预测包括温度、风速和风向以及平均海平面压力等在内的5个变量。
完整的变量种类和具体高度(以气压表示,单位:hPa)如下表所示:
为了比较GraphCast和HRES的表现,研究人员从欧洲中期天气预报中心(ECMWF)的ERA5再分析数据中选取了2018年(GraphCast训练数据截止2017年)的历史数据。
研究者分别让HRES和GraphCast站在当时的情况下进行“预测”,然后比较它们的“预测”和ERA5进行比较。
在500hPa高度场上,GraphCast的RMSE(均方根误差,数值越低表现越好)和ACC(异常相关系数)指标都显著优于HRES。
而在研究人员选取的50-1000hPa的1380个数据点中,GraphCast有90.3%优于HRES,89.9%优势显著(下图d组中,蓝色表示GraphCast优于HRES,越深优势越明显)。
除了这些数据,GraphCast在极端天气的预测上也有明显优势。
对于热带气旋路径,GraphCast中位误差低于HRES,特别是在前4.75天开始,优势开始变得明显(下图a、b)。
在根据大气河流(Atmospheic River)进行水汽通量预测时,GraphCast的RMSE值也明显低于HRES(下图c)。
预测热浪时,GraphCast在提前12小时、5天、10天时,准确度也都比HRES高(下图d)。
今年9月,GraphCast成功在登陆前9天预测了北大西洋的飓风Lee,而使用传统方法最多提前6天预报。
GraphCast不仅准确度高,预测速度也非常快。
在一台Google TPU v4机器上使用GraphCast进行10天预测,只需不到一分钟就能完成。
相比之下,使用HRES等传统方法,即使在超级计算机上也要花费数个小时。
那么,GraphCast是如何实现高效准确的气象预测的呢?
不使用物理方程,预测全靠数据分析
工作流程上,输入从6小时前开始到当前的气象数据,GraphCast就可以预测未来6小时的天气。
而预测出的数据可以作为新的“当前”态,继续往后迭代预测,最长可以预测到10天后的天气状况。
原理层面,GraphCast使用机器学习方式和图神经网络(GNN)架构,其中包括编码器和解码器各一层,以及中间层16层,参数量为3670万。
它仅通过学习已有气象数据实现预测,不依赖人类建立的物理方程。
GraphCast将0.25度网格的气象数据进行编码映射到神经网络,经过传递计算后的结果再由解码器还原为气象数据。
训练时,GraphCast使用的是来自ERA5数据集中的1979-2017这近四十年天气的再分析数据,包括了卫星图像、雷达和气象站测结果。
ERA5是基于4DVar方法和同化观测生成的全球最优重构资料,涵盖时间从上世纪40年代至今,空间则覆盖全球。
而如果使用更近期的数据,GraphCast的预测结果准确度还能继续提高。
下一步,DeepMind计划构建集合预报模型,以适应实际情况中天气的不确定性,进一步增强预报准确性。