准确预测极端降水,哥伦比亚大学推出升级版神经网络 Org-NN
内容一览:随着环境变化加剧,近年来全球极端天气现象频频出现,准确预测降水强度对人类以及自然环境都十分重要。传统模型预测降水的方差较小,偏向小雨,对极端降水预测不足。
关键词:极端天气 内隐学习 神经网络
本文首发于 HyperAI 超神经微信公众平台~
受台风「杜苏芮」影响,北京市从 7 月 29 日开始了连续多日的强降雨,部分地区为特大暴雨。极端强降雨导致了海河流域发生流域性较大洪水,门头沟、涿州等地发生了严重的洪涝灾害。
据央视网 7 月 31 日报道,此次强降雨期间,北京已累计排蓄水超过 1000 万立方米,相当于排空了约 5 个颐和园昆明湖的水量,及时、准确、有效地预测极端降水,能最大程度上减轻人员伤亡,减少气象灾害带来的损失。
传统的气候模型参数化中缺少亚网格尺度的云结构与组织 (subgrid-scale cloud structure and organization) 信息,这会对粗粒度分辨率下降水强度和随机性产生影响,导致无法准确预测极端降水情况。哥伦比亚大学 LEAP 实验室使用全球风暴解析模拟与机器学习,创建了一种新的算法,解决了信息缺失的问题,提供了一种更精确的预测方法。
目前,该研究已发表于《PNAS》,文章标题为《Implicit learning of convective organization explains precipitation stochasticity》。
论文已发表于《PNAS》
论文地址:https://www.pnas.org/doi/10.1073/pnas.2216158120#abstract
准备工作:10 天气象数据+ 2 个神经网络
数据与处理
实验团队所用数据集是大气模式系统 (SAM) DYAMOND (DYnamics of the Atmospheric general circulation Modeled On Non-hydrostatic Domains) 第二阶段比较项目中模拟的大气环流动力学的一部分。这个项目对比模拟了北半球冬季的 40 天,实验人员将其中初始的 10 天作为模型的 spin-up,在后 30 天中随机抽取了 10 天作为训练集。
研究人员选择了合适的数据,并将这些数据粗粒度 (coarse-grain) 划分为子域,等同于或可与 GCM-size 的网格。
接下来,为了提供训练、验证和测试数据集,团队将 10 天分为 6 天、2 天、2 天,分别用于训练、验证和测试,且只保留了降水大于阙值 (0.05mm/h) 的样本,以便只专注于降水强度 (intensity) 而不是降水的起因 (trigger) 。最终,样本总数为 108 个。
神经网络架构
在实验中,研究人员使用了两个神经网络:传统模型 Baseline-NN(基准神经网络)与新提出的 Org-NN。
Baseline-NN 是一个全连接前馈神经网络 (full connected feed-forward network),学习率按代进行调整。作为传统模型,Baseline-NN 只能访问大规模变量并预测降水。
Org-NN 含有一个自编码器,其编码器部分包括 3 个一维卷积层和两个全连接层。编码器的 input 是尺寸为 32 x 32 的高分辨率 PW (可降水,precipitable water)异常 (anomalie),output 为 org 变量,org 维度是该网络的超参数,研究人员将其设置为了 4。解码器接收 org 变量并对原始的高分辨率场进行重构,与编码器的结构恰好相反。Org-NN 的神经网络部分与 Baseline-NN 相似,只额外添加了组织潜在变量 (org) 作为其 input。
两者都使用 TensorFlow 2.9 版本实现,并使用 Sherpa 优化库对超参数进行了调优。
实验结果
实验团队对两个模型进行了预训练。为了评估神经网络的预测性能,科研人员选择了 R2,这是一种常用于量化回归模型性能的指标。计算公式如下:
传统模型 Baseline-NN
实验团队首先使用 Baseline-NN。下图展示当使用粗粒度的 PW、SST、qv2m 和 T2m 作为 input 时的降水可预测性。其中,qv2m 与 T2m 用于向 Baseline-NN 提供边界层 (boundary-layer) 条件的信息。实验团队将粗粒度的 PW 分组,在每个组内对粗粒度降水的预测值与实际值进行平均,同时计算了落在每个分组内的粗粒度降水值方差。
PW:可降水,precipitable water
SST:海面温度,sea surface temperature
qv2m:近地表 2m 的比湿,near-surface specific humidity
T2m:近地表 2m 空气湿度,surface temperature
图 1:PW bin 上粗粒度降水平均值
虚线:真实的降水平均值
橘线:预测的降水平均值
绿线:每个 PW bin 中计算出的 R2
阴影部分:每个分组内的方差
Baseline-NN 准确地恢复了降水平均值(即分组的平均值)在 PW 条件下的关键行为,以及在临界点附近出现的快速转变。但是,实验团队发现它无法解释全球暴风模拟中观察到的降水变异性,而且其性能(通过所有样本的 R2 值估量)约为 0.45。低 R2 值表示,尽管可以捕捉到一些降水变异性,但是无法找到 input 与降水之间的强关系,且每个 PW bin 计算的 R2 值也未超过 0.5。
与此同时,实验团队还将 Baseline-NN 所预测的降水的概率密度函数与实际降水做比较,显示该模型无法预测降水分布的尾部 (tail) ,即无法预测极端降水的情况。
图 2:降水的概率密度函数示意图
蓝色部分:真实降水的概率密度函数
橙色部分:根据预测所得降水的概率密度函数
研究人员还将在粗粒度上的总云量作为神经网络的 input 之一,对 Baseline-NN 进一步测试。总云量在气候模型中为参数化变量,与降水无直接关系,所以将其作为神经网络的输入可能会提供有关凝结水的线索,而凝结水会直接用于降水的参数化。这其实对预测改进的作用很小,但是强调了平均云量并不能提供准确预测降水的相关信息。此外,实验团队通过进一步分析,证实了 CAPE 与 CIN 不能作为预测因子,且不能改善预测结果。
图 3: 降水概率密度函数图
蓝色部分:真实降水概率密度函数
橘色部分:预测得出降水概率密度函数
a:input 为 [PW、SST、qv2m、T2m、感热通量(sensible heat flux)、潜热通量(latent heat flux)]
b:input 为 [PW、SST、qv2m、T2m、总云量]
c:input 为 [PW、SST、qv2m、T2m、CAPE、CIN]
结论是 Baseline-NN 在准确预测降水以及变异性方面能力较低。
新模型 Org-NN
实验团队接下来颠覆了传统方法,即利用 Org-NN进行预测。因为 Org-NN 含有一个自编码器,它可以直接从神经网络的目标函数通过反向传播接受反馈。因此,自编码器将可以被动提取改善降水预测的相关信息。
下图显示了以粗粒度变量和 org 作为输入的 Org-NN 的降水预测结果。相比于 Baseline-NN,Org-NN 的进步显著。当在所有数据点上进行计算时,预测的 R2 增加到 0.9。对于 PW 的每一个区间,除了降水较小的区间,计算得到的 R2 值几乎都接近 0.80。
图 5: Org-NN 预测结果图
D:PW bin 上粗粒度降水平均值
E:降水的概率密度函数示意图
F:图 D 中每个纬度和经度位置在时间步长上计算得出的 R2 值。图中的白色区域表示降水小于 0.05 毫米/小时,被排除在模型的输入之外。除未达到降水阈值的点的附近区域外,Org-NN 在大部分区域的 R2 值显著高于 0.8。
实验团队比较了 Org-NN 和高分辨率降水模型的真实降水的概率密度函数,对 Org-NN 的性能进一步量化。结果发现,Org-NN 完全捕捉到了概率密度函数,包括它分布的尾部,也就是对应着极端降水的部分。这说明 Org-NN 能够准确预测极端降水的情况。
实验团队所得结果表明,通过将 org 纳入 input,降水预测得到了显著的改善。这表明了,在当前的气候模型中,亚网格尺度结构可能是对流和降水参数化缺失的重要信息。
实验流程总结
图 6: 实验流程概览
A:数据处理过程:粗粒度化高分辨率数据
B:Baseline-NN:该网络接收粗尺度变量 (如 SST 和 PW) 作为 input,并预测粗尺度降水。
C:Org-NN : 左图显示了自动编码器,它接收高分辨率 PW 作为 input,并在通过瓶颈后对其进行重建。右图显示了预测粗尺度降水的神经网络。
传统气候模型变革在即
本次实验的团队来自 Learning the Earth with Artificial Intelligence and Physics (LEAP),这是哥伦比亚大学于 2021 年启动的 NSF 科学与技术中心,其主要研究策略就是结合物理建模与机器学习,利用气候科学、气候模拟的专业知识与尖端的机器学习算法,改进近期气候预测。这对气候科学与数据科学的发展都有所增益。
LEAP 实验室部分成员简介
|实验室官网:https://leap.columbia.edu
目前,研究人员正在将他们的机器学习方法应用于气候模型中,以改进降水强度和变异性的预测,并使科学家能够在全球变暖背景下,更准确地预测水循环和极端天气模式的变化。
同时,这项研究还开辟了新的研究方向,例如探索降水具有记忆效应的可能性,即大气保留有关最近天气条件的信息,进而影响后续的大气条件。这种新方法可能在降水模拟之外具有广泛的应用,如对冰盖和海洋表面进行更好的模拟。
本文首发于 HyperAI 超神经微信公众平台~
相关文章:

准确预测极端降水,哥伦比亚大学推出升级版神经网络 Org-NN
内容一览:随着环境变化加剧,近年来全球极端天气现象频频出现,准确预测降水强度对人类以及自然环境都十分重要。传统模型预测降水的方差较小,偏向小雨,对极端降水预测不足。 关键词:极端天气 内隐学习 神经网…...

【数据结构】反转链表、链表的中间节点、链表的回文结构(单链表OJ题)
正如标题所说,本文会图文详细解析三道单链表OJ题,分别为: 反转链表 (简单) 链表的中间节点 (简单) 链表的回文结构 (较难) 把他们放在一起讲的原因是: 反转链…...

Python爬虫-抓取的目标数据为#x开头,怎么解决?
前言 本文是该专栏的第4篇,后面会持续分享python爬虫案例干货,记得关注。 在做爬虫项目的时候,有时候抓取的平台目标数据为&#x开头,如下图所示: 浏览器显示的正常数据,但通过爬虫协议获取到的网页源码数据却是以&#x开头的隐藏数据,遇到这种情况,爬虫需要怎么处…...

短视频账号矩阵系统/技术开发搭建私有部署
本系统是基于短视频领域的新一代系统,旨在提供一个高效、全面的短视频管理与分发平台。系统采用先进的开发算法和技术,实现了智能化视频分类、推荐和用户互动功能。 目录 一、抖音SEO账号矩阵系统的开发和部署遵循以下原则: 二、账号矩阵绑…...

光致发光二极管光源——荧光效率检测系统
发光二极管(LED)光源已经逐步地取代传统光源,并在生产和生活中得以广泛应用。荧光粉在LED照明设备中起到了至关重要的作用,其功能为将转换芯片所产生的紫外或者蓝光,发射出目标颜色的光。近年来,人们为了提…...

【手撕C语言】多线程
(꒪ꇴ꒪ ),Hello我是祐言QAQ我的博客主页:C/C语言,Linux基础,ARM开发板,软件配置等领域博主🌍快上🚘,一起学习,让我们成为一个强大的攻城狮!送给自己和读者的一句鸡汤🤔&…...

Dubbo2-概述
Dubbo 阿里公司开源的一个高性能,轻量级的javaRPC(远程服务调用方案)框架,提供高性能远程调用方案以及SOA服务治理方案 Dubbo架构 节点角色说明: Provider:服务提供方 Container:服务运行容器 Consumer:调用远程服务…...

【将回声引入信号中】在语音或音频文件中引入混响或简单回声,以研究回声延迟和回波幅度对生成的回波信号感知的影响(Matlab代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

pythonocc进阶学习:投影projection
1.点 到 线,(直线,曲线)等上的投影 staticmethod # 点到Lin的投影 def Project_Pnt_To_Lin(p: gp_Pnt, lin: gp_Lin):Edge BRepBuilderAPI_MakeEdge(lin).Edge()curve BRep_Tool.Curve(Edge)proPnt GeomAPI_ProjectPointOnCurve(p, curve[0])Neares…...

Scractch3.0_Arduino_ESP32_学习随记_显示网络天气(二)
这里写目录标题 目的器材程序联系我们 目的 通过C02获取网络天气。并在屏上显示 器材 硬件: 齐护机器人C02 购买地址 软件: scratch3.0 下载地址:官网下载 程序 使用的是公开免费的API,对请求间隔和次数有限制,如果连续获取可能会被封IPÿ…...
Mysql压力测试(sysbench)
目录 配置项目环境: 参考:采用sysbench压测mysql详解_dream21st的博客-CSDN博客 实验步骤: 1、安装sysbench工具 2、在master上创建用户和库,配置用户的权限可以使他可以访问库(Mysql的主从复制) 3、基…...
TBDS MPP参数列表
TBDS MPP参数列表 namesettingdescriptionapplication_namessqlSets the application name to be reported in statistics and logs.archive_cleanup_commandSets the shell command that will be executed at every restart point.archive_command(disabled)Sets the shell co…...

C# OpenCvSharp 读取rtsp流
效果 项目 代码 using OpenCvSharp; using OpenCvSharp.Extensions; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading; using Syste…...
每日后端面试5题 第七天
一、内连接和外连接查询有什么区别? 内连接只查询出两表的交集; 外连接会查询出某表的全部与两表的交集。 二、Nginx的作用 1.反向代理 前端把请求发送给nginx,再由nginx将请求发送给后端服务器。 2.负载均衡 提高访问速度;…...

计算机视觉的应用10-图片中的表格结构识别与提取实战
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用10-图片中的表格结构识别与提取实战,表格结构识别在信息处理领域中具有广泛应用,但由于表格的多样性和复杂性,以及难以准确解析的布局和格式,传统的方…...
P4178 Tree (点分治)
题目链接 一:我们考虑树上两点之间的路径有什么情况 1:经过根节点(即在根节点的两端) 2:不经过根节点(完全在一颗子树的一侧) 二:我们考虑这两种路径是否可以归为一类 1࿱…...
Kubernetes 二进制搭建
Kubernetes 二进制搭建 一、二进制搭建 Kubernetes v1.201.1 部署准备1.2 操作系统初始化配置1.3 部署 etcd 集群1.3.1 etcd 作为服务发现系统,有以下的特点1.3.2 准备签发证书环境1.3.3 在 master01 节点上操作1.3.4 生成证书 1.4 部署 docker引擎1.4.1 部署 Maste…...

QT QtXlsx安装使用
QtXlsx介绍 QtXlsx是一个可以读取和写入Excel文件的库。它不需要Microsoft Excel,可以在Qt5支持的任何平台上使用。 这里一定是需要QT5支持的。 须知安装QtXlsx时,需要下载perl 1.安装perl 这里选择官网下载安装即可。 官网地址:https://p…...

Java医院信息化HIS管理系统源码
HIS模板分为两种:病历模板和报表模板。模板管理是运营管理的核心组成部分,是基层卫生健康云中各医疗机构定制电子病历和报表的地方,各医疗机构可根据自身特点特色定制电子病历和报表,制作的电子病历及报表可直接在业务系统中使用。…...

【Uni-App】uview 开发多端应用,密码显示隐藏功能不生效问题
出现的问题: 使用uview组件u-input框密码绑定时会出现右侧密码显隐图标不显示的问题 思路: 1.看了下uview源码,发现这有一段注释,我们需要把源码修改一下,问题出在这里 这行代码修改为 :password"password || …...
git提交代码和解决冲突修复bug
提交到分支的步骤如下: 确保你当前在开发分支上,可以使用命令 git branch 来查看当前所在分支,并使用 git checkout 命令切换到开发分支。使用 git add 命令将修改的文件添加到暂存区。使用 git commit 命令提交代码到本地仓库。 解决合并冲…...
vue3 按钮级别权限控制
在Vue 3中实现按钮级别的权限控制,可以通过多种方式实现。这里我将介绍几种常见的方法: 方法1:使用Vue 3的Composition API 在Vue 3中,你可以使用Composition API来创建一个可复用的逻辑来处理权限控制。 创建权限控制逻辑 首…...

1panel面板中部署SpringBoot和Vue前后端分离系统 【图文教程】
1panel面板中部署SpringBoot和Vue前后端分离系统 一,1panel面板部署二,安装OpenResty三,安装MySQL,Redis等Spring boot 运行依赖环境四,SpringBoot 应用配置及打包部署配置打包部署 五 ,前端VUE应用配置打包…...
stm32_DMA
DMA 1. 概念与基本原理 DMA,全称Direct Memory Access,即直接存储器访问。它是微控制器(MCU)、嵌入式处理器中的一个独立硬件模块,用于在无需CPU干预的情况下,在不同内存区域(包括外设寄存器和…...

明基编程显示器终于有优惠了,程序员快来,错过等一年!
最近618的活动已经陆续开始了,好多人说这是买数码产品的好时候,作为一名资深程序员,我做了不少功课,决定给自己升级办公设备,入手明基 RD 系列的显示器,这是市面上首家专注于我们程序员痛点和需求的产品&am…...

.NET 原生驾驭 AI 新基建实战系列(三):Chroma ── 轻松构建智能应用的向量数据库
在人工智能AI和机器学习ML迅猛发展的今天,数据的存储和检索需求发生了巨大变化。传统的数据库擅长处理结构化数据,但在面对高维向量数据时往往力不从心。向量数据库作为一种新兴技术,专为AI应用设计,能够高效地存储和查询高维向量…...

Unity优化篇之DrawCall
当然可以!以下是完整、详尽、可发布的博客文章,专注讲解 Unity 的静态合批与动态合批机制,并详细列出它们对 Shader 的要求和所有限制条件。文章结构清晰、技术深度足够,适合发布在 CSDN、掘金、知乎等技术平台。 urp默认隐藏动态…...

Webpack的基本使用 - babel
Mode配置 Mode配置选项可以告知Webpack使用相应模式的内置优化 默认值是production(什么都不设置的情况下) 可选值有:none | development | production; 这几个选项有什么区别呢? 认识source-map 我们的代码通常运行在浏览器…...
SpringCloud——OpenFeign
概述: OpenFeign是基于Spring的声明式调用的HTTP客户端,大大简化了编写Web服务客户端的过程,用于快速构建http请求调用其他服务模块。同时也是spring cloud默认选择的服务通信工具。 使用方法: RestTemplate手动构建: // 带查询…...

LabVIEW与Modbus/TCP温湿度监控系统
基于LabVIEW 开发平台与 Modbus/TCP 通信协议,设计一套适用于实验室环境的温湿度数据采集监控系统。通过上位机与高精度温湿度采集设备的远程通信,实现多设备温湿度数据的实时采集、存储、分析及报警功能,解决传统人工采集效率低、环境适应性…...