2023.08.27 学习周报
文章目录
- 摘要
- 文献阅读
- 1.题目
- 2.重点
- 3.引言
- 4.方法
- 5.实验结果
- 6.结论
- 深度学习
- Majorization-Minimization算法
- 1.基本思想
- 2.要求
- 3.示意图
- 总结
摘要
This week, I read a computer science on the prediction of atmospheric pollutants in urban environments based on coupled deep learning models and sensitivity analysis. First, a coupled model combining attention mechanisms, convolutional neural networks and long and short term memory units is proposed to predict O3 and PM2.5 levels as well as AQI in the atmosphere. Secondly, the correlation degree between the predicted value and the measured value of this model is greater than 0.90, which is better than the other four models. Finally, sobol-based sensitivity analysis is used to identify the variables that contribute the most to the model prediction results. Therefore, on the premise of not affecting the prediction performance of the model, the removal of the variable that contributes the least to the prediction result can improve the modeling efficiency and reduce the calculation cost. In addition, I learn the physical laws and mathematical equations of air pollutant transmission.
本周,阅读了一篇基于耦合深度学习模型和敏感性分析的城市环境大气污染物预测的文章。首先,提出了一个结合注意力机制、卷积神经网络和长短期记忆单元的耦合模型,用于预测大气中的O3、PM2.5水平以及AQI。其次,该模型预测值与实测值的关联程度大于0.90,优于其他四种模型。最后,采用基于sobol的敏感性分析来识别对模型预测结果贡献最大的变量。于是,在不影响模型预测性能的前提下,去除对预测结果贡献最小的变量,可以提高建模效率,降低计算成本。此外,我学习了大气污染物传输的物理规律与数学方程。
文献阅读
1.题目
Prediction of atmospheric pollutants in urban environment based on coupled deep learning model and sensitivity analysis
2.重点
1.将CNN、LSTM和注意力机制结合起来进行大气预测;
2.提出的模型优于其他模型,预测数据与观测数据之间的差值R的平方大于0.9。
3.敏感性分析确定了对污染物影响最大的因素。(通过敏感性系数识别对模型目标输出贡献最大的变量,它简化了模型结构,可以分析模型输入变量与目标输出之间的不确定关系,增加了模型的适用性。)
4.删除对输出贡献不大的变量可以提高建模效率。
5.污染物的关键因素在整个期间和COVID-19爆发之前保持相似。
3.引言
1.问题
1)CNN-LSTM混合算法虽然在一定程度上提高了回归任务的精度,但在时间维度上时间特征的重要性并不一致。
2)只使用标准的CNN和LSTM组合很难反映不同特征的重要性,从而导致对特征重要性的错误评估。
3)局部灵敏度分析计算量较小,但可能忽略参数之间的相互作用。
2.解决方案
1)将CNN与LSTM单元相结合,可以捕获序列的特征和隐藏的时间特征。
2)引入注意力机制,根据每个特征的贡献分配不同的权重,进一步增强模型捕获特征的能力。
3)全局敏感性分析可以同时分析了多个输入变量对模型目标输出的影响,有助于揭示不同时期影响环境空气质量的关键因素。
3.研究过程
采用基于sobol的全球敏感性分析,以新冠肺炎疫情为时间边界,检验疫情防控措施在不同时期是否影响了大气污染物与气象因子之间的复杂关系。
4.方法
1.数据集
收集了北京2015年1月1日至2022年7月9日的大气污染数据(包括PM2.5、PM10、SO2、NO2、O3和CO)和气象数据(包括风速(WS)、风向(WD)、相对湿度(RH)、降水(PR)、气压§、温度(T)、露点(DP)和太阳辐射(SI)),其中用两天相邻数据的平均值插值和填充缺失值。
2.模型
1)CNN模块负责提取输入数据的特征,注意力机制根据特征的重要性对CNN提取的特征赋予不同的权重,LSTM模块接收特征权值,并将其应用于学习和预测任务。
2)通过CNN的卷积层滑动提取特征,池化层降低提取的特征维数,提取的特征通过全连通层作为向量H输出:
3)注意力机制对CNN提取的H=[p1, p2,…,pn]中包含的特征赋予不同的权重,使用Softmax函数将这些特征表示为张量。
4)使用以下四个指标来衡量模型的性能:均方根误差(RMSE)、平均绝对误差(MAE)、均方误差(MSE)和决定系数(R2)。
3.Sobol敏感性分析
1)使用Sobol进行全局敏感性分析,以确定模型中最具影响力的参数,并删除对输出影响很小甚至于没有影响的参数。
2)基于方差的Sobol灵敏度分析方法采用蒙特卡罗抽样,根据每个参数对输出目标的贡献进行灵敏度分析。假设模型y=f(x1, x2,…,xn)和xi (i = 1,2,…,n)服从[0,1]均匀分布,则f(x)可分解为:
3)Sobol证明这种分解是唯一的,并且多次积分可以找到每个分解项。f(x)的总方差为:
4)偏差:
5)灵敏度系数Si1,i2,…,is为:
其中:Si为xi的一阶灵敏度指数,表示单个变量对模型输出的影响。
5.实验结果
1.O3、PM2.5和AQI的变化趋势
1)与封城前相比,封城期间PM2.5浓度和AQI浓度急剧下降,O3略有上升趋势。这与污染物形成机制的不同有关。
2)夏季太阳辐照强度高,地表温度升高,近地表空气受热,空气对流增加,有利于污染物的扩散和沉积。
3)春季西北地区沙尘暴频发,在风的作用下,污染物被输送到北京。
4)秋季天气条件稳定,太阳辐照强度减弱,而冬季气温下降,气象条件不利于垂直对流,导致空气质量下降。
2.AC-LSTM模型性能评价
1)提出的模型对于O3、PM2.5和AQI的预测都取得了满意的结果,数据中似乎没有任何异常值。
2)散点图证实了观测值与所提出模型的预测值之间存在很强的正线性相关。
3.与其他模型比较
1)AC-LSTM模型对O3、PM2.5和AQI的预测值与实测值的相关系数最高,一致性最好。
2)五个模型对某些峰值的拟合程度相对较差,这可能与天气和其他因素的突然变化有关。
3)对于预测数据和观测数据的一致性,深度学习模型优于机器学习模型。
4.敏感性分析
1)太阳辐射、PM2.5和露点是与O3浓度相关程度最大的因子,CO、PM10和NO2对PM2.5浓度影响较大,而颗粒物和NO2对AQI的影响最为显著。
2)CO是PM2.5最重要的影响因素,这可能是因为它们的来源相似。第一种,交通排放、煤炭燃烧、生物质燃烧等。另一种,空气中的CO、SO2、氮氧化物等大气污染物可以通过一系列大气化学反应生成PM2.5。
3)敏感性分析结果显示,在整个时间段内PM2.5、PM10和NO2是关键因素。
5.消融实验
依次减去对模型输出贡献最小的变量,观察模型预测精度的变化。
1)当去掉对模型贡献最小的变量时,模型预测指标表现出很小的波动。当剔除敏感性指标较为显著的变量后,模型的各项指标发生突变。即表现为R2减小,RMSE、MAE、MSE增大。
2)RMSE、MAE和MSE随着输入变量的移除而稳步增加,表明没有单一变量可以准确预测这些污染物水平。
3)实验结果表明,随着敏感度指标较高的参数被去除,AC-LSTM模型的预测性能下降。
6.结论
1.提出了一种利用注意力机制的CNN-LSTM大气预测模型,并将其应用于北京周边地区的污染情况。
2.实验结果表明,AC-LSTM模型优于CNN-LSTM、LSTM、SVR和RF模型,O3、PM2.5和AQI的观测值与预测值之间的R2值分别为0.95、0.92和0.96,但部分峰值的预测值未能达到预期。
3.基于Sobol的敏感性分析方法,发现太阳辐照度是整个时期影响O3的最重要因素,CO水平是影响PM2.5浓度的主要因素,PM2.5和PM10是影响AQI的最主要因素。
4.封城前、封城后的敏感性分析表明,PM2.5和太阳辐照度与O3密切相关,而影响PM2.5的关键因素在不同时期有所不同。PM2.5、PM10和NO在整个阶段与疫情前基本相同。
5.消融实验表明,减少输入次数使AC-LSTM模型预测结果的R2对O3、PM2.5和AQI分别降低5%、1%和5%,均在可接受范围内。
深度学习
- 基于牛顿运动定律,假设大气污染物在空气中受到多个力的作用,从而影响其传输和扩散。
1)扩散力:大气污染物在空气中由于浓度梯度而产生的分子扩散,使得污染物向低浓度区域扩散。
2)对流力:大气中的气流和气流的变化会影响污染物的传输,将污染物从一个地区带到另一个地区。
3)沉降力:大气中的重力会使得颗粒状的污染物向下沉降,其速率与污染物的大小和密度有关。
4)扩散和湍流混合:大气中存在的湍流可以将污染物混合到更大的空间范围内。
将上述力结合起来,建立一个基本的多维作用力模型来描述大气污染物的传输过程,但这种简化的模型只能适用一些基本的情况。因为大气污染物传输受到许多因素的影响,如地形条件、气象因素、污染源分布等。
2.大气污染物传输涉及的数学方程
1)弥散方程
其中:C是污染物的浓度,t是时间,D是扩散系数,nabla^2表示浓度梯度的二阶导数。
2)对流扩散方程
其中:u是流速矢量,表示污染物在风中的传输速度。
3)Navier-Stokes方程
在三维情况下,该方程描述速度场随时间的变化。引入一个附加的输运方程来描述污染物浓度场C的变化:
其中:u是流体速度,D是污染物的扩散系数,S是污染物的源项。
4)具体步骤
初始条件: 给定初始时刻的污染物浓度分布和流体速度场。
求解方程: 利用描述污染物输运的方程,结合已知的流体速度场,求解污染物浓度场随时间和空间的演化。
模拟和预测: 基于求解得到的污染物浓度场,可以进行数值模拟和预测,以获得污染物在空间中的传输过程和分布情况。
运动轨迹分析: 通过分析污染物浓度场的变化,可以获得污染物在不同时间段内的运动轨迹。
5)Eulerian和Lagrangian
Eulerian描述基于固定点的观察,用来跟踪污染物浓度随时间和位置的变化。Lagrangian描述则是基于污染物微粒的运动轨迹,更适用于描述颗粒状污染物的传输。
Majorization-Minimization算法
1.基本思想
需要优化一个函数 f(x), 但是直接优化这个 f(x) 太难了。比如, 这个函数是个非凸的函数,我们直接求 f(x) 极小化是很困难的事情。于是,可以找另外一个函数 u(xk, x),这个 u(xk, x) 是对原来的目标函数 f(x) 在点 xk 处的一个近似,这个时候我们就转而去优化 u(xk, x) 来达到优化 f(x) 的目的。
2.要求
1)u(xk, x) 是可微分的(凸),这样就很容易对 u(xk, x) 求优化;
2)u(xk, x) 是对 f(x) 的一个近似,如果 u(xk, x) 不近似于 f(x) 就无法达到通过优化 u(xk, x) 来近似优化 f(x) 的目的。
3.示意图
假设 x0 在A点,构造一个在函数 f(x) 上面的函数 u(xk, x),我们通过找到 u 的最小值B点,在下一步 x1 移动到和B横坐标一样的 C点,于是写出表达式:
为什么要保证 u(xk, x) 在函数 f(x)上呢?
这是因为 u(xk, x) 是 f(x) 的一个替身,我们极小化 u(xk, x) 就是在极小化 f(x) 的上界,就是间接的在极小化 f(x)。于是写出表达式:
因此,C点比B点低比A点低,目标函数的值就不会上升了,而是期望目标函数的值能下降。
总结
本周,我学习了大气污染物传输的物理规律和数学方程,以及Majorization-Minimization算法,理解其中的优势点。下周,我将继续阅读大量文献和学习其中知识点,逐步推进论文写作。
相关文章:

2023.08.27 学习周报
文章目录 摘要文献阅读1.题目2.重点3.引言4.方法5.实验结果6.结论 深度学习Majorization-Minimization算法1.基本思想2.要求3.示意图 总结 摘要 This week, I read a computer science on the prediction of atmospheric pollutants in urban environments based on coupled d…...

css元素定位:通过元素的标签或者元素的id、class属性定位,还不明白的伙计,看这个就行了!
前言 大部分人在使用selenium定位元素时,用的是xpath元素定位方式,因为xpath元素定位方式基本能解决定位的需求。xpath元素定位方式更直观,更好理解一些。 css元素定位方式往往被忽略掉了,其实css元素定位方式也有它的价值&…...

基于Spring实现博客项目
访问地址:用户登录 代码获取:基于Spring实现博客项目: Spring项目写博客项目 一.项目开发 1.项目开发阶段 需求评审,需求分析项目设计(接口设计,DB设计等,比较大的需求,需要设计流程图,用例图,UML, model中的字段)开发+自测提测(提交测试…...

数据库第十七课-------ETL任务调度系统的安装和使用
作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 🎂 作者介绍: 🎂🎂 🎂 🎉🎉🎉…...

Qt 动态中英文切换
背景: 需要界面实现动态国际化,一键点击切换中英文或其他语言。 前提: 已经完成了整个界面的翻译,拿到匹配的ts翻译文件,注意:要保证界面切换后,翻译的全覆盖,要保证任何需要反应的地方,都用到了tr("")包含,不然Linguist会捕捉不到。.ts文件的生成参考下文…...

hdfs操作
hadoop fs [generic options] [-appendToFile … ] [-cat [-ignoreCrc] …] [-checksum …] [-chgrp [-R] GROUP PATH…] [-chmod [-R] <MODE[,MODE]… | OCTALMODE> PATH…] [-chown [-R] [OWNER][:[GROUP]] PATH…] [-copyFromLocal [-f] [-p] [-l] [-d] … ] [-copyTo…...

h5分享页适配手机电脑
实现思路 通过media媒体查询结合rem继承html文字大小来实现。 快捷插件配置 这里使用了VSCode的px to rem插件。 先在插件市场搜索cssrem下载插件; 配置插件 页面编写流程及适配详情 配置meta h5常用配置信息:<meta name"viewport" content&quo…...
崭新商业理念:循环购模式的价值引领-微三云门门
尊敬的创业者们,我是微三云门门,今天我将为您详细探讨一种具有颠覆性的商业模式——循环购模式。这套私域流量裂变策略在实际应用中取得了巨大的成功,某些企业在短短6个月内迅速积累了400万用户! 循环购商业模式的核心聚焦于三个…...

二级MySQL(二)——编程语言,函数
SQL语言又称为【结构化查询语言】 请使用FLOOR(x)函数求小于或等于5.6的最大整数 请使用TRUNCATE(x,y)函数将数字1.98752895保留到小数点后4位 请使用UPPER()函数将字符串‘welcome’转化为大写…...

python爬虫12:实战4
python爬虫12:实战4 前言 python实现网络爬虫非常简单,只需要掌握一定的基础知识和一定的库使用技巧即可。本系列目标旨在梳理相关知识点,方便以后复习。 申明 本系列所涉及的代码仅用于个人研究与讨论,并不会对网站产生不好…...

系列十三、idea创建文件自动生成作者信息
File>Settings>Editor>File and Code Templates>Includes>File Header /*** Author : 一叶浮萍归大海* Date: ${DATE} ${TIME}* Description: */...

spring websocket demo
一 java依赖 gradle 配置 implementation "org.springframework.boot:spring-boot-starter-websocket" implementation "org.springframework.security:spring-security-messaging" 二 配置WebSocketConfig import org.springframework.beans.factory.a…...

C语言的发展及特点
1. C语言的发展历程 C语言作为计算机编程领域的重要里程碑,其发展历程承载着无数开发者的智慧和创新。C语言诞生于20世纪70年代初,由计算机科学家Dennis Ritchie在贝尔实验室首次推出。当时,Ritchie的目标是为Unix操作系统开发一门能够更方便…...

Flink Kubernates Native - 入门
创建 namespace [rootCentOSA flink-1.17.1]# kubectl create ns flink-native [rootCentOSA flink-1.17.1]# kubectl config set-context --current --namespaceflink-native命令空间添加资源限制 [rootCentOSA flink-1.17.1]# vim namespace-ResourceQuota.yamlapiVersion:…...

Ceph入门到精通-大流量10GB/s支持OSPF(ECMP)-LVS 集群
Keepalived-LVS 能够提高集群的高可用性并增加后端检测功能、简化配置,满足常规需求。但Keepalived-LVS集群中,同一个VIP只能由一台设备进行宣告,为一主多备的架构,不能横向拓展集群的性能,为此我们引入OSPF来解决该问…...

IDEA、git如何修改历史提交commit的邮箱
第一种情况:当前提交不是从其他分支clone过来的: step1: git log 查看提交日志,获取commit ID step2: git rebase -i [你的commitID] git rebase -i c2ef237854290051bdcdb50ffbdbb78481d254bb step3:…...

字符设备驱动(内核态用户态内存交互)
前言 内核驱动:运行在内核态的动态模块,遵循内核模块框架接口,更倾向于插件。 应用程序:运行在用户态的进程。 应用程序与内核驱动交互通过既定接口,内核态和用户态访问依然遵循内核既定接口。 环境搭建 系统&#…...

Qt基础 线程池
目录 QThreadPool类 QRunnable类 应用场景示例 QThreadPool类 主要属性: 1、activeThreadCount: 此属性表示线程池中的活动线程数,通过activeThreadCount() 调用。 2、expiryTimeout: 线程活着的时间。没有设置expiryTimeout毫秒的线程会自动退出&am…...

Django(8)-静态资源引用CSS和图片
除了服务端生成的 HTML 以外,网络应用通常需要一些额外的文件——比如图片,脚本和样式表——来帮助渲染网络页面。在 Django 中,我们把这些文件统称为“静态文件”。 我们使用static文件来存放静态资源,django会在每个 INSTALLED…...

C++ list模拟实现
list模拟实现代码: namespace djx {template<class T>struct list_node{T _data;list_node<T>* _prev;list_node<T>* _next;list_node(const T& x T()):_data(x),_prev(nullptr),_next(nullptr){}};template<class T,class Ref,class Pt…...

中国建筑出版传媒许少辉博士八一新书乡村振兴战略下传统村落文化旅游设计日京东当当畅销榜自由营九三学
中国建筑出版传媒许少辉博士八一新书乡村振兴战略下传统村落文化旅游设计日京东当当畅销榜自由营九三学...

C语言(第三十二天)
1. 递归是什么? 递归是学习C语言函数绕不开的一个话题,那什么是递归呢? 递归其实是一种解决问题的方法,在C语言中,递归就是函数自己调用自己。 写一个史上最简单的C语言递归代码: #include <stdio.h>…...

arcgis+postgresql+postgis使用介绍
关于arcgis在postgresql创建地理数据库我分享一下自己的经历: 众所周知,arcgis如果在oracle中创建地理数据库,必须要使用ArcToolbox里面的地理数据库工具去创建,在里面发现它还可以创建sql_server, postgresql数据库类型…...

机器视觉之开运算和闭运算
开运算(Opening)和闭运算(Closing)是数学形态学中常用的图像处理操作,通常用于去除图像中的噪声、连接物体、分离物体等操作。它们分别由两个基本操作组成:腐蚀(Erosion)和膨胀&…...

【python爬虫】—URL管理器的实现
python爬虫-url管理器 url管理器的作用python实现 url管理器的作用 在Python爬虫中,URL管理器(URL Manager)是一个重要的组件,用于有效管理爬取过程中所涉及的URL。它主要负责以下几个方面的任务: URL去重(…...

Oracle 19C RAC安装PSU oui-patch.xml权限错误
Oracle 19C RAC安装PSU时,节点2安装失败,经排查错误原因为oui-patch.xml文件权限错误。 Oracle官方建议oui-patch.xml文件权限,改成660或者666: chmod 660 oui-patch.xml权限修改完成后,安装psu还是失败,…...

华为数通方向HCIP-DataCom H12-821题库(单选题:161-180)
第161题 以下关于 URPF(Unicast Reverse Path Forwarding) 的描述, 正确的是哪一项 A、部署了严格模式的 URPF,也能够可以同时部署允许匹配缺省路由模式 B、如果部署松散模式的 URPF,默认情况下不需要匹配明细路由 C、如果部署松散模式的…...

ResNet详解:网络结构解读与PyTorch实现教程
目录 一、深度残差网络(Deep Residual Networks)简介深度学习与网络深度的挑战残差学习的提出为什么ResNet有效? 二、深度学习与梯度消失问题梯度消失问题定义为什么会出现梯度消失?激活函数初始化方法网络深度 如何解决梯度消失问…...

ChatGPT 随机动态可视化图表分析
动态可视化图表分析实例如下图: 这样的动态可视化图表可以使用ChatGPT OpenAI 来实现。 给ChatGPT发送指令: 你现在是一个数据分析师,请使用HTML,JS,Echarts,来完成一个动态条形图,条形图方向横向,数据可以随机生成,并且随机生成10个不同的商品名称,每个类别分别用…...

国标视频融合云平台EasyCVR视频汇聚平台的应用场景及其功能说明
一、平台简介 EasyCVR国标视频融合云平台是一款基于端-边-云一体化架构的视频融合AI智能分析网关平台。EasyCVR平台支持视频汇聚、融合管理,兼容多类型设备、多协议接入。其提供的视频功能包括:视频监控、无插件直播录像、云存储、检索回放、智能告警、…...