【MATLAB第64期】【保姆级教程】基于MATLAB的SOBOL全局敏感性分析模型运用(含无目标函数,考虑代理模型)
【MATLAB第64期】【保姆级教程】基于MATLAB的SOBOL全局敏感性分析模型运用(含无目标函数,考虑代理模型)
版本更新:
2023/8/5:
1.因BP作为代理模型不稳定,经过测试,libsvm比rf /bp 效果稳定且精度较高。故用libsvm替换原来的bp,并增加选择libsvm的原因。
2.增加用libsvm作为代理模型的sobol敏感结果对比分析及验证内容。
3.增加遍历来筛选sobol样本数量,进行结果比对。
4.单独以sobol作为一章 。 因为内容比较多,为了便于观看 ,后期会更新其他的全局敏感性分析方法。(PAWN,GSA等)
引言
在前面几期,介绍了局部敏感性分析法,本期来介绍sobol全局敏感性分析模型,因还在摸索中,其他全局敏感性模型敬请期待。
【MATLAB第31期】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理回归问题MATLAB代码实现(持续更新)
【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现
【MATLAB第63期】基于MATLAB的改进敏感性分析方法IPCC,拥挤距离与皮尔逊系数法结合实现回归与分类预测
一、SOBOL(有目标函数)
(1)评价指标
评价指标包括:一阶影响指数S,总效应指数ST**
*一阶影响指数S:*显示由各个输入变量的方差产生的因变量的方差,根据一阶影响指数可以量化单个变量对模型的敏感程度
总效应指数ST:显示由每个输入变量的方差及其与其他输入变量的相互作用而产生的因变量的方差。
每个因变量和所有变量的 Sobol 指数都显示在专用的 Sobol 图中
,其中直方图按总效应指数ST排序。因变量对具有最高总效应指数ST的输入变量最敏感。
输入变量的总效应指数ST和一阶影响指数S之间的差异可以衡量该输入与其他输入变量之间相互作用的效果。
(2)运行思路
A、设定目标函数(3个变量,即维度D=3)
Y=X1^2+2*X2+X3-1
y=x(1)^2+2*x(2)+x(3)-1;
B、设定变量上下限
VarMin=[0 0 0];%各个参数下限
VarMax=[10 10 10];%各个参数上限
C、设定sobol其他参数
M=D*2 %2倍D数量的矩阵,提高样本丰富度
%则此时相当于共6个输入变量
VarMin=[0 0 0 0 0 0];%各个参数下限
VarMax=[10 10 10 10 10 10];%各个参数上限
nPop=4;%采样数量,样本数量(数量设置越大,准确率越高。为了方便展示数值,选取nPop=4)
增加对nPop样本数量筛选功能。
对nPop采用遍历形式,即4:50:1000,50为间隔数。
其中,第四条线代表所有变量S /ST之和。
通过nPop=4结果可以看出,S /ST值相对稳定性较差。基本在nPop=200左右保持稳定。为了方便展示数值,选取nPop=4。
D、生成sobol序列样本数据
这里要说,除了sobol序列函数可以生成样本数据,其他也可以, 比如正交设计、超立方抽样等等。很关键!!!举一反三即可
1、 生成多组N*M(即N行6列)的样本矩阵p。用自带函数sobolset生成。
p= sobolset(M)
**p 矩阵形式: 9007199254740992x6 sobolset**
2、 筛选nPop*M(即4行6列)的样本矩阵R。
两种思路,第一种直接选取前nPop行的p采样数据 ,优点是方便快捷,但是缺点是样本不随机,并没有考虑上下限对样本的影响 。
% 第一种
R=p(1:nPop,:);%选取前nPop行
% 第二种
for i=1:nPop% 选取前nPop行被上下限空间处理后的样本r=p(i,:);r=VarMin+r.*(VarMax-VarMin);R=[R; r];
end
本例因为最小和最大值一样,如果最小值和最大值均为0/1,则两种方法结果一致。
第二种方法R矩阵为:
明显第二种方法更符合逻辑。
E、R样本拆分变换(提高样本丰富度)
1.将矩阵的前D列设置为矩阵A,后D列设置为B列,在我们的例子中就是矩阵m的前3列设置为矩阵A,后3列设置为矩阵B。
A=R(:,1:D);% 每行代表一组参数,其中每列代表每组参数的一个参数;行数就代表共有几组参数
B=R(:,D+1:end);
2.构造nPop*D的矩阵ABi(i = 1,2,…,D),即用矩阵B中的第i列替换矩阵A的第i列,以本体为例:
for i=1:DtempA=A;tempA(:,i)=B(:,i);AB(1:nPop,1:D,i)=tempA;
end
AB=
经过这三步我们构造了A、B、AB1、AB2、AB3这五个矩阵,这样我们就有(D + 2) * nPop (即20)组x1、x2、x3输入数据,因此我们将有20组Y值。将上述的数据带入函数 ,这里详细的计算过程就不描述了。根据输入我们得出对应的Y值矩阵。
F、计算所有样本对应的Y值
for i=1:nPopYA(i)=myfun(A(i,:)); %A矩阵对应的YA值YB(i)=myfun(B(i,:));%B矩阵对应的YB值for j=1:DYAB(i,j)=myfun(AB(i,:,j));%YAB矩阵对应的YAB值end
end
[YA YB YAB1 YAB2 YAB3 ]组合起来
依次各列数据代表YA YB YAB1 YAB2 YAB3值
G、一阶影响指数S值、总效应指数ST值计算
1.计算公式:
var方差函数为matlab自带
2.一阶影响指数S值
VarX=zeros(D,1);% S的分子
S=zeros(D,1);
VarY=var([YA;YB],1);% S的分母。 计算基于给定的样本总体的方差(EXCEL var.p())
for i=1:Dfor j=1:nPopVarX(i)=VarX(i)+YB(j)*(YAB(j,i)-YA(j));endVarX(i)=1/nPop*VarX(i);S(i)=VarX(i)/VarY; %一阶影响指数
end
3.总效应指数ST值
绘图:
H、分析
1.回到目标函数:y=x(1)^2+2*x(2)+x(3)-1;
可根据数学所学知识,得X1项为幂函数,X2项为系数=2的一次函数,X3项为系数=1的一次函数
根据常识即理论可知,敏感度排序X1>X2>X3
通过SOBOL的总效应指数ST柱状图结果也可以证实以上结论。
2.其次,一阶影响指数S中,第二个变量对应的S为负值,表示单个变量对因变量的敏感度,即所谓的局部敏感性分析法。
|X1|>|X2|>|X3|
而全局要考虑不同变量对因变量的影响,即ST定义——每个输入变量的方差及其与其他输入变量的相互作用而产生的因变量的方差。
3.输入变量的总效应指数ST和一阶影响指数S之间的差异可以衡量该输入与其他输入变量之间相互作用的效果。
二、SOBOL(无目标函数)
1.解决思路
(1)针对简单线性数据及非线性数据,用函数拟合得到公式,随后思路与上面一致。
(2)无法拟合得到公式, 即复杂非线性函数,需要通过借用机器学习模型,作为训练学习模型(黑箱子模型)
本文具体研究攻克第二种情况
有个前提(模型拟合性较好,对应数据较好)
即训练学习模型, 训练集和测试集拟合效果很棒。
如果拟合效果差,SOBOL分析结果一定存在较大误差。
2.模型选择
1、选用libsvm模型作为代理模型
原因:
(1)代理模型讲究运行效率快、精度高、模型简单 。libsvm符合以上情况,仅有的两超参数c、g经验值结果普遍较好,基本不用调参 。
(2)进行对比以bp为代表的神经网络模型,因其机理中涉及随机初始的权值阈值等参数,会让模型不够稳定。
(3)进行对比的rf随机森林模型, 训练效果远差于bp /libsvm ,且参数调整较为复杂。
(4)深度学习模型更适合大数据模型,对于平时用的小数据,传统模型不见得效果比深度模型差 ,其次深度学习运行时间、模型复杂程度,调参难度等问题明显无法与传统方法相比 。
故综合以上原因 ,选择libsvm作为代理模型。
libsvm运行插件在往期文章分享过,可直接下载。
【MATLAB第8期】#源码分享//基于MATLAB的最简易且不用安装的支持向量机LIBSVM函数及SVM分类回归模型参数设置
2.数据设置:常用的案例数据 ,103*8 ,前7列代表输入变量, 最后1列代表因变量。
3.选用模型后,几个点需要注意:
(1)数据固定,即训练样本/测试样本固定, 所代表的模型评价才够稳定。
(2)使用固定算子函数代码(神经网络代理模型是必要的) ,即开头代码为: rng default 或者rng(M)等 ,M根据实际测试效果确定。可固定输出结果,保证运行结果一致。此一致代表此刻你打开的matlab, 在不关闭情况下每次运行结果一致。跟matlab版本有关,系统版本,以及电脑有关。
(3)最为关键的一点 ,变量的上下限不能超过案例数据的上下限,为了保证模型的普适性和有效性!!!
比如案例数据的训练样本中, X1-X7的最小值为:
[137 0 0 160 4.4 708 650]
X1-X7的最大值为:
[374 193 260 240 19 1049.90 902]
那么你的sobol序列生成的数据也只能在这个范围,才能保证代理模型的有效性。
(4)生成样本的数量当然以多为好, 但不能跟案例数据样本数量差距太大,减少偶然性。
(5)代理模型效果(以libsvm为例)
训练集数据的R2为:0.99787
测试集数据的R2为:0.96186
训练集数据的MAE为:0.32795
测试集数据的MAE为:1.2748
训练集数据的MBE为:0.019637
测试集数据的MBE为:-1.1294
个人认为,训练集和测试集R2如果均大于0.9还是可以的,评价指标好坏全凭主观意思。包括评价指标的选择,不一定是R2,R2更适合这样的波动的曲线 。
(6)保存模型所需要的变量
save svmnet model ps_output ps_input
通过sobol生成样本进行仿真预测。
3.SOBOL模型分析
(1)sobol参数设置
%% 设定:给定参数个数和各个参数的范围
D=7;% 7个参数
M=D*2;%
nPop=80;% 采样点个数,跟训练样本数量大概一致
VarMin=[137 0 0 160 4.4 708 650];%各个参数下限
VarMax=[374 193 260 240 19 1049.90 902];%各个参数上限
nPop=10:50:500
nPop数量遍历结果:
nPop=10 / 60时 ,S/ST值结果不稳定,样本数=200时偏于稳定
本文便于分析,选取nPop=80。
(2)运行结果
一阶影响指数:S0.25-0.000.280.21-0.00-0.020.04总效应指数:ST0.300.010.300.330.010.050.06
敏感程度(libsbm作为代理模型):X4>X3≈X1>X7>X6>X5>X2
跟原先使用BP模型,分析结果进行对比:
敏感程度(BP作为代理模型): X3≈X1>X4>X2>X7>X6>X5
最显著区别是,关于X4变量的敏感程度的区别,其次是X6-X7变量的敏感程度的区别。
两者结果不同,需要通过控制变量法,剔除部分变量,看代理模型的训练效果是否能够印证sobol分析的结果。
4.SOBOL结果验证
验证方法有很多, 其中极差分析法是相对比较理想的方法 。当然极差分析法也可以直接取代sobol进行分析, 原理就是通过控制变量改变X1-X7参数固定比例的值 ,然后看对Y结果的影响 。 比如对于X1来说 ,每个样本的X1增加-10% -5% 5% 10% 四种情况 ,来看对Y结果的影响 。当然计算量比较大 ,不过结果是非常可观的,可以直接通过Y变化百分比来显示 ,不像sobol 的S /ST结果那么抽象 。
本文为了分析简便, 以结果为导向 ,通过筛选变量 ,对代理模型重新预测,看预测效果 。当然结果也只能验证本文选用的代理模型不错 ,但无法证明最优。
(1)第一招:主打的就是和平(求同存异 )
X1 / X3 /X4 三个变量相对都比较重要 。 用这3个变量分别测试libsvm /bp的预测效果 。**
A、libsvm结果
B、BP结果
分析可得,libsvm结果符合逻辑,比所有参数作为输入结果差, 但结果也基本满足要求,R2均在0.9左右。而BP结果不合理,测试集R2甚至为负数。
(2)第二招:是来找茬的
找到结果区别最大的X4变量作为研究对象,在筛除X4作为输入后, 看两者结果。
A、libsvm结果
B、BP结果
可以看出,在筛除X4之后, libsvm明显测试结果下来了, 不过R2=0.75还是交了个及格答卷 。而BP结果仍然比较差。
(3)第三招:兵戎相见
通过分别把各自模型中比较满意的敏感度较高的变量作为输入,看效果。
libsvm:X1 X3 X4 X6 X7
BP:X1 X2 X3 X4
A、libsvm结果
B、BP结果
以上结果有两个关键结论:
a、 libsvm筛选的这5个变量结果的确好, R2均在0.98以上。而从BP这里可以看出, 结果真不行。这里不是针对BP,而是指在场的神经网络模型。
b、根据 libsvm剔除X2、X5的测试集R2为0.98,大于X1-X7作为输入时测试的结果0.96,这里可以真正体现使用sobol的意义。对于S值和ST值均较小的变量,剔除后结果有所改善。
用libsvm作为代理模型,进行sobol分析,以上结论就是研究中较为理想的结果。
三、代码获取
包括sobol(无目标函数(libsvm代理模型)和有目标函数)
其中,代理模型的目标函数加密,不影响使用。
私信回复“64期”即可获取下载链接。
相关文章:

【MATLAB第64期】【保姆级教程】基于MATLAB的SOBOL全局敏感性分析模型运用(含无目标函数,考虑代理模型)
【MATLAB第64期】【保姆级教程】基于MATLAB的SOBOL全局敏感性分析模型运用(含无目标函数,考虑代理模型) 版本更新: 2023/8/5: 1.因BP作为代理模型不稳定,经过测试,libsvm比rf /bp 效果稳定且精…...

Python web实战之Django用户认证详解
关键词: Python Web 开发、Django、用户认证、实战案例 概要 今天来探讨一下 Django 的用户认证吧!在这篇文章中,我将为大家带来一些有关 Django 用户认证的最佳实践。 1. Django 用户认证 在开发 Web 应用程序时,用户认证是一个…...

每天五分钟机器学习:梯度下降算法和正规方程的比较
本文重点 梯度下降算法和正规方程是两种常用的机器学习算法,用于求解线性回归问题。它们各自有一些优点和缺点,下面将分别对它们进行详细的讨论。 区别 1. 梯度下降算法是一种迭代的优化算法,通过不断迭代调整参数来逼近最优解。它的基本思想是根据目标函数的梯度方向,沿…...

生信学院|08月18日《基于Flow Simulation的冷链运输产品案例》
课程主题:基于Flow Simulation的冷链运输产品案例 课程时间:2023年08月18日 14:00-14:30 主讲人:江流洋 生信科技 CAE专家 1、达索仿真方案介绍 2、项目介绍 3、案例分析 请安装腾讯会议客户端或APP,微信扫描海报中的二维码…...

不可错过的家装服务预约小程序商城开发指南
在当今社会,家装行业发展迅速,越来越多的人开始寻求专业的家装预约和咨询服务。对于不懂技术的新手来说,创建一个自己的家装预约咨询平台可能听起来很困难,但实际上通过一些第三方制作平台和工具,这个过程可以变得简单…...

任务 13、MidJourney种子激发极致创作,绘制震撼连贯画作
13.1 任务概述 通过本次实验任务,学员将深入了解Midjourney种子的概念和重要性,以及种子对生成图像的影响。他们将学会在Midjourney平台中设置种子值并调整其参数,以达到所需的效果。此外,任务还详细介绍了Midjourney V4.0版本中…...

IAR开发环境的安装、配置和新建STM32工程模板
IAR到环境配置到新建工程模板-以STM32为例 一、 简单介绍一下IAR软件1. IAR的安装(1) 下载IAR集成开发环境安装文件(2) 安装 2. 软件注册授权 二、IAR上手使用(基于STM32标准库新建工程)1、下载标准库文件2、在IAR新建工程&#x…...

FPGA优质开源项目 – PCIE通信
本文介绍一个FPGA开源项目:PCIE通信。该工程围绕Vivado软件中提供的PCIE通信IP核XDMA IP建立。Xilinx提供了XDMA的开源驱动程序,可在Windows系统或者Linux系统下使用,因此采用XDMA IP进行PCIE通信是比较简单直接的。 本文主要介绍一下XDMA I…...

NLP:长文本场景下段落分割(文本分割、Text segmentation)算法实践----一种结合自适应滑窗的文本分割序列模型
NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等 专栏详细介绍:NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型…...

商汤科技2021校招-开发大类B卷
笔试时间:2020.09.18,19:00——21:00 岗位:嵌入式软件工程师 题型:单选4道,不定项选择题2道,填空2道,编程2道。 1、单选 1、在一棵二叉树上第5层的结点数最多是:16 第1层1个 2^0 第2层2个 2^1 第3层4个 2^2 第n层 2^(n-1...

陪诊小程序开发|陪诊系统定制|数字化医疗改善就医条件
健康问题这几年成为人们关注的焦点之一,然而看病却是一个非常麻烦的过程,特别是对于那些身处陌生城市或者不熟悉就医流程的人来说。幸运的是现在有了陪诊小程序下,为您提供便捷的助医服务,使得就医过程得更加简单和轻松。 陪诊系统…...

stable diffusion(1): webui的本地部署(windows)
一、前言 是的,现在是202308月份了,网上已经有很多打包好的工具,或者直接进一个web就能用SD的功能,但是我们作为程序员,就应该去躺坑,这样做也是为了能够有更多自主操作的空间。 像其他AI一样,…...

(树) 剑指 Offer 36. 二叉搜索树与双向链表 ——【Leetcode每日一题】
❓ 剑指 Offer 36. 二叉搜索树与双向链表 难度:中等 输入一棵二叉搜索树,将该二叉搜索树转换成一个 排序的循环双向链表。要求不能创建任何新的节点,只能调整树中节点指针的指向。 为了让您更好地理解问题,以下面的二叉搜索树为…...

TypeScript初学
文章转载:https://blog.csdn.net/weixin_46185369/article/details/121512287 写的很详细,适合初学者看看。 一、TypeScript是什么? 1.TypeScript简称:TS,是JavaScript的超集。简单来说就是:JS有的TS都有…...

C/C++预定义宏
MSVC文档: https://learn.microsoft.com/en-us/cpp/preprocessor/predefined-macros?viewmsvc-170 GCC文档: https://gcc.gnu.org/onlinedocs/gcc/Function-Names.html https://gcc.gnu.org/onlinedocs/cpp/Predefined-Macros.html 参考:…...

原型链污染挖掘(存储XSS)
服务XSS响应 将JSON content-type更改为HTML 在Express应用中使用 JSON内容类型响应 并反映一个JSON: app.use(bodyParser.json({type: application/json})); app.post(/, function(req, res){_.merge({}, req.body);res.send(req.body); }); 在这些情况下&…...

Chrome开发者工具介绍
Chrome开发者工具介绍 前言1 打开DevTools2 命令菜单3 Elements面板ConsoleJavaScript调试Network 前言 Chrome开发者工具是谷歌浏览器自带的一款开发者工具,它可以给开发者带来很大的便利。常用的开发者工具面板主要包含Elements面板、Console面板、Sources面板、…...

利用MMPose进行姿态估计(训练、测试全流程)
前言 MMPose是一款基于PyTorch的姿态分析开源工具箱,是OpenMMLab项目成员之一,主要特性: 支持多种人体姿态分析相关任务:2D多人姿态估计、2D手部姿态估计、动物关键点检测等等更高的精度和更快的速度:包括“自顶向下”…...

ROS2 编译含有自定义消息项目报错:msg/detail/header__struct.h: 没有那个文件或目录
项目场景: 当迁移ROS 1 项目到 ROS 2 时,有时候会遇到消息类型的变化和更新,消息类型可能需要进行一些调整以适应新的ROS 2要求。本文将介绍如何处理自定义消息中的Header字段,以确保项目能够顺利地适应ROS 2的消息类型定义。 问…...

线段树思想拆解(下篇)
线段树思想拆解(下篇) 上篇回顾 到这里我们已经处理好了初始化以及添加方法,接下来实现范围的 query 方法 public int query(int queryL, int queryR) {return query(queryL, queryR, 1, orgLength - 1, 1);}到此为止通过借助 sum 数组&…...

Containerd容器镜像管理
1. 轻量级容器管理工具 Containerd 2. Containerd的两种安装方式 3. Containerd容器镜像管理 4. Containerd数据持久化和网络管理 1、Containerd镜像管理 1.1 Containerd容器镜像管理命令 docker使用docker images命令管理镜像单机containerd使用ctr images命令管理镜像,con…...

Baumer工业相机堡盟工业相机如何通过BGAPI SDK获取相机当前数据吞吐量(C#)
Baumer工业相机堡盟工业相机如何通过BGAPISDK里函数来获取相机当前数据吞吐量(C#) Baumer工业相机Baumer工业相机的数据吞吐量的技术背景CameraExplorer如何查看相机吞吐量信息在BGAPI SDK里通过函数获取相机接口吞吐量 Baumer工业相机通过BGAPI SDK获取…...

Ubuntu服务器版配置wifi
最近把曾经不用的上网本安装了一个Ubuntu-Server版,当成服务器来用,因为家庭网络布线问题,只好用自带的WIFI来连接网络,Server版也没有什么图形化的管理工具,之后手动编辑配置文件了。 Server下面配置起来还是很方便的…...

Windows 主机的VMware 虚拟机访问 wsl-ubuntu 的 API 服务
Windows 主机的VMware 虚拟机访问 wsl-ubuntu 的 API 服务 0. 背景1. 设置2. 删除 0. 背景 需要从Windows 主机的VMware 虚拟机访问 wsl-ubuntu 的 API 服务。 1. 设置 Windows 主机的IP:192.168.31.20 wsl-ubuntu Ubuntu-22.04 的IP:172.29.211.52 &…...

【Spring】(一)Spring设计核心思想
文章目录 一、初识 Spring1.1 什么是 Spring1.2 什么是 容器1.3 什么是 IoC 二、对 IoC 的深入理解2.1 传统程序开发方式存在的问题2.2 控制反转式程序的开发2.3 对比总结 三、对 Spring IoC 的理解四、DI 的概念4.1 什么是 DI4.2 DI 与 IoC的关系 一、初识 Spring 1.1 什么是…...

chrome插件开发实例04-智能收藏夹
目录 功能说明 演示 源码下载 源代码 manifest.json popup.html popup.js background.js 功能说明 基于chrome插件...

iOS技术之 手机系统15.0之后 的 UITableView section header多22像素问题
iOS 15 的 UITableView又新增了一个新属性:sectionHeaderTopPadding 会给每一个section header 增加一个默认高度,当我们 使用 UITableViewStylePlain 初始化 UITableView的时候,就会发现,系统给section header增高了22像素。 解…...

Windows下安装Kafka(图文记录详细步骤)
Windows下安装Kafka Kafka简介一、Kafka安装前提安装Kafka之前,需要安装JDK、Zookeeper、Scala。1.1、JDK安装(version:1.8)1.1.1、JDK官网下载1.1.2、JDK网盘下载1.1.3、JDK安装 1.2、Zookeeper安装1.2.1、Zookeeper官网下载1.2.…...

linuxARM裸机学习笔记(3)----主频和时钟配置实验
引言:本文主要学习当前linux该如何去配置时钟频率,这也是重中之重。 系统时钟来源: 32.768KHz 晶振是 I.MX6U 的 RTC 时钟源, 24MHz 晶振是 I.MX6U 内核 和其它外设的时钟源 1. 7路PLL时钟源【都是从24MHZ的晶振PLL而来…...

防勒索病毒
随着勒索软件攻击在2023年的激增,网络安全已成为当今最重要的议题之一。根据区块链分析公司Chainaanalysis的最新报告,勒索软件攻击已成为唯一呈增长趋势的基于加密货币的犯罪行为,勒索金额更是比一年前增加了近1.758亿美元,达到4…...