当前位置: 首页 > news >正文

模型 正态分布(通俗解读)

系列文章 分享 模型,了解更多👉 模型_思维模型目录。随机世界的规律,大自然里的钟形曲线。


1 正态分布的应用

1.1 质量管理之六西格玛

六西格玛是一种旨在通过识别和消除缺陷原因来提高制造过程或业务流程质量的管理策略。我们先来了解下六西格玛相关的基本概念:

  • 西格玛等级:西格玛等级是一个衡量过程能力的指标,表示缺陷率的多少。一个过程的西格玛等级越高,其缺陷率越低。
  • 缺陷:在六西格玛中,缺陷是指任何不符合规格的产品或服务。
  • 过程能力:指一个过程在没有特殊原因影响下,能够持续生产符合规格要求的产品或服务的能力。

接下来说明下正态分布与六西格玛的关系:

  • 在六西格玛中,假设大多数过程的输出是正态分布的。这意味着过程的输出变量(如产品尺寸、重量等)会围绕均值对称分布,并且大部分输出值会集中在均值附近。
  • 利用正态分布的特性,六西格玛方法可以预测和控制过程的缺陷率。例如,如果一个过程的输出是正态分布的,那么大约99.73%的产品将位于均值的±3个标准差范围内。

这里给出一个六西格玛方法的使用案例,便于深入理解该方法。假设一个制造过程生产的小部件的尺寸是关键的质量指标,该尺寸服从正态分布。通过测量和分析,我们知道部件的尺寸均值为100毫米,标准差为1毫米。

  • 过程能力分析:使用正态分布的特性,我们可以计算出在均值±3σ(简单理解为误差±3毫米)范围内的部件比例,这将帮助我们了解过程的稳定性和一致性。
  • 缺陷预防:如果我们设定规格限为98毫米到102毫米,那么任何超出这个范围的部件都被视为缺陷。通过正态分布,我们可以预测大约有多少部件会超出规格限,从而采取措施减少这些缺陷。
  • 持续改进:通过收集数据和分析过程输出的分布,六西格玛团队可以识别导致缺陷的潜在原因,并采取措施来减少变异,提高过程的西格玛等级。

六西格玛方法强调使用数据和统计工具来驱动决策,正态分布在这一过程中发挥了核心作用,帮助组织实现更高的质量标准和更低的缺陷率。

1.2 风险管理中的VaR估算(通俗解读)

你是一个小岛国的财务顾问,这个国家有一个由500个当地最大企业组成的股票市场指数,我们称之为“小岛500指数”。这个指数类似于现实世界中的S&P 500指数。作为财务顾问,你的任务是帮助岛上的居民了解他们的投资可能面临的风险。

首先,你需要向居民解释什么是VaR。你可以这样描述:“VaR就像是一个天气预报,告诉我们在大多数情况下,我们可能会遇到的最大风暴(损失)。但就像天气有时会出乎意料一样,VaR并不保证损失不会超过预报的数额。”

接下来,你开始收集过去几年“小岛500指数”的每日价格变动数据。这就像是记录每天的天气变化,以便我们可以预测未来的天气模式。我们使用正态分布估算VaR:

  1. 计算平均收益:你计算了这段时间内指数的平均每日收益,假设是0.05%。
  2. 计算标准差:接着,你计算了收益的标准差,这是衡量收益波动大小的指标,假设是1%。
  3. 确定置信水平:你告诉居民,你将使用95%的置信水平来计算VaR,这意味着在95%的交易日里,损失不会超过你计算出的数额。

于是开始使用正态分布的相关知识计算VaR,流程如下:

  1. 使用正态分布:你假设指数的收益遵循正态分布,这是一个常见的数学分布,形状像一个钟形曲线。
  2. 查找Z-分数:在95%的置信水平下,你查找到对应的Z-分数,这是正态分布表中的一个数值,用来确定损失超过多少标准差。
  3. 计算VaR:使用以下公式计算VaR: VaR=平均收益−(Z-分数×标准差)VaR=平均收益−(Z-分数×标准差) 假设Z-分数是1.65,代入数字得到: VaR=0.0005%−(1.65×0.01)=−1.645%VaR=0.0005%−(1.65×0.01)=−1.645% 这意味着在95%的交易日里,指数的每日损失不会超过1.645%。

你向岛上的居民解释说:“根据我们的计算,如果你们投资了‘小岛500指数’,那么在95%的交易日里,你们的最大损失可能不会超过1.645%。这就像我们告诉你们,95%的时间里,风暴的强度不会超过这个级别。”

居民们现在对可能面临的投资风险有了更好的理解,并且可以根据这个信息做出更明智的投资决策。当然,你也提醒他们,这只是一个估计,实际损失有时会超出这个范围,就像偶尔也会有意外的大风暴一样。

以上就是形象的解读VaR概念以及它在评估投资风险中的应用。

1.3 正态分布优化神经网络之激活函数

正态分布在人工智能(AI)领域的应用非常广泛,其中一个具体的应用案例是在神经网络中的激活函数。激活函数(形象解读激活函数:它就像神经网络中的交通信号灯,它告诉网络在何时“通行”(激活神经元)或“停止”(抑制激活)。不同类型的激活函数就像不同的信号灯模式,有的快速反应(ReLU),有的平滑过渡(Sigmoid),确保信息流在网络中高效有序地传递)是神经网络中的基本构件,用于在神经元之间引入非线性,使得网络能够学习和模拟复杂的函数映射。正态分布,特别是其变体,如高斯分布,可以作为激活函数的一种选择。

在神经网络的上下文中,正态分布可以用于模拟数据的分布,帮助网络更好地适应输入数据的统计特性。例如,如果输入数据的分布接近正态分布,使用正态分布作为激活函数可以提高网络对数据的拟合能力(就像是一位画家在画布上模仿自然风景。如果画家技艺高超,他画的画就能非常接近真实的风景,细节丰富,色彩逼真。在这里,画家的技艺相当于神经网络的学习能力,而画布上的作品则相当于网络对数据的拟合结果。提高拟合能力意味着神经网络能够更准确地捕捉和再现数据的特征,就像画家能更精确地复制自然景观一样)。此外,正态分布的数学特性,如其平滑性和可微性,使其在梯度下降等优化算法中表现良好,有助于网络的训练过程。

1.4 正态分布在生化检验中的应用

生化检验是利用生物或化学方法对各项人体指标进行检查化验,例如肝功能、血脂、血糖等。在这些检验中,很多指标如血糖、甘油三酯、血红蛋白、红细胞数、白细胞以及血小板等的频数呈现正态分布规律。

这种正态分布规律的发现对于生化检验具有重要的实际价值,因为它可以帮助医生更准确地评估检验结果,确定正常范围,并为临床诊断提供有力的数据支撑。

例如,当检验结果显示某项指标的数值高于或低于正常范围时,这可能表明人体出现了不同程度的异常。通过测定血清天冬氨酸氨基转移酶这一指标,如果生化检验结果偏高,则可能与心肌梗塞、中毒性肝炎等病症相关。

因此,正态分布在生化检验中的应用,不仅有助于医学参考值范围的制定,还能在质量控制、试验设计和结果分析等方面发挥重要作用。

1.5 正态分布在教育领域考试结果分析中的应用

某市的重点高中在一次期末考试后,对数学成绩进行了统计分析。这所高中以其高标准和严格的教学方法而闻名。学校收集了所有参加期末考试的高二学生的成绩数据,共计300名学生。对其进行数据分析,具体如下:

  1. 数据整理:学校将成绩数据录入统计软件,并计算了成绩的均值和标准差。
  2. 分布形态:通过绘制成绩的直方图,学校发现成绩分布呈现出明显的右偏态(正偏态),即大部分学生的成绩集中在高分区域,而低分区域的成绩较少。

通过正态分布的应用发现:

  1. 偏态分布特征:分析结果显示,成绩的均值为92分,标准差为8分,但成绩的分布并不是对称的,而是向右偏斜,表明高分学生较多。
  2. 成绩区间预测:尽管成绩分布不是正态分布,学校仍使用正态分布理论来估计不同成绩区间的学生比例,发现超过70%的学生成绩高于84分(均值加一个标准差)。
  3. 教学效果评估:由于成绩分布的偏态,学校意识到可能存在“天花板效应”,即考试难度不足以区分高水平学生之间的差异。
  4. 考试难度调整:学校发现考试内容可能过于简单,导致大部分学生都能轻易获得高分,这可能掩盖了学生之间真实的能力差异。

呈现的结果与影响:

  • 考试内容调整:学校决定在未来的考试中增加难度,以更好地区分学生的不同能力水平。
  • 教学方法改进:学校意识到需要调整教学方法,以确保所有学生都能在更高难度的考试中表现出色。
  • 学生能力识别:学校利用偏态分布的分析结果来识别那些在高难度问题上表现出色的学生,并为他们提供更高级的课程和挑战。

这次期末考试的成绩分析揭示了考试内容和教学方法可能需要改进的地方。虽然成绩的偏态分布不是理想的正态分布,但它为学校提供了宝贵的信息,帮助学校更好地理解学生的表现,并据此做出相应的教学和考试调整。

2 模型 正态分布

2.1 什么是正态分布?

正态分布,也称为高斯分布(Gaussian distribution),是一种在统计学中非常重要的连续概率分布。它具有以下特征:

  1. 对称性:正态分布是对称的,其均值(mean)、中位数(median)和众数(mode)相同。
  2. 钟形曲线:正态分布的图形呈现为一个钟形曲线,两侧逐渐向X轴下降。
  3. 均值和标准差:正态分布完全由其均值(μ)和标准差(σ)确定。均值是分布的中心位置,标准差描述了数据的分散程度。
  4. 68-95-99.7规则:在正态分布中,大约68%的数据位于均值±1个标准差的范围内,95%的数据位于均值±2个标准差的范围内,99.7%的数据位于均值±3个标准差的范围内。

正态分布的数学表达式为:

正态分布最早由德国数学家和天文学家莫里茨·卡尔·弗里德里希·本茨(Moritz Carl Friedrich Benz)在1810年或1811年提出,但并未得到广泛认可。后来,德国数学家和天文学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)在1812年左右独立发现了这一分布,并将其应用于天文学中最小二乘法的误差分析。由于高斯在科学界的巨大影响力,这一分布最终以他的名字命名为高斯分布。

正态分布在19世纪由比利时数学家昆特莱特(Adolphe Quetelet)进一步推广到社会和自然科学领域。昆特莱特发现,许多自然和社会科学现象的测量结果都呈现出正态分布的特性。

正态分布在统计学和概率论中的重要性,使得它成为许多统计方法的基础,如假设检验、回归分析、抽样分布等。

2.2 为什么会有正态分布?

正态分布在自然界和社会现象中的普遍性可以通过多种理论来解释。以下是一些可能的原因,这些原因导致了正态分布的普遍性:

  • 中心极限定理:这是正态分布普遍性的最主要原因之一。根据中心极限定理,如果多个相互独立的随机变量之和(无论这些变量本身遵循什么分布)的样本量足够大,它们的分布将趋近于正态分布。这意味着即使原始数据不遵循正态分布,它们的平均值或总和往往也会呈现出正态分布的特性。
  • 测量误差:在许多情况下,观测到的变量可能受到多种小的、随机的测量误差的影响。这些小误差的叠加往往会导致正态分布。
  • 自然选择和进化:在生物学中,自然选择可能导致某些特征(如身高、体重)在种群中呈现出正态分布,因为极端值可能不利于生存和繁殖。
  • 经济和社会因素:在经济和社会现象中,多种因素的相互作用可能导致结果的分布趋于正态。例如,收入水平可能受到教育、工作经验、地理位置等多种因素的影响,这些因素的综合作用可能导致收入分布接近正态。
  • 大数定律:大数定律指出,当样本量足够大时,样本均值的分布将趋近于总体均值的分布。如果总体分布本身是正态的,那么样本均值的分布也将是正态的。
  • 物理过程:在物理学中,许多自然过程(如分子的热运动)可以产生正态分布的结果。例如,气体分子的速度分布遵循麦克斯韦-波尔兹曼分布,这是一种正态分布的特例。
  • 心理学因素:在心理学中,人们的感知和判断往往受到多种因素的影响,这些因素的综合作用可能导致某些心理测量结果呈现出正态分布。
  • 统计假设:在统计学中,正态分布经常被用作分析的假设前提,因为许多统计方法(如线性回归、ANOVA等)在正态分布的假设下具有最佳性能。
  • 数据生成过程:在某些情况下,数据生成过程本身可能就会产生正态分布的结果。例如,某些化学反应的速率可能遵循正态分布。
  • 抽样分布:在抽样调查中,如果样本是从正态分布的总体中抽取的,那么样本均值的分布也将是正态的,即使样本量不大。

这些原因中的一些是统计学和概率论的理论结果,而另一些则是对自然界和社会现象的观察和解释。正态分布的普遍性是这些因素共同作用的结果。

3 模型简图


​​​​​​​

相关文章:

模型 正态分布(通俗解读)

系列文章 分享 模型,了解更多👉 模型_思维模型目录。随机世界的规律,大自然里的钟形曲线。 1 正态分布的应用 1.1 质量管理之六西格玛 六西格玛是一种旨在通过识别和消除缺陷原因来提高制造过程或业务流程质量的管理策略。我们先来了解下六…...

安装了Vue-pdf后,打包文件多出了worker.js和worker.js.gz

解决方式: 修改node_modules/worker-loader/dist/index文件 将 const filename _loaderUtils2.default.interpolateName(this, options.name || 中的 js/[hash].worker.js,更改为 static/js/[hash].worker.js...

使用excel生成国际化多语言js文件的脚本

1、创建一个空文件夹 2、终端 cnpm install xlsx3、在文件夹创建一个index.js // 导入 Node.js 内置的 fs 模块 const fs = require(fs); // 导入 xlsx 模块,用于处理 Excel 文件 const XLSX = require(xlsx);// 读取 Excel 文件 function readExcelFile(filePath) {const …...

【蝉联】摩斯再次获得“中国隐私计算市场份额第一”

蝉联第一 8月2日,全球领先的IT市场研究和咨询公司IDC发布了《中国隐私计算平台厂商市场份额,2023》报告。蚂蚁集团凭借商用隐私计算平台摩斯(MORSE),以 35.3%的市场份额蝉联第一。 2023年,中国隐私计算平台…...

安装 qcloud-python-sts 失败 提示 gbk codecs decode byte 应该如何解决

安装 qcloud-python-sts 失败 提示 gbk codecs decode byte 应该如何解决 解决方案: 将windows 修改为utf-8编码格式 解决步骤如下: 1. 进入控制台 2. 点击区域 4. 点击管理 4.勾选UTF-8 5.重启系统即可...

mv:自动对焦代码

try:# The camera will now focus on whatever is in front of it.sensor.ioctl(sensor.IOCTL_TRIGGER_AUTO_FOCUS) except:raise (Exception("Auto focus is not supported by your sensor/board combination."))...

【C++】数组案例 五只小猪称体重

题目:给出物质小猪体重,找出最大的体重的值并打印 思路:利用菽粟写入五只小猪的体重,让每一个元素都赋值给一个整型变量并每赋值一次就于下一个数组中的元素比,若是大就继续赋值给这个变量,若是小则不赋值…...

Bug 解决 | 后端项目无法正常启动,或依赖服务连接失败

目录 1、版本问题 2、依赖项问题 明明拷贝的代码,为什么别人行,我启动就报错? 这篇文章我就理一下最最常见的项目启动报错的两种原因! 1、版本问题 比如明明项目的 Java 版本是 8,你非得拿 5 跑?那不是…...

Linux: network: mlx5_core crash;dos

https://bugzilla.redhat.com/show_bug.cgi?idCVE-2024-41090 https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux.git/commit/?id8be915fc5ff9a5e296f6538be12ea75a1a93bdea https://www.openwall.com/lists/oss-security/2024/07/24/4 是tap的驱动向下传递的包…...

用手机剪辑视频素材从哪里找?用手机视频素材库分享

视频编辑是一门充满创意的艺术,无论是制作短片、广告还是个人Vlog,都离不开高质量的视频素材。如果自己拍摄的素材不能完全满足创作需求,或者需要更多样化的内容来丰富视频,那么优质的视频素材来源至关重要。下面推荐几个提供高品…...

DataStream API使用Sink及自定义Sink

目录 Data Sinks 案例 自定义Sink Human实体类 自定义RichSinkFunction MySQL Sink使用 测试 Data Sinks 数据接收器(Data sinks)消费数据流并将它们转发到文件、套接字、外部系统或打印它们。Flink带有各种内置输出格式,这些格式被封装在数据流的算子后面: …...

C++标准模板(STL)- 类型支持 (类型属性,检查类型是否拥有强结构相等性,std::has_strong_structural_equality)

类型特性 类型特性定义一个编译时基于模板的结构&#xff0c;以查询或修改类型的属性。 试图特化定义于 <type_traits> 头文件的模板导致未定义行为&#xff0c;除了 std::common_type 可依照其所描述特化。 定义于<type_traits>头文件的模板可以用不完整类型实例…...

《中国数据库前世今生》观影——2000年代/数据库分型及国产数据库开端

引出 《中国数据库前世今生》观影——2000年代/数据库分型及国产数据库开端 第3集&#xff1a;2000年代/数据库分型及国产数据库开端 y2k问题 千年虫&#xff0c;又叫做“计算机2000年问题”“电脑千禧年千年虫问题”或“千年危机”。缩写为“Y2K]”。是指在某些使用了计算机…...

图的同态Graph Homomorphism与同构Graph Isomorphism

图的同态Graph Homomorphism 图的同态&#xff08;Graph Homomorphism&#xff09;是图论中的一个重要概念&#xff0c;用于描述图之间的一种映射关系。图的同态描述了一个图如何通过映射保留其边的结构。 ### 图的同态定义 设有两个图 \( G (V_G, E_G) \) 和 \( H (V_H, …...

使用 Python 对雷达卫星 sar 图像进行降噪的三种方法

合成孔径雷达 (SAR) 图像广泛应用于各种领域(航空航天、军事、气象等)。问题是这种图像在其原始格式中受到噪点的影响。虽然这些图像通常也是沉重的文件,但从科学的角度来看,有效地对其进行去噪的任务似乎既具有挑战性,又在现实世界中非常有用。 卫星图像有两大类: 光学…...

C# Unity 面向对象补全计划 之 初识继承方法与多态

本文仅作学习笔记与交流&#xff0c;不作任何商业用途&#xff0c;作者能力有限&#xff0c;如有不足还请斧正 本系列旨在通过补全学习之后&#xff0c;给出任意类图都能实现并做到逻辑上严丝合缝 1.继承方法 C# & Unity 面向对象补全计划 之 继承&#xff08;字段与属性&…...

突破PyCharm索引瓶颈:提升文件索引速度的策略

突破PyCharm索引瓶颈&#xff1a;提升文件索引速度的策略 PyCharm作为Python开发者的首选IDE&#xff0c;以其强大的功能和灵活的配置而广受好评。然而&#xff0c;当处理大型项目或复杂文件结构时&#xff0c;文件索引慢的问题可能会显著降低开发效率。本文将提供一系列优化技…...

体素相关的快速计算

“体素”通常是指在三维空间中具有固定尺寸和位置的小立方体单元。 体素的优点包括&#xff1a; 易于处理和计算&#xff1a;在计算机图形学和三维建模中&#xff0c;体素的结构相对简单&#xff0c;计算和操作较为方便。能精确表示物体的内部结构&#xff1a;对于一些需要了…...

Python 爬虫项目实战(二):爬取微博热搜榜

前言 网络爬虫&#xff08;Web Crawler&#xff09;&#xff0c;也称为网页蜘蛛&#xff08;Web Spider&#xff09;或网页机器人&#xff08;Web Bot&#xff09;&#xff0c;是一种按照既定规则自动浏览网络并提取信息的程序。爬虫的主要用途包括数据采集、网络索引、内容抓…...

文件解析漏洞复现

一、IIS 6.X 1.在网站目录创建文件夹名为xxx.asp/xxx.asa 文件夹&#xff0c;里面的任意文件都会被当作asp文件执行 创建1.asp 访问 2.ooo.asp.jpg会被当做asp文件执行 创建一个ooo.asp;.jpg 访问 二、IIS 7.X 上传1.jpg文件在网址后/.php可以成功执行 写一个1.jpg文件内容…...

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

MPNet:旋转机械轻量化故障诊断模型详解python代码复现

目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留&#xff0c;CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制&#xff08;CCA-Attention&#xff09;&#xff0c;…...

CMake基础:构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

Frozen-Flask :将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是&#xff1a;将一个 Flask Web 应用生成成纯静态 HTML 文件&#xff0c;从而可以部署到静态网站托管服务上&#xff0c;如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)

可以使用Sqliteviz这个网站免费编写sql语句&#xff0c;它能够让用户直接在浏览器内练习SQL的语法&#xff0c;不需要安装任何软件。 链接如下&#xff1a; sqliteviz 注意&#xff1a; 在转写SQL语法时&#xff0c;关键字之间有一个特定的顺序&#xff0c;这个顺序会影响到…...

Linux云原生安全:零信任架构与机密计算

Linux云原生安全&#xff1a;零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言&#xff1a;云原生安全的范式革命 随着云原生技术的普及&#xff0c;安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测&#xff0c;到2025年&#xff0c;零信任架构将成为超…...

网络编程(UDP编程)

思维导图 UDP基础编程&#xff08;单播&#xff09; 1.流程图 服务器&#xff1a;短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...