当前位置: 首页 > article >正文

从概念到应用:一文读懂概率密度函数与累积分布函数的联系与区别

1. 随机变量理解概率分布的基础概率密度函数PDF和累积分布函数CDF是统计学中描述随机变量分布的两个核心工具。要真正理解它们我们得从随机变量这个基础概念说起。随机变量就像是一个数学魔术师能把随机现象的结果转化为数值。举个例子抛硬币时正面可以记为1反面记为0测量某人身高可以得到172.3cm这样的数值。随机变量主要分为两类离散型和连续型。离散型就像数楼梯台阶每一步都是明确的、可数的。比如掷骰子出现的点数只能是1到6的整数不可能出现2.5点。而连续型则像滑滑梯可以停在任意位置。比如人的身高理论上可以是170cm、170.01cm甚至170.0001cm有无限多种可能。这里有个实用的小技巧如果你能数出可能结果的数量比如骰子点数有6种那就是离散型如果能测量出无限精细的结果比如用越来越精确的尺子量身高那就是连续型。这个区别对理解PDF和CDF至关重要因为它们在两种随机变量上的表现有显著差异。2. 概率密度函数PDF捕捉概率的密度2.1 离散型随机变量的PDF对于离散型随机变量PDF直接告诉我们某个具体值出现的概率。以掷骰子为例用X表示出现的点数其PDF可以表示为 P(X1)1/6 P(X2)1/6 ... P(X6)1/6 其他所有值概率都是0。这就像给每个可能的点数分配了明确的概率重量。离散型PDF有三个关键特点每个可能值的概率都在0到1之间所有可能值的概率之和等于1计算特定事件的概率时只需把相关结果的概率相加比如计算点数小于3的概率就是P(X1)P(X2)1/61/61/3。2.2 连续型随机变量的PDF连续型随机变量的PDF则大不相同。因为可能值无限多任何单个精确值的概率实际上都是0。比如测量一个人的身高恰好是170.000...cm无限精确的概率为0。这时PDF不再直接表示概率而是表示概率密度。想象PDF就像一条曲线曲线在某点的高度不代表概率但曲线下方面积代表概率。比如身高在169cm到171cm之间的概率就是PDF曲线在这两点之间的面积。连续型PDF的特点曲线在任何点的值可以大于1因为不是概率本身整个曲线下方的总面积等于1计算概率需要求积分比如P(aXb)∫[a到b]PDF(x)dx3. 累积分布函数CDF概率的累积视角3.1 CDF的基本概念CDF给出了随机变量X小于等于某个值x的概率记作F(x)P(X≤x)。对于掷骰子的例子 F(1)1/6点数≤1的概率 F(2)2/6点数≤1或2的概率 ... F(6)1点数≤6的必然事件CDF有几个重要特性单调不减x增加时F(x)不会减小右连续在跳跃点处保持右极限当x趋近于-∞时F(x)趋近于0x趋近于∞时F(x)趋近于13.2 连续型随机变量的CDF对于连续型变量CDF是PDF的积分。以标准正态分布为例计算P(X≤1.96)可以用统计软件from scipy.stats import norm print(norm.cdf(1.96)) # 输出约0.975这表示标准正态变量有97.5%的概率取值不超过1.96。CDF在实际应用中非常有用。比如质量控制中想知道产品尺寸小于某个阈值的比例金融风险管理中计算损失不超过一定金额的概率等。4. PDF与CDF的深层联系4.1 微积分关系PDF和CDF通过微积分紧密相连。对于连续型随机变量CDF是PDF的积分F(x)∫[-∞到x]f(t)dtPDF是CDF的导数f(x)dF(x)/dx这就像速度PDF和位移CDF的关系位移是速度对时间的积分速度是位移的导数。以正态分布为例它的PDF是钟形曲线import numpy as np import matplotlib.pyplot as plt x np.linspace(-4, 4, 1000) pdf norm.pdf(x) cdf norm.cdf(x) plt.figure(figsize(12,5)) plt.subplot(121) plt.plot(x, pdf) plt.title(正态分布PDF) plt.subplot(122) plt.plot(x, cdf) plt.title(正态分布CDF) plt.show()4.2 离散型情况的对应关系对于离散型变量虽然不能直接用导数但有类似关系CDF是PDF的累加和F(x)∑[t≤x]P(Xt)PDF是CDF的差分P(Xx)F(x)-F(x-)比如骰子的CDF在x2处是2/6x1处是1/6所以P(X2)2/6-1/61/6。5. 实际应用中的选择指南5.1 何时使用PDFPDF在以下场景特别有用需要了解概率密度分布形状时如判断偏态机器学习中构建生成模型如GANs假设检验中计算似然比需要可视化概率分布特征时例如在异常检测中我们可能设置一个阈值当数据点的PDF值低于该阈值时视为异常。5.2 何时使用CDFCDF在以下情况更适用计算随机变量落在某个区间的概率统计推断中的p值计算可靠性工程中的故障概率分析金融风险管理中的VaR计算比如在A/B测试中我们可能关心新版本指标比旧版本好的概率这可以直接通过CDF计算。5.3 实用建议数据探索阶段先看CDF它能快速展示数据分布的全貌模型构建阶段根据模型类型选择生成模型多用PDF判别模型可能用CDF结果解释阶段CDF通常更直观特别是对非技术人员编程实现时大多数统计库都提供PDF/CDF的计算函数如Python的scipy.stats模块在实际数据分析项目中我经常同时使用两者。比如先用CDF快速了解数据分布范围再用PDF分析具体的密度特征。曾经在一个用户行为分析项目中通过CDF发现90%的用户停留时间在5分钟内然后聚焦分析这部分的PDF特征找到了产品改进的关键点。

相关文章:

从概念到应用:一文读懂概率密度函数与累积分布函数的联系与区别

1. 随机变量:理解概率分布的基础 概率密度函数(PDF)和累积分布函数(CDF)是统计学中描述随机变量分布的两个核心工具。要真正理解它们,我们得从随机变量这个基础概念说起。随机变量就像是一个数学魔术师&am…...

如何快速配置游戏自动化助手:面向新手的完整指南

如何快速配置游戏自动化助手:面向新手的完整指南 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gitcode.…...

蓝桥杯备赛指南:从零构建算法知识体系

1. 蓝桥杯竞赛与算法知识体系概述 参加蓝桥杯竞赛就像玩一款策略游戏,你需要先收集基础装备(语法和API),然后学习各种战斗技巧(算法和数据结构),最后才能挑战大Boss(竞赛题目&#…...

Ubuntu一键部署Docker与可视化面板Portainer实战

1. 为什么选择Docker与Portainer? 如果你是一名开发者或者运维人员,肯定对Docker不陌生。简单来说,Docker就像是一个魔法箱子,可以把你的应用和它需要的所有东西打包在一起,这样在任何地方运行都不会出问题。而Portain…...

如何快速配置英雄联盟助手:ChampR的完整使用指南

如何快速配置英雄联盟助手:ChampR的完整使用指南 【免费下载链接】champr 🐶 Yet another League of Legends helper 项目地址: https://gitcode.com/gh_mirrors/ch/champr 你是否曾经在英雄联盟游戏中因为出装选择而犹豫不决?&#x…...

给AMD APU装Debian驱动,除了firmware-linux,你还需要注意这个Secure Display报错

给AMD APU装Debian驱动:从Secure Display报错到完美图形加速 在Debian系统上为AMD APU(加速处理单元)配置显卡驱动时,许多用户会遇到一个令人困惑的报错——"Secure Display: Generic Failure"。这个看似简单的提示背后…...

QSpectrumAnalyzer终极指南:3步掌握多平台SDR频谱分析

QSpectrumAnalyzer终极指南:3步掌握多平台SDR频谱分析 【免费下载链接】qspectrumanalyzer Spectrum analyzer for multiple SDR platforms (PyQtGraph based GUI for soapy_power, hackrf_sweep, rtl_power, rx_power and other backends) 项目地址: https://git…...

手把手教你如何在企业网络中部署SyncE(含芯片选型指南)

手把手教你如何在企业网络中部署SyncE(含芯片选型指南) 在数字化转型浪潮中,企业网络对时钟同步精度的要求正从毫秒级向微秒级跃迁。SyncE(同步以太网)技术凭借其媲美传统SDH的同步性能,正在5G前传、金融交…...

西门子1200 PLC罐装线项目:博图编程实践与精彩解析

西门子1200plc罐装线项目,程序包括modbus通讯,模拟量输入输出,西门子程序画面精彩,程序编辑分类清晰,非常具有参考学习意义,支持博图V13及以上版本打开在自动化控制领域,西门子1200 PLC以其强大…...

Windows上安装APK的终极解决方案:APK Installer完整指南

Windows上安装APK的终极解决方案:APK Installer完整指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 还在为Windows电脑无法直接安装安卓应用而烦恼吗&a…...

Android SVG 实战:从零构建交互式中国地图组件

1. SVG基础与Android开发准备 SVG(Scalable Vector Graphics)作为矢量图形标准,在Android开发中具有独特优势。与传统的位图格式不同,SVG通过XML描述图形,这意味着无论放大多少倍都不会出现像素化。在Android项目中&a…...

从SGD到Adam:深度学习优化器演进之路与实战选型指南

1. 优化器:深度学习的隐形引擎 第一次训练神经网络时,我盯着损失曲线像过山车一样上蹿下跳,差点以为代码写错了。后来才发现,问题出在那个不起眼的优化器参数上。优化器就像深度学习模型的导航系统,它决定了模型参数如…...

别光看菜单了!HFSS 2023 R2工作界面保姆级拆解:从建模到仿真的高效操作流

HFSS 2023 R2界面深度优化指南:从功能认知到效率革命 第一次打开HFSS 2023 R2时,那个充满各种窗口和工具栏的界面可能会让你感到些许压迫感。但别担心,这就像飞行员第一次坐进战斗机驾驶舱——看似复杂的仪表盘背后,其实隐藏着精…...

告别复杂配置!在Ubuntu 20.04/22.04上快速部署Astra Pro摄像头(含PCL点云实时显示)

在Ubuntu 20.04/22.04上极简部署Astra Pro深度相机的完整指南 深度相机在机器人、三维重建和计算机视觉领域扮演着越来越重要的角色。Astra Pro作为一款性价比极高的深度感知设备,其部署过程却常常让开发者头疼。本文将彻底改变这一现状——通过自动化脚本和现代包管…...

从踩坑到精通:Element el-date-picker 与后端 API 联调的那些‘坑’和最佳实践

从踩坑到精通:Element el-date-picker 与后端 API 联调实战指南 在前后端分离的开发模式中,日期选择器作为高频交互组件,其与后端的数据对接往往成为初级开发者的"隐形杀手"。Element UI 的 el-date-picker 组件虽然功能强大&#…...

别再只调参了!用进化算法给DDPG当“外挂”,解决强化学习探索难题(附PyTorch代码)

进化算法与DDPG的协同进化:突破强化学习探索瓶颈的工程实践 在机器人控制、游戏AI等需要连续动作决策的场景中,深度确定性策略梯度算法(DDPG)因其出色的表现而广受欢迎。然而,许多工程师在实际项目中都会遇到这样的困…...

量化分析第一步:手把手教你用Pandas清洗网易金融下载的股票CSV数据

量化分析第一步:手把手教你用Pandas清洗网易金融下载的股票CSV数据 刚拿到网易金融导出的股票CSV数据时,很多人会直接扔进分析工具——直到发现中文列名报错、日期格式混乱、停牌日数据缺失等问题才手忙脚乱。作为量化分析的真正起点,数据清洗…...

用Vue3 + CSS动画复刻扭蛋抽奖效果:从产品原型到流畅交互的完整实现

Vue3 CSS动画打造高沉浸感扭蛋抽奖:工程化实现与性能优化实战 扭蛋机抽奖效果在营销活动中总能吸引用户眼球——那些跳跃的彩球、戏剧性的下落过程、充满惊喜的开启瞬间,构成了完美的用户体验闭环。作为前端开发者,我们不仅要还原视觉效果&a…...

IDEA调试必备:VM options和Program arguments的10个高级用法(含Spring/MyBatis实战)

IDEA调试进阶:VM Options与Program Arguments的10个企业级实战技巧 在Java开发领域,IDEA作为主流IDE,其调试功能的高阶使用往往能显著提升开发效率。特别是VM Options和Program Arguments这两个看似基础的配置项,实则蕴含着许多未…...

【SketchUp 2024】从模糊到清晰:二维图像交互全流程优化与三维模型导入/导出实战解析

1. SketchUp 2024图像处理全流程优化 每次打开SketchUp准备大展拳脚时,最让人头疼的就是导入的参考图总是糊成一片。这个问题在2024版其实有更智能的解决方案。在系统设置里找到OpenGL选项时,会发现新增了"智能纹理优化"选项,这个功…...

【IMX6ULL驱动开发实战】03.打通开发环境:从零配置IMX6ULL与虚拟机的静态IP网络

1. 为什么需要配置静态IP网络环境 刚接触IMX6ULL开发板的朋友经常会遇到一个头疼的问题:为什么我在虚拟机里编译好的程序,死活传不到开发板上?这就像你写了一封信,却找不到收件人的具体地址一样让人抓狂。其实核心原因就在于网络…...

如何用MTB Nodes轻松制作专业级ComfyUI动画:免费开源终极指南

如何用MTB Nodes轻松制作专业级ComfyUI动画:免费开源终极指南 【免费下载链接】comfy_mtb Animation oriented nodes pack for ComfyUI 项目地址: https://gitcode.com/gh_mirrors/co/comfy_mtb 想用ComfyUI创作惊艳动画却不知从何开始?MTB Nodes…...

STM32 HAL库驱动NRF24L01老是失败?这份避坑指南帮你搞定SPI配置、电源和天线

STM32 HAL库驱动NRF24L01实战避坑指南 调试NRF24L01模块时,明明硬件连接正确,代码也照着示例写了,可就是无法正常通信——这种抓狂的经历相信不少开发者都遇到过。作为一款经典的2.4GHz无线模块,NRF24L01以其低成本和高性能在物联…...

深度学习模型解释:SHAP与LIME

深度学习模型解释:SHAP与LIME 引言 深度学习模型在各个领域取得了显著的成功,但它们往往被视为"黑盒",难以理解其决策过程。模型解释性已成为深度学习应用中的关键挑战,尤其是在医疗、金融等对决策可解释性要求较高的领…...

2023最新GPS星历下载指南:从广播星历到精密星历(附RINEX/SP3文件解析)

2023最新GPS星历数据获取与实战应用全解析 在卫星导航定位领域,GPS星历数据的质量直接影响着定位精度。无论是测绘工程中的厘米级作业,还是自动驾驶车辆的高精度导航,都离不开准确的星历数据支撑。2023年,随着全球导航卫星系统&am…...

国民技术 N32G457VEL7 LQFP-100 单片机

关键特性 内核CPU一32位ARM Cortex-M4内核FPU,单周期硬件乘除法指令,支持DSP指令和MPU 内置8KB指令缓存,支持Flash加速单元执行程序0等待最高主频144MHz,180DMIPS 加密存储器 硬件ECC校验,10万次擦写次数,10年数据保持…...

国民技术 N32G451RCL7 LQFP-64 单片机

关键特性 内核CPU 32位ARM Cortex-M4内核FPU,单周期硬件乘除法指令,支持 DSP指令和 MPU 内置8KB指令Cache缓存,支持Flash加速单元执行程序0等待 最高主频144MHz,180DMIPS 加密存储器 高达512KByte片内Flash,支持加密存…...

别再乱用本地布线了!7系列FPGA时钟设计避坑指南:BUFG、BUFH、BUFR到底怎么选?

7系列FPGA时钟架构深度解析:BUFG、BUFH与BUFR的黄金选择法则 当你在Vivado中看到时序报告里那些令人头疼的红色警告时,是否曾怀疑过自己的时钟方案出了问题?7系列FPGA的时钟架构就像一座精密的钟表,每个齿轮(时钟缓冲…...

EXPKEYSIG签名失效:Open Robotics密钥更新与APT源安全修复实战

1. 当APT更新报错时发生了什么? 那天我正在给一台Ubuntu 18.04的机器人开发机做例行更新,突然在终端里看到一串刺眼的红色错误提示:"下列签名无效:EXPKEYSIG F42ED6FBAB17C654"。作为一个常年和Linux打交道的开发者&am…...

终极指南:如何用Bioicons免费矢量图标库快速制作专业科研图表

终极指南:如何用Bioicons免费矢量图标库快速制作专业科研图表 【免费下载链接】bioicons A library of free open source icons for science illustrations in biology and chemistry 项目地址: https://gitcode.com/gh_mirrors/bi/bioicons Bioicons是一个免…...