当前位置: 首页 > news >正文

机器学习数学基础:25.随机变量分布详解

一、随机变量与分布函数的基本概念

(一)什么是随机变量?

在概率论领域,随机变量是将随机试验的结果进行数值化的关键概念。它就像一座桥梁,把抽象的随机事件和具体的数学分析连接起来。

举例来说,在一个抽奖活动中,奖箱里有 5 张奖券,其中 2 张是一等奖,3 张是二等奖。我们定义随机变量 X X X来表示抽奖的结果:当抽到一等奖时,令 X = 2 X \ = 2 X =2;抽到二等奖时,令 X = 1 X \ = 1 X =1。这样,原本模糊的抽奖结果就被转化为具体的数值,方便我们用数学方法进行研究。从这个例子可以看出,随机变量的取值是由随机事件的结果决定的,并且每个取值都对应着一定的概率。在上述抽奖例子中, P ( X = 2 ) = 2 5 P(X \ = 2)\ =\frac{2}{5} P(X =2) =52 P ( X = 1 ) = 3 5 P(X \ = 1)\ =\frac{3}{5} P(X =1) =53

(二)分布函数(CDF)的定义与性质

分布函数 F ( x ) F(x) F(x)是描述随机变量概率分布的重要工具,它表示随机变量 X X X取值小于等于 x x x的概率,用数学表达式写为 F ( x ) = P ( X ≤ x ) F(x)\ =P(X\leq x) F(x) =P(Xx)

它具有以下四个重要性质:

  1. 单调不减性:对于任意两个实数 x 1 x_1 x1 x 2 x_2 x2,若 x 1 < x 2 x_1 < x_2 x1<x2,那么 F ( x 1 ) ≤ F ( x 2 ) F(x_1)\leq F(x_2) F(x1)F(x2)。这一性质很好理解,因为 F ( x ) F(x) F(x)是累积概率,随着 x x x的增大,包含的随机事件结果只会增多或者不变,所以对应的概率不会减小。例如,在一个连续型随机变量的分布中,假设 x 1 = 1 x_1 \ = 1 x1 =1 x 2 = 2 x_2 \ = 2 x2 =2,如果 X X X在区间 ( 1 , 2 ] (1, 2] (1,2]内有一定的取值概率,那么 F ( 2 ) F(2) F(2)必然大于等于 F ( 1 ) F(1) F(1)
  2. 极限值性质:当 x x x趋向于负无穷( x → − ∞ x\to -\infty x)时, F ( x ) F(x) F(x)的极限值为 0,即 lim ⁡ x → − ∞ F ( x ) = 0 \lim_{x\to -\infty}F(x)\ =0 limxF(x) =0。这意味着随机变量 X X X取到一个极其小的值的概率几乎为 0。例如,在描述某地区成年人身高的随机变量分布中,身高小于一个极小值(比如 -1 米,这在现实中几乎不可能)的概率就是 0。当 x x x趋向于正无穷( x → + ∞ x\to +\infty x+)时, F ( x ) F(x) F(x)的极限值为 1,即 lim ⁡ x → + ∞ F ( x ) = 1 \lim_{x\to +\infty}F(x)\ =1 limx+F(x) =1,这表示随机变量 X X X取值小于等于一个极大值的概率是 100%。比如,在上述身高的例子中,身高小于一个极大值(比如 3 米,虽然现实中几乎不会达到,但从理论上涵盖了所有可能的身高)的概率就是 1。
  3. 右连续性:对于任意实数 x 0 x_0 x0,函数 F ( x ) F(x) F(x) x 0 x_0 x0处右连续,即 lim ⁡ x → x 0 + F ( x ) = F ( x 0 ) \lim_{x\to x_0^ + }F(x)\ =F(x_0) limxx0+F(x) =F(x0)。直观地说,当我们从 x 0 x_0 x0的右侧无限趋近于 x 0 x_0 x0时, F ( x ) F(x) F(x)的极限值等于 F ( x 0 ) F(x_0) F(x0)。例如,对于一个离散型随机变量 X X X,其分布函数在每个跳跃点处都满足右连续。假设 X X X的取值为 1,2,3,对应的概率分别为 0.2 0.2 0.2 0.3 0.3 0.3 0.5 0.5 0.5,其分布函数 F ( x ) F(x) F(x) x = 1 x \ = 1 x =1处,从右侧趋近于 1 时的极限值等于 F ( 1 ) F(1) F(1)
  4. 有界性 0 ≤ F ( x ) ≤ 1 0\leq F(x)\leq 1 0F(x)1,这是因为 F ( x ) F(x) F(x)表示概率,而概率的取值范围必然在 0 到 1 之间。

为了更直观地理解分布函数,我们来看一个离散型随机变量的例子。假设随机变量 X X X的取值为 1,2,3,对应的概率分别为 P ( X = 1 ) = 1 4 P(X \ = 1)\ =\frac{1}{4} P(X =1) =41 P ( X = 2 ) = 1 2 P(X \ = 2)\ =\frac{1}{2} P(X =2) =21 P ( X = 3 ) = 1 4 P(X \ = 3)\ =\frac{1}{4} P(X =3) =41。那么它的分布函数 F ( x ) F(x) F(x)为:
F ( x ) = { 0 , x < 1 1 4 , 1 ≤ x < 2 3 4 , 2 ≤ x < 3 1 , x ≥ 3 F(x)\ =\begin{cases}0, & x < 1 \\ \frac{1}{4}, & 1\leq x < 2 \\ \frac{3}{4}, & 2\leq x < 3 \\ 1, & x\geq 3\end{cases} F(x) = 0,41,43,1,x<11x<22x<3x3
在这个例子中,当 x x x从小于 1 逐渐增大到 1 时, F ( x ) F(x) F(x)从 0 跳跃到 1 4 \frac{1}{4} 41;当 x x x从小于 2 增大到 2 时, F ( x ) F(x) F(x) 1 4 \frac{1}{4} 41跳跃到 3 4 \frac{3}{4} 43;当 x x x从小于 3 增大到 3 时, F ( x ) F(x) F(x) 3 4 \frac{3}{4} 43跳跃到 1,并且在每个分段点处都满足右连续的性质。

(三)例题

设随机变量 X X X的分布律为 P ( X = − 1 ) = 1 3 P(X\ =-1)\ =\frac{1}{3} P(X =1) =31 P ( X = 0 ) = 1 6 P(X \ = 0)\ =\frac{1}{6} P(X =0) =61 P ( X = 1 ) = 1 2 P(X \ = 1)\ =\frac{1}{2} P(X =1) =21,求 X X X的分布函数 F ( x ) F(x) F(x)


x < − 1 x < -1 x<1时, F ( x ) = P ( X ≤ x ) = 0 F(x)\ =P(X\leq x)\ =0 F(x) =P(Xx) =0
− 1 ≤ x < 0 -1\leq x < 0 1x<0时, F ( x ) = P ( X = − 1 ) = 1 3 F(x)\ =P(X\ =-1)\ =\frac{1}{3} F(x) =P(X =1) =31
0 ≤ x < 1 0\leq x < 1 0x<1时, F ( x ) = P ( X = − 1 ) + P ( X = 0 ) = 1 3 + 1 6 = 1 2 F(x)\ =P(X\ =-1)+P(X \ = 0)\ =\frac{1}{3}+\frac{1}{6}\ =\frac{1}{2} F(x) =P(X =1)+P(X =0) =31+61 =21
x ≥ 1 x\geq 1 x1时, F ( x ) = P ( X = − 1 ) + P ( X = 0 ) + P ( X = 1 ) = 1 3 + 1 6 + 1 2 = 1 F(x)\ =P(X\ =-1)+P(X \ = 0)+P(X \ = 1)\ =\frac{1}{3}+\frac{1}{6}+\frac{1}{2}\ =1 F(x) =P(X =1)+P(X =0)+P(X =1) =31+61+21 =1

所以 X X X的分布函数为:
F ( x ) = { 0 , x < − 1 1 3 , − 1 ≤ x < 0 1 2 , 0 ≤ x < 1 1 , x ≥ 1 F(x)\ =\begin{cases}0, & x < -1 \\ \frac{1}{3}, & -1\leq x < 0 \\ \frac{1}{2}, & 0\leq x < 1 \\ 1, & x\geq 1\end{cases} F(x) = 0,31,21,1,x<11x<00x<1x1

二、离散型随机变量的分布率与概率计算

(一)分布率(概率质量函数)

离散型随机变量的分布率是对随机变量所有可能取值及其对应概率的详细描述。它就像一份详细的地图,清晰地展示了随机变量在各个取值点的概率分布情况。

零一分布(伯努利分布)是一种简单而常见的离散型分布。它主要用于描述只有两种可能结果的单次试验,例如抛硬币(正面或反面)、产品是否合格(合格或不合格)等。在零一分布中,我们通常用 X X X表示随机变量, p p p表示成功的概率(比如抛硬币正面朝上的概率),那么 X X X的取值为 1(成功)和 0(失败),其概率分布为 P ( X = 1 ) = p P(X \ = 1)\ =p P(X =1) =p P ( X = 0 ) = 1 − p P(X \ = 0)\ =1 - p P(X =0) =1p

(二)求解步骤

求解离散型随机变量的分布率一般可以分为以下两个关键步骤:

  1. 确定所有可能取值:仔细分析随机试验的结果,找出随机变量能够取到的所有不同数值。例如,在掷骰子的试验中,如果我们定义随机变量 X X X为骰子朝上一面的点数,那么 X X X的可能取值就是 1,2,3,4,5,6。
  2. 计算每个取值的概率:根据具体的试验情况,运用合适的方法来计算每个取值出现的概率。常见的方法有古典概型、频率估计概率等。对于古典概型,若试验的所有基本事件总数为 n n n,而事件 A A A包含的基本事件数为 m m m,则事件 A A A发生的概率 P ( A ) = m n P(A)\ =\frac{m}{n} P(A) =nm。例如,在上述掷骰子的例子中,每个点数出现的概率都是 1 6 \frac{1}{6} 61,因为总共有 6 种等可能的结果,而每个点数都是其中的 1 种。

(三)例题

从 1,2,3,4 这 4 个数字中随机抽取一个,记为 X X X,再从 1 到 X X X中随机抽取一个,记为 Y Y Y,求 X X X的分布率。


X X X的可能取值为 1,2,3,4。
P ( X = 1 ) = 1 4 P(X \ = 1)\ =\frac{1}{4} P(X =1) =41,因为从 4 个数字中取到 1 的概率是 1 4 \frac{1}{4} 41
P ( X = 2 ) = 1 4 P(X \ = 2)\ =\frac{1}{4} P(X =2) =41,同理,取到 2 的概率也是 1 4 \frac{1}{4} 41
P ( X = 3 ) = 1 4 P(X \ = 3)\ =\frac{1}{4} P(X =3) =41,取到 3 的概率为 1 4 \frac{1}{4} 41
P ( X = 4 ) = 1 4 P(X \ = 4)\ =\frac{1}{4} P(X =4) =41,取到 4 的概率为 1 4 \frac{1}{4} 41

所以 X X X的分布率为:

X X X1234
P P P 1 4 \frac{1}{4} 41 1 4 \frac{1}{4} 41 1 4 \frac{1}{4} 41 1 4 \frac{1}{4} 41

三、常见离散分布类型与应用

(一)二项分布

  1. 背景:二项分布用于描述在 n n n次独立重复试验中,每次试验只有两种可能结果(成功或失败),且每次试验成功的概率都为 p p p,我们关注的是这 n n n次试验中成功的次数 X X X的概率分布情况。例如,在多次抛硬币试验中,每次抛硬币正面朝上(成功)的概率为 p = 0.5 p \ = 0.5 p =0.5,抛 n n n次后正面朝上的次数就服从二项分布。这里的“独立重复”非常重要,意味着每次试验的结果都不会受到其他试验的影响。
  2. 公式:其概率计算公式为 P ( X = k ) = C n k p k ( 1 − p ) n − k P(X \ = k)\ =C_n^k p^k(1 - p)^{n - k} P(X =k) =Cnkpk(1p)nk,其中 k = 0 , 1 , 2 , ⋯ , n k \ = 0, 1, 2, \cdots, n k =0,1,2,,n C n k C_n^k Cnk是组合数,表示从 n n n次试验中选取 k k k次成功的组合方式的数量,计算组合数的公式为 C n k = n ! k ! ( n − k ) ! C_n^k\ =\frac{n!}{k!(n - k)!} Cnk =k!(nk)!n! n ! n! n!表示 n n n的阶乘,即 n ! = n × ( n − 1 ) × ⋯ × 1 n!\ =n\times(n - 1)\times\cdots\times1 n! =n×(n1)××1。例如,当 n = 3 n \ = 3 n =3 k = 2 k \ = 2 k =2时, C 3 2 = 3 ! 2 ! ( 3 − 2 ) ! = 3 × 2 ! 2 ! × 1 = 3 C_3^2\ =\frac{3!}{2!(3 - 2)!}\ =\frac{3\times2!}{2!\times1}\ =3 C32 =2!(32)!3! =2!×13×2! =3
  3. 示例:某射手射击一次,击中目标的概率为 0.8,现连续射击 3 次,设击中目标的次数为 X X X,则 X ∼ B ( 3 , 0.8 ) X\sim B(3, 0.8) XB(3,0.8)
    计算 P ( X = 2 ) P(X \ = 2) P(X =2)
    P ( X = 2 ) = C 3 2 × 0. 8 2 × ( 1 − 0.8 ) 3 − 2 = 3 ! 2 ! ( 3 − 2 ) ! × 0.64 × 0.2 = 3 × 0.64 × 0.2 = 0.384 \begin{align*} P(X \ = 2)&\ =C_3^2\times0.8^2\times(1 - 0.8)^{3 - 2}\\ &\ =\frac{3!}{2!(3 - 2)!}\times0.64\times0.2\\ &\ =3\times0.64\times0.2\\ &\ =0.384 \end{align*} P(X =2) =C32×0.82×(10.8)32 =2!(32)!3!×0.64×0.2 =3×0.64×0.2 =0.384

(二)几何分布

  1. 背景:几何分布主要研究在一系列独立重复试验中,首次成功所需的试验次数。比如,在投篮过程中,每次投篮命中的概率为 p p p,我们关心的是第一次投中时已经进行了多少次投篮,这个投篮次数就服从几何分布。
  2. 公式:概率公式为 P ( X = k ) = ( 1 − p ) k − 1 p P(X \ = k)\ =(1 - p)^{k - 1}p P(X =k) =(1p)k1p,其中 k = 1 , 2 , 3 , ⋯ k \ = 1, 2, 3, \cdots k =1,2,3,。这里的 p p p是每次试验成功的概率, k k k表示首次成功时进行的试验次数。例如,假设每次抽奖中奖的概率为 0.1,设 X X X为首次中奖时已经抽奖的次数,那么 P ( X = 1 ) = 0.1 P(X \ = 1)\ =0.1 P(X =1) =0.1 P ( X = 2 ) = ( 1 − 0.1 ) × 0.1 = 0.09 P(X \ = 2)\ =(1 - 0.1)\times0.1 \ = 0.09 P(X =2) =(10.1)×0.1 =0.09 P ( X = 3 ) = ( 1 − 0.1 ) 2 × 0.1 = 0.081 P(X \ = 3)\ =(1 - 0.1)^2\times0.1 \ = 0.081 P(X =3) =(10.1)2×0.1 =0.081,以此类推。
  3. 示例:某运动员进行罚球训练,每次罚球命中的概率为 0.7,求该运动员首次命中时罚球次数 X X X的分布。
    X X X服从几何分布,其分布律为 P ( X = k ) = ( 1 − 0.7 ) k − 1 × 0.7 P(X \ = k)\ =(1 - 0.7)^{k - 1}\times0.7 P(X =k) =(10.7)k1×0.7 k = 1 , 2 , 3 , ⋯ k \ = 1, 2, 3, \cdots k =1,2,3,
    比如 P ( X = 1 ) = 0.7 P(X \ = 1)\ =0.7 P(X =1) =0.7 P ( X = 2 ) = 0.3 × 0.7 = 0.21 P(X \ = 2)\ =0.3\times0.7 \ = 0.21 P(X =2) =0.3×0.7 =0.21 P ( X = 3 ) = 0. 3 2 × 0.7 = 0.063 P(X \ = 3)\ =0.3^2\times0.7 \ = 0.063 P(X =3) =0.32×0.7 =0.063

(三)泊松分布

  1. 背景:泊松分布常用于描述在单位时间、单位面积或单位空间内,稀有事件的发生次数。例如,在一个繁忙的交通路口,一天内发生交通事故的次数;在一个大型超市,一小时内顾客投诉的次数等。这些事件发生的概率相对较小,但在一定的时间或空间范围内又会有一定的发生频率,适合用泊松分布来建模。
  2. 公式:概率公式为 P ( X = k ) = λ k e − λ k ! P(X \ = k)\ =\frac{\lambda^k e^{-\lambda}}{k!} P(X =k) =k!λkeλ,其中 k = 0 , 1 , 2 , ⋯ k \ = 0, 1, 2, \cdots k =0,1,2, λ \lambda λ是一个重要参数,表示单位时间(或空间)内事件的平均发生率, e e e是自然常数,约等于 2.71828。例如,若某地区平均每天发生 2 起火灾,即 λ = 2 \lambda \ = 2 λ =2,那么计算某天发生 3 起火灾的概率 P ( X = 3 ) P(X \ = 3) P(X =3)时,代入公式可得:
    P ( X = 3 ) = 2 3 × e − 2 3 ! = 8 × 0.13534 6 ≈ 0.1805 \begin{align*} P(X \ = 3)&\ =\frac{2^3\times e^{-2}}{3!}\\ &\ =\frac{8\times0.13534}{6}\\ &\approx0.1805 \end{align*} P(X =3) =3!23×e2 =68×0.135340.1805
  3. 参数 λ \lambda λ的大小决定了泊松分布的形态和特征。 λ \lambda λ越大,表示事件发生的平均频率越高; λ \lambda λ越小,则事件发生的平均频率越低。在实际应用中,我们需要根据具体问题的数据来估计 λ \lambda λ的值,从而准确地使用泊松分布进行概率计算和分析。

(四)例题

已知某商店每天顾客的投诉次数 X X X服从参数 λ = 3 \lambda \ = 3 λ =3的泊松分布,求该商店一天内至少有 2 次投诉的概率。


已知 X ∼ P ( 3 ) X\sim P(3) XP(3),其概率公式为 P ( X = k ) = 3 k e − 3 k ! P(X \ = k)\ =\frac{3^k e^{-3}}{k!} P(X =k) =k!3ke3 k = 0 , 1 , 2 , ⋯ k \ = 0, 1, 2, \cdots k =0,1,2,
P ( X ≥ 2 ) = 1 − P ( X < 2 ) = 1 − P ( X = 0 ) − P ( X = 1 ) P(X\geq2)\ =1 - P(X < 2)\ =1 - P(X \ = 0)-P(X \ = 1) P(X2) =1P(X<2) =1P(X =0)P(X =1)
P ( X = 0 ) = 3 0 × e − 3 0 ! = e − 3 ≈ 0.0498 P(X \ = 0)\ =\frac{3^0\times e^{-3}}{0!}\ =e^{-3}\approx0.0498 P(X =0) =0!30×e3 =e30.0498
P ( X = 1 ) = 3 1 × e − 3 1 ! = 3 e − 3 ≈ 3 × 0.0498 = 0.1494 P(X \ = 1)\ =\frac{3^1\times e^{-3}}{1!}\ =3e^{-3}\approx3\times0.0498 \ = 0.1494 P(X =1) =1!31×e3 =3e33×0.0498 =0.1494
所以 P ( X ≥ 2 ) = 1 − 0.0498 − 0.1494 = 0.8008 P(X\geq2)\ =1 - 0.0498 - 0.1494 \ = 0.8008 P(X2) =10.04980.1494 =0.8008

四、随机变量函数的分布求解

当我们面对随机变量的函数 Y = g ( X ) Y \ = g(X) Y =g(X)时,可以采用以下两步法来求解其分布:

(一)确定取值

首先要明确函数 Y = g ( X ) Y \ = g(X) Y =g(X)的所有可能取值。这需要根据 X X X的取值范围以及函数 g ( X ) g(X) g(X)的具体形式来确定。例如,若 X X X是离散型随机变量,取值为 x 1 , x 2 , ⋯ x_1,x_2,\cdots x1,x2,,那么将这些值代入 g ( X ) g(X) g(X)中,得到 g ( x 1 ) , g ( x 2 ) , ⋯ g(x_1),g(x_2),\cdots g(x1),g(x2),,这些就是 Y Y Y的可能取值,注意如果有重复的值,只保留一个。

比如,设 X X X为离散型随机变量,取值为 − 1 , 0 , 1 -1,0,1 1,0,1,定义 Y = X 2 Y \ = X^2 Y =X2。将 X X X的取值代入 Y = X 2 Y \ = X^2 Y =X2中,当 X = − 1 X\ =-1 X =1时, Y = ( − 1 ) 2 = 1 Y \ = (-1)^2 \ = 1 Y =(1)2 =1;当 X = 0 X \ = 0 X =0时, Y = 0 2 = 0 Y \ = 0^2 \ = 0 Y =02 =0;当 X = 1 X \ = 1 X =1时, Y = 1 2 = 1 Y \ = 1^2 \ = 1 Y =12 =1。所以 Y Y Y的可能取值为 0 0 0 1 1 1

(二)求概率

然后根据 X X X的分布情况,来计算 Y Y Y取每个值的概率。对于离散型随机变量 X X X,若已知其分布律 P ( X = x i ) = p i P(X \ = x_i)\ =p_i P(X =xi) =pi i = 1 , 2 , ⋯ i \ = 1,2,\cdots i =1,2,。当求 Y = g ( X ) Y \ = g(X) Y =g(X)取某一值 y j y_j yj的概率 P ( Y = y j ) P(Y \ = y_j) P(Y =yj)时,需要找出所有使得 g ( x i ) = y j g(x_i)\ =y_j g(xi) =yj x i x_i xi,然后将对应的 P ( X = x i ) P(X \ = x_i) P(X =xi)相加。

继续以上面 Y = X 2 Y \ = X^2 Y =X2的例子为例,已知 X X X的分布律为 P ( X = − 1 ) = 1 4 P(X\ =-1)\ =\frac{1}{4} P(X =1) =41 P ( X = 0 ) = 1 2 P(X \ = 0)\ =\frac{1}{2} P(X =0) =21 P ( X = 1 ) = 1 4 P(X \ = 1)\ =\frac{1}{4} P(X =1) =41

  • 对于 Y = 0 Y \ = 0 Y =0,只有 X = 0 X \ = 0 X =0时满足 Y = X 2 = 0 Y \ = X^2 \ = 0 Y =X2 =0,所以 P ( Y = 0 ) = P ( X = 0 ) = 1 2 P(Y \ = 0)\ =P(X \ = 0)\ =\frac{1}{2} P(Y =0) =P(X =0) =21
  • 对于 Y = 1 Y \ = 1 Y =1 X = − 1 X\ =-1 X =1 X = 1 X \ = 1 X =1时都满足 Y = X 2 = 1 Y \ = X^2 \ = 1 Y =X2 =1,所以 P ( Y = 1 ) = P ( X = − 1 ) + P ( X = 1 ) = 1 4 + 1 4 = 1 2 P(Y \ = 1)\ =P(X\ =-1)+P(X \ = 1)\ =\frac{1}{4}+\frac{1}{4}\ =\frac{1}{2} P(Y =1) =P(X =1)+P(X =1) =41+41 =21

(三)例题

设随机变量 X X X的分布律为 P ( X = 1 ) = 1 3 P(X \ = 1)\ =\frac{1}{3} P(X =1) =31 P ( X = 2 ) = 1 2 P(X \ = 2)\ =\frac{1}{2} P(X =2) =21 P ( X = 3 ) = 1 6 P(X \ = 3)\ =\frac{1}{6} P(X =3) =61,求 Y = 2 X − 1 Y \ = 2X - 1 Y =2X1的分布律。

  1. 确定 Y Y Y的取值
    • X = 1 X \ = 1 X =1时, Y = 2 × 1 − 1 = 1 Y \ = 2\times1 - 1 \ = 1 Y =2×11 =1
    • X = 2 X \ = 2 X =2时, Y = 2 × 2 − 1 = 3 Y \ = 2\times2 - 1 \ = 3 Y =2×21 =3
    • X = 3 X \ = 3 X =3时, Y = 2 × 3 − 1 = 5 Y \ = 2\times3 - 1 \ = 5 Y =2×31 =5
      所以 Y Y Y的可能取值为 1 1 1 3 3 3 5 5 5
  2. 计算 Y Y Y取每个值的概率
    - P ( Y = 1 ) = P ( X = 1 ) = 1 3 P(Y \ = 1)\ =P(X \ = 1)\ =\frac{1}{3} P(Y =1) =P(X =1) =31
    - P ( Y = 3 ) = P ( X = 2 ) = 1 2 P(Y \ = 3)\ =P(X \ = 2)\ =\frac{1}{2} P(Y =3) =P(X =2) =21
    - P ( Y = 5 ) = P ( X = 3 ) = 1 6 P(Y \ = 5)\ =P(X \ = 3)\ =\frac{1}{6} P(Y =5) =P(X =3) =61

所以 Y = 2 X − 1 Y \ = 2X - 1 Y =2X1的分布律为:

Y Y Y 1 1 1 3 3 3 5 5 5
P P P 1 3 \frac{1}{3} 31 1 2 \frac{1}{2} 21 1 6 \frac{1}{6} 61

五、总结与对比

分布类型应用场景核心公式参数含义
零一分布单次试验成功/失败,如抛一次硬币、检验一件产品是否合格 P ( X = 1 ) = p P(X \ = 1)\ =p P(X =1) =p P ( X = 0 ) = 1 − p P(X \ = 0)\ =1 - p P(X =0) =1p p p p:单次试验成功的概率
二项分布 n n n次独立重复试验的成功次数,如 n n n次抛硬币正面朝上的次数、 n n n次射击命中的次数 P ( X = k ) = C n k p k ( 1 − p ) n − k P(X \ = k)\ =C_n^k p^k(1 - p)^{n - k} P(X =k) =Cnkpk(1p)nk k = 0 , 1 , ⋯ , n k \ = 0,1,\cdots,n k =0,1,,n n n n:试验次数; p p p:每次试验成功的概率
几何分布首次成功所需的试验次数,如首次投篮命中时的投篮次数、首次抽奖中奖时的抽奖次数 P ( X = k ) = ( 1 − p ) k − 1 p P(X \ = k)\ =(1 - p)^{k - 1}p P(X =k) =(1p)k1p k = 1 , 2 , ⋯ k \ = 1,2,\cdots k =1,2, p p p:每次试验成功的概率
泊松分布单位时间/空间内稀有事件的发生次数,如一天内某网站的故障次数、一小时内某医院的急诊病人数 P ( X = k ) = λ k e − λ k ! P(X \ = k)\ =\frac{\lambda^k e^{-\lambda}}{k!} P(X =k) =k!λkeλ k = 0 , 1 , ⋯ k \ = 0,1,\cdots k =0,1, λ \lambda λ:单位时间(或空间)内事件的平均发生率

通过对这些随机变量分布的详细学习,我们能够更好地理解和处理各种随机现象。在实际应用中,要准确判断问题适合哪种分布类型,然后运用相应的公式和方法进行概率计算和分析。同时,多做练习题有助于我们熟练掌握这些知识,提高解决实际问题的能力。

相关文章:

机器学习数学基础:25.随机变量分布详解

一、随机变量与分布函数的基本概念 &#xff08;一&#xff09;什么是随机变量&#xff1f; 在概率论领域&#xff0c;随机变量是将随机试验的结果进行数值化的关键概念。它就像一座桥梁&#xff0c;把抽象的随机事件和具体的数学分析连接起来。 举例来说&#xff0c;在一个…...

香港电讯与Zenlayer达成战略合作,拓展全球互联生态圈

作为主要国际金融与贸易中心&#xff0c;香港一直是连系中国内地及全球市场的重要门户。香港电讯作为本地领先的综合电讯服务提供商&#xff0c;拥有广泛的网络资源和深厚的技术专长&#xff0c;一直支持国内企业“走出去”和外资企业“走进来”。而旗下由PCCW Global营运的Con…...

MySQL-事务隔离级别

事务有四大特性&#xff08;ACID&#xff09;&#xff1a;原子性&#xff0c;一致性&#xff0c;隔离性和持久性。隔离性一般在事务并发的时候需要保证事务的隔离性&#xff0c;事务并发会出现很多问题&#xff0c;包括脏写&#xff0c;脏读&#xff0c;不可重复读&#xff0c;…...

【Python学习 / 6】面向对象编程(OOP)

文章目录 ⭐前言⭐一、类和对象&#xff1a;面向对象编程基础1. 类&#xff08;Class&#xff09;类的组成&#xff1a;例子&#xff1a;定义一个简单的 Dog 类代码解析&#xff1a; 2. 对象&#xff08;Object&#xff09;对象的创建&#xff1a; 3. 三大特性&#xff1a;封装…...

Ollama DeepSeek + AnythingLLM 实现本地私有AI知识库

Ollama DeepSeek AnythingLLM 实现本地私有AI知识库 本地部署DeepSeek-r1下载安装AnythingLLMAnythingLLM 配置LLM首选项Embedder首选项向量数据库工作区其他配置 AnythingLLM Workspace使用上传知识词嵌入知识检索 本文主要介绍了如何使用AnythingLLM结合Ollama部署的DeepSee…...

个人博客测试报告

一、项目背景 个人博客系统采用前后端分离的方法来实现&#xff0c;同时使用了数据库来存储相关的数据&#xff0c;同时将其部署到云服务器上。前端主要有四个页面构成&#xff1a;登录页、列表页、详情页以及编辑页&#xff0c;以上模拟实现了最简单的个人博客系统。其结合后…...

嵌入式八股文(四)计算机网络篇

第一章 基础概念 1. 服务 指网络中各层为紧邻的上层提供的功能调用,是垂直的。包括面向连接服务、无连接服务、可靠服务、不可靠服务。 2. 协议 是计算机⽹络相互通信的对等层实体之间交换信息时必须遵守的规则或约定的集合。⽹络协议的三个基本要素:语法、…...

基于Electron+Vue3创建桌面应用

Electron 是一个开源框架,基于 Chromium 和 Node.js,用于开发跨平台桌面应用程序。它允许开发者使用 HTML、CSS 和 JavaScript 等 Web 技术构建原生桌面应用,支持 Windows、macOS 和 Linux。Electron 以其开发便捷性、强大的功能和丰富的生态系统而广泛应用于工具类应用、媒…...

建立稳定分析模式的模式语言01

Haitham Hamza 等 著&#xff0c;wnb 译 摘要 一般认为&#xff0c;软件分析模式在减少开销和缩短软件产品生命周期等方面会起到重要的作用。然而&#xff0c;分析模式的巨大潜能还未被充分发掘。缺乏稳定性是当前分析模式存在的主要问题。多数情况下&#xff0c;为特定问题建…...

【C++游戏开发-五子棋】

使用C开发五子棋游戏的详细实现方案&#xff0c;涵盖核心逻辑、界面设计和AI对战功能&#xff1a; 1. 项目结构 FiveChess/ ├── include/ │ ├── Board.h // 棋盘类 │ ├── Player.h // 玩家类 │ ├── AI.h // AI类 │ └── Game.h // 游戏主逻辑 ├── src/ …...

ubuntu20动态修改ip,springboot中yaml的内容的读取,修改,写入

文章目录 前言引入包yaml原始内容操作目标具体代码执行查看结果总结: 前言 之前有个需求&#xff0c;动态修改ubuntu20的ip&#xff0c;看了下&#xff1a; 本质上是修改01-netcfg.yaml文件&#xff0c;然后执行netplan apply就可以了。 所以&#xff0c;需求就变成了 如何对ya…...

tailwindcss学习02

vue中接入tailwindcss 使用cmd不要使用powershell npm create vitelatest stu02 -- --template vue cd stu02npm install --registry http://registry.npm.taobao.org npm install -D tailwindcss3.4.17 postcss autoprefixer --registry http://registry.npm.taobao.org npx t…...

千峰React:脚手架准备+JSX基础

组件化->封装性 React提供函数组件实现组件化 React和传统JS的区别就是JS需要手动管理DOM操作&#xff0c;React: 采用组件化开发&#xff0c;通过虚拟DOM提升性能。 MVC 是一种软件设计模式&#xff0c;全称为 Model-View-Controller&#xff08;模型-视图-控制器&#x…...

【算法】快排

题目 快排 思路 如果输入为0或1直接返回&#xff1b;否则取一个基准值&#xff0c;可以取中间位置&#xff0c;如果输入是有序的可以避免时间过长&#xff0c;然后移动指针&#xff0c;先让i指针右移&#xff0c;如果小于基准值就继续右移&#xff0c;j指针左移同理。如果指…...

开放签电子签章工具版 2.0 正式发布,构建全场景电子签约能力、满足复杂的签章管理场景

根据近半年开源用户和市场需求反馈&#xff0c;开放签团队推出电子签章工具版2.0版本&#xff0c;主要解决复杂的签约流程集成和电子印章授权管理场景。以API接口对外提供服务和配置一套可视化后台管理系统&#xff0c;可与业务系统无缝集成&#xff0c;用户使用起来毫无“违和…...

python和pycharm 和Anaconda的关系

好的&#xff0c;下面我会详细说明 Python、PyCharm 和 Anaconda 三者的关系&#xff0c;并逐一解释它们的功能和作用。 1. Python&#xff08;编程语言&#xff09; 定义&#xff1a;Python 是一种高级编程语言&#xff0c;设计简洁&#xff0c;易于学习&#xff0c;且功能强…...

DeepSeek V3和R1

DeepSeek V3 和 R1 是深度求索&#xff08;DeepSeek&#xff09;推出的两款大模型&#xff0c;基于混合专家架构&#xff08;MoE&#xff09;&#xff0c;但在设计目标、训练方法和应用场景上存在显著差异。以下是两者的详细对比与补充内容&#xff1a; DeepSeek V3和R1 一、模…...

JavaScript数组-获取数组中的元素

在JavaScript中&#xff0c;数组是一种非常实用的数据结构&#xff0c;它允许我们将多个值存储在一个单独的变量中。无论是数字、字符串还是对象&#xff0c;都可以作为数组的元素。获取数组中的特定元素是操作数组的基础技能之一。本文将详细介绍如何在JavaScript中获取数组中…...

SSE:用于流式传输的协议

一.什么是SSE SSE协议是一种基于http协议的单向通信协议&#xff0c;服务端可以向客户端发送数据&#xff0c;但是客户端不能向服务器发送数据。客户端通过创建一个到服务器的单向连接来监听事件。可以将一次性返回数据包改为流式返回数据。SSE协议支持断线重连&#xff0c;也支…...

Aseprite详细使用教程(7)——切片工具

1.名词解释 快捷键&#xff1a;ShiftC 切片工具功能&#xff08;了解即可&#xff09;&#xff1a; &#xff08;1&#xff09;优化资源加载: 将较大的图像切成多个较小的切片&#xff0c;可减小单个文件大小&#xff0c;在网页或游戏等场景中&#xff0c;能显著提升加载速度…...

XCTF-web-easyupload

试了试php&#xff0c;php7&#xff0c;pht&#xff0c;phtml等&#xff0c;都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接&#xff0c;得到flag...

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

R语言AI模型部署方案:精准离线运行详解

R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中&#xff0c;选择 环境 -> 常规 &#xff0c;将其中的颜色主题改成深色 点击确定&#xff0c;更改完成...

macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录 问题现象问题原因解决办法 问题现象 macOS启动台&#xff08;Launchpad&#xff09;多出来了&#xff1a;Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显&#xff0c;都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

苍穹外卖--缓存菜品

1.问题说明 用户端小程序展示的菜品数据都是通过查询数据库获得&#xff0c;如果用户端访问量比较大&#xff0c;数据库访问压力随之增大 2.实现思路 通过Redis来缓存菜品数据&#xff0c;减少数据库查询操作。 缓存逻辑分析&#xff1a; ①每个分类下的菜品保持一份缓存数据…...

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包&#xff1a; for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录 一、SQL注入 二、insert注入 三、报错型注入 四、updatexml函数 五、源码审计 六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段 本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...

html-<abbr> 缩写或首字母缩略词

定义与作用 <abbr> 标签用于表示缩写或首字母缩略词&#xff0c;它可以帮助用户更好地理解缩写的含义&#xff0c;尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时&#xff0c;会显示一个提示框。 示例&#x…...

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

禁止商业或二改转载&#xff0c;仅供自学使用&#xff0c;侵权必究&#xff0c;如需截取部分内容请后台联系作者! 文章目录 介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...