10 常见概率分布之几何分布

几何分布是离散概率分布的一种,主要用来描述在一系列独立的伯努利试验中,直到第一次成功所需的试验次数。换句话说,几何分布关注的是“在第几次试验中首次获得成功”。这种分布非常适合用于建模“等待时间”类型的问题。

几何分布的定义

如果一个随机变量 $X$ 表示在独立重复实验中第一次成功所需的实验次数,并且每次实验成功的概率为 $p$,那么 $X$ 服从参数为 $p$ 的几何分布,记作 $X \sim \text{Geom}(p)$。

概率质量函数

几何分布的概率质量函数(PMF)可以表示为:

$$
P(X = k) = (1-p)^{k-1} p \quad (k = 1, 2, 3, \ldots)
$$

其中,$P(X = k)$ 表示第一次成功发生在第 $k$ 次试验的概率。

累积分布函数

几何分布的累积分布函数(CDF)表示为:

$$
P(X \leq k) = 1 - (1-p)^k \quad (k = 1, 2, 3, \ldots)
$$

几何分布的性质

几何分布有几个重要的性质,它们对理解和实际应用很有帮助:

  1. 期望值

    • 几何分布的期望值 $E(X)$ 为 $\frac{1}{p}$。
  2. 方差

    • 几何分布的方差 $Var(X)$ 为 $\frac{1-p}{p^2}$。

这些性质使得几何分布在一些实际问题中非常有用,比如:

  • 求解在多次投掷一枚硬币后,第一次出现“正面”的次数。
  • 在顾客到达服务台的场景中,计算首次服务成功的顾客数量。

应用案例

投掷硬币的例子

假设你在投掷一枚公平的硬币,正面朝上的概率 $p = 0.5$。你想知道在多次投掷中,第一次出现“正面”的次数。根据几何分布的定义,我们知道这个随机变量 $X \sim \text{Geom}(0.5)$。

计算概率

我们可以计算第一次出现“正面”在第 $k$ 次投掷的概率:

比如 $k = 1$:

$$
P(X = 1) = (1-0.5)^{1-1} \cdot 0.5 = 1 \cdot 0.5 = 0.5
$$

再看 $k = 3$:

$$
P(X = 3) = (1-0.5)^{3-1} \cdot 0.5 = (0.5)^2 \cdot 0.5 = 0.25 \cdot 0.5 = 0.125
$$

这些计算结果表明,第一次成功可能在第一次或第三次尝试中发生的概率。

方差与期望计算

  • 对于投掷硬币的场景,期望值为:

$$
E(X) = \frac{1}{p} = \frac{1}{0.5} = 2
$$

这意味着,在无限多次投掷中,我们平均需要投掷 2 次才能首次达到“正面”。

  • 方差计算为:

$$
Var(X) = \frac{1-p}{p^2} = \frac{0.5}{(0.5)^2} = 2
$$

这意味着,实际的投掷次数将围绕着期望次数 2 波动,波动量为 2。

Python 示例

下面是一个简单的 Python 示例,展示了如何使用概率质量函数计算几何分布的概率:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import numpy as np
import matplotlib.pyplot as plt

# 设定参数
p = 0.5
k = np.arange(1, 21) # 试验次数

# 计算几何分布的概率
pmf = (1 - p) ** (k - 1) * p

# 绘图展示
plt.bar(k, pmf)
plt.xlabel('试验次数 (k)')
plt.ylabel('概率 P(X=k)')
plt.title('几何分布 (p=0.5)')
plt.xticks(k)
plt.show()

在这段代码中,我们设定了概率 $p=0.5$,然后计算出了前 20 次试验中首次成功的概率,并通过条形图展示出来。

总结

几何分布是一个非常重要的概率分布,用于建模等待时间的情形,实际应用广泛。在了解了几何分布的定义、性质以及实际案例后,我们可以更好地运用其来解决实际问题。

在下一个部分,我们将深入探讨如何计算随机变量的期望值,并进一步理解它与方差的关系。这将有助于我们更全面地掌握概率论的基础知识,特别是在实际问题中的应用。

10 常见概率分布之几何分布

https://zglg.work/ai-prob-you-need/10/

作者

IT教程网(郭震)

发布于

2024-08-10

更新于

2024-08-11

许可协议

分享转发

交流

更多教程加公众号

更多教程加公众号

加入星球获取PDF

加入星球获取PDF

打卡评论