10 常见概率分布之几何分布
几何分布是离散概率分布的一种,主要用来描述在一系列独立的伯努利试验中,直到第一次成功所需的试验次数。换句话说,几何分布关注的是“在第几次试验中首次获得成功”。这种分布非常适合用于建模“等待时间”类型的问题。
几何分布的定义
如果一个随机变量 表示在独立重复实验中第一次成功所需的实验次数,并且每次实验成功的概率为 ,那么 服从参数为 的几何分布,记作 。
概率质量函数
几何分布的概率质量函数(PMF)可以表示为:
其中, 表示第一次成功发生在第 次试验的概率。
累积分布函数
几何分布的累积分布函数(CDF)表示为:
几何分布的性质
几何分布有几个重要的性质,它们对理解和实际应用很有帮助:
- 期望值:
- 几何分布的期望值 为 。
- 方差:
- 几何分布的方差 为 。
这些性质使得几何分布在一些实际问题中非常有用,比如:
- 求解在多次投掷一枚硬币后,第一次出现“正面”的次数。
- 在顾客到达服务台的场景中,计算首次服务成功的顾客数量。
应用案例
投掷硬币的例子
假设你在投掷一枚公平的硬币,正面朝上的概率 。你想知道在多次投掷中,第一次出现“正面”的次数。根据几何分布的定义,我们知道这个随机变量 。
计算概率
我们可以计算第一次出现“正面”在第 次投掷的概率:
比如 :
再看 :
这些计算结果表明,第一次成功可能在第一次或第三次尝试中发生的概率。
方差与期望计算
- 对于投掷硬币的场景,期望值为:
这意味着,在无限多次投掷中,我们平均需要投掷 2 次才能首次达到“正面”。
- 方差计算为:
这意味着,实际的投掷次数将围绕着期望次数 2 波动,波动量为 2。
Python 示例
下面是一个简单的 Python 示例,展示了如何使用概率质量函数计算几何分布的概率:
import numpy as np
import matplotlib.pyplot as plt
# 设定参数
p = 0.5
k = np.arange(1, 21) # 试验次数
# 计算几何分布的概率
pmf = (1 - p) ** (k - 1) * p
# 绘图展示
plt.bar(k, pmf)
plt.xlabel('试验次数 (k)')
plt.ylabel('概率 P(X=k)')
plt.title('几何分布 (p=0.5)')
plt.xticks(k)
plt.show()
在这段代码中,我们设定了概率 ,然后计算出了前 20 次试验中首次成功的概率,并通过条形图展示出来。
总结
几何分布是一个非常重要的概率分布,用于建模等待时间的情形,实际应用广泛。在了解了几何分布的定义、性质以及实际案例后,我们可以更好地运用其来解决实际问题。
在下一个部分,我们将深入探讨如何计算随机变量的期望值,并进一步理解它与方差的关系。这将有助于我们更全面地掌握概率论的基础知识,特别是在实际问题中的应用。