Jupyter AI

10 常见概率分布之几何分布

📅 发表日期: 2024年8月10日

分类: 📊AI 概率必备

👁️阅读: --

几何分布是离散概率分布的一种,主要用来描述在一系列独立的伯努利试验中,直到第一次成功所需的试验次数。换句话说,几何分布关注的是“在第几次试验中首次获得成功”。这种分布非常适合用于建模“等待时间”类型的问题。

几何分布的定义

如果一个随机变量 XX 表示在独立重复实验中第一次成功所需的实验次数,并且每次实验成功的概率为 pp,那么 XX 服从参数为 pp 的几何分布,记作 XGeom(p)X \sim \text{Geom}(p)

概率质量函数

几何分布的概率质量函数(PMF)可以表示为:

P(X=k)=(1p)k1p(k=1,2,3,)P(X = k) = (1-p)^{k-1} p \quad (k = 1, 2, 3, \ldots)

其中,P(X=k)P(X = k) 表示第一次成功发生在第 kk 次试验的概率。

累积分布函数

几何分布的累积分布函数(CDF)表示为:

P(Xk)=1(1p)k(k=1,2,3,)P(X \leq k) = 1 - (1-p)^k \quad (k = 1, 2, 3, \ldots)

几何分布的性质

几何分布有几个重要的性质,它们对理解和实际应用很有帮助:

  1. 期望值
    • 几何分布的期望值 E(X)E(X)1p\frac{1}{p}
  2. 方差
    • 几何分布的方差 Var(X)Var(X)1pp2\frac{1-p}{p^2}

这些性质使得几何分布在一些实际问题中非常有用,比如:

  • 求解在多次投掷一枚硬币后,第一次出现“正面”的次数。
  • 在顾客到达服务台的场景中,计算首次服务成功的顾客数量。

应用案例

投掷硬币的例子

假设你在投掷一枚公平的硬币,正面朝上的概率 p=0.5p = 0.5。你想知道在多次投掷中,第一次出现“正面”的次数。根据几何分布的定义,我们知道这个随机变量 XGeom(0.5)X \sim \text{Geom}(0.5)

计算概率

我们可以计算第一次出现“正面”在第 kk 次投掷的概率:

比如 k=1k = 1

P(X=1)=(10.5)110.5=10.5=0.5P(X = 1) = (1-0.5)^{1-1} \cdot 0.5 = 1 \cdot 0.5 = 0.5

再看 k=3k = 3

P(X=3)=(10.5)310.5=(0.5)20.5=0.250.5=0.125P(X = 3) = (1-0.5)^{3-1} \cdot 0.5 = (0.5)^2 \cdot 0.5 = 0.25 \cdot 0.5 = 0.125

这些计算结果表明,第一次成功可能在第一次或第三次尝试中发生的概率。

方差与期望计算

  • 对于投掷硬币的场景,期望值为:
E(X)=1p=10.5=2E(X) = \frac{1}{p} = \frac{1}{0.5} = 2

这意味着,在无限多次投掷中,我们平均需要投掷 2 次才能首次达到“正面”。

  • 方差计算为:
Var(X)=1pp2=0.5(0.5)2=2Var(X) = \frac{1-p}{p^2} = \frac{0.5}{(0.5)^2} = 2

这意味着,实际的投掷次数将围绕着期望次数 2 波动,波动量为 2。

Python 示例

下面是一个简单的 Python 示例,展示了如何使用概率质量函数计算几何分布的概率:

import numpy as np
import matplotlib.pyplot as plt

# 设定参数
p = 0.5
k = np.arange(1, 21)  # 试验次数

# 计算几何分布的概率
pmf = (1 - p) ** (k - 1) * p

# 绘图展示
plt.bar(k, pmf)
plt.xlabel('试验次数 (k)')
plt.ylabel('概率 P(X=k)')
plt.title('几何分布 (p=0.5)')
plt.xticks(k)
plt.show()

在这段代码中,我们设定了概率 p=0.5p=0.5,然后计算出了前 20 次试验中首次成功的概率,并通过条形图展示出来。

总结

几何分布是一个非常重要的概率分布,用于建模等待时间的情形,实际应用广泛。在了解了几何分布的定义、性质以及实际案例后,我们可以更好地运用其来解决实际问题。

在下一个部分,我们将深入探讨如何计算随机变量的期望值,并进一步理解它与方差的关系。这将有助于我们更全面地掌握概率论的基础知识,特别是在实际问题中的应用。