概述
泊松分布
是一种离散概率分布,用于描述在固定时间或空间内某个事件发生的次数。它通常适用于事件发生的次数是独立且概率恒定的情况。泊松分布常用于排队理论、交通流量、网络流量等领域。
定义
一个随机变量 $X$ 服从参数为 $\lambda$ 的泊松分布,记作 $X \sim \text{Poisson}(\lambda)$,其概率质量函数为:
$$
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots
$$
这里:
- $k$ 是事件发生的次数,
- $\lambda$ 是单位时间或空间内事件的平均发生次数,
- $e$ 是自然常数,约等于 2.71828。
特性
均值和方差:
- 对于泊松分布,均值和方差均为 $\lambda$。
- 这意味着,如果某事件的平均发生率为 $\lambda$,则在长期观察中,其发生的次数的均值和方差都是 $\lambda$。
条件:
- 事件是独立的。
- 在给定的时间区间或空间区域内,事件发生的概率是恒定的。
应用案例
假设某餐厅的外卖平均每小时接到5个订单,即 $\lambda = 5$。我们想知道在一个小时内接到3个订单的概率。
使用泊松分布的公式,我们有:
$$
P(X = 3) = \frac{5^3 e^{-5}}{3!} = \frac{125 e^{-5}}{6} \approx 0.1404
$$
这表示在一个小时内接到3个订单的概率大约为14.04%。
Python 示例代码
下面是一个简单的 Python 示例,展示如何使用 scipy
库计算泊松分布的概率。
1 | import numpy as np |
在这段代码中,我们计算了在给定 $\lambda$ 的情况下,从0到14的事件发生概率,并使用柱状图呈现出来。
总结
泊松分布是分析离散事件发生频率的重要工具。通过了解其基本定义、公式、特性及应用场景,可以更有效地处理相关问题。常见的应用包括电话呼叫、顾客到达、故障发生等场景。掌握泊松分布是学习更复杂概率理论的基础步骤。