5 生成随机变量与分布之离散随机变量与连续随机变量
在上一讲中,我们探讨了随机变量
的定义。随机变量是从某个随机试验中获取的一种量化结果。现在,我们将讨论的主题是离散随机变量
与连续随机变量
,这两者是理解概率分布和随机过程的重要基础。
离散随机变量
定义
离散随机变量
是指其取值为可数(有限或无限可数)的随机变量。也就是说,离散随机变量的可能取值可以列表列出。例如,掷一枚公平的六面骰子时,随机变量 $X$ 表示骰子上显示的点数,$X$ 的可能取值为 {1, 2, 3, 4, 5, 6}。
概率分布
离散随机变量的概率分布
常用概率质量函数
(PMF)来描述。对于离散随机变量 $X$,其概率质量函数定义为:
$$
P(X = x) = p(x)
$$
其中,$p(x)$ 表示 $X$ 取值为 $x$ 的概率。
案例:掷骰子
假设我们进行一次掷骰子实验,定义随机变量 $X$ 为掷出的点数。我们有:
- $P(X = 1) = \frac{1}{6}$
- $P(X = 2) = \frac{1}{6}$
- $P(X = 3) = \frac{1}{6}$
- $P(X = 4) = \frac{1}{6}$
- $P(X = 5) = \frac{1}{6}$
- $P(X = 6) = \frac{1}{6}$
这些概率满足 $0 \leq p(x) \leq 1$,并且所有可能的概率之和等于1,即:
$$
\sum_{x=1}^{6} p(x) = 1
$$
代码示例
下面的代码使用Python中的numpy
库模拟掷骰子的过程,并生成对应的概率分布。
1 | import numpy as np |
连续随机变量
定义
连续随机变量
是指其取值为所有实数的随机变量。由于连续随机变量可以取无限多个值,因此其概率用概率密度函数
(PDF)来描述,而不是简单的概率值。
概率密度函数
对于连续随机变量 $Y$,其概率密度函数 $f(y)$ 定义为:
$$
P(a < Y < b) = \int_a^b f(y) , dy
$$
这里,$P(a < Y < b)$ 表示随机变量 $Y$ 取值在区间 $(a, b)$ 内的概率。
案例:正态分布
考虑一个典型的连续随机变量——正态分布(也称为高斯分布)。它的概率密度函数形式为:
$$
f(y) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(y - \mu)^2}{2\sigma^2}}
$$
其中,$\mu$ 是均值,$\sigma$ 是标准差。
代码示例
下面的代码展示了如何绘制正态分布的概率密度函数。
1 | import numpy as np |
总结
在今天的教程中,我们了解了离散随机变量
和连续随机变量
的定义、特点及它们各自的概率分布形式。在下一篇中,我们将进一步讨论累积分布函数
(CDF)与概率密度函数
(PDF)之间的联系与区别。这将帮助我们更好地理解随机变量的性质及其在实际问题中的应用。
希望这一讲能帮助你在概率论的学习中更进一步!
5 生成随机变量与分布之离散随机变量与连续随机变量