在上一讲中，我们探讨了随机变量的定义。随机变量是从某个随机试验中获取的一种量化结果。现在，我们将讨论的主题是离散随机变量与连续随机变量，这两者是理解概率分布和随机过程的重要基础。

离散随机变量

定义

离散随机变量是指其取值为可数（有限或无限可数）的随机变量。也就是说，离散随机变量的可能取值可以列表列出。例如，掷一枚公平的六面骰子时，随机变量 $X$ 表示骰子上显示的点数， $X$ 的可能取值为 {1, 2, 3, 4, 5, 6}。

概率分布

离散随机变量的概率分布常用概率质量函数（PMF）来描述。对于离散随机变量 $X$ ，其概率质量函数定义为：

P(X = x) = p(x)

其中， $p(x)$ 表示 $X$ 取值为 $x$ 的概率。

案例：掷骰子

假设我们进行一次掷骰子实验，定义随机变量 $X$ 为掷出的点数。我们有：

$P(X = 1) = \frac{1}{6}$
$P(X = 2) = \frac{1}{6}$
$P(X = 3) = \frac{1}{6}$
$P(X = 4) = \frac{1}{6}$
$P(X = 5) = \frac{1}{6}$
$P(X = 6) = \frac{1}{6}$

这些概率满足 $0 \leq p(x) \leq 1$ ，并且所有可能的概率之和等于1，即：

\sum_{x=1}^{6} p(x) = 1

代码示例

下面的代码使用Python中的numpy库模拟掷骰子的过程，并生成对应的概率分布。

import numpy as np
import matplotlib.pyplot as plt

# 模拟掷骰子1000次
np.random.seed(0)
dice_rolls = np.random.randint(1, 7, size=1000)

# 计算概率分布
values, counts = np.unique(dice_rolls, return_counts=True)
probabilities = counts / len(dice_rolls)

# 绘图
plt.bar(values, probabilities)
plt.xticks(values)
plt.xlabel('点数')
plt.ylabel('概率')
plt.title('掷骰子的概率分布')
plt.show()

连续随机变量

定义

连续随机变量是指其取值为所有实数的随机变量。由于连续随机变量可以取无限多个值，因此其概率用概率密度函数（PDF）来描述，而不是简单的概率值。

概率密度函数

对于连续随机变量 $Y$ ，其概率密度函数 $f(y)$ 定义为：

P(a < Y < b) = \int_a^b f(y) \, dy

这里， $P(a < Y < b)$ 表示随机变量 $Y$ 取值在区间 $(a, b)$ 内的概率。

案例：正态分布

考虑一个典型的连续随机变量——正态分布（也称为高斯分布）。它的概率密度函数形式为：

f(y) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(y - \mu)^2}{2\sigma^2}}

其中， $\mu$ 是均值， $\sigma$ 是标准差。

代码示例

下面的代码展示了如何绘制正态分布的概率密度函数。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 均值和标准差
mu, sigma = 0, 1

# x值范围
x = np.linspace(-5, 5, 1000)

# 计算概率密度
y = norm.pdf(x, mu, sigma)

# 绘图
plt.plot(x, y)
plt.title('标准正态分布的概率密度函数')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.grid()
plt.show()

总结

在今天的教程中，我们了解了离散随机变量和连续随机变量的定义、特点及它们各自的概率分布形式。在下一篇中，我们将进一步讨论累积分布函数（CDF）与概率密度函数（PDF）之间的联系与区别。这将帮助我们更好地理解随机变量的性质及其在实际问题中的应用。

希望这一讲能帮助你在概率论的学习中更进一步！

Jupyter AI

5 AI必备概率论小白教程：生成随机变量与分布之离散随机变量与连续随机变量

离散随机变量

定义

概率分布

案例：掷骰子

代码示例

连续随机变量

定义

概率密度函数

案例：正态分布

代码示例

总结

📊AI 概率必备 (滚动鼠标查看)