5 AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量
在上一讲中,我们探讨了随机变量
的定义。随机变量是从某个随机试验中获取的一种量化结果。现在,我们将讨论的主题是离散随机变量
与连续随机变量
,这两者是理解概率分布和随机过程的重要基础。
离散随机变量
定义
离散随机变量
是指其取值为可数(有限或无限可数)的随机变量。也就是说,离散随机变量的可能取值可以列表列出。例如,掷一枚公平的六面骰子时,随机变量 表示骰子上显示的点数, 的可能取值为 {1, 2, 3, 4, 5, 6}。
概率分布
离散随机变量的概率分布
常用概率质量函数
(PMF)来描述。对于离散随机变量 ,其概率质量函数定义为:
其中, 表示 取值为 的概率。
案例:掷骰子
假设我们进行一次掷骰子实验,定义随机变量 为掷出的点数。我们有:
这些概率满足 ,并且所有可能的概率之和等于1,即:
代码示例
下面的代码使用Python中的numpy
库模拟掷骰子的过程,并生成对应的概率分布。
import numpy as np
import matplotlib.pyplot as plt
# 模拟掷骰子1000次
np.random.seed(0)
dice_rolls = np.random.randint(1, 7, size=1000)
# 计算概率分布
values, counts = np.unique(dice_rolls, return_counts=True)
probabilities = counts / len(dice_rolls)
# 绘图
plt.bar(values, probabilities)
plt.xticks(values)
plt.xlabel('点数')
plt.ylabel('概率')
plt.title('掷骰子的概率分布')
plt.show()
连续随机变量
定义
连续随机变量
是指其取值为所有实数的随机变量。由于连续随机变量可以取无限多个值,因此其概率用概率密度函数
(PDF)来描述,而不是简单的概率值。
概率密度函数
对于连续随机变量 ,其概率密度函数 定义为:
这里, 表示随机变量 取值在区间 内的概率。
案例:正态分布
考虑一个典型的连续随机变量——正态分布(也称为高斯分布)。它的概率密度函数形式为:
其中, 是均值, 是标准差。
代码示例
下面的代码展示了如何绘制正态分布的概率密度函数。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# 均值和标准差
mu, sigma = 0, 1
# x值范围
x = np.linspace(-5, 5, 1000)
# 计算概率密度
y = norm.pdf(x, mu, sigma)
# 绘图
plt.plot(x, y)
plt.title('标准正态分布的概率密度函数')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.grid()
plt.show()
总结
在今天的教程中,我们了解了离散随机变量
和连续随机变量
的定义、特点及它们各自的概率分布形式。在下一篇中,我们将进一步讨论累积分布函数
(CDF)与概率密度函数
(PDF)之间的联系与区别。这将帮助我们更好地理解随机变量的性质及其在实际问题中的应用。
希望这一讲能帮助你在概率论的学习中更进一步!