在统计学中,随机变量
是一个重要的概念。它用于将随机实验的结果映射到实数上。简单来说,随机变量是一个变量,其值是由随机事件决定的。
随机变量的定义
随机变量分为两类:
离散随机变量(Discrete Random Variable):其可能取值是有限或可数无限的。常用的例子包括掷骰子的结果、抽奖的号码等。
例如,掷一个六面的骰子,随机变量 $X$ 表示显示的点数,$X$ 可能的取值为 {1, 2, 3, 4, 5, 6}。
连续随机变量(Continuous Random Variable):其可能取值在一个区间内,可以有无穷多个值。常见的例子包括身高、体重等。
例如,随机变量 $Y$ 表示某个班级学生的身高,$Y$ 可以取任意实数值,可能的取值区间为 (150, 200) cm。
概率分布
随机变量的下一个重要概念是其概率分布
。概率分布描述了随机变量取各个值的概率。
离散随机变量的概率分布
对于离散随机变量,我们可以使用概率质量函数(PMF)来描述其概率分布。
例子:掷骰子的概率分布
假设我们掷一枚公平的六面骰子,那么随机变量 $X$ 的概率分布可以表示为:
- $P(X=1) = \frac{1}{6}$
- $P(X=2) = \frac{1}{6}$
- $P(X=3) = \frac{1}{6}$
- $P(X=4) = \frac{1}{6}$
- $P(X=5) = \frac{1}{6}$
- $P(X=6) = \frac{1}{6}$
我们可以用Python代码来模拟这个实验:
1 2 3 4 5 6 7 8 9 10 11 12 13
| import numpy as np import matplotlib.pyplot as plt
results = np.random.randint(1, 7, 1000)
plt.hist(results, bins=np.arange(0.5, 7.5, 1), density=True) plt.xticks(range(1, 7)) plt.xlabel('点数') plt.ylabel('概率') plt.title('掷骰子的概率分布') plt.show()
|
连续随机变量的概率分布
对于连续随机变量,我们使用概率密度函数(PDF)。PDF 描述了随机变量在每一点的“密度”。
例子:身高的概率分布
假设某班级的学生身高服从正态分布,均值为 170 cm,标准差为 10 cm。可以用概率密度函数来描述其分布:
$$
f(y) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(y - \mu)^2}{2\sigma^2}}
$$
在这里,$\mu = 170$, $\sigma = 10$。
我们可以使用Python绘制这个分布:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm
mu, sigma = 170, 10
x = np.linspace(140, 200, 100) y = norm.pdf(x, mu, sigma)
plt.plot(x, y) plt.title('身高的概率密度函数') plt.xlabel('身高 (cm)') plt.ylabel('概率密度') plt.grid() plt.show()
|
期望与方差
随机变量的另一个重要属性是其期望
和方差
。
期望
期望
(或均值)是随机变量的加权平均值,表示随机变量的中心位置。
$$
E(X) = \sum_{i} x_i \cdot P(X = x_i)
$$
$$
E(Y) = \int_{-\infty}^{\infty} y \cdot f(y) dy
$$
方差
方差
衡量随机变量取值的离散程度。公式如下:
$$
Var(X) = E[(X - E(X))^2]
$$
$$
Var(Y) = \int_{-\infty}^{\infty} (y - E(Y))^2 \cdot f(y) dy
$$
例子:骰子的期望和方差
对于之前的掷骰子例子,期望可以计算为:
$$
E(X) = \sum_{i=1}^{6} i \cdot \frac{1}{6} = 3.5
$$
方差可以通过公式得到:
$$
Var(X) = E(X^2) - (E(X))^2
$$
$$
E(X^2) = \sum_{i=1}^{6} i^2 \cdot \frac{1}{6} = \frac{91}{6} \approx 15.17
$$
$$
Var(X) = 15.17 - (3.5)^2 \approx 2.92
$$
通过以上内容,我们可以更好地理解随机变量的概念,以及如何在实际问题中应用这些知识。随机变量为我们分析和理解随机现象提供了一个强大的工具。