12 概率基础之随机变量

在我们了解了常见概率分布的基础上,接下来将深入探讨一个核心概念:随机变量。随机变量是统计学中用于描述不确定性的工具,它将随机实验的结果与数值对应起来。本文将详细介绍随机变量的定义、类型、性质、以及一些实际案例,以便读者能够更好地理解这一重要概念。

1. 随机变量的定义

随机变量是一个函数,它将每一个可能的实验结果映射为一个数值。可以理解为,随机变量通过特定的方式对不确定性进行量化。用数学语言来表达:

  • 如果 $\Omega$ 是样本空间,则随机变量 $X$ 是一个从 $\Omega$ 映射到实数集 $\mathbb{R}$ 的函数:
    $$
    X: \Omega \rightarrow \mathbb{R}
    $$

例子:

考虑一次掷骰子的实验。设 $X$ 是掷出结果的随机变量。那么:

  • 如果掷出的是 1,$X=1$;
  • 如果掷出的是 2,$X=2$;
  • 如果掷出的是 6,$X=6$。

对此我们可以计算出 $X$ 的概率分布,每个结果的概率都是 $\frac{1}{6}$。

2. 随机变量的类型

随机变量主要分为两大类:离散随机变量连续随机变量

2.1 离散随机变量

离散随机变量是指其取值为可数的,通常是整数。它可以取有限个或可数无限个值。例如:

  • 投掷一枚硬币,记录正面朝上的次数。
  • 参加考试的学生人数。

离散随机变量的概率分布可以用概率质量函数(PMF)来表示,记作 $P(X = x)$。

例子:

在掷骰子的例子中,$X$(掷出的点数)是离散随机变量,其概率质量函数为:
$$
P(X = k) = \frac{1}{6} \quad (k = 1, 2, 3, 4, 5, 6)
$$

2.2 连续随机变量

连续随机变量是指其取值为不可数的,通常是在某个区间内的实数。它的每个可能的取值对应的“概率”实际上是一个区间,因此使用概率密度函数(PDF)来描述,记作 $f_X(x)$。

例子:

假设我们测量一个人的身高,$H$ 是身高的随机变量。$H$ 可以在某个范围内(如 150 cm 到 200 cm)取任何值,其概率密度函数可能是:

$$
f_H(h) = k \cdot h \quad (150 \leq h \leq 200)
$$

其中 $k$ 是一个常数,用于确保整体面积为 1。

3. 随机变量的性质

随机变量有几个重要的性质,包括期望值 (期望) 和方差 (方差)。

3.1 期望值

期望值是对随机变量取值的加权平均,反映了随机变量的中心位置。

  • 离散随机变量的期望值定义为:
    $$
    E(X) = \sum_{i} x_i P(X = x_i)
    $$
  • 连续随机变量的期望值定义为:
    $$
    E(X) = \int_{-\infty}^{\infty} x f_X(x) , dx$$

3.2 方差

方差是量度随机变量取值离散程度的重要指标,计算方式为:

  • 离散随机变量的方差定义为:
    $$
    Var(X) = E[(X - \mu)^2] = E(X^2) - [E(X)]^2
    $$

  • 连续随机变量的方差定义为:
    $$
    Var(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f_X(x) , dx
    $$

其中 $\mu = E(X)$。

例子:

对于掷骰子的随机变量 $X$,其期望值和方差可以计算如下:

  • 期望值:
    $$
    E(X) = \sum_{k=1}^{6} k \cdot P(X = k) = \sum_{k=1}^{6} k \cdot \frac{1}{6} = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5
    $$

  • 方差:
    $$
    Var(X) = E(X^2) - (E(X))^2 = \frac{1^2 + 2^2 + 3^2 + 4^2 + 5^2 + 6^2}{6} - (3.5)^2 = \frac{91}{6} - 12.25 \approx 2.9167
    $$

4. 代码示例

下面是一个使用 Python 计算离散随机变量期望值和方差的简单代码示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import numpy as np

# 定义概率质量函数
values = np.array([1, 2, 3, 4, 5, 6])
probabilities = np.array([1/6] * 6)

# 计算期望
expected_value = np.sum(values * probabilities)
print("期望值 E(X):", expected_value)

# 计算方差
expected_value_sq = np.sum(values**2 * probabilities)
variance = expected_value_sq - expected_value**2
print("方差 Var(X):", variance)

运行以上代码将输出掷骰子的期望值和方差。

总结

在本文中,我们探讨了随机变量的定义、类型及其性质。理解随机变量的概念是理解更复杂的统计推断的基础。在下一篇中,我们将更深入地探讨推断统计中的点估计与区间估计,这将为分析随机数据提供更具体的方法和工具。希望您继续关注我们系列教程!

12 概率基础之随机变量

https://zglg.work/statistics-zero/12/

作者

IT教程网(郭震)

发布于

2024-08-10

更新于

2024-08-10

许可协议

分享转发

交流

更多教程加公众号

更多教程加公众号

加入星球获取PDF

加入星球获取PDF

打卡评论