13 数据分析基础之基本数据分析方法

在上篇文章中,我们探讨了推断性统计的基本概念及方法,介绍了如何利用样本数据推测总体特征。今天,我们将进一步深入数据分析的基础内容,讨论一些基本的分析方法。理解这些方法对于任何数据分析小白都是至关重要的,因为它们构成了数据分析的基础。

1. 描述性统计

描述性统计是数据分析中最基础的一个环节,它主要用于总结和描述数据的基本特征。我们可以主要通过以下几个方面来开展描述性统计:

1.1 中心趋势的测量

在描述性统计中,最常见的中心趋势测量指标包括:

  • 均值(mean):所有数据的算术平均值。计算公式为:

$$
\text{Mean} = \frac{\sum_{i=1}^{n} x_i}{n}
$$

  • 中位数(median):将所有数据点从小到大排序后,位于中间位置的值。如果数据量为偶数,则取中间两个值的平均。

  • 众数(mode):数据集中出现频率最高的值。

案例:

假设我们有一组数据:[2, 3, 5, 7, 7, 8, 10]

  • 均值:$(2 + 3 + 5 + 7 + 7 + 8 + 10) / 7 = 6.14$(约)
  • 中位数:由于数据有7个,故中位数是第4个数,即$7$。
  • 众数:$7$出现次数最多。

1.2 离散程度的测量

离散程度衡量数据的变动情况,常用的指标有:

  • 方差(variance):数据偏离均值的程度,计算公式为:

$$
\text{Variance} = \frac{\sum_{i=1}^{n} (x_i - \text{Mean})^2}{n}
$$

  • 标准差(standard deviation):方差的平方根,表示数据的离散程度。

  • 极差(range):数据集中最大值与最小值的差值。

案例:

继续使用上面的数据集[2, 3, 5, 7, 7, 8, 10],我们可以计算方差和标准差。

  • 均值为$6.14$,则方差为:

$$
\text{Variance} = \frac{(2-6.14)^2 + (3-6.14)^2 + (5-6.14)^2 + (7-6.14)^2 + (7-6.14)^2 + (8-6.14)^2 + (10-6.14)^2}{7}
$$

  • 设置代码来计算上述结果:
1
2
3
4
5
6
7
8
9
10
import numpy as np

data = [2, 3, 5, 7, 7, 8, 10]
mean = np.mean(data)
variance = np.var(data)
std_dev = np.std(data)

print("均值:", mean)
print("方差:", variance)
print("标准差:", std_dev)

2. 数据分布分析

数据分布分析是指通过不同的图表和统计方法了解数据的分布特征。常用的方法有以下几种:

2.1 直方图

直方图用于展示数据的频数分布情况,帮助我们观察数据的分布形态,如正态分布、偏态分布等。

代码示例:

1
2
3
4
5
6
7
import matplotlib.pyplot as plt

plt.hist(data, bins=5, edgecolor='black')
plt.title('数据直方图')
plt.xlabel('数据值')
plt.ylabel('频数')
plt.show()

2.2 散点图

散点图主要用于呈现两个变量之间的关系,适合进行相关性分析。

代码示例:

假设我们有两个变量:X = [1, 2, 3, 4, 5]Y = [2, 3, 5, 7, 11],可以画出散点图。

1
2
3
4
5
6
7
8
X = [1, 2, 3, 4, 5]
Y = [2, 3, 5, 7, 11]

plt.scatter(X, Y)
plt.title('散点图示例')
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.show()

3. 结论

在本文中,我们探索了基本的描述性统计方法,包括中心趋势的测量、离散程度的评估,以及如何简要地进行数据分布分析。无论你是数据分析的新手,还是有一些经验的分析师,掌握这些基本方法都是至关重要的。

接下来的文章中,我们将深入探讨数据可视化的原则,这将帮助我们更有效地展示和传达数据的意义。在数据分析的旅程中,基础知识是迈向更高阶层次的第一步。希望你能通过这些知识积累自信,在数据的海洋中自由游泳!

13 数据分析基础之基本数据分析方法

https://zglg.work/data-analysis-zero/13/

作者

IT教程网(郭震)

发布于

2024-08-10

更新于

2024-08-10

许可协议

分享转发

交流

更多教程加公众号

更多教程加公众号

加入星球获取PDF

加入星球获取PDF

打卡评论