15 特征值的定义与计算

在上一篇中,我们讨论了线性方程组,包括齐次与非齐次方程组的相关内容。接下来,我们将聚焦于特征值及其计算,这是理解特征向量的基础。特征值和特征向量在机器学习、计算机视觉和量子力学等领域都有重要应用,因此掌握它们既是线性代数学习的重要一环,也是AI研究的基本功。

特征值的定义

在数学中,给定一个线性变换,由矩阵表示,特征值是这个矩阵的某些特性。具体来说,设有一个方阵 $A$,一个非零向量 $\mathbf{v}$ 叫做 $A$ 的特征向量,如果存在一个数 $\lambda$,使得下式成立:

$$
A\mathbf{v} = \lambda \mathbf{v}
$$

在上面的等式中,$\lambda$ 被称为特征值(Eigenvalue),$\mathbf{v}$ 被称为特征向量(Eigenvector)。直观上,特征向量是在应用矩阵 $A$ 时方向不变,而特征值则表示在该方向上的拉伸或压缩程度。

特征值的几何解释

几何上,特征值和特征向量可以看作是线性变换的“固有性质”。比如,如果我们把一个二维平面上的向量视为一个点,当我们用一个矩阵 $A$ 去变换这个点时,大部分点都会改变方向和长度。然而,某些特定的方向(即特征向量)上的点,在变换后仍然沿着原来的方向,只是长度有所改变,长度变化的倍数就是这个方向的特征值。

特征值的计算

特征值的计算涉及特征多项式的求解,详述如下:

  1. 特征多项式:首先,我们需要计算矩阵 $A$ 的特征多项式,这是通过以下行列式得到的:

$$
\text{det}(A - \lambda I) = 0
$$

这里,$I$ 是与 $A$ 同阶的单位矩阵,$\lambda$ 是特征值。这一方程的解 $\lambda$ 就是矩阵 $A$ 的特征值。

  1. 求解步骤
    • 计算 $A - \lambda I$,并求其行列式。
    • 将行列式设为0,得到一个关于 $\lambda$ 的多项式。
    • 求出该多项式的根,这些根即为特征值。

示例

假设我们有一个矩阵:

$$
A = \begin{pmatrix}
2 & 1 \
1 & 2
\end{pmatrix}
$$

计算特征值的步骤如下:

  1. 计算 $A - \lambda I$:

$$
A - \lambda I = \begin{pmatrix}
2 - \lambda & 1 \
1 & 2 - \lambda
\end{pmatrix}
$$

  1. 求行列式:

$$
\text{det}(A - \lambda I) = (2 - \lambda)(2 - \lambda) - 1 \cdot 1 = (2 - \lambda)^2 - 1
$$

  1. 设行列式为0:

$$
(2 - \lambda)^2 - 1 = 0
$$

  1. 解这个方程:

$$
(2 - \lambda)^2 = 1 \
2 - \lambda = \pm 1 \
\lambda_1 = 3, \lambda_2 = 1
$$

因此,矩阵 $A$ 的特征值为 $\lambda_1 = 3$ 和 $\lambda_2 = 1$。

Python代码示例

下面是使用 Python 中的 numpy 库计算特征值的示例代码:

1
2
3
4
5
6
7
8
9
10
import numpy as np

# 定义矩阵
A = np.array([[2, 1],
[1, 2]])

# 计算特征值
eigenvalues, eigenvectors = np.linalg.eig(A)

print("特征值:", eigenvalues)

运行后,代码输出将是特征值的数组,应该会得到类似于 [3. 1.] 的结果。

总结

在本篇中,我们了解到特征值的定义及其几何意义,同时详细介绍了如何通过特征多项式来计算特征值。这些概念将是我们在下篇中讨论特征向量的基础。为了更好地理解这些理论,实践中的例子和代码实现是非常重要的,鼓励读者反复练习。下一篇将继续探讨特征向量的定义及其计算方法。

15 特征值的定义与计算

https://zglg.work/ai-linear-you-need/15/

作者

IT教程网(郭震)

发布于

2024-08-10

更新于

2024-08-10

许可协议

分享转发

交流

更多教程加公众号

更多教程加公众号

加入星球获取PDF

加入星球获取PDF

打卡评论