15 特征值的定义与计算

在上一篇中，我们讨论了线性方程组，包括齐次与非齐次方程组的相关内容。接下来，我们将聚焦于特征值及其计算，这是理解特征向量的基础。特征值和特征向量在机器学习、计算机视觉和量子力学等领域都有重要应用，因此掌握它们既是线性代数学习的重要一环，也是AI研究的基本功。

特征值的定义

在数学中，给定一个线性变换，由矩阵表示，特征值是这个矩阵的某些特性。具体来说，设有一个方阵 $A$ ，一个非零向量 $\mathbf{v}$ 叫做 $A$ 的特征向量，如果存在一个数 $\lambda$ ，使得下式成立：

A\mathbf{v} = \lambda \mathbf{v}

在上面的等式中， $\lambda$ 被称为特征值（Eigenvalue）， $\mathbf{v}$ 被称为特征向量（Eigenvector）。直观上，特征向量是在应用矩阵 $A$ 时方向不变，而特征值则表示在该方向上的拉伸或压缩程度。

特征值的几何解释

几何上，特征值和特征向量可以看作是线性变换的“固有性质”。比如，如果我们把一个二维平面上的向量视为一个点，当我们用一个矩阵 $A$ 去变换这个点时，大部分点都会改变方向和长度。然而，某些特定的方向（即特征向量）上的点，在变换后仍然沿着原来的方向，只是长度有所改变，长度变化的倍数就是这个方向的特征值。

特征值的计算

特征值的计算涉及特征多项式的求解，详述如下：

特征多项式：首先，我们需要计算矩阵 $A$ 的特征多项式，这是通过以下行列式得到的：

\text{det}(A - \lambda I) = 0

这里， $I$ 是与 $A$ 同阶的单位矩阵， $\lambda$ 是特征值。这一方程的解 $\lambda$ 就是矩阵 $A$ 的特征值。

求解步骤：
- 计算 $A - \lambda I$ ，并求其行列式。
- 将行列式设为0，得到一个关于 $\lambda$ 的多项式。
- 求出该多项式的根，这些根即为特征值。

示例

假设我们有一个矩阵：

A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}

计算特征值的步骤如下：

计算 $A - \lambda I$ ：

A - \lambda I = \begin{pmatrix} 2 - \lambda & 1 \\ 1 & 2 - \lambda \end{pmatrix}

求行列式：

\text{det}(A - \lambda I) = (2 - \lambda)(2 - \lambda) - 1 \cdot 1 = (2 - \lambda)^2 - 1

设行列式为0：

(2 - \lambda)^2 - 1 = 0

解这个方程：

(2 - \lambda)^2 = 1 \\ 2 - \lambda = \pm 1 \\ \lambda_1 = 3, \lambda_2 = 1

因此，矩阵 $A$ 的特征值为 $\lambda_1 = 3$ 和 $\lambda_2 = 1$ 。

Python代码示例

下面是使用 Python 中的 numpy 库计算特征值的示例代码：

import numpy as np

# 定义矩阵
A = np.array([[2, 1],
              [1, 2]])

# 计算特征值
eigenvalues, eigenvectors = np.linalg.eig(A)

print("特征值:", eigenvalues)

运行后，代码输出将是特征值的数组，应该会得到类似于 [3. 1.] 的结果。

总结

在本篇中，我们了解到特征值的定义及其几何意义，同时详细介绍了如何通过特征多项式来计算特征值。这些概念将是我们在下篇中讨论特征向量的基础。为了更好地理解这些理论，实践中的例子和代码实现是非常重要的，鼓励读者反复练习。下一篇将继续探讨特征向量的定义及其计算方法。

15 特征值的定义与计算

特征值的定义

特征值的几何解释

特征值的计算

示例

Python代码示例

总结

💬 评论

📈AI 线性代数必备 (滚动鼠标查看)