郭震 AI公众号:郭震AI

15 特征值的定义与计算

发布日期:

最近更新:

分类: AI线性代数小白

预计阅读: 4 分钟

阅读次数: 0

预计阅读4 分钟
结构重点6 个
图文要点6 张
正文规模1.8k 字
特征值的定义与计算概念图查看大图
特征值的定义与计算概念图

特征值描述矩阵沿某些特殊方向的缩放程度。它是理解降维、稳定性和深度模型行为的重要入口。

特征值的定义与计算核对图查看大图
特征值的定义与计算核对图

我会记住特征向量方向不变,特征值只是缩放倍数。方向变了,就不是那条特征方向。

在上一篇中,我们讨论了线性方程组,包括齐次与非齐次方程组的相关内容。接下来,我们将聚焦于特征值及其计算,这是理解特征向量的基础。特征值和特征向量在机器学习、计算机视觉和量子力学等领域都有重要应用,因此掌握它们既是线性代数学习的重要一环,也是AI研究的基本功。

特征值的定义

在数学中,给定一个线性变换,由矩阵表示,特征值是这个矩阵的某些特性。具体来说,设有一个方阵 AA,一个非零向量 v\mathbf{v} 叫做 AA 的特征向量,如果存在一个数 λ\lambda,使得下式成立:

特征值计算判断卡查看大图
特征值计算判断卡

计算特征值时,先构造特征方程、求行列式、解多项式,再检查特征向量和重根情况。

Av=λvA\mathbf{v} = \lambda \mathbf{v}

在上面的等式中,λ\lambda 被称为特征值(Eigenvalue),v\mathbf{v} 被称为特征向量(Eigenvector)。直观上,特征向量是在应用矩阵 AA 时方向不变,而特征值则表示在该方向上的拉伸或压缩程度。

特征值的几何解释

几何上,特征值和特征向量可以看作是线性变换的“固有性质”。比如,如果我们把一个二维平面上的向量视为一个点,当我们用一个矩阵 AA 去变换这个点时,大部分点都会改变方向和长度。然而,某些特定的方向(即特征向量)上的点,在变换后仍然沿着原来的方向,只是长度有所改变,长度变化的倍数就是这个方向的特征值。

特征值的计算

特征值的计算涉及特征多项式的求解,详述如下:

线性代数阅读地图卡查看大图
线性代数阅读地图卡

《特征值的定义与计算》读到最后,可以把图里的流程当成检查表:问题是否明确,操作是否落地,判断标准是否能复用。

  1. 特征多项式:首先,我们需要计算矩阵 AA 的特征多项式,这是通过以下行列式得到的:
det(AλI)=0\text{det}(A - \lambda I) = 0

这里,II 是与 AA 同阶的单位矩阵,λ\lambda 是特征值。这一方程的解 λ\lambda 就是矩阵 AA 的特征值。

  1. 求解步骤
    • 计算 AλIA - \lambda I,并求其行列式。
    • 将行列式设为0,得到一个关于 λ\lambda 的多项式。
    • 求出该多项式的根,这些根即为特征值。

示例

假设我们有一个矩阵:

A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}

计算特征值的步骤如下:

  1. 计算 AλIA - \lambda I
AλI=(2λ112λ)A - \lambda I = \begin{pmatrix} 2 - \lambda & 1 \\ 1 & 2 - \lambda \end{pmatrix}
  1. 求行列式:
det(AλI)=(2λ)(2λ)11=(2λ)21\text{det}(A - \lambda I) = (2 - \lambda)(2 - \lambda) - 1 \cdot 1 = (2 - \lambda)^2 - 1
  1. 设行列式为0:
(2λ)21=0(2 - \lambda)^2 - 1 = 0
  1. 解这个方程:
(2λ)2=12λ=±1λ1=3,λ2=1(2 - \lambda)^2 = 1 \\ 2 - \lambda = \pm 1 \\ \lambda_1 = 3, \lambda_2 = 1

因此,矩阵 AA 的特征值为 λ1=3\lambda_1 = 3λ2=1\lambda_2 = 1

Python代码示例

下面是使用 Python 中的 numpy 库计算特征值的示例代码:

import numpy as np

# 定义矩阵
A = np.array([[2, 1],
              [1, 2]])

# 计算特征值
eigenvalues, eigenvectors = np.linalg.eig(A)

print("特征值:", eigenvalues)

运行后,代码输出将是特征值的数组,应该会得到类似于 [3. 1.] 的结果。

特征值的定义与计算应用复盘卡查看大图
特征值的定义与计算应用复盘卡

如果《特征值的定义与计算》还没完全消化,可以从这张卡片的四个动作重新走一遍。

特征值的定义与计算应用检查卡查看大图
特征值的定义与计算应用检查卡

回看《特征值的定义与计算》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。

总结

在本篇中,我们了解到特征值的定义及其几何意义,同时详细介绍了如何通过特征多项式来计算特征值。这些概念将是我们在下篇中讨论特征向量的基础。为了更好地理解这些理论,实践中的例子和代码实现是非常重要的,鼓励读者反复练习。下一篇将继续探讨特征向量的定义及其计算方法。

相关教程

相关入口

AI 教程总索引

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

相关内容

相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...