Jupyter AI

22 奇异值分解之奇异值的计算

📅发表日期: 2024-08-10

🏷️分类: AI线性代数小白

👁️阅读次数: 0

在上一篇中,我们讨论了奇异值分解(SVD)的概念,理解了为何它在数据科学和机器学习中如此重要。本篇将深入探讨如何计算奇异值,帮助你掌握这一核心技术,为后续的应用打下坚实的基础。

1. 理论基础

奇异值分解是一种矩阵分解方法,将任意矩阵AA分解为三个矩阵的乘积。具体地说,若AA是一个m×nm \times n的矩阵,则可以表示为:

A=UΣVTA = U \Sigma V^T

其中:

  • UU是一个m×mm \times m的正交矩阵;
  • Σ\Sigma是一个m×nm \times n的对角矩阵,其中包含了AA的奇异值;
  • VTV^TVV的转置,VV是一个n×nn \times n的正交矩阵。

奇异值是矩阵AA在某种意义上的“特征”,它们反映了AA的结构特征和信息。从Σ\Sigma中提取奇异值,方法如下:

  1. 计算ATAA^T AAATA A^T
  2. 获取这两个矩阵的特征值。
  3. 将特征值开平方得到奇异值。

2. 奇异值的计算步骤

为了获得奇异值,我们可以遵循这些步骤:

步骤1:计算ATAA^T A

给定一个矩阵AA,首先计算其转置矩阵ATA^T,然后计算乘积ATAA^T A。这个结果是一个n×nn \times n的矩阵。

步骤2:求特征值

然后,我们需要计算ATAA^T A的特征值λi\lambda_i。如果AA是一个m×nm \times n的矩阵,ATAA^T A将是一个n×nn \times n的矩阵,可以使用求解特征多项式的方法来找出特征值。

步骤3:计算奇异值

奇异值sis_i是特征值的非负平方根:

si=λis_i = \sqrt{\lambda_i}

对所有的特征值λi\lambda_i执行这一操作,得到的就是所有的奇异值。

3. 示例案例

我们通过一个实际的矩阵来演示如何计算奇异值。设矩阵AA为:

A=(123456)A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix}

计算步骤详解

  1. 计算ATAA^T A

    AT=(135246)A^T = \begin{pmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{pmatrix}

    所以,

    ATA=(135246)(123456)=(35444456)A^T A = \begin{pmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{pmatrix} \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix} = \begin{pmatrix} 35 & 44 \\ 44 & 56 \end{pmatrix}
  2. 求特征值:特征值λ\lambda需要解这个方程:

    det(ATAλI)=0\text{det}(A^T A - \lambda I) = 0

    这里II是单位矩阵,计算可以得到特征值为:

    λ1=91,λ2=0\lambda_1 = 91, \quad \lambda_2 = 0
  3. 计算奇异值:

    s1=λ1=919.54s_1 = \sqrt{\lambda_1} = \sqrt{91} \approx 9.54 s2=λ2=0=0s_2 = \sqrt{\lambda_2} = \sqrt{0} = 0

最终,矩阵AA的奇异值为9.54和0。

4. Python代码实现

通过Python库NumPy,我们可以轻松实现这些计算,代码如下:

import numpy as np

# 定义矩阵A
A = np.array([[1, 2], [3, 4], [5, 6]])

# 计算奇异值
U, s, VT = np.linalg.svd(A)

# 输出奇异值
print("奇异值:", s)

运行上述代码将输出:

奇异值: [9.52551809 0.51449576]

小结

本篇文章详细介绍了奇异值的计算过程,包括理论基础和实际案例,此外还用Python实现了计算奇异值的代码。这一知识对于理解奇异值分解及其应用至关重要。在下一篇中,我们将探讨奇异值分解在实际中的应用场景,例如在推荐系统和图像处理中的使用。

请持续关注我们的系列教程,深入掌握线性代数在AI中的重要性!

💬 评论

暂无评论