机器学习数学基础:21.特征值与特征向量
一、引言
在现代科学与工程的众多领域中,线性代数扮演着举足轻重的角色。其中,特征值、特征向量以及相似对角化的概念和方法,不仅是线性代数理论体系的核心部分,更是解决实际问题的有力工具。无论是在物理学中描述系统的振动模式,还是在计算机科学里进行数据降维与图像处理,它们都发挥着关键作用。本教程将深入且全面地对这些内容展开讲解,旨在帮助读者透彻理解并熟练运用相关知识。
二、基础知识准备
(一)对角矩阵的高次幂计算
在开启特征值与特征向量的探索之旅前,我们先来聚焦对角矩阵的高次幂运算。对角矩阵是一种结构特殊的方阵,其显著特点是主对角线以外的所有元素均为零。用数学语言描述,对于一个 n n n阶对角矩阵 Λ = ( λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n ) \Lambda \ = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix} Λ = λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn ,在计算它的 N N N次幂 Λ N \Lambda^N ΛN时,我们可以遵循一个简洁的规则:直接将主对角线上的各个元素替换为它们各自的 N N N次幂。即 Λ N = ( λ 1 N 0 ⋯ 0 0 λ 2 N ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n N ) \Lambda^N \ = \begin{pmatrix} \lambda_1^N & 0 & \cdots & 0 \\ 0 & \lambda_2^N & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^N \end{pmatrix} ΛN = λ1N0⋮00λ2N⋮0⋯⋯⋱⋯00⋮λnN 。
为了更直观地理解,我们来看几个具体例子。当 N = 2 N \ = 2 N =2时, Λ 2 = ( λ 1 2 0 ⋯ 0 0 λ 2 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n 2 ) \Lambda^2 \ = \begin{pmatrix} \lambda_1^2 & 0 & \cdots & 0 \\ 0 & \lambda_2^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^2 \end{pmatrix} Λ2 = λ120⋮00λ22⋮0⋯⋯⋱⋯00⋮λn2 ;当 N = 3 N \ = 3 N =3时, Λ 3 = ( λ 1 3 0 ⋯ 0 0 λ 2 3 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n 3 ) \Lambda^3 \ = \begin{pmatrix} \lambda_1^3 & 0 & \cdots & 0 \\ 0 & \lambda_2^3 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^3 \end{pmatrix} Λ3 = λ130⋮00λ23⋮0⋯⋯⋱⋯00⋮λn3 。这种计算方式的便捷性,源于对角矩阵自身独特的结构,使得高次幂的计算变得相对简单直接。
(二)对角矩阵的乘法
在矩阵乘法的运算体系中,对角矩阵的乘法展现出独特的简便性。假设我们有两个 n n n阶对角矩阵 Λ 1 = ( a 1 0 ⋯ 0 0 a 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ a n ) \Lambda_1 \ = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix} Λ1 = a10⋮00a2⋮0⋯⋯⋱⋯00⋮an 和 Λ 2 = ( b 1 0 ⋯ 0 0 b 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ b n ) \Lambda_2 \ = \begin{pmatrix} b_1 & 0 & \cdots & 0 \\ 0 & b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & b_n \end{pmatrix} Λ2 = b10⋮00b2⋮0⋯⋯⋱⋯00⋮bn 。
它们的乘积 Λ 1 Λ 2 \Lambda_1\Lambda_2 Λ1Λ2的计算过程如下:根据矩阵乘法的定义,对于一般矩阵 C = A B C \ = AB C =AB, C C C的元素 c i j = ∑ k = 1 n a i k b k j c_{ij} \ = \sum_{k \ = 1}^{n}a_{ik}b_{kj} cij =∑k =1naikbkj。但对于对角矩阵 Λ 1 \Lambda_1 Λ1和 Λ 2 \Lambda_2 Λ2,由于非对角元素均为 0 0 0,在计算乘积矩阵 Λ 1 Λ 2 \Lambda_1\Lambda_2 Λ1Λ2的元素时,只有 i = j i \ = j i =j的位置上的元素不为 0 0 0。具体来说, ( Λ 1 Λ 2 ) i i = a i b i (\Lambda_1\Lambda_2)_{ii} \ = a_ib_i (Λ1Λ2)ii =aibi,而 ( Λ 1 Λ 2 ) i j = 0 (\Lambda_1\Lambda_2)_{ij} \ = 0 (Λ1Λ2)ij =0( i ≠ j i \neq j i=j)。所以 Λ 1 Λ 2 = ( a 1 b 1 0 ⋯ 0 0 a 2 b 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ a n b n ) \Lambda_1\Lambda_2 \ = \begin{pmatrix} a_1b_1 & 0 & \cdots & 0 \\ 0 & a_2b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_nb_n \end{pmatrix} Λ1Λ2 = a1b10⋮00a2b2⋮0⋯⋯⋱⋯00⋮anbn ,即只需将对应位置的元素相乘即可得到乘积矩阵的元素。
三、特征值与特征向量的求解
(一)求解方法概述
对于一个 n n n阶方阵 A A A,我们通过构建并求解特征方程 ∣ A − λ E ∣ = 0 \vert A - \lambda E\vert \ = 0 ∣A−λE∣ =0来获取其特征值 λ \lambda λ。这里的 E E E代表 n n n阶单位矩阵, ∣ A − λ E ∣ \vert A - \lambda E\vert ∣A−λE∣是一个关于 λ \lambda λ的 n n n次多项式,被称为矩阵 A A A的特征多项式。
从行列式的计算角度来看, A − λ E A - \lambda E A−λE是将矩阵 A A A的主对角线元素分别减去 λ \lambda λ后得到的矩阵,然后计算这个新矩阵的行列式。例如,对于二阶矩阵 A = ( a 11 a 12 a 21 a 22 ) A \ = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix} A =(a11a21a12a22), A − λ E = ( a 11 − λ a 12 a 21 a 22 − λ ) A - \lambda E \ = \begin{pmatrix} a_{11} - \lambda & a_{12} \\ a_{21} & a_{22} - \lambda \end{pmatrix} A−λE =(a11−λa21a12a22−λ),其特征多项式 ∣ A − λ E ∣ = ( a 11 − λ ) ( a 22 − λ ) − a 12 a 21 \vert A - \lambda E\vert \ = (a_{11} - \lambda)(a_{22} - \lambda) - a_{12}a_{21} ∣A−λE∣ =(a11−λ)(a22−λ)−a12a21,这是一个关于 λ \lambda λ的二次多项式。
求解特征方程 ∣ A − λ E ∣ = 0 \vert A - \lambda E\vert \ = 0 ∣A−λE∣ =0,本质上就是求解这个 n n n次多项式方程的根。这些根就是矩阵 A A A的特征值,在求解过程中,可能会出现重根的情况。例如,对于矩阵 A = ( 2 1 1 2 ) A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} A =(2112),其特征多项式为 ∣ A − λ E ∣ = ∣ 2 − λ 1 1 2 − λ ∣ = ( 2 − λ ) 2 − 1 = λ 2 − 4 λ + 3 \vert A - \lambda E\vert \ = \begin{vmatrix} 2 - \lambda & 1 \\ 1 & 2 - \lambda \end{vmatrix} \ = (2 - \lambda)^2 - 1 \ = \lambda^2 - 4\lambda + 3 ∣A−λE∣ = 2−λ112−λ =(2−λ)2−1 =λ2−4λ+3。令 λ 2 − 4 λ + 3 = 0 \lambda^2 - 4\lambda + 3 \ = 0 λ2−4λ+3 =0,通过因式分解得到 ( λ − 1 ) ( λ − 3 ) = 0 (\lambda - 1)(\lambda - 3) \ = 0 (λ−1)(λ−3) =0,解得特征值 λ 1 = 1 \lambda_1 \ = 1 λ1 =1, λ 2 = 3 \lambda_2 \ = 3 λ2 =3,这里特征值没有重根。但对于一些特殊矩阵,可能会出现如二重根、三重根等情况。
(二)特征向量的求解
当我们成功求得矩阵 A A A的特征值 λ \lambda λ后,接下来要做的是将每个特征值 λ \lambda λ代入齐次线性方程组 ( A − λ E ) X = 0 (A - \lambda E)X \ = 0 (A−λE)X =0,以此来求解对应的特征向量 X X X。
以矩阵 A = ( 2 1 1 2 ) A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} A =(2112)为例,当 λ 1 = 1 \lambda_1 \ = 1 λ1 =1时,将其代入 ( A − λ 1 E ) X = 0 (A - \lambda_1 E)X \ = 0 (A−λ1E)X =0,得到 ( 2 − 1 1 1 2 − 1 ) ( x 1 x 2 ) = ( 1 1 1 1 ) ( x 1 x 2 ) = ( 0 0 ) \begin{pmatrix} 2 - 1 & 1 \\ 1 & 2 - 1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 0 \\ 0 \end{pmatrix} (2−1112−1)(x1x2) =(1111)(x1x2) =(00)。
为了求解这个齐次线性方程组,我们对系数矩阵 ( 1 1 1 1 ) \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} (1111)进行初等行变换。根据初等行变换的规则,将第二行减去第一行,可将系数矩阵化为 ( 1 1 0 0 ) \begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} (1010)。这意味着原方程组等价于 x 1 + x 2 = 0 x_1 + x_2 \ = 0 x1+x2 =0,我们令 x 2 = t x_2 \ = t x2 =t( t t t为任意非零实数),那么 x 1 = − t x_1 \ = -t x1 =−t。所以,对应的特征向量可以表示为 X 1 = t ( − 1 1 ) X_1 \ = t\begin{pmatrix} -1 \\ 1 \end{pmatrix} X1 =t(−11)( t ≠ 0 t \neq 0 t=0),这里 t t t的任意非零取值都对应着一个特征向量,它们构成了属于特征值 λ 1 = 1 \lambda_1 \ = 1 λ1 =1的特征向量空间。
当 λ 2 = 3 \lambda_2 \ = 3 λ2 =3时,代入 ( A − λ 2 E ) X = 0 (A - \lambda_2 E)X \ = 0 (A−λ2E)X =0,即 ( 2 − 3 1 1 2 − 3 ) ( x 1 x 2 ) = ( − 1 1 1 − 1 ) ( x 1 x 2 ) = ( 0 0 ) \begin{pmatrix} 2 - 3 & 1 \\ 1 & 2 - 3 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 0 \\ 0 \end{pmatrix} (2−3112−3)(x1x2) =(−111−1)(x1x2) =(00)。
同样对系数矩阵 ( − 1 1 1 − 1 ) \begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix} (−111−1)进行初等行变换,将第一行乘以 − 1 -1 −1后加到第二行,可化为 ( 1 − 1 0 0 ) \begin{pmatrix} 1 & -1 \\ 0 & 0 \end{pmatrix} (10−10)。此时方程组等价于 x 1 − x 2 = 0 x_1 - x_2 \ = 0 x1−x2 =0,令 x 2 = s x_2 \ = s x2 =s( s s s为任意非零实数),则 x 1 = s x_1 \ = s x1 =s。所以对应的特征向量为 X 2 = s ( 1 1 ) X_2 \ = s\begin{pmatrix} 1 \\ 1 \end{pmatrix} X2 =s(11)( s ≠ 0 s \neq 0 s=0)。
需要特别强调的是,在求解特征向量时,我们要找出所有的特征向量,而不仅仅是基础解系。基础解系是齐次线性方程组解空间的一组基,它能通过线性组合表示出解空间中的所有向量,但每个基础解系向量乘以非零标量后得到的向量也都是特征向量,我们需要将它们都考虑在内。
四、相似对角化
(一)相似对角化的条件
对于一个 n n n阶方阵 A A A,若存在一个可逆矩阵 P P P和一个对角矩阵 Λ \Lambda Λ,使得 P − 1 A P = Λ P^{-1}AP \ = \Lambda P−1AP =Λ成立,则称矩阵 A A A可进行相似对角化。
判断矩阵 A A A能否相似对角化,是一个关键且严谨的过程,我们需要通过求特征向量和基础解系来得出结论。具体步骤如下:
- 首先,求解特征方程 ∣ A − λ E ∣ = 0 \vert A - \lambda E\vert \ = 0 ∣A−λE∣ =0,从而得到矩阵 A A A的所有特征值 λ i \lambda_i λi( i = 1 , 2 , ⋯ , n i \ = 1, 2, \cdots, n i =1,2,⋯,n)。这些特征值是后续分析的基础。
- 对于每一个特征值 λ i \lambda_i λi,将其代入齐次线性方程组 ( A − λ i E ) X = 0 (A - \lambda_i E)X \ = 0 (A−λiE)X =0,然后求解该方程组,得到基础解系 ξ i 1 , ξ i 2 , ⋯ , ξ i r i \xi_{i1}, \xi_{i2}, \cdots, \xi_{ir_i} ξi1,ξi2,⋯,ξiri。这里的 r i r_i ri表示基础解系中向量的个数,它反映了属于特征值 λ i \lambda_i λi的线性无关特征向量的数量。
- 最后,我们检查所有特征值对应的线性无关特征向量的个数之和是否等于矩阵 A A A的阶数 n n n,即判断 ∑ i = 1 n r i = n \sum_{i \ = 1}^{n}r_i \ = n ∑i =1nri =n是否成立。如果等式成立,那么矩阵 A A A可相似对角化;若不成立,则矩阵 A A A不可相似对角化。
(二)相似对角化的步骤
- 第一步,全面且准确地求出矩阵 A A A的所有特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ1,λ2,⋯,λn。这一步是相似对角化的起始点,需要我们熟练掌握特征方程的求解方法。
- 第二步,针对每个特征值 λ i \lambda_i λi,细致地求出对应的所有线性无关的特征向量 ξ i 1 , ξ i 2 , ⋯ , ξ i r i \xi_{i1}, \xi_{i2}, \cdots, \xi_{ir_i} ξi1,ξi2,⋯,ξiri。然后,将这些特征向量按照一定的顺序按列构成可逆矩阵 P = ( ξ 11 , ⋯ , ξ 1 r 1 , ξ 21 , ⋯ , ξ 2 r 2 , ⋯ , ξ n 1 , ⋯ , ξ n r n ) P \ = (\xi_{11}, \cdots, \xi_{1r_1}, \xi_{21}, \cdots, \xi_{2r_2}, \cdots, \xi_{n1}, \cdots, \xi_{nr_n}) P =(ξ11,⋯,ξ1r1,ξ21,⋯,ξ2r2,⋯,ξn1,⋯,ξnrn)。在构建 P P P矩阵时,要确保特征向量的排列顺序与后续对角矩阵 Λ \Lambda Λ中特征值的顺序相对应。
- 第三步,构建对角矩阵 Λ = ( λ 1 ⋱ λ n ) \Lambda \ = \begin{pmatrix} \lambda_1 & & & \\ & \ddots & & \\ & & \lambda_n & \\ \end{pmatrix} Λ = λ1⋱λn 。其中,主对角线上的元素就是矩阵 A A A的特征值,并且这些特征值的顺序要与 P P P矩阵中特征向量的排列顺序严格对应。
例如,对于前面提到的矩阵 A = ( 2 1 1 2 ) A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} A =(2112),特征值 λ 1 = 1 \lambda_1 \ = 1 λ1 =1对应的特征向量取 ξ 11 = ( − 1 1 ) \xi_{11} \ = \begin{pmatrix} -1 \\ 1 \end{pmatrix} ξ11 =(−11)(当 t = 1 t \ = 1 t =1时),特征值 λ 2 = 3 \lambda_2 \ = 3 λ2 =3对应的特征向量取 ξ 21 = ( 1 1 ) \xi_{21} \ = \begin{pmatrix} 1 \\ 1 \end{pmatrix} ξ21 =(11)(当 s = 1 s \ = 1 s =1时),则 P = ( − 1 1 1 1 ) P \ = \begin{pmatrix} -1 & 1 \\ 1 & 1 \end{pmatrix} P =(−1111), Λ = ( 1 0 0 3 ) \Lambda \ = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix} Λ =(1003)。通过计算 P − 1 A P P^{-1}AP P−1AP,可以验证 P − 1 A P = Λ P^{-1}AP \ = \Lambda P−1AP =Λ,从而实现了矩阵 A A A的相似对角化。
(三) P P P矩阵的可逆性
在相似对角化的过程中, P P P矩阵的可逆性具有举足轻重的地位。从相似对角化的定义 P − 1 A P = Λ P^{-1}AP \ = \Lambda P−1AP =Λ可以看出,如果 P P P不可逆,那么 P − 1 P^{-1} P−1就不存在,也就无法满足相似对角化的形式要求,矩阵 A A A也就不能进行相似对角化。
深入分析可知, P P P矩阵是由矩阵 A A A的特征向量构成的。而 P P P矩阵可逆的充要条件是它的列向量线性无关,也就是矩阵 A A A的 n n n个特征向量线性无关。这进一步说明了 n n n阶方阵 A A A可相似对角化的充要条件是 A A A有 n n n个线性无关的特征向量。如果 A A A的特征向量线性相关,那么 P P P矩阵就不可逆,相似对角化也就无法实现。
五、特征值与相似矩阵的性质
(一)特征值的性质
- 特征值乘积与行列式的关系:特征值的乘积等于矩阵的行列式,即 ∏ i = 1 n λ i = ∣ A ∣ \prod_{i \ = 1}^{n}\lambda_i \ = \vert A\vert ∏i =1nλi =∣A∣。这一性质揭示了特征值与矩阵行列式之间的内在联系。例如,对于矩阵 A = ( 2 1 1 2 ) A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} A =(2112),我们可以通过行列式的计算公式 ∣ A ∣ = 2 × 2 − 1 × 1 = 3 \vert A\vert \ = 2\times2 - 1\times1 \ = 3 ∣A∣ =2×2−1×1 =3来计算其行列式的值。同时,我们已经求得该矩阵的特征值 λ 1 = 1 \lambda_1 \ = 1 λ1 =1, λ 2 = 3 \lambda_2 \ = 3 λ2 =3, λ 1 λ 2 = 1 × 3 = 3 \lambda_1\lambda_2 \ = 1\times3 \ = 3 λ1λ2 =1×3 =3,恰好等于矩阵 A A A的行列式 ∣ A ∣ \vert A\vert ∣A∣。这一性质在很多情况下可以帮助我们快速验证计算结果的正确性,或者通过已知的特征值来计算矩阵的行列式。
- 特征值之和与矩阵迹的关系:特征值的和等于矩阵的主对角线元素之和,矩阵的主对角线元素之和也被称为矩阵的迹,记为 t r ( A ) tr(A) tr(A),即 ∑ i = 1 n λ i = ∑ i = 1 n a i i \sum_{i \ = 1}^{n}\lambda_i \ = \sum_{i \ = 1}^{n}a_{ii} ∑i =1nλi =∑i =1naii。对于矩阵 A = ( 2 1 1 2 ) A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} A =(2112), t r ( A ) = 2 + 2 = 4 tr(A)\ =2 + 2 \ = 4 tr(A) =2+2 =4,而特征值 λ 1 = 1 \lambda_1 \ = 1 λ1 =1, λ 2 = 3 \lambda_2 \ = 3 λ2 =3, λ 1 + λ 2 = 1 + 3 = 4 \lambda_1+\lambda_2 \ = 1 + 3 \ = 4 λ1+λ2 =1+3 =4,二者相等。这一性质在判断矩阵的一些特性以及简化计算中具有重要作用。比如,当我们知道矩阵的特征值时,能快速得到矩阵的迹;反之,若已知矩阵的迹和部分特征值,也可据此求出其他特征值。
(二)相似矩阵的性质
- 特征值相同:相似矩阵具有相同的特征值。即若矩阵 A A A与 B B B相似,存在可逆矩阵 P P P使得 P − 1 A P = B P^{-1}AP \ = B P−1AP =B,那么 A A A和 B B B的特征多项式 ∣ A − λ E ∣ \vert A - \lambda E\vert ∣A−λE∣与 ∣ B − λ E ∣ \vert B - \lambda E\vert ∣B−λE∣是相等的。这是因为 ∣ B − λ E ∣ = ∣ P − 1 A P − λ E ∣ = ∣ P − 1 ( A − λ E ) P ∣ \vert B - \lambda E\vert \ = \vert P^{-1}AP - \lambda E\vert \ = \vert P^{-1}(A - \lambda E)P\vert ∣B−λE∣ =∣P−1AP−λE∣ =∣P−1(A−λE)P∣,根据行列式的性质 ∣ P − 1 ( A − λ E ) P ∣ = ∣ P − 1 ∣ ∣ A − λ E ∣ ∣ P ∣ \vert P^{-1}(A - \lambda E)P\vert \ = \vert P^{-1}\vert\vert A - \lambda E\vert\vert P\vert ∣P−1(A−λE)P∣ =∣P−1∣∣A−λE∣∣P∣,又因为 ∣ P − 1 ∣ ∣ P ∣ = 1 \vert P^{-1}\vert\vert P\vert \ = 1 ∣P−1∣∣P∣ =1,所以 ∣ B − λ E ∣ = ∣ A − λ E ∣ \vert B - \lambda E\vert \ = \vert A - \lambda E\vert ∣B−λE∣ =∣A−λE∣,进而 A A A和 B B B有相同的特征值。这一性质在矩阵的变换和分类中非常关键,相似矩阵由于特征值相同,在很多与特征值相关的性质和应用上表现出一致性。
- 行列式相等:相似矩阵的行列式相等。因为 ∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ A ∣ \vert B\vert \ = \vert P^{-1}AP\vert \ = \vert P^{-1}\vert\vert A\vert\vert P\vert \ = \vert A\vert ∣B∣ =∣P−1AP∣ =∣P−1∣∣A∣∣P∣ =∣A∣(依据行列式的性质 ∣ A B ∣ = ∣ A ∣ ∣ B ∣ \vert AB\vert \ = \vert A\vert\vert B\vert ∣AB∣ =∣A∣∣B∣以及 ∣ P − 1 ∣ ∣ P ∣ = 1 \vert P^{-1}\vert\vert P\vert \ = 1 ∣P−1∣∣P∣ =1)。这意味着相似矩阵在行列式相关的运算和性质上是等价的,例如在判断矩阵是否可逆时,相似矩阵具有相同的可逆性(因为可逆矩阵的行列式不为零,相似矩阵行列式相等,所以要么都可逆,要么都不可逆)。
- 迹相等:相似矩阵的迹相等。由于相似矩阵特征值相同,而特征值的和等于矩阵的迹,所以相似矩阵的迹必然相等。即若 A A A与 B B B相似, t r ( A ) = t r ( B ) tr(A)\ =tr(B) tr(A) =tr(B)。这一性质在一些需要比较矩阵特征的场景中很有用,比如在判断两个矩阵是否可能相似时,迹是否相等可以作为一个初步的判断条件。
六、伴随矩阵与转置矩阵的特征值
(一)伴随矩阵的特征值
对于矩阵 A A A,当 A A A可逆时,其伴随矩阵 A ∗ A^* A∗满足 A ∗ = ∣ A ∣ A − 1 A^* \ = \vert A\vert A^{-1} A∗ =∣A∣A−1。假设 λ \lambda λ是 A A A的特征值, ξ \xi ξ是对应的特征向量,即 A ξ = λ ξ A\xi \ = \lambda\xi Aξ =λξ( ξ ≠ 0 \xi\neq0 ξ=0)。两边同时左乘 A ∗ A^* A∗,得到 A ∗ A ξ = A ∗ λ ξ A^*A\xi \ = A^*\lambda\xi A∗Aξ =A∗λξ。又因为 A ∗ A = ∣ A ∣ E A^*A \ = \vert A\vert E A∗A =∣A∣E,所以 ∣ A ∣ ξ = λ A ∗ ξ \vert A\vert\xi \ = \lambda A^*\xi ∣A∣ξ =λA∗ξ,则 A ∗ ξ = ∣ A ∣ λ ξ A^*\xi \ = \frac{\vert A\vert}{\lambda}\xi A∗ξ =λ∣A∣ξ( λ ≠ 0 \lambda\neq0 λ=0)。这表明当 λ \lambda λ是可逆矩阵 A A A的非零特征值时, ∣ A ∣ λ \frac{\vert A\vert}{\lambda} λ∣A∣是 A ∗ A^* A∗的特征值。例如,若 A A A是一个 3 3 3阶可逆矩阵, ∣ A ∣ = 6 \vert A\vert \ = 6 ∣A∣ =6, A A A的一个特征值为 2 2 2,那么 A ∗ A^* A∗对应有一个特征值为 6 2 = 3 \frac{6}{2}\ =3 26 =3。
当 λ = 0 \lambda \ = 0 λ =0时,情况较为特殊。若 0 0 0是 A A A的特征值,则 A A A不可逆(因为可逆矩阵的特征值都不为 0 0 0),此时需要根据 A A A的秩等信息进一步分析 A ∗ A^* A∗的特征值情况。若 r ( A ) < n − 1 r(A)<n - 1 r(A)<n−1( n n n为矩阵 A A A的阶数),则 A ∗ A^* A∗的所有元素都为 0 0 0,即 A ∗ = 0 A^* \ = 0 A∗ =0, 0 0 0是 A ∗ A^* A∗的 n n n重特征值;若 r ( A ) = n − 1 r(A)\ =n - 1 r(A) =n−1, A ∗ A^* A∗的秩为 1 1 1, 0 0 0是 A ∗ A^* A∗的 n − 1 n - 1 n−1重特征值,另一个非零特征值可通过其他方法计算。
(二)伴随矩阵与转置矩阵特征值的关系
A A A的伴随矩阵 A ∗ A^* A∗和 A A A的转置矩阵 A T A^T AT的特征值相同。这是因为 ∣ A T − λ E ∣ = ∣ ( A − λ E ) T ∣ \vert A^T - \lambda E\vert \ = \vert (A - \lambda E)^T\vert ∣AT−λE∣ =∣(A−λE)T∣,根据行列式的性质 ∣ A T ∣ = ∣ A ∣ \vert A^T\vert \ = \vert A\vert ∣AT∣ =∣A∣,可得 ∣ ( A − λ E ) T ∣ = ∣ A − λ E ∣ \vert (A - \lambda E)^T\vert \ = \vert A - \lambda E\vert ∣(A−λE)T∣ =∣A−λE∣,所以 A A A和 A T A^T AT有相同的特征多项式,进而有相同的特征值。而 A ∗ A^* A∗与 A A A的特征值存在上述关系,所以在一定条件下, A ∗ A^* A∗和 A T A^T AT的特征值相同。这一关系在研究矩阵的各种变换和性质时提供了更多的思路和联系,例如在某些涉及伴随矩阵和转置矩阵的计算和证明中,可以利用它们特征值相同这一性质进行推导和简化。
七、矩阵 A A A及其相关矩阵的特征值与特征向量性质推导
(一) a A + b E aA + bE aA+bE( a a a、 b b b为常数 )的特征值与特征向量
已知 λ \lambda λ是矩阵 A A A的特征值, ξ \xi ξ是对应的特征向量,即 A ξ = λ ξ A\xi \ = \lambda\xi Aξ =λξ。
对于矩阵 a A + b E aA + bE aA+bE,计算 ( a A + b E ) ξ (aA + bE)\xi (aA+bE)ξ:
( a A + b E ) ξ = a A ξ + b E ξ = a λ ξ + b ξ = ( a λ + b ) ξ \begin{align*} (aA + bE)\xi&\ =aA\xi + bE\xi\\ &\ =a\lambda\xi + b\xi\\ &\ =(a\lambda + b)\xi \end{align*} (aA+bE)ξ =aAξ+bEξ =aλξ+bξ =(aλ+b)ξ
根据特征值与特征向量的定义,满足 ( a A + b E ) ξ = μ ξ (aA + bE)\xi \ = \mu\xi (aA+bE)ξ =μξ( μ \mu μ为特征值, ξ \xi ξ为特征向量)的 μ \mu μ就是 a A + b E aA + bE aA+bE的特征值,所以 a A + b E aA + bE aA+bE的特征值为 a λ + b a\lambda + b aλ+b,且特征向量与 A A A相同,为 ξ \xi ξ。这表明对矩阵 A A A进行 a a a倍缩放并加上 b b b倍单位矩阵的变换后,其特征值也相应地进行 a a a倍缩放再加上 b b b的变换,而特征向量保持不变。
(二) A n A^n An( n n n为正整数 )的特征值与特征向量
已知 A ξ = λ ξ A\xi \ = \lambda\xi Aξ =λξ,当 n = 2 n \ = 2 n =2时:
A 2 ξ = A ( A ξ ) = A ( λ ξ ) = λ A ξ = λ 2 ξ \begin{align*} A^2\xi&\ =A(A\xi)\\ &\ =A(\lambda\xi)\\ &\ =\lambda A\xi\\ &\ =\lambda^2\xi \end{align*} A2ξ =A(Aξ) =A(λξ) =λAξ =λ2ξ
假设当 n = k n \ = k n =k( k k k为正整数)时, A k ξ = λ k ξ A^k\xi \ = \lambda^k\xi Akξ =λkξ成立。
当 n = k + 1 n \ = k + 1 n =k+1时:
A k + 1 ξ = A ( A k ξ ) = A ( λ k ξ ) = λ k A ξ = λ k + 1 ξ \begin{align*} A^{k + 1}\xi&\ =A(A^k\xi)\\ &\ =A(\lambda^k\xi)\\ &\ =\lambda^k A\xi\\ &\ =\lambda^{k + 1}\xi \end{align*} Ak+1ξ =A(Akξ) =A(λkξ) =λkAξ =λk+1ξ
由数学归纳法可知,对于任意正整数 n n n, A n ξ = λ n ξ A^n\xi \ = \lambda^n\xi Anξ =λnξ。所以 A n A^n An的特征值为 λ n \lambda^n λn,特征向量为 ξ \xi ξ。这体现了矩阵幂次运算与特征值、特征向量之间的规律,矩阵 A A A的 n n n次幂的特征值是其原特征值的 n n n次幂,且特征向量在幂次变换下保持稳定。
(三) A − 1 A^{-1} A−1( A A A可逆 )的特征值与特征向量
因为 A A A可逆,且 A ξ = λ ξ A\xi \ = \lambda\xi Aξ =λξ( ξ ≠ 0 \xi\neq0 ξ=0),两边同时左乘 A − 1 A^{-1} A−1:
A − 1 A ξ = A − 1 λ ξ ξ = λ A − 1 ξ \begin{align*} A^{-1}A\xi&\ =A^{-1}\lambda\xi\\ \xi&\ =\lambda A^{-1}\xi \end{align*} A−1Aξξ =A−1λξ =λA−1ξ
由于 λ ≠ 0 \lambda\neq0 λ=0(可逆矩阵的特征值不为 0 0 0),等式两边同时除以 λ \lambda λ,得到 A − 1 ξ = 1 λ ξ A^{-1}\xi \ = \frac{1}{\lambda}\xi A−1ξ =λ1ξ。所以 A − 1 A^{-1} A−1的特征值为 1 λ \frac{1}{\lambda} λ1,特征向量为 ξ \xi ξ。这表明可逆矩阵 A A A的逆矩阵的特征值是 A A A特征值的倒数,且矩阵 A A A与其逆矩阵 A − 1 A^{-1} A−1具有相同的特征向量,反映了可逆矩阵与其逆矩阵在特征向量性质上的紧密联系。
(四) A T A^T AT( A A A的转置矩阵 )的特征值
已知 A A A和 A T A^T AT的特征多项式分别为 ∣ A − λ E ∣ \vert A - \lambda E\vert ∣A−λE∣和 ∣ A T − λ E ∣ \vert A^T - \lambda E\vert ∣AT−λE∣。
根据行列式的性质:对于任意矩阵 M M M, ∣ M T ∣ = ∣ M ∣ \vert M^T\vert \ = \vert M\vert ∣MT∣ =∣M∣。
对于 M = A − λ E M \ = A - \lambda E M =A−λE,有 ∣ A T − λ E ∣ = ∣ ( A − λ E ) T ∣ = ∣ A − λ E ∣ \vert A^T - \lambda E\vert \ = \vert (A - \lambda E)^T\vert \ = \vert A - \lambda E\vert ∣AT−λE∣ =∣(A−λE)T∣ =∣A−λE∣。
因为特征多项式相等,所以 A A A和 A T A^T AT有相同的特征值。但需要注意的是,虽然 A A A和 A T A^T AT特征值相同,它们的特征向量一般不同。这是因为矩阵转置后,其对向量的变换方式在空间中的表现有所不同,导致满足特征向量定义的向量集合通常不一致。
八、总结
本教程全面且深入地讲解了线性代数中特征值与特征向量的求解方法,包括从特征方程出发求特征值,以及通过代入方程组细致求解特征向量的过程,同时强调了求解特征向量时要涵盖所有情况。对于相似对角化,我们详细阐述了其基础概念、判断条件、具体步骤以及 P P P矩阵可逆性的重要意义。此外,还深入探讨了特征值与相似矩阵的诸多性质,以及伴随矩阵与转置矩阵特征值的特点和关系,并对矩阵 A A A及其相关矩阵的特征值与特征向量性质进行了详细推导。
特征值、特征向量以及相似对角化作为线性代数的核心内容,不仅在理论体系中占据关键地位,而且在实际应用中有着广泛的用途。希望读者通过本教程能够深入理解这些知识,熟练掌握相关的计算和判断方法,为后续在数学、物理、工程、计算机科学等多个领域的学习和研究打下坚实的基础。在学习过程中,建议读者多做练习题,通过实际操作加深对这些概念和方法的理解和运用能力。
相关文章:
机器学习数学基础:21.特征值与特征向量
一、引言 在现代科学与工程的众多领域中,线性代数扮演着举足轻重的角色。其中,特征值、特征向量以及相似对角化的概念和方法,不仅是线性代数理论体系的核心部分,更是解决实际问题的有力工具。无论是在物理学中描述系统的振动模式…...
【目标检测json2txt】label从COCO格式json文件转YOLO格式txt文件
目录 🍀🍀1.COCO格式json文件 🌷🌷2.YOLO格式txt文件 💖💖3.xml2json代码(python) 🐸🐸4.输入输出展示 🙋🙋4.1输入json 🍂🍂4.2输出txt 整理不易,欢迎一键三连!!! 送你们一条美丽的--分割线-- 🍀🍀1.COCO格式json文件 COCO数…...
强化学习之 PPO 算法:原理、实现与案例深度剖析
目录 一、引言二、PPO 算法原理2.1 策略梯度2.2 PPO 核心思想 三、PPO 算法公式推导3.1 重要性采样3.2 优势函数估计 四、PPO 算法代码实现(以 Python 和 PyTorch 为例)五、PPO 算法案例应用5.1 机器人控制5.2 自动驾驶 六、总结 一、引言 强化学习作为…...
vue-点击生成动态值,动态渲染回显输入框
1.前言 动态点击生成数值,回显输入框,并绑定。 2.实现 <template><div style"display:flex;align-items: center;flex-direction:row"><a-input:key"inputKey"v-model"uploadData[peo.field]"placehold…...
高性能 :OpenAI Triton Open-source GPU programming Language LINUX 环境配置
目录 配置triton环境cudabuild-essential带有pip的python环境直接安装pipanaconda 安装 triton 环境pip install tritonpip install torch 运行test示例vector-add.pylaunch.json 配置triton环境 cuda wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_…...
TCP 端口号为何位于首部前四个字节?协议设计的智慧与启示
知乎的一个问题很有意思:“为什么在TCP首部中要把TCP的端口号放入最开始的四个字节?” 这种问题很适合我这种搞历史的人,大年初一我给出了一个简短的解释,但仔细探究这个问题,我们将会获得 TCP/IP 被定义的过程。 文…...
HTML之JavaScript函数声明
HTML之JavaScript函数声明 1. function 函数名(){}2. var 函数名 function(){}<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…...
R 数组:高效数据处理的基础
R 数组:高效数据处理的基础 引言 在数据科学和统计分析领域,R 语言以其强大的数据处理和分析能力而备受推崇。R 数组是 R 语言中用于存储和操作数据的基本数据结构。本文将详细介绍 R 数组的创建、操作和优化,帮助读者掌握 R 数组的使用技巧…...
git服务器搭建,gitea服务搭建,使用systemclt管理服务
文章目录 页面展示使用二进制文件安装git服务下载选择架构使用wget下载安装 验证 GPG 签名服务器设置准备环境创建systemctl文件 备份与恢复备份命令 (dump)恢复命令 (restore) 页面展示 使用二进制文件安装git服务 所有打包的二进制程序均包含 SQLite,MySQL 和 Po…...
Pdf手册阅读(1)--数字签名篇
原文阅读摘要 PDF支持的数字签名, 不仅仅是公私钥签名,还可以是指纹、手写、虹膜等生物识别签名。PDF签名的计算方式,可以基于字节范围进行计算,也可以基于Pdf 对象(pdf object)进行计算。 PDF文件可能包…...
嵌入式WebRTC压缩至670K,目标将so动态库压缩至500K,.a静态库还可以更小
最近把EasyRTC的效果发布出去给各大IPC厂商体验了一下,直接就用EasyRTC与各个厂商的负责人进行的通话,在通话中,用户就反馈效果确实不错! 这两天有用户要在海思hi3516cv610上使用EasyRTC,工具链是:gcc-2024…...
百度高德地图坐标转换
百度地图和高德地图的侧重点不太一样。同样一个地名,在百度地图网站上搜索到的地点可能是商业网点,在高德地图网站上搜索到的地点可能是自然行政地点。 高德地图api 在高德地图中,搜索地名,如“乱石头川”,该地名会出…...
ES 索引结构
ES 既不像 MySQL 这样有严格的 Schema,也不像 MongoDB 那样完全无 Schema,而是介于两者之间。 1️⃣ ES 的 Schema 模式 ES 默认是 Schema-less(无模式) 的,允许动态添加字段。 但 ES 也支持 Schema(映射 …...
HPM_SDK应用本地化——基于6750evkmini
文章目录 前言一、准备工作1、下载官方的SDK2、解压SDK 二、实操1、新建目标工程文件夹2、回到SDK中将相关文件复制1、Borad文件夹2、hello_world文件夹 三、实验现象总结 前言 为什么要对sdk进行应用本地化?在嵌入式开发中我们一般将官方提供的SDK作为参考&#x…...
【deepseek-r1本地部署】
首先需要安装ollama,之前已经安装过了,这里不展示细节 在cmd中输入官网安装命令:ollama run deepseek-r1:32b,开始下载 出现success后,下载完成 接下来就可以使用了,不过是用cmd来运行使用 可以安装UI可视化界面&a…...
查询语句来提取 detail 字段中包含 xxx 的 URL 里的 commodity/ 后面的数字串
您可以使用以下 SQL 查询语句来提取 detail 字段中包含 oss.kxlist.com 的 URL 里的 commodity/ 后面的数字串: <p><img style"max-width:100%;" src"https://oss.kxlist.com//8a989a0c55e4a7900155e7fd7971000b/commodity/20170925/20170…...
堆排序
目录 堆排序(不稳定): 代码实现: 思路分析: 总结: 堆排序(不稳定): 如果想要一段数据从小到大进行排序,则要先建立大根堆,因为这样每次堆顶上都能…...
【MySQL】我在广州学Mysql 系列—— 数据备份与还原
ℹ️大家好,我是练小杰,今天周一,过两天就是元宵节了,今年元宵节各位又要怎么过呢!! 本文主要对Mysql数据库中的数据备份与还原内容进行讨论!! 回顾:👉【MySQ…...
【LeetCode Hot100 双指针】移动零、盛最多水的容器、三数之和、接雨水
双指针 1. 移动零题目描述解题思路关键思路:步骤:时间复杂度:空间复杂度: 代码实现 2. 盛最多水的容器题目解析解题思路代码实现 3. 三数之和问题描述:解题思路:算法步骤:代码实现: …...
HTML应用指南:利用POST请求获取接入比亚迪业态的充电桩位置信息
在新能源汽车快速发展的今天,充电桩的分布和可用性成为了影响用户体验的关键因素之一。比亚迪作为全球领先的新能源汽车制造商,不仅在车辆制造方面取得了卓越成就,也在充电基础设施建设上投入了大量资源。为了帮助用户更方便地找到比亚迪充电桩的位置,本篇文章,我们将探究…...
【力扣数据库知识手册笔记】索引
索引 索引的优缺点 优点1. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度(创建索引的主要原因)。3. 可以加速表和表之间的连接,实现数据的参考完整性。4. 可以在查询过程中,…...
在rocky linux 9.5上在线安装 docker
前面是指南,后面是日志 sudo dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo dnf install docker-ce docker-ce-cli containerd.io -y docker version sudo systemctl start docker sudo systemctl status docker …...
[ICLR 2022]How Much Can CLIP Benefit Vision-and-Language Tasks?
论文网址:pdf 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏向于笔记,谨慎食用 目录 1. 心得 2. 论文逐段精读 2.1. Abstract 2…...
[10-3]软件I2C读写MPU6050 江协科技学习笔记(16个知识点)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...
04-初识css
一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...
Python如何给视频添加音频和字幕
在Python中,给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加,包括必要的代码示例和详细解释。 环境准备 在开始之前,需要安装以下Python库:…...
大模型多显卡多服务器并行计算方法与实践指南
一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...
回溯算法学习
一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...
LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf
FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...
