CICC科普栏目|如何理解矩阵的特征值问题?

表示。我们来检查是否存在实数𝜆和非零实向量(𝑥, 𝑦)使得

上述方程等价于联立线性方程组−𝑦= λ𝑥和𝑥 = 𝜆𝑦。由此得𝑥 = −𝜆2𝑥。若𝑥 ≠ 0,则𝜆2+ 1 = 0,它在实数范围内没有解。若𝑥= 0,因(𝑥, 𝑦) ≠ (0, 0),则𝑦 ≠0。同样的代换逻辑用在𝑦上(𝑦 = −𝜆2𝑦),也导出𝜆2+ 1 = 0。所以上述旋转矩阵𝐴在实数域内不存在特征值,自然也没有对应的特征向量了。

即便是从前没有学过矩阵理论的读者,也可能已经想象出了走出困境的方法:在复数范围里求解特征值问题,理由是 1806 年被业余数学家阿尔冈(Jean-Robert Argand,1768-1822)首次无漏洞证明的代数基本定理“非常数单变量多项式至少有一个复数根”。(在这之前多位著名数学家如欧拉和拉格朗日都给出了漏洞不一的“证明”,其中“数学王子”高斯(Carl Friedrich Gauss,1777-1855)于 22岁时放进其博士论文的证明漏洞最小,但其中的“拓扑漏洞”要等到 121 年后才被一位 27 岁的俄罗斯数学家奥斯特罗夫斯基(Alexander Markowich Ostrowski,1893-1986)完全填补,从中可见复数的神秘、深奥和魅力。)

所以,从现在开始,我们在复数域上研究矩阵特征值问题。令𝐴为一个𝑛阶复方阵,即𝐴的每个元素都是复数。自然每一个实矩阵也是复矩阵。将𝑛维欧几里得空间𝑅𝑛中的实向量的每个实数分量换成复数,得到的向量空间称为𝑛维酉空间,记成𝐶𝑛,其中两个复向量𝑧= (𝑧1, … , 𝑧𝑛)和𝑤= (𝑤1, … , 𝑤𝑛)的内积定义为

这里的两个向量𝑧和𝑤都被看成为列向量,上标记号“∗”表示对矩阵实施的“共轭转置”运算,即将矩阵转置(行变成列)后的所有元素求其共轭复数。酉空间𝐶𝑛由上述内积诱导出的2-范数

也称为酉范数。和欧几里得空间𝑅𝑛中的正交概念相仿,在酉空间𝐶𝑛里,如果向量𝑧和𝑤的内积为零,即𝑤∗𝑧 = 0,则说它们是彼此正交的,用符号𝑧 ⊥ 𝑤表示。

给定的𝑛阶复矩阵𝐴定义了线性算子𝐴: 𝐶𝑛→ 𝐶𝑛。如果存在一个复数𝜆和非零复向量𝑧使得𝐴𝑧 = 𝜆z,则称𝜆为𝐴的一个特征值,而𝑧为𝐴的与特征值𝜆相关的一个特征向量。

回到刚才考虑过的90度旋转矩阵𝐴,它被视为把2维酉空间𝐶2映到自身的复域上的一个线性算子。与之前只考虑实数域情形不一样的是,此时,特征值方程𝜆2+ 1 = 0在复数域中有两个根𝑖和−𝑖,因此这个被看成复方阵的2阶实方阵𝐴有且仅有两个特征值。此外,这两个虚数特征值还彼此共轭。通过求解对应于𝑖的线性方程组−𝑦=i𝑥及𝑥= 𝑖𝑦和对应于−𝑖的线性方程组−𝑦=−𝑖𝑥及𝑥=−𝑖𝑦,我们获得与特征值𝑖相关的一个复特征向量(1, −𝑖)及与特征值−𝑖相关的一个复特征向量(1, 𝑖)。仔细观察后,又一个现象出现了:对应于相异特征值的特征向量(1, −𝑖)和(1, 𝑖)彼此正交。我们将在下一篇文章中解释为什么。

再一次检视上段两组关于2维特征向量两分量𝑥和𝑦的方程,容易发现,它们都是齐次线性方程组,即如果将它们分别改写成“标准形式”,就是

𝑖𝑥+ 𝑦= 0, 𝑥− 𝑖𝑦= 0;𝑖𝑥− 𝑦= 0, 𝑥+ 𝑖𝑦= 0。

这类方程组有个好性质,即如果(𝑥1, 𝑦1)和(𝑥2, 𝑦2)都是方程组的解,则它们的所有“线性组合”也是同一个方程组的解,即对任意复数𝑎1和𝑎2,向量

都满足该方程组。由此推出,虽然只有两个特征值,但每个特征值都率领了由无限多个士兵组成的特征向量队伍。这说明,对应于同一个特征值的所有特征向量全体,再插进零向量,这个集合将构成一个向量空间。因为如此构造的向量空间是𝐶2的子集,它被叫做𝐶2的子空间。

特征多项式与凯莱-哈密尔顿定理

熟悉了上面这个简单例子,我们就可以讨论一般矩阵特征值问题的基本性质。设𝐴= (𝑎𝑖𝑗)为一𝑛阶复矩阵。根据特征值问题的定义。复数𝜆是方阵𝐴的一个特征值意味着关于未知复向量𝑥的方程𝐴𝑥 = 𝜆𝑥有非零解。将这个方程改写成与之等价的齐次方程形式

(𝜆𝐼−𝐴)𝑥=0,

其中𝐼是𝑛阶的单位矩阵,运用以前学过的矩阵是否可求逆的语言(𝜆是𝐴的特征值当且仅当矩阵𝜆𝐼 − 𝐴是无逆可求的(因为由特征值的定义,𝜆是𝐴的特征值等价于性质“算子𝜆𝐼 − 𝐴不是单射”,因而它的逆矩阵不存在)。而矩阵无逆的一个简单判别准则就是它的行列式等于零。方阵𝐵的行列式一般简洁地写成|𝐵|或 det𝐵,其中的det 是英文单词determinant(行列式)的前三个字母。这样一 来,我们获得𝜆是𝐴的特征值的一个充分必要条件:

定理 1. 复数𝜆是方阵𝐴的特征值当且仅当|𝜆𝐼− 𝐴|= 0。

那么,若𝐴是𝑛阶的,会有多少个𝜆满足定理 1中的等式呢?要回答这个问题,我们用𝑧取代𝜆,将上面定理中的等式变成含有未知数𝑧的方程

|𝑧𝐼−𝐴|=0。(1)

根据定理 1,方程(1)的所有解给出𝐴的所有特征值。那么到底有几个解呢?前面我们对平面上的一个2阶旋转实矩阵证实了它有两个特征值,我们再考察一般的3阶复矩阵(注意其(3, 3)元素𝑖不是虚数单位)

它所对应的特征值方程是

假定大家知道怎样计算三阶行列式,那么上述方程的左端展开后变成

其中 Tr(𝐴) = 𝑎+ 𝑒 + 𝑖是𝐴的主对角线元素之和,称为𝐴的迹。因为这个三次多项式顶多有三个相异的复数根,故𝐴顶多有三个不同的特征值。如果记入重根的重数,𝐴恰好有三个特征值。每个特征值作为多项式|𝑧𝐼− 𝐴|之根的重数(或|𝑧𝐼− 𝐴|在复数域上的因式分解中相应线性因子的幂指数)称为该特征值的代数重数。

上面对三阶矩阵的结论可以直接推广到𝑛阶矩阵𝐴。此时,由行列式的经典定义或等价的按行或按列拉普拉斯展开计算公式,易见行列式|𝑧𝐼− 𝐴|展开后是变量𝑧的𝑛阶复系数多项式,故根据代数基本定理,多项式方程|𝑧𝐼 − 𝐴| = 0至多有𝑛个相异复数根,它们就是𝐴的所有相异特征值𝜆1, … , 𝜆𝑘。如果考虑到根的重数,就恰好有𝑛个根,因此𝑛阶矩阵𝐴恰好有𝑛个(可以相同的)特征值。设

为|𝑧𝐼 − 𝐴|的唯一线性因式分解,则对𝑖= 1, … , 𝑘,线性因子𝑧 − 𝜆𝑖的幂指数𝑠𝑖称为特征值𝜆𝑖的代数重数。直接展开|𝑧𝐼− 𝐴|,考虑到𝑧𝑛−1项只能来自主对角线元素的乘积,我们可以发现该项的系数为−Tr(𝐴),其中 Tr(𝐴)是𝐴的主对角线元素之和,叫做𝐴的迹;常数项为(−1)𝑛|𝐴|。另一方面,根据多项式根与系数关系的韦达定理,对比同次项系数可知,按代数重数计(允许重复),所有特征值之和等于Tr(𝐴),所有特征值之积等于|𝐴|。确定特征值的多项式|𝑧𝐼 − 𝐴|被命名为方阵𝐴的特征多项式,而对应的方程|𝑧𝐼 − 𝐴| = 0则称为𝐴的特征方程。

方阵的一大好处是它可以代入一个多项式,即若𝑝(𝑧) = 𝑎0+ 𝑎1𝑧+ ⋯ +𝑎𝑡𝑧𝑡是一多项式,则定义𝑝(𝐴) = 𝑎0𝐼 + 𝑎1𝐴+ ⋯ + 𝑎𝑡𝐴𝑡。矩阵论中最著名的定理之一是如下的

凯莱-哈密尔顿定理:设方阵𝐴的特征多项式|𝑧𝐼− 𝐴|为𝑝(𝑧),则𝑝(𝐴) = 0。

这个定理是深入研究矩阵特征值问题的基础,或许可以称它为“矩阵特征值问题基本定理”。凯莱(Arthur Carley,1821-1895)开创了矩阵时代,而爱尔兰数学家哈密尔顿(William Rowan Hamilton,1805 -1865)则是四元数之 父。

美国数学普及家贝尔(Eric Temple Bell,1883-1960)在巨著Men of Mathematics(《大数学家》)中描绘了哈密尔顿的晚景:

“哈密尔顿于 1865年 9月 2日因痛风去世,享年 61岁。去世后,人们发现他留下了大量杂乱无章的手稿,以及大约 60本厚重的数学手稿。目前,他的著作正在编纂成册。从他手稿的状况可以看出,他生命最后三分之一的时间里,家庭生活十分艰辛:无数盛着干瘪肉排残渣的餐盘被埋在堆积如山的纸张中,还有足够一家人使用的餐具从杂乱的纸张中被翻了出来。”

2008年,杨振宁先生提到他少年时所读到的这个凄惨故事,表示他绝不能像哈密尔顿那样在太太离世后过“相当漫长的孤独生活”。这样的坚定信念给他带来了堪称幸福的二十年晚年生活。

几何重数与代数重数的关系

现在我们转向探索,当方阵𝐴的一个特征值𝜆已知后,怎样求出它所对应的全部特征向量。根据特征向量的定义,所有满足齐次线性方程组

(𝜆𝐼−𝐴)𝑥=0

的非零向量𝑥 ∈ 𝐶𝑛组成了矩阵𝐴与特征值𝜆相关的特征向量全体。根据线性方程组的解理论,这个集合和零向量单点集{0}的并集是𝐶𝑛的一个子空间,称为𝐴对应于特征值𝜆的特征子空间。试问,这个向量空间到底有多大呢?或者更精确地说,它的维数等于几?

让我们回忆与矩阵相伴的几个重要概念。设𝐵为一𝑚行𝑛列复矩阵,它的𝑛个列向量所张成的𝐶𝑚的子空间称为𝐵的值空间或列空间,记为𝑅(𝐵);它的𝑚个行向量所张成的𝐶𝑛的子空间称为𝐵的行空间中已经证明:矩阵𝐵的值空间𝑅(𝐵)的维数等于𝐵的行空间的维数,这个共同的非负整数称为𝐵的秩。在一般的线性代数教科书中,𝐵的秩被等价地定义为𝐵的非零子行列式(也叫𝐵的子式)的最大阶数。作为线性算子,矩阵𝐵的定义域𝐶𝑛中被𝐵映射到𝐶𝑚中零向量的那些向量的全体是𝐶𝑛的一个子空间,称为𝐵的零空间,记作𝑁(𝐵)。在前述的文章中我们已经证明:𝐵的零空间的维数加上𝐵的值空间的维数等于𝐵的列数。

零空间的概念马上让我们知晓,与方阵𝐴的特征值𝜆相关的特征子空间恰恰就是奇异矩阵𝜆I − A的零空间。我们把𝑁(𝜆I − A)的维数称为特征值𝜆的几何重数。这样,𝐴的任何特征值既有代数重数,也有几何重数,前者来自特征多项式的因式分解,显示出特征值的代数特色,后者来自特征子空间的尺寸,量化了特征向量群体的几何维度。那么,它们之间是否具有永恒的大小关系?

是的,同一个特征值的几何重数总是向上“仰视”代数重数的,即它小于或等于代数重数。下面是一个满足“小于”关系的简单例子。令

注意它是非对称的实矩阵,其特征多项式为

故𝐴仅有一个相异特征值0,其代数重数为2。为了得到0的几何重数,我们求解方程对应于特征值0的特征向量方程组(0𝐼 − 𝐴)𝑦 = 0,所得到的特征子空间𝑁(0𝐼 − 𝐴)是𝐶2的一维子空间{(𝑥, 0): 𝑥∈ 𝐶}。故特征值0的几何重数等于1,它确实小于代数重数2。

当然也有矩阵,其特征值的几何重数就等于代数重数,最简单的例子莫过于将上面2阶矩阵中的右上角元素换成0而成为零矩阵,它的特征多项式依然是𝑧2,但对应于唯一特征值0的特征子空间则是全空间𝐶2,因此几何重数和代数重数均为2。后面我们将给出保证两个重数相等的一个一般性的充分条件。运用本文以及我们之前文章引进的概念和方法,下面对任意方阵给出“几何重数不大于代数重数”的一个易懂证明。设𝑛阶方阵𝐴的特征值𝜆的几何重数为𝑟,代数重数为𝑠。令𝑢1, … , 𝑢𝑟为特征子空间𝑁(𝜆𝐼− 𝐴)的一个基底(即𝑢1, … , 𝑢𝑟线性无关,且它们共同张成𝑁(𝜆𝐼− 𝐴);前者意指只要𝑢1, … , 𝑢𝑟的某个线性组合𝑎1𝑢1+⋯ + 𝑎𝑟𝑢𝑟= 0,必定有𝑎1= ⋯ = 𝑎𝑟= 0,后者说𝑁(𝜆𝐼 − 𝐴)内的每一个向量都可以写成𝑢1, … , 𝑢𝑟的线性组合形式)。则可在𝐶𝑛中取𝑛 − 𝑟个线性无关的向量𝑢𝑟+1, … , 𝑢𝑛,使得将它们放在一起的𝑛个向量𝑢1, … , 𝑢𝑟, 𝑢𝑟+1, … , 𝑢𝑛构成𝐶𝑛的一个基底。以它们为列向量形成一个𝑛阶方阵𝑈= [𝑢1, … , 𝑢𝑟, … , 𝑢𝑛],则它是可逆矩阵,其逆矩阵𝑈−1满足等式𝑈−1𝑈 = 𝐼。由于行列式保持矩阵的乘积运算不变,我们也获得对应的行列式等式|𝑈−1||𝑈| = |𝑈−1𝑈| = |𝐼| = 1。

定义新矩阵𝐵= 𝑈−1𝐴U。则由

可知𝐵和𝐴有相同的特征多项式。现在,

又因为𝑈−1𝑈= 𝑈−1[𝑢1, … , 𝑢𝑟, … , 𝑢𝑛] = 𝐼= [𝑒1, … , 𝑒𝑟, … , 𝑒𝑛],我们进一步有

只要把上式中的最后那个按列划分的矩阵按前𝑟行和后𝑛− 𝑟行进行分块,使之成为一个2 × 1阶块矩阵,其上面那块的左边是个𝑟阶对角矩阵𝜆𝐼𝑟,其中𝐼𝑟是𝑟阶单位矩阵,那么我们就看出𝑈−1𝐴𝑈实际上具有2阶块上三角形状,即

其中子矩阵𝐸和𝐹分别是𝐵的子矩阵[𝑈−1𝐴𝑢𝑟+1, … , 𝑈−1𝐴𝑢𝑛]的上下部分。这样一来,

既然|𝑧𝐼− 𝐵|= |𝑧𝐼− 𝐴|,而(𝑧− 𝜆)𝑠是|𝑧𝐼− 𝐴|的素因子分解中所有线性因子𝑧−𝜆的乘积,必然(𝑧− λ)𝑟要整除(𝑧− 𝜆)𝑠,故得结论𝑟≤ 𝑠。

由于上述结论在矩阵理论中的重要性,我们把它写成定理的形式:

定理 2.设𝜆是一个方阵的特征值,则它的代数重数大于或等于它的几何重数。

当矩阵的特征值具有相等的代数重数和几何重数时,我们称这个特征值是半单的,特别地,如果代数重数等于1(此时几何重数也必定等于1,因为特征子空间至少是一维的向量空间),则说此特征值是单的。我们在文章的后面部分将给出半单特征值在“简化”矩阵结构的行动中所起的关键作用。

矩阵可对角化的充要条件

我们继续讨论特征值的基本性质。首先我们证明,对应于给定方阵不同特征值的特征向量线性无关。为了给出证明的思想,我们只考虑三个特征向量的情形。设𝜆1, 𝜆2, 𝜆3为𝑛阶方阵𝐴的相异特征值,其各自对应的特征向量分别为𝑢1, 𝑢2, 𝑢3。我们要证:假如有三个复数𝑎1, 𝑎2, 𝑎3满足𝑎1𝑢1+ 𝑎2𝑢2+ 𝑎3𝑢3= 0,则这三个数全部为零。欲证𝑎1= 0,将矩阵(𝜆2𝐼 − 𝐴)(𝜆3𝐼 − 𝐴)左乘上式两边,便得

即𝑎1(𝜆2− 𝜆1)(𝜆3− 𝜆1)𝑢1= 0。因为𝑢1为非零向量且(𝜆2− 𝜆1)(𝜆3− 𝜆1) ≠ 0,故𝑎1= 0。同理可证𝑎2= 0和𝑎3= 0。用同样的手段就能证明一般性的结论:

定理 3.设𝜆1,. . . , 𝜆𝑘为一个方阵两两不相等的特征值,其对应的特征向量分别是𝑢1,. . . , 𝑢𝑘,则𝑢1,. . . , 𝑢𝑘线性无关。

有了定理 3 作后盾,就容易推出如下的事实:假设𝑛阶方阵𝐴的所有相异特征值为𝜆1, . . . , 𝜆𝑘。对𝑖= 1, … , 𝑘,如果𝑢𝑖1, … , 𝑢𝑖𝑟𝑖为特征子空间𝑁(𝜆𝑖𝐼− 𝐴)的一个基底,那么向量𝑢11, … , 𝑢1𝑟1, 𝑢21, … , 𝑢2𝑟2, . . . , 𝑢𝑘1, … , 𝑢𝑘𝑟𝑘线性无关。

现在进一步假定这些特征值𝜆1, . . . , 𝜆𝑘都是半单的,即对𝑖= 1, … , 𝑘都有𝑟𝑖=𝑠𝑖,其中𝑟𝑖和𝑠𝑖分别为𝜆𝑖的几何重数和代数重数。那么显然有𝑟1+ 𝑟2+ ⋯ + 𝑟𝑘=𝑛。因为𝑛维向量空间中的任何𝑛个线性无关的向量都提供了这个空间的一个基底,故在所有特征值均为半单的条件下,特征向量集

是𝑛维酉空间𝐶𝑛的一个基底。这个基底有什么实用的价值吗?

价值之一是它可以用来“化简矩阵”!矩阵既然是数组,其非零元素就可能稠密分布,拥挤不堪,令人眼花缭乱,比如大数学家希尔伯特(David Hilbert,1862-1943)于 1894年引进的“希尔伯特矩阵”,它的第𝑖行第𝑗列元素是𝑖+ 𝑗− 1的倒数,所以这是个处处没有零元素的“最稠密矩阵”。数学能将复杂对象像变魔术一样化简到一目了然,而好的数学演讲者能将复杂理论解释得如水晶般透明。如果有个办法能让手中的一般矩阵摇身变为元素几乎全为零的对角矩阵,而保持原先矩阵的主要性质不变,那可是一件再好不过的事了。

对所要化简的𝑛阶方阵𝐴,只需一个条件,即它所有的特征值𝜆1, . . . , 𝜆𝑘都是半单的,我们就能完成使命。分别对应于𝜆1, . . . , 𝜆𝑘的各特征子空间的基底组成了由(2)式排列而成的𝐶𝑛基底。以这些特征向量按(2)的次序为列构造𝑛阶方阵𝑈,则它是非奇异矩阵。由

我们发现𝑈−1𝐴𝑈是对角矩阵,它的对角元素从左上到右下依次是𝑠1个𝜆1,𝑠2个𝜆2,等等,直到𝑠𝑘个𝜆𝑘。这样,我们证明出了矩阵的一个“对角矩阵标准型定理”:

定理 4.令𝜆1, . . . , 𝜆𝑘为𝑛阶方阵𝐴的所有相异特征值,并设它们都是半单的。则存在𝑛阶非奇异矩阵𝑈使得𝑈−1𝐴𝑈 = 𝐷为一𝑘阶块对角矩阵,其对角块依次是

两个同阶方阵𝐴和𝐵,如果满足关系𝑈−1𝐴𝑈= 𝐵,其中𝑈是某个非奇异矩阵,那么我们就说𝐴与𝐵是“相似”的,有时如同中学平面几何教科书上表示两个三角形相似的符号那样写成𝐴∼ 𝐵。定理 4表明,所有其特征值均为半单的矩阵相似于一个对角矩阵,它的对角元素由这些特征值按各自的重数一一排列。一个特殊的情形是,𝑛阶矩阵𝐴有𝑛个相异的特征值,这时𝐴一定相似于某个对角矩阵。

如果一个矩阵与一个对角矩阵相似,我们则说它是“可对角化”的。上面的定理 4 提供了可对角化矩阵的一个充分条件。反过来,只要给定的矩阵𝐴相似于一个对角矩阵,则它的所有特征值都是半单的。事实上,设𝐷是一对角矩阵,其对角元素为𝑑1, . . . , 𝑑𝑛(彼此可以相同),且𝑈= [𝑢1, . . . , 𝑢𝑛]是一非奇异矩阵,满足𝑈−1𝐴𝑈 = 𝐷。则前式等价于𝐴𝑈 = 𝑈𝐷。对矩阵等式

按列写出,就是𝐴𝑢𝑖= 𝑑𝑖𝑢𝑖,𝑖= 1, … , 𝑛。换言之,𝑢1, . . . , 𝑢𝑛是矩阵𝐴分别对应于特征值𝑑1, . . . , 𝑑𝑛的特征向量。既然这𝑛个线性无关的特征向量组成𝐶𝑛的一个基底,𝐴的所有相异特征值都是半单的。到此,我们论证出了如下的“等价性定理”:

定理 5. 一个方阵可对角化当且仅当它的所有相异特征值都是半单的。

相似矩阵的性质与埃尔米特矩阵初探

与三角形一样,矩阵之间的相似关系是个“等价关系”,即(i)每个方阵与它自己相似,这时建立相似关系的矩阵𝑈就可取为单位矩阵;(ii)若𝐴与𝐵相似,则𝐵与𝐴相似,这是因为𝑈−1𝐴𝑈= 𝐵隐含𝐴= 𝑈𝐵𝑈−1= (𝑈−1)-1𝐵𝑈−1;(iii)若𝐴与𝐵相似且𝐵与𝐶相似,则𝐴与𝐶相似,道理是𝑈−1𝐴𝑈= 𝐵和𝑉−1𝐵𝑉=𝐶推出

𝑉−1𝑈−1𝐴𝑈𝑉 = 𝑉−1𝐵𝑉 = 𝐶,

因此(𝑈𝑉)-1𝐴(𝑈𝑉) = 𝐶。

相似的矩阵同样具有许多共同的性质,就好比双胞胎不仅外貌酷似,连性情也往往相投。前面已经说过,如果𝐴 ∼ 𝐵,那么|𝑧𝐼 − 𝐴| = |𝑧𝐼 − 𝐵|,即它们有完全一样的特征多项式,所以它们不仅有一模一样的特征值,而且每个共同的特征值的代数重数也一样。但是它们的几何重数会有不相等的危险性吗?

答案是否定的。我们只需验证对每一个特征值,这两个相似矩阵各自对应的特征子空间之间存在一个自然得体的单射加满射关系(称为双射)。由于𝐴∼ 𝐵,存在非奇异矩阵𝑈使得𝐴= 𝑈𝐵𝑈−1。简单计算给出𝐴𝑢= 𝜆𝑢当且仅当

𝐵(𝑈−1𝑢) = 𝜆(𝑈−1𝑢)。若将𝑈−1𝑢写成𝑣,则𝑢∈ 𝑁(𝜆𝑖𝐼− 𝐴)当且仅当𝑣∈𝑁(𝜆𝑖𝐼 − 𝐵),由此,𝑢是𝐴与𝜆𝑖相关的特征向量等价于𝑈−1𝑢是𝐵与𝜆𝑖相关的特征向量。因为𝑈−1是可逆算子,它建立了𝑁(𝜆𝑖𝐼− 𝐴)和𝑁(𝜆𝑖𝐼− 𝐵)之间的一一对应。特别地,特征值𝜆𝑖关于𝐴的几何重数等于𝜆𝑖关于𝐵的几何重数。

然而,正如前面的简单例子所显示的,并非方阵的每个特征值都是半单的。事实上,只要有一个特征值是非半单的,矩阵就不可能对角化。在这个最一般的非半单特征值情形下,人们退而求其次,引进了所谓的“广义特征向量”的概念,犹如当矩阵无逆可求时可以寻觅“广义逆矩阵”(参看我们之前在《返朴》发表的文章)。披在广义特征向量身上的外衣是世界品牌“若尔当标准型”,它比半单特征值旗帜下的对角矩阵标准型只多了一条与主对角线平行、含有非零元素的次对角线,却具有丰富多彩的数学内容。未来有机会时我们将集中讨论若尔当标准型。

在下一次详细讨论埃尔米特矩阵前,我们考察一个2阶实对称矩阵的特征值问题,所取的矩阵有个在“数值代数”中最得宠的学名叫 Householder 矩阵(也叫反射矩阵;Alston Scott Householder(1904 -1993)是美国数学家,他最广为人知的数学发现就是这种形式简单、极其有用的埃尔米特矩阵𝐻 = 𝐼 − 2𝑣𝑣∗,其中𝑣的酉范数等于1;他的著作《数值分析中的矩阵理论》是一部写法独特的经典之作),如下所示:

除了多了一个负号,它几乎就是文章最早举例的那个非对称实矩阵。这个实对称矩阵的特征多项式是

故它有两个单特征值1和−1。和之前特征值为正负虚数单位的矩阵相比,这里复数被毫不留情地挤出特征值队伍之外。第一个特征值占有特征向量(1, −1),第二个特征值对应的特征向量是(1, 1)。不难发现这两个特征向量相互正交!

有了这个例子垫底,未来我们就可以深入探讨实对称矩阵、埃尔米特矩阵、正交矩阵、酉矩阵,乃至更加一般的正规矩阵的特征值问题了。返回搜狐,查看更多