特征值和特征向量
特征值、特征向量的由来
给定矩阵
在这一过程中,我们对一些特殊的向量很感兴趣,他们在输入(
对这个式子,我们试着计算特征值为
的特征向量,此时有 ,也就是特征值为 的特征向量应该位于 的零空间中。 也就是说,如果矩阵是奇异的,那么它将有一个特征值为
。 我们再来看投影矩阵
的特征值和特征向量。用向量 乘以投影矩阵 得到投影向量 ,在这个过程中,只有当 已经处于投影平面(即 的列空间)中时, 与 才是同向的,此时 投影前后不变( )。 即在投影平面中的所有向量都是投影矩阵的特征向量,而他们的特征值均为
。 再来观察投影平面的法向量,也就是投影一讲中的
向量。我们知道对于投影,因为 ,所以 ,即特征向量 的特征值为 。 于是,投影矩阵的特征值为
。 再多讲一个例子,二阶置换矩阵
,经过这个矩阵处理的向量,其元素会互相交换。 那么特征值为
的特征向量(即经过矩阵交换元素前后仍然不变)应该型为 。 特征值为
的特征向量(即经过矩阵交换元素前后方向相反)应该型为 。
再提前透露一个特征值的性质:对于一个
在上面二阶转置矩阵的例子中,如果我们求得了一个特征值
求解
对于方程
观察
这样一来,方程中就没有
现在计算一个简单的例子,
,再来说一点题外话,这是一个对称矩阵,我们将得到实特征值,前面还有置换矩阵、投影矩阵,矩阵越特殊,则我们得到的特征值与特征向量也越特殊。看置换矩阵中的特征值,两个实数 ,而且它们的特征向量是正交的。 回到例题,计算
,也就是对角矩阵平移再取行列式。原式继续化简得 。可以看到一次项系数 与矩阵的迹有关,常数项与矩阵的行列式有关。 继续计算特征向量,
,显然矩阵是奇异的(如果是非奇异说明特征值计算有误),解出矩阵的零空间 ;同理计算另一个特征向量, ,解出矩阵的零空间 。 回顾前面转置矩阵的例子,对矩阵
有 。看转置矩阵 与本例中的对称矩阵 有什么联系。 易得
,两个矩阵特征值相同,而其特征值刚好相差 。也就是如果给一个矩阵加上 ,则它的特征值会加 ,而特征向量不变。这也很容易证明,如果 ,则 ,所以 还是原来的 ,而 变为 。
接下来,看一个关于特征向量认识的误区:已知
再来看旋转矩阵的例子,旋转
的矩阵 (将每个向量旋转 ,用 表示因为旋转矩阵是正交矩阵中很重要的例子)。 上面提到特征值的一个性质:特征值之和等于矩阵的迹;现在有另一个性质:特征值之积等于矩阵的行列式。$$\prod_{i=1}^n\lambda_i=\det A$$
对于
矩阵,有 ,再来思考特征值与特征向量的由来,哪些向量旋转 后与自己平行,于是遇到了麻烦,并没有这种向量,也没有这样的特征值来满足前面的方程组。 我们来按部就班的计算,
,于是特征值为 ,我们看到这两个值满足迹与行列式的方程组,即使矩阵全是实数,其特征值也可能不是实数。本例中即出现了一对共轭负数,我们可以说,如果矩阵越接近对称,那么特征值就是实数。如果矩阵越不对称,就像本例, ,这是一个反对称的矩阵,于是我得到了纯虚的特征值,这是极端情况,通常我们见到的矩阵是介于对称与反对称之间的。 于是我们看到,对于好的矩阵(置换矩阵)有实特征值及正交的特征向量,对于不好的矩阵(
旋转矩阵)有纯虚的特征值。 再来看一个更糟的情况,
,这是一个三角矩阵,我们可以直接得出其特征值,即对角线元素。来看如何得到这一结论的: ,于是 。而我们说这是一个糟糕的状况,在于它的特征向量。 带入特征值计算特征向量,带入
得 ,算出一个特征值 ,当我们带入第二个特征值 时,我们无法得到另一个与 线性无关的特征向量了。 而本例中的矩阵
是一个退化矩阵(degenerate matrix),重复的特征值在特殊情况下可能导致特征向量的短缺。
这一讲我们看到了足够多的“不好”的矩阵,下一讲会介绍一般情况下的特征值与特征向量。