正定矩阵和最小值
本讲我们会了解如何完整的测试一个矩阵是否正定,测试
正定性的判断
我们仍然从二阶说起,有矩阵
- 矩阵的所有特征值大于零则矩阵正定:
; - 矩阵的所有顺序主子阵(leading principal submatrix)的行列式(即顺序主子式,leading principal minor)大于零则矩阵正定:
; - 矩阵消元后主元均大于零:
; ;
大多数情况下使用4来定义正定性,而用前三条来验证正定性。
来计算一个例子:
来试试
,此时矩阵为 , ,此时的矩阵成为半正定矩阵(positive semi-definite)。矩阵奇异,其中一个特征值必为 ,从迹得知另一个特征值为 。矩阵的主元只有一个,为 。 计算
,得 这样我们得到了一个关于 的函数 ,这个函数不再是线性的,在本例中这是一个纯二次型(quadratic)函数,它没有线性部分、一次部分或更高次部分( 是线性的,但引入 后就成为了二次型)。 当
取 时,判定1、2、3都是“刚好不及格”。 我们可以先看“一定不及格”的样子,令
,矩阵为 ,二阶顺序主子式变为 ,显然矩阵不是正定的,此时的函数为 ,如果取 则有 。 如果我们把
放在直角坐标系中,图像过原点 ,当 或 或 时函数为开口向上的抛物线,所以函数图像在某些方向上是正值;而在某些方向上是负值,比如 ,所以函数图像是一个马鞍面(saddle), 点称为鞍点(saddle point),它在某些方向上是极大值点,而在另一些方向上是极小值点。(实际上函数图像的最佳观测方向是沿着特征向量的方向。) 再来看一下“一定及格”的情形,令
,矩阵为 ,行列式为 ,迹为 ,特征向量均大于零,矩阵可以通过测试。此时的函数为 ,函数在除 外处处为正。我们来看看 的图像,式子的平方项均非负,所以需要两个平方项之和大于中间项即可,该函数的图像为抛物面(paraboloid)。在 点函数的一阶偏导数均为零,二阶偏导数均为正(马鞍面的一阶偏导数也为零,但二阶偏导数并不均为正,所以),函数在改点取极小值。 在微积分中,一元函数取极小值需要一阶导数为零且二阶导数为正
。在线性代数中我们遇到了了多元函数 ,要取极小值需要二阶偏导数矩阵为正定矩阵。 在本例中(即二阶情形),如果能用平方和的形式来表示函数,则很容易看出函数是否恒为正,
。另外,如果是上面的 的情形,则有 ,如果是 的情形,则有 。 如果令
,相当于使用 平面截取该函数图像,将得到一个椭圆曲线。另外,如果在 的马鞍面上截取曲线将得到一对双曲线。 再来看这个矩阵的消元,
,这就是 ,可以发现矩阵 中的项与配平方中未知数的系数有关,而主元则与两个平方项外的系数有关,这也就是为什么正数主元得到正定矩阵。 上面又提到二阶导数矩阵,这个矩阵型为
,显然,矩阵中的主对角线元素(纯二阶导数)必须为正,并且主对角线元素必须足够大来抵消混合导数的影响。同时还可以看出,因为二阶导数的求导次序并不影响结果,所以矩阵必须是对称的。现在我们就可以计算 阶矩阵了。
接下来计算一个三阶矩阵,
- 先来计算矩阵的顺序主子式,分别为
;再来计算主元,分别为 ;计算特征值, 。 - 计算
。 - 图像是四维的抛物面,当我们在
处截取该面,将得到一个椭圆体。一般椭圆体有三条轴,特征值的大小决定了三条轴的长度,而特征向量的方向与三条轴的方向相同。
现在我们将矩阵