低秩近似之路三CR
低秩近似之路(三):CR
Author: [苏剑林]
Link: [https://zhuanlan.zhihu.com/p/3977810830]
最佳排版请看原博客:
低秩近似之路(三):CR - 科学空间|Scientific Spaces (opens new window)在https://kexue.fm/archives/10407 (opens new window)中,我们证明了SVD可以给出任意矩阵的最优低秩近似。那里的最优近似是无约束的,也就是说SVD给出的结果只管误差上的最小,不在乎矩阵的具体结构,而在很多应用场景中,出于可解释性或者非线性处理等需求,我们往往希望得到具有某些特殊结构的近似分解。
因此,从这篇文章开始,我们将探究一些具有特定结构的低秩近似,而本文将聚焦于其中的CR近似(Column-Row Approximation),它提供了加速矩阵乘法运算的一种简单方案。
问题背景
矩阵的最优
1、如果
再有其他约束,那么 最优解就是 ,其中 奇异值分解(SVD); 2、如果约定
( ),且 (或 )已经给定,那么 最优解是 (或 ),这里的 “https://kexue.fm/archives/10366 (opens new window)”。
这两个结果都有很广泛的应用,但它们都没有显式地引入
这里的
即
初步近似
如果我们将
其中
而找
我们知道,矩阵的
其中
如果笔者没有理解错,这个优化问题的精确求解是NP-Hard的,所以一般情况下只能寻求近似算法。一个可精确求解的简单例子是
所以它的最小值就是最小的
采样视角
有一些场景允许我们将式
其中
这样放宽之后,我们可以从采样视角来看待这个问题。首先我们引入任意
也就是说,
这意味着当
到目前为止,我们的理论结果跟分布
来比较不同的
等号在
对应的误差为
最优的
延伸讨论
不管是按模长排序还是按
我们可以尝试将排序的单位改为
初始化
对于
,执行:
;
; 返回
。
说白了,就是每次都从剩下的向量中挑选和模长最小的
另一个值得思考的问题是如果允许CR近似放宽为
如果
我们记
这同样可以通过伪逆写出最优解
最后一个等号假设了
现在的问题是直接套用上式的话对原始问题来说计算量太大,因为
即
文章小结
本文介绍了矩阵乘法的CR近似,这是一种具有特定行列结构的低秩近似,相比由SVD给出的最优低秩近似,CR近似具有更直观的物理意义以及更好的可解释性。