想知道下面图片处理中的线性代数知识么?
下面就和大家一起学习一下矩阵的特征值和相似对角化在图片压缩、降噪方面的应用。
特征值与特征向量的几何意义
从之前的学习中,我们知道方阵可以看作是对空间的线性变化,那么由特征值的定义
如果空间中存在向量,当方阵对空间做线性变换时在线照片压缩,的方向不发生改变,只有长度伸缩为原来的倍,这样的我们称为的特征向量和对应的特征值()。
相似对角化的几何意义
一般来说,如果矩阵的非零元很多的话,那么对应的线性变换表示起来会比较困难。如果我们能选取另一组空间的基,使得线性变化在这组基上等价于对角矩阵,即
其中是原本空间的基到新的基的过渡矩阵,就能很简单的表示线性变化(.)
特征值与相似对角化的现实意义
上面我们所提到的是特征值和相似对角化的几何意义。而在现实当中,特征值和特征向量一样有着其独特的应用——那就是图片压缩和去噪。
图片与矩阵的对应
我们在电子设备上随处可见的图片,其实都是由一个个小像素块组成。而图片的分辨率,也就是指这个图像是由多少个像素块组成的。分辨率为1920×1080,图像也就是由1920×1080个像素块组成的。
我们让不同颜色对应不同数字在线照片压缩,如让0对应黑色,1对应白色,我们就能把像素块的颜色都记录下来营销引流,这样下面的矩阵就和图片可以对应起来。
同样的道理,对于一个分辨率为的图片,我们就可以构建一个的矩阵来存储它。反之,对于一个的矩阵,我们也能构建一张分辨率为的图片与之对应。事实上,这也正是电子设备储存图像的原理。
实对称矩阵与图片压缩
我们来考虑一种特殊的情况。我们假设图片对应的矩阵是阶实对称矩阵。那么我们知道,可由正交矩阵对角化为对角矩阵,即
其中是矩阵的非0特征值,是的个线性无关特征向量所在的空间的一个规范正交基。
按我们之前的算法,电子设备要储存这张图片,就要储存下中的个元素。但上面的等式为我们提供了另一种方法。我们可以只存储下和,当显示图片时,再通过
来得到 此时,中有个元素,中有个元素,共有个元素,那么我们就只需要储存个元素。显然,只要,我们就能用更少的元素来储存图片,图片所占的空间也就会下降。这就实现了对图像的一个简单压缩。
但在现实当中,很多时候图片的矩阵几乎都是行满秩或者列满秩,上述方法意义不大。但从
中,我们可以注意到,一般来说,绝对值较大的特征值,会对矩阵中的元素值有更大的影响。那么,如果我们把中绝对值较小的特征值认为是0,即让
就只需存储个元素,能节省很多空间。但问题是,这样对图片又会有什么影响?我们以下面的黑白图片为例。
上图可以转换为一个260阶的满秩实对称矩阵,我们将其相似对角化并让特征值按绝对值从大到小排序。我们来看看它的前10个特征值:
可见特征值下降的趋势是很快的。事实上,在中,有如下关系:
的值绝对值大于的特征值的个数
5
22
3
33
1
69
0.3
110
0.1
188
我们依次用绝对值大于的特征值来近似还原图像,有
可见当取1″ data-formula-type=”inline-equation”>时,已经可以很好的表示图像。而相比起直接存储矩阵B,此时我们仅需存储
的元素即可。虽然压缩比不高,但我们可以在里再寻找的适合的值进行压缩。这种压缩方式虽然会丢失一些图片的信息,但影响并不大。
一般图片的压缩
对于实对称矩阵的图片,我们可以用特征值和特征向量进行图片压缩。但现实中大多数图像,不仅不能对称,还更有可能不是方阵,更别谈什么特征值与特征向量了。对于这种图像,我们还能否进行类似的操作呢?
我们可以注意到,对于任意阶实矩阵 和一定也是实对称矩阵。那么,我们是否可以用和的特征值和特征向量来表示呢?
事实上,对此,我们有奇异值分解定理:
秩为的实矩阵可分解为如下形式
其中,是的个线性无关特征向量所在空间的一组规范正交基构成的正交矩阵,是的个线性无关特征向量所在空间的一组规范正交基构成的正交矩阵,是形如
的矩形对角矩阵,是对角矩阵,其对角元素称为矩阵的奇异值。
那么,对于
这里的奇异值和实对称矩阵的特征值所起到作用的相似的。并且我们可以证明,和的非零特征值相同并且是非负数,而
这次我们选取一张彩色图片作为例子。和黑白图像不同的是,彩色图片的像素值在三个分量上有不同的取值().
也就是说,对于分辨率为的图像,我们需要用三个矩阵来分别储存它在三个分量上不同的值,而奇异值分解可以让我们用个元素来储存。
这张图片所对应的矩阵是阶的矩阵,并且三个矩阵的秩
的奇异值矩阵的秩。我们分别对其奇异值分解进行分析如下:
奇异值最大值奇异值最大值奇异值最大值
181000
178000
161000
关于奇异值大致分布情况如下:
的值大于的奇异值数大于的奇异值数大于的奇异值数
10000
7
6
6
3000
26
22
21
1000
70
68
63
500
130
127
125
100
442
442
444
分别取以上不同个数奇异值近似矩阵并生成图像可得:
可见当取到前1000个奇异值时,和原图的差距便已经不大,此时图像的压缩比为
图片的降噪
上面我们提到的是图形压缩。特征值和特征向量还有另一个作用——图片去噪。
首先,我们得明确什么是“噪”?这里的噪指的是图片本来的信息,因为设备原因(比如图片扫描仪问题)或者环境原因而发生改变。例如,理想情况下,我们认为本来的图片(矩阵)如下图:
但是由于噪声变成了下图:
理想状况下,原图应该只有三个奇异值8,但我们对有噪声的图进行奇异值分解,会得到9个奇异值
我们可以看到后6个奇异值远小于前3个。由于较大的奇异值对矩阵元素的值影响较大,我们可以假设后面的奇异值都是由噪声所造成的,那么我们就可以近似得到
从而得到下面的改进图: