范云鵬 郭小娥
摘?要:現(xiàn)在的社會是一個信息社會,每天都產(chǎn)生和傳送各種各樣的信息,尤其隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,需要處理的信息更是多到不可勝數(shù)。而圖像是信息的主要載體,但圖像本身占有巨大的空間,因此圖像壓縮越來越收重視。本文介紹一種有效的圖像壓縮的方法—奇異值分解。該方法最大的優(yōu)點是在所有的同階分解中誤差最小的。
關(guān)鍵詞:奇異值;壓縮;代數(shù)特征
現(xiàn)代科學(xué)技術(shù)發(fā)展的速度越來越快,需要掌握的知識越來越多。過去需要幾十年知識的總量才會增加一倍,而現(xiàn)在這個周期已經(jīng)縮短到幾年。而知識是通過信息傳播的,信息主要是以圖像和視頻的形式存在的,尤其是現(xiàn)在互聯(lián)網(wǎng)技術(shù)的發(fā)展,大大方便了人們的生活?,F(xiàn)在看報紙,看書的人越來越少,看電子書和在網(wǎng)上看新聞的越來越多,還可以通過網(wǎng)絡(luò)足不出戶買衣服,買菜,直播賣貨和買貨的人也增加了許多,另外現(xiàn)在年輕人白天工作忙,中午沒時間吃飯,可以通過網(wǎng)絡(luò)訂餐,大大節(jié)省了時間,還有在線上課等,但是,網(wǎng)絡(luò)中的信息都是以數(shù)字形式存儲和傳輸?shù)?。而信息?jīng)過數(shù)字化以后的數(shù)據(jù)量占有非常大的空間。我們平常用手機拍的相片都是幾千行幾千列,在網(wǎng)絡(luò)剛興起的時候,從網(wǎng)上下載一幅照片都需要幾個小時的時間,而視頻占有的空間更大,因此圖像壓縮受顯得尤為必要。
平常上網(wǎng)看新聞或者購物看電影的時候,經(jīng)常遇到網(wǎng)絡(luò)卡頓的情形,那是由于同一時刻在帶寬上的信息太多。雖然現(xiàn)在隨著互聯(lián)網(wǎng)技術(shù)的成熟,網(wǎng)速是越來越快,但信息比以前也多得多,現(xiàn)在的網(wǎng)速依然沒有辦法滿足人們的需求。圖像壓縮的目的就是減少圖像存儲的空間,增加圖像的亮度清晰度,從而達(dá)到網(wǎng)絡(luò)流暢的目的。
原始圖像含有的數(shù)據(jù)并不是全部都有用,它含有一些多余的無用信息,而且圖像的像素值很多都是非常接近甚至是一樣的,重復(fù)的部分也沒必要重復(fù)傳輸,這就為圖像壓縮提供了必要性。截至目前,許多專家都投入這一挑戰(zhàn)性課題的研究當(dāng)中并產(chǎn)生了很多圖像壓縮的方法,主要方法如下:
(1)PCA算法:它采用的是向量模型,需要把二維向量轉(zhuǎn)化成一維向量。(2)GLRAM:該方法采用的是矩陣模型,進(jìn)行的是雙邊壓縮,大大提高了壓縮效率,但它的缺點是迭代算法,除此之外還有非負(fù)矩陣分解和支持向量機分解也可以實現(xiàn)圖像壓縮,本文介紹一種經(jīng)典的壓縮方法—奇異值分解。矩陣奇異值分解是一種重要分解。近年來,它在數(shù)據(jù)建模,最佳逼近問題,實驗數(shù)據(jù)處理,數(shù)字圖像壓縮等領(lǐng)域得到了廣泛的應(yīng)用。
1?奇異值的定義和分解
為A的奇異值。
定理1:設(shè)A為m行n列的矩陣,設(shè)mn,A的秩為r,則存在兩個正交矩陣U=[u1,u2…um]∈Rm×m,UTU=I和V=[v1,v2…vn]∈Rn×n,VTV=I,以及對角陣S=diag[λ1,λ2…,λr,0,…0]∈Rm×n,λ1>λ2>…>λr≥0,使得下式成立:
其中λi2為ATA的特征值,ui,vi分別是ATA和AAT對應(yīng)于λi2的特征向量。我們將對角陣S稱為奇異值矩陣,稱式(1)為A的奇異值分解。
證明:由于ATA是半正定的Hermite矩陣,且rank(ATA)=rank(A),故ATA有如下形式的Schur分解:
其中V=(v1,…,vn)是正交矩陣,σ1…σr>0,σr+1=…σn=0,令V1=[v1,…,vr],V2=[vr+1,…,vn],Λ=diag(σ1,…σr)。
則從(2)式可得:
式(3)表明AV1的列是相互正交的;表明AV2的列都是零向量,即AV2=0,因此,令U1=AV1Λ-1則UT1U1=Ir。再取U2∈Cm×(m-r)使U=[U1,U2]是m階正交的,則有:
分解式中的Λ是由A唯一確定的,V的第i列vi稱為A屬于σi的一個單位右奇異向量,U的第i列ui稱為A屬于σi的一個單位左奇異向量。
設(shè)A1,A2,A3分別表示三幅圖像,對它們進(jìn)行奇異值分解:
A1=U1S1V1,A2=U2S2V2,A3=U3S3V3
用第一幅圖像得到的矩陣U1,V1和第二幅圖像的奇異值矩陣相乘后U1S2V1顯示和A1很接近,U1S3V1和第一幅圖也很接近,但U2S1V2和A1相差很大,這說明矩陣U和V里包含圖像的關(guān)鍵信息,奇異值矩陣含有很多的無用信息。
2?誤差分析和應(yīng)用
在泛函分析中,我們學(xué)習(xí)過范數(shù)的概念。范數(shù)是一個函數(shù),它定義在賦范線性空間中,它常常被用來度量某個向量空間中的每個向量的大小。滿足一定的條件:(1)非負(fù)性;(2)其次性;(3)三角不等式。求A的低秩逼近,就是要找另一個矩陣B,使A-B的范數(shù)最小。由奇異值分解定理得知,要找矩陣B,第一步對A做奇異值分解,分解以后A表示成A=UDVT,那么我們把矩陣U的前k列元素組成的矩陣記作Uk,取矩陣V的前k列元素組成的元素記作VK,則當(dāng)B=Ukdiag(σ1,σ2…σk)Vk時誤差最小,那么B是A的最優(yōu)逼近,稱之為SVD逼近。我們看下面的定理:
定理2:用SVD把A表示成Ak=UkΛVTk,在A所有的秩為k的近似分解中,Ak是A誤差最小的分解矩陣。
對矩陣奇異值分解后會產(chǎn)生一個m行m列的矩陣U,m行n列的矩陣S,n行n列的矩陣V,其中奇異值在S的對角線上并且是由大到小排列的,一般情況下前10%甚至1%的奇異值就占了全部奇異值之和的99%以上。所以只需要取出矩陣S的前k行k列組成新的矩陣Sk,取矩陣U的前K列元素組成矩陣Uk,矩陣V的前K列元素組成矩陣Vk,用UkSkVk重構(gòu)圖像,取得k夠小就可以很大程度實現(xiàn)圖像的壓縮。
3?結(jié)語
利用奇異值分解進(jìn)行圖像壓縮,它的優(yōu)點是誤差小,穩(wěn)定,但是當(dāng)矩陣行數(shù)和列數(shù)非常大的時候,矩陣奇異值的計算是一個難題。所以一般把奇異值分解和其他方法結(jié)合起來進(jìn)行圖像的壓縮,這是進(jìn)一步需要研究的課題。
參考文獻(xiàn):
[1]徐樹方.矩陣計算的理論和方法.第4版,北京:北京大學(xué)出版社.
[2]陳亞雄,黃樟燦.基于奇異值分解和Contourlet變換的圖像壓縮方法.計算機應(yīng)用研究,2017.1,1(34):317320.
[3]景永霞,王治和.基于矩陣奇異值分解的文本分類算法研究.西北師范大學(xué)學(xué)報,2018,3(54):5156.
[4]王凱,王菊香.矩陣的奇異值分解在紅外光譜預(yù)處理中的應(yīng)用.海軍航空工程學(xué)院學(xué)報,2017,3(32):270274.
[5]馮栩,李可欣.基于隨機奇異值分解的快速矩陣補全算法及其應(yīng)用.計算機輔助設(shè)計與圖形學(xué)學(xué)報,2017,12(29):23432348。
[6]J.Ye.Generalized?Low?Rank?Approximations?of?Matrices,Machine?learning,2004:887894.
[7]黃東煜,張景潤.一種基于迭代奇異值分解的定頻干擾信號消除算法.信息技術(shù),2018,4(39):3944.
作者簡介:范云鵬(1981—?),男,漢族,陜西西安人,碩士,西安思源學(xué)院基礎(chǔ)部教師,從事學(xué)校高等數(shù)學(xué)、線性代數(shù)、概率論等課程的教學(xué)和科研工作,研究方向:矩陣的優(yōu)化和最優(yōu)解。