燕巖軍
(山西機電職業(yè)技術學院,山西 長治 046011)
開宗明義,數(shù)字圖像處理就是用現(xiàn)代手段對圖像進行處理。人們對數(shù)字圖像都應該很熟悉。我們在計算機上看到的圖像,數(shù)碼相機拍到的圖像,雷達圖像,人體MRI圖像等等都屬于數(shù)字圖像。數(shù)字圖像處理是指用計算機對圖像進行分析處理,以達到所需結(jié)果的技術。
圖像處理的內(nèi)容十分廣泛,具體而言,可以分為:圖像獲取、圖像增強、圖像復原、圖像壓縮、圖像分割等。這些內(nèi)容都是基于矩陣的處理得到的。下面舉例介紹幾個重要的應用。
圖像獲取是圖像處理的第一步。圖像獲取有很多方法,最常用的方法就是用傳感器如數(shù)字攝像機、掃描儀等設備得到。
數(shù)字圖像處理的定義:我們可以將一幅圖像定義為一個二維函數(shù)f(x,y) ,這里x和y是空間坐標,在空間坐標(x,y)上的幅值f稱為該點圖像的強度或灰度。對于數(shù)字圖像而言,x,y和幅值f都是有限的、離散的。這樣一幅圖像就可以用一個二維函數(shù)來表示。模擬圖像不利于計算機處理,所以我們常常將模擬圖像轉(zhuǎn)換為數(shù)字圖像。模擬圖像轉(zhuǎn)化為數(shù)字圖像的方式是:取樣和量化。我們將x,y坐標值離散化稱為取樣,將幅度值f離散化稱之為量化。經(jīng)過取樣和量化的圖像是一幅數(shù)字圖像。數(shù)字圖像的質(zhì)量很大程度上取決于取樣和量化的取樣數(shù)和灰度級。取樣和量化的結(jié)果是一個實際的矩陣。這個矩陣可以表示為
更一般的矩陣表達方式為:
圖像壓縮的數(shù)字圖像數(shù)據(jù)壓縮技術的應用,其目的是減少圖像遺留在數(shù)據(jù)中的多余信息,使之得到更高效的格式存儲和傳輸數(shù)據(jù)。可以將圖象數(shù)據(jù)壓縮的原因在于,數(shù)據(jù)中還有多余的信息。圖像數(shù)據(jù)的冗余引起的在圖像中的空間冗余,時間冗余的存在下,在不同的幀中的圖像序列中,不同顏色的平面或光譜帶間的相關性引起的相鄰像素之間的相關性引起的頻譜冗余。
圖像壓縮是有損數(shù)據(jù)壓縮可以是無損數(shù)據(jù)壓縮。無損圖像壓縮方法的行程長度編碼,熵編碼方法,如LZW,有損壓縮方式主要是變換編碼,諸如離散余弦變換(DCT) 或小波變換,使傅立葉變換,量化和熵編碼方法壓縮和分形壓縮(分形壓縮)。
則特征值λi與μi之間的關系為:λi=μi>0,(i=1,2,…,r)。
其中,△ =diag(δ1,δ2,…δr),△為奇異對角陣。U滿足UH AAH U是對角陣,V滿足VH AH AV是對角陣。U的第i列為A的對應于?δi奇異值對應的左奇異向量,V的第i列為A的對應于δi奇異值對應的右奇異向量。它們的每一列均為單位向量,且各列之間相互正交。
奇異值分解是一種基于特征向量的矩陣變換方法。奇異值分解是現(xiàn)代數(shù)值的最基本和最重要的工具之一。
每一矩陣的奇異值(δ,δ,…,δ)是唯一的,它12r將矩陣數(shù)據(jù)的特征與分布很明顯的算了出來。一般來講,矩陣的奇異值的分解可以作這樣的一種理解:可以將矩陣當做是一種線性變換,它在根本上將m維空間的點映射到了n維的空間。通過奇異值的分解之后,該線性變換被分割成3個部分,分別為U、△和V, 其中U和V都是標準正交矩陣,因此它們相對應的線性變換,就相當于對m維和n維坐標系中坐標軸的旋轉(zhuǎn)變換。
若A為數(shù)字圖像,則A可視為二維時頻信息,可將A的奇異值分解公式寫為:
在當中,ui與vi各為U與V的列矢量,δi為A的非零奇異值。因此上述公式所表示的數(shù)字圖像A可以看成是r個秩為1的子圖相加的結(jié)果,奇異值?δi為權系數(shù)。所以Ai也表示時頻信息,對應的ui和vi可分別視為頻率矢量和時間矢量,因此數(shù)字圖像A中的時頻信息就被分解到一系列由ui和vi構成的視頻平面中。
由矩陣范數(shù)理論,奇異值能與向量2-范數(shù)和矩陣Frobenious-范數(shù)(F-范數(shù))相聯(lián)系。
若以F-范數(shù)的平方表示圖像的能量,則由矩陣奇異值分
綜上所述,數(shù)字圖像A在被奇異值分解之后,它的紋理與幾何意義上的信息大多都集中在U、VH之中,而△中的奇異值通常代表了圖像的能量信息。
性質(zhì)1:矩陣的奇異值代表著圖像的能量信息,因此它具有很高的穩(wěn)定性。
設=A+δ,δ是矩陣A擾動矩陣的一個。A和B的非零奇異值分別記為:δ11≥δ12≥…≥δ1r和 δ21≥δ22≥…≥δ2r。且r=rank(A) ,δ1是δ的最大奇異值。則有:|δ1i- δ2i|≤‖A-B‖2=‖δ‖2=δ1。
通過上述闡述可以得知,圖像在被小的擾動所干擾的時候,擾動矩陣的最大奇異值一般情況下都大于圖像矩陣奇異值的變換。因此圖像奇異值的穩(wěn)定性能非常強。
性質(zhì)2:矩陣的奇異值具有比例不變性。
性質(zhì)3:矩陣的奇異值具有旋轉(zhuǎn)不變性。
設m×n,矩陣A的奇異值為 δi(i=1,2,…,r),r=rank(A) 。若Ur是酉矩陣,則矩陣Ur A的奇異值與矩陣A的奇異值相同:
性質(zhì) 4:設,rank(A) =r≥s。若△s=diag(δ1,δ2,…,δs),
所以可得:
上面的方程式已經(jīng)說明,通常在F-范數(shù)意義之下,As是在空間(秩為s的m×n維 矩陣構成的線性空間)中A的一個將秩最佳逼近。因此可根據(jù)需要保留s(s<r)個大于某個閾值的δi而舍棄其余r-s個小于閾值的δi且保證兩幅圖像在某種意義下的近似。這就為奇異值特征矢量的降維和數(shù)據(jù)壓縮等應用找到了依據(jù)。
結(jié)語:前面所有的討論都已經(jīng)表明,圖像壓縮通過奇異值來分解的辦法是有效的,具備很好的實用價值,不過還有很多有待改進之處。
1.劃分子塊的劃分方式上,通常采取更有效的方法來完成。例如,大型矩陣,隨機抽樣矩陣居較小的矩陣計算的小矩陣的奇異值,反復幾次,這些小的奇異值的原始矩陣奇異矩陣逼近。
2.操作的速度的影響因素,是比較大的SVD變換操作,可以找到一個快速的奇異值分解的變換算法。
此外,如果是已知的特征空間中的圖像矩陣的奇異值,一般認為,較大的奇異值和其對應的奇異向量表示的圖像信號,而噪聲的小的奇異值反映在和它們相應的奇異向量。選擇閾值低于閾值的奇異值被設置為0(截斷)是根據(jù)一定的準則,那么這些奇異值和奇異向量對應的重構圖像進行去噪??紤]圖像局部平穩(wěn),奇異值分解的圖像塊消噪保持邊緣細節(jié),所以在一定程度上。如果你仔細看,SVD去噪有方向性。據(jù)SVD圖像的性質(zhì),圖像塊旋轉(zhuǎn)SVD去噪,圖像劃分成不同的塊,然后分別為每個圖像塊旋轉(zhuǎn)SVD的去噪,最后的總投資組合去噪圖像。因此,圖像的主觀質(zhì)量可能已大大提高。
[1]許君一.矩陣分解及量化數(shù)字水印研究[D].廣州:中山大學,2006.
[2]張瑾,楊常清.基于矩陣分析的數(shù)字圖像處理方法[J].微機發(fā)展,2003,13(5):35~37.
[3]RafaelC.Gonzalez,,Richard E.Woods.Digital ImageProcessing.Second Edition[M].Beijing:Publishing Houseof Electronics Industry,2007.2.
[4]岡薩雷斯.數(shù)字圖像處理.第二版[M].北京:電子工業(yè)出版社,2007,42.
[5]曠明.關于矩陣變換的數(shù)字圖形處理[J].達縣師范高等??茖W校學報,2003,13(2):15~18.