唐國維 張 巖 王苫社 李井輝
(1.東北石油大學計算機與信息技術學院,黑龍江 大慶 163318;2.哈爾濱工業(yè)大學計算機科學與技術學院,哈爾濱 150001)
從傅里葉分析到小波分析再到多尺度幾何分析(Multiscale Geometric Analysis,MGA),多年來數學工作者和信號處理專家一直試圖尋找更有效的信號表示和分析方法。在過去的幾十年中,小波分析的快速發(fā)展和成熟無疑使信號處理工作達到了一次高潮,其應用領域也迅速從數學、信號處理拓展到物理、天文、地理、生物及化學等學科。盡管如此,研究者們也發(fā)現(xiàn),由于小波變換只能反映信號的零維奇異性,即只能表達奇異點的位置和特性,而對于更高維的特征則顯得力不從心。另外,由于小波變換核為各向同性(isotropy),因而只能表達圖像過邊緣的特性,無法表達圖像沿邊緣的特性。因此小波在表示具有點奇異性的函數時是最優(yōu)基,但是對于自然圖像而言,小波基并不是最優(yōu)基[1]。
約十年前,出現(xiàn)了一門嶄新的信號分析工具——多尺度幾何分析[2]。多尺度幾何分析包括一系列的方法,主要有:Candès E J和Donoho D于1998年提出的脊波變換(Ridgelet Transform)、1999年提出的單尺度脊波變換(Monoscale Ridgelet Transform)和Curvelet變換,Pennec E L和Mallat S于2000年提出的Bandelet變換及Do M N和Vetterli M于2002年提出的Contourlet變換等。其中,Contourlet變換是一種基于多分辨率多方向的幾何分析方法,能夠較好地捕捉圖像本身所特有的幾何特性[3],其基本思想是首先利用一個類似于小波的多尺度分解捕捉邊緣奇異點,再根據方向信息將臨近的奇異點連接成輪廓,且使用一個系數表示。但由于變換中使用了LP變換,使得Contourlet變換本身并不適合直接用于圖像編碼等處理。
為解決Contourlet變換中的冗余問題,Eslami R和Radha H提出了基于小波的Contourlet變換(Wavelet-Based Contourlet Transform,WBCT)[4]。該方法去除了LP濾波器結構引入的數據冗余,形成了非冗余且完全重構的濾波器組,能夠有效地逼近圖像。相比于Contourlet,WBCT更適合于圖像壓縮。但是,WBCT在進行方向分解的時,為避免能量流失,對最低頻子帶未進行方向分解;而對高頻子帶,采取不同子帶方向分解數目固定的分解方式,沒有充分考慮圖像本身的特性。特別是高頻子帶通常包含大量細節(jié)信息,這給編碼等后續(xù)操作帶來直接影響。因此筆者提出一種基于熵的WBCT自適應方向分解優(yōu)化算法,在對圖像進行L級小波完全分解的基礎上,對i(1≤i≤L)級高頻子帶進行2L-i+1個方向分解,然后分析各子帶不同方向分解數目時熵的變化情況,并根據最小熵原則給出各個子帶的最優(yōu)方向分解數目。
Contourlet變換是在Curvelet變換的基礎上提出的一種多分辨率、多方向、局域的幾何分析方法,由于變換中使用了LP變換,在處理高頻信息時沒有進行下采樣操作,導致Contourlet存在1/3的冗余。為此,Eslami R和Radha H提出了基于小波的Contourlet變換,其基本思想是用小波變換中的Mallat塔式分解代替Contourlet變換中的LP分解,從而消除了Contourlet變換中存在的冗余,這一過程用可分離的濾波器組實現(xiàn)。然后用方向濾波器分別對Mallat分解中的非LL子帶進行卷積處理,以更“稀疏”地表示圖像,這一過程由不可分離的具有迭代層次結構的扇形濾波器組實現(xiàn),其原理如圖1所示。
圖1 WBCT方向分解原理
對于高頻細節(jié)部分的方向分解,WBCT采用了與Contourlet相同的方法,即將高頻部分分解于各個頻帶方向上,每一層頻域分解成2l個子帶。圖2給出了八方向的頻域子帶分解示意圖,與ω0軸正方向夾角45~135°之間的頻帶稱作第一通道,其余為第二通道。
圖2 楔型頻域子帶分解
圖3 四方向濾波器組示意圖
WBCT繼承了小波變換和Contourlet變換的優(yōu)點,同時又彌補了二者的不足,從而更容易捕捉圖像的幾何結構和紋理特性。圖4給出了Babara圖像的DWT系數和WBCT系數的對比,從中可看出Contourlet的方向濾波對小波系數高頻部分的紋理捕捉能力。
圖4 Babara圖像的DWT系數和WBCT系數分布
在進行方向分解的時候,考慮到低頻分量的特殊地位,WBCT對最低頻子帶不進行方向分解,而對高頻子帶采取不同子帶的方向分解數目固定的分解方式。由于高頻子帶包含豐富的細節(jié)信息,方向分解數目合適與否將對后續(xù)處理(如編碼等)產生較大影響。筆者以PSNR值對其特性進行分析。對512×512的Babara圖像進行4級小波變換,并對高頻子帶按不同方向分解數目進行方向分解,然后采用SPECK算法[5]對其進行壓縮處理,并計算重構圖像的PSNR值。表1給出了碼率為0.25b/p時的PSNR值。
表1 Babara圖像各高頻子帶不同方向分解數的PSNR值對比
從表1中可以看出,對高頻子帶進行不同數目的方向分解,壓縮后其重構圖像PSNR值是不同的,因此如何確定高頻子帶最佳方向分解數目是一個值得研究的問題。理論上可通過計算變換域迭代投影過程中圖像的量化誤差并使其最小而得到,但該方法的實際操作性差[6]。文獻[7]結合實驗,給出了如下的方向分解策略:對原始圖像進行L級小波分解以后,僅在除第L級和第L-1級外的各級小波子帶上進行方向分解,且最高分辨率上方向分解數為2L-1。顯然該方法對圖像內容還考慮得不夠深入。筆者緊密結合圖像自身特性,從熵的角度對方向分解數目進行研究。
根據文獻[8,9],描述高頻子帶紋理/邊緣特征的一個重要指標是熵。由于Contourlet根據方向信息將臨近的奇異點連接成輪廓,且使用一個系數表示,因此方向分解必然引起子帶熵的變化,而且變化和分解的方向數目有關。根據熵的定義,如果方向分解后小波系數分布更加有規(guī)律(對編碼有利),其熵值必定減小。因此,最佳的方向分解數應使小波子帶的熵達到最小值。
設s為經Contourlet方向分解后的任一子帶,則定義該方向子帶的熵如下:
Es=-∑p(i)log2p(i)
(1)
其中,p(i)為像素灰度值為i的概率,p(i)=ni/ns,ni為灰度值為i的像素數目,ns為子帶s的像素總數。當對小波子帶進行不同數目的方向分解時,其熵值發(fā)生變化。熵值變大,表明有輪廓被打散;熵值變小,則表明有系數被合并成為輪廓。為此,對某一小波高頻子帶S,若其方向分解數目為2d,d=0,1,2,…,則定義該小波子帶的平均熵為:
(2)
其中,Es(s=1,2,…,2d)為Contourlet方向分解后的各子帶熵。則基于熵的Contourlet方向分解優(yōu)化過程如下:
a. 小波子帶完全方向分解,即假定對圖像進行L級小波變換,則對第i(1≤i≤L)級高頻子帶確定其首次方向分解數為2L-i+1;
b. 確定最佳方向分解數;
c. 對所有高頻小波子帶均進行步驟b的處理。
假設對某一小波子帶S進行2j個方向分解,步驟b的具體方法為:
為驗證上述算法的有效性,選取512×512的標準灰度圖像Boat進行方向分解實驗。小波基選取D9/7雙正交小波基,分解級數L=4。考慮到pkva濾波器在定位邊緣方向上更加有效,因此在進行方向分解時采用pkva濾波器取代扇形濾波器以減少方向間的交互信息。按照式(1)計算得到小波分解各高頻子帶的熵見表2。
表2 Boat圖像小波分解后各高頻子帶的熵
對各小波高頻子帶采取不同的方向分解數進行方向分解,并按式(2)計算每個小波子帶不同方向分解數時的平均熵,計算結果見表3,并按最小熵原則確定最佳方向分解數目。
表3 Boat圖像各高頻子帶不同方向分解數時的平均熵
表4 Boat圖像兩種算法下各子帶的方向分解數
圖5給出了根據原始WBCT和筆者改進的算法進行的實際方向分解的情況,后者系數分布規(guī)律更加合理,更有利于后續(xù)進一步編碼處理。
為驗證方向分解的合理性,選取Boat等6幅常用標準圖像,采用SPECK算法對方向分解后的圖像進行壓縮處理,并計算其重構圖像的PSNR值(表5)??梢钥闯?,與原始WBCT算法方向分解數目固定相比,筆者提出的最優(yōu)方向分解數算法可以明顯提高重構圖像的峰值信噪比。
圖5 Boat圖像兩種算法方向分解情況對比表5 采用SPECK算法壓縮后不同碼率下的PSNR值
圖像1.00b·p-10.50b·p-10.25b·p-10.10b·p-1WBCT筆者算法WBCT筆者算法WBCT筆者算法WBCT筆者算法Boat36.4337.1832.4033.9329.2829.5826.2326.35Baboon28.7329.3025.8126.1923.8124.1022.3322.47Man33.9534.8530.7431.4428.3828.8725.9026.23Goldhill34.8835.1031.8832.0529.4029.5326.8827.09Plant37.6338.5933.5934.2730.2930.8726.8227.10Peppers35.6636.4633.0634.0930.8431.7627.7028.13
Contourlet變換將小波的優(yōu)點延伸到高維空間,具有多分辨率、局部化及各向異性等優(yōu)良特性,是一種真正意義上的圖像二維表示方法。筆者針對基于小波的Contourlet方向分解沒有考慮子帶內系數分布特性的問題,提出基于熵的子帶方向分解優(yōu)化算法,使得各方向子帶內部的局部相關性加強,而子帶間相關性減弱,這對提高圖像的壓縮比是至關重要的。通過實驗可以看出,重構圖像的峰值信噪比得到有效提高,這說明筆者將熵作為方向分解的依據是正確的。
[1] 倪偉,郭寶,龍楊鑼.圖像多尺度幾何分析新進展:Contourlet[J].計算機科學,2006,33(2):234~236,262.
[2] 焦李成,譚山.圖像的多尺度幾何分析:回顧和展望[J].電子學報,2003,31(z1):1975~1981.
[3] Do M N,Vetterli M.Contourlets:A Directional Multiresolution Image Representation[C].Proceedings of IEEE International Conference on Image Processing.New York,USA:IEEE,2002:357~360.
[4] Eslami R,Radha H.Wavelet-based Contourlet Transform and Its Application to Image Coding[C].Proceedings of IEEE International Conference on Image Processing.Singapore:IEEE,2004:3189~3192.
[5] Pearlman W A,Islam A,Nagaraj N,et al.Efficient,Low-complexity Image Coding with a Set-partitioning Embedded Block Coder[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(11):1219~1235.
[6] 唐國維.嵌入式小波圖像編碼算法及應用研究[D].哈爾濱:哈爾濱工程大學,2010.
[7] 王向陽,左珂可.低比特率混合域圖像壓縮編碼算法研究[J].中國圖象圖形學報,2007,12(11):2000~2005.
[8] Pham T D.Image Texture Analysis Using Geostatistical Information Entropy[C].The 6th IEEE International Conference on Intelligent Systems (IS).Sofia:IEEE,2012:353~356.
[9] Pham T D. Geostatistical Entropy for Texture Analysis:An Indicator Kriging Approach[J].International Journal of Intelligent Systems,2014,29(3): 253~265.