李 政
(山東藝術(shù)學(xué)院現(xiàn)代技術(shù)教育部,山東濟南 250014)
二元樹復(fù)小波在圖像特征提取和分類中的設(shè)計與應(yīng)用
李 政
(山東藝術(shù)學(xué)院現(xiàn)代技術(shù)教育部,山東濟南 250014)
通過二元樹復(fù)小波變換對圖像進行 4尺度分解,提取每一尺度下代表 6個方向的高頻帶子圖小波系數(shù)模的均值和標(biāo)準(zhǔn)方差組成 48維的特征向量,利用支持向量機的一對一多分類算法對Brodatz圖像庫中的 112幅圖像進行了紋理特征提取和分類實驗,結(jié)果表明二元樹復(fù)小波變換提取的圖像特征能有效提高圖像的分類精度.
二元樹復(fù)小波變換;小波系數(shù);支持向量機;特征提取
紋理是反映圖像像素灰度集或顏色的某種規(guī)律性變化的基本視覺特征之一,可以對圖像空間信息進行一定程度的定量描述,在基于內(nèi)容的圖像檢索[1]、人臉識別[2]、圖像理解等領(lǐng)域得到了深入研究和廣泛應(yīng)用[3],期間涌現(xiàn)了許多有效的紋理特征提取算法,這些算法可大致分為統(tǒng)計法、模型法、結(jié)構(gòu)法和頻譜法.頻譜法中的小波變換和分析是提取圖像紋理特征的有效方法之一,Manjunath等[4]提出了利用 Gabor小波變換的紋理特征提取方法,基于Brodatz紋理庫的實驗結(jié)果表明優(yōu)于金字塔結(jié)構(gòu)小波變換和樹結(jié)構(gòu)小波變換;Kingsbury[5]提出的二元樹復(fù)小波變換 (Dual-Tree ComplexWavelets Transfor m,DT-CWT)具有近似平移不變性、良好的方向選擇性、完備重構(gòu)和計算復(fù)雜度低等優(yōu)點,逐漸成為圖像特征提取和分析的研究熱點之一;尚趙偉等[6]對DT-CWT進行了理論分析及紋理檢索和相似計算實驗,結(jié)果表明 DT-CWT在紋理特征提取方面的性能優(yōu)于單小波;Chen等[7]結(jié)合支持向量機(SupportVectorMachine,SVM)和 DT-CWT應(yīng)用于掌紋識別和手寫體數(shù)字識別并得到了較高的識別率;文獻 [8]基于多類 SVM和 DT-CWT利用 Brodatz紋理庫進行的實驗表明分類正確率明顯優(yōu)于其它算法,但 Brodatz紋理庫包含 112幅圖像,而文獻[8]中只是選擇了其中 30幅圖像進行分類實驗,其實驗結(jié)果的有效性和普遍性值得進一步驗證,這不能說明對全部 112幅圖像的的分類實驗結(jié)果如何,為了進一步驗證其方法的有效性和適用性,本文將采用同文獻[8]類似的方法,但本文對 SVM進行了參數(shù)優(yōu)化調(diào)整,并對 DT-CWT提取的特征向量進行了規(guī)范化處理,在此基礎(chǔ)上利用 SVM的一對一多分類算法對 Brodatz紋理庫的 112幅圖像進行分類實驗和深入分析.
DT-CWT是基于實數(shù)小波變換實現(xiàn)復(fù)數(shù)小波變換,通過 2個并行的實數(shù)濾波器組得到實部和虛部系數(shù)[5],即基于對偶樹的 DT-CWT中由 2棵平行的小波樹組成,每棵樹對應(yīng)的濾波器是傳統(tǒng)小波變換的雙正交濾波器,其中一棵小波樹是奇數(shù)長的高通濾波器,其采樣序列的中點偶對稱;另一棵小波樹是偶數(shù)長的高通濾波器,其采樣序列的中點奇對稱,它們交替奇偶濾波得到的輸出分別對應(yīng)的是復(fù)小波變換的實部和虛部.相對于傳統(tǒng)的實離散小波變換,DT-CWT具有近似平移不變性、良好的方向選擇性、有限的數(shù)據(jù)冗余、完備重構(gòu)及低計算復(fù)雜度等優(yōu)點,DT-CWT可以區(qū)分頻率空間的不同部分,兼具了平移不變性和方向選擇性.DT-CWT在每一個尺度分解下生成 6個復(fù)系數(shù)高頻帶子圖,它們分別代表 ±15°、±45°和 ±75°方向的脈沖響應(yīng),圖 1為DT-CWT濾波器的脈沖響應(yīng)圖示,從中可看出DT-CWT具有很好的空間頻率局部特性,適合用來提取圖像各個方向上的空間局部特性.
本文的紋理圖像分類算法主要有圖像特征提取和分類器設(shè)計 2個步驟,圖像特征提取算法通過Matlab編程實現(xiàn) DT-CWT的特征提取,支持向量機分類器采用臺灣大學(xué)林智仁等開發(fā)的支持多類分類的支持向量機軟件BSVM 2.06[9-10].
本文利用 Brodatz圖像數(shù)據(jù)庫中的 112幅自然紋理圖像作為實驗數(shù)據(jù),縮小的圖像如圖2所示.每幅原始圖像為 640×640像素的 256級灰度圖像,按5×5將每幅圖像不重疊分割為 25塊 128×128像素大小的圖像塊,原則上認為從同一幅圖像分割的結(jié)果圖像具有相似的紋理特征,所以,認為來自于同一幅圖像分割后所得小塊圖像屬于同一類別,這樣生成的實驗數(shù)據(jù)集包含了 112個紋理類別共有2 800幅 128×128像素大小的圖像塊.
利用Matlab 7.0實現(xiàn)了 DT-CWT紋理特征提取算法,利用 DT-CWT對每幅 128×128像素的圖像塊進行 4尺度小波分解,然后對變換后每一尺度的高頻帶子圖分別計算 6個方向小波系數(shù)模的均值μi,j和標(biāo)準(zhǔn)方差σi,j,i=1,2,3,4,j=1,2,3,4,5,6,由此生成 48維的紋理特征向量來表示 1幅紋理圖像.均值和標(biāo)準(zhǔn)方差的計算公式分別為:
圖3為 1幅圖像進行 4尺度 DT-CWT分解后小波系數(shù)的圖像,每一層有 6個方向的子圖.
BSVM 2.06采用了 one-vs-one的多類分類算法,如何針對特定問題選擇最適合的核函數(shù)目前還沒有一個通用的準(zhǔn)則,也是一個亟待解決的難題.本文實驗首先對線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)和 Sigmoid核函數(shù)進行了分類精度測試,測試結(jié)果發(fā)現(xiàn)徑向基核函數(shù)的平均分類準(zhǔn)確度在 80%以上;線性核函數(shù)在 70%左右;1~5階多項式核函數(shù)在 20%左右,而 Sigmoid核函數(shù)效果最差,平均準(zhǔn)確度在 10%左右,從本文實驗中可以得出結(jié)論,不同核函數(shù)及其參數(shù)選擇對支持向量機的分類精度有較大的影響.所以,實驗采用徑向基核函數(shù)對紋理圖像進行分類并統(tǒng)計分類準(zhǔn)確率.
首先對徑向基核函數(shù)懲罰參數(shù) C和控制核函數(shù)寬度的σ進行了不同組合分類精度測試,測試結(jié)果如圖4、5所示,圖4是懲罰參數(shù) C=1 000,C=100,σ=0.1,0.2,…,1時的平均分類準(zhǔn)確率;圖5是懲罰參數(shù)C=1 000,C=100,σ=0.01,0.02,…,0.1時的平均分類準(zhǔn)確率.從圖4、5的結(jié)果可以看出當(dāng)懲罰參數(shù) C=1 000,σ=0.3和 0.7時的平均分類準(zhǔn)確率較高,分別達到 89.9099%和 89.9459%,本章實驗最終的分類結(jié)果通過采用徑向基核函數(shù) (RBF)及其參數(shù)設(shè)置 C=1 000,σ=0.7得到,在此參數(shù)配置下,對訓(xùn)練樣本數(shù)與分類準(zhǔn)確率的關(guān)系進行了測試,測試結(jié)果如圖6所示.
在利用 BSVM 2.06進行分類實驗時,每類紋理圖像隨機選取了 8個訓(xùn)練樣本,測試樣本數(shù)為 25,這樣訓(xùn)練樣本有 896幅紋理圖像,測試樣本由 2 800幅紋理圖像組成.首先利用訓(xùn)練樣本集來訓(xùn)練支持向量機,然后利用訓(xùn)練好的支持向量機分類器對測試樣本集進行分類實驗,并對每類圖像的分類準(zhǔn)確率和全部圖像的平均準(zhǔn)確率進行了統(tǒng)計分析,并與文獻[4]中給出的每類圖像利用 Gabor小波、金字塔結(jié)構(gòu)小波 (PWT)、樹結(jié)構(gòu)小波 (T WT)變換提取的紋理特征的分類準(zhǔn)確率進行了比較,分類準(zhǔn)確率結(jié)果如表1所示.
表1 Brodatz中 112幅紋理圖像的平均分類準(zhǔn)確率圖像
(續(xù)表1)
圖像名稱分類準(zhǔn)確率 /%Gabor PWT T WT DT-CWT D71 42.92 45.83 68.75 100.00 D72 47.50 48.75 75.83 84.00 D73 66.67 51.67 57.92 52.00 D74 78.75 85.00 85.00 100.00 D75 95.42 86.67 93.75 100.00 D76 99.17 96.25 95.83 100.00 D77 100.00 100.00 100.00 100.00 D78 97.50 93.33 85.42 100.00 D79 100.00 100.00 100.00 92.00 D80 100.00 85.83 85.83 100.00 D81 100.00 90.83 95.83 100.00 D82 100.00 100.00 100.00 100.00 D83 100.00 98.75 99.58 100.00 D84 100.00 100.00 100.00 100.00 D85 99.58 96.67 100.00 100.00 D86 91.67 60.83 71.67 96.00 D87 99.58 92.08 82.92 100.00 D88 41.67 48.75 51.67 60.00 D89 21.25 22.08 26.25 72.00 D90 34.58 19.58 31.67 76.00 D91 25.42 12.92 16.25 80.00 D92 87.50 92.50 92.08 100.00 D93 72.92 38.75 30.00 100.00 D94 100.00 91.67 92.08 100.00 D95 87.50 65.00 92.50 100.00 D96 98.33 77.50 94.17 96.00 D97 37.08 29.17 39.58 88.00 D98 52.50 52.08 65.00 64.00 D99 67.28 62.14 63.62 68.00 D100 87.08 71.67 53.33 80.00 D101 58.75 65.00 63.75 84.00 D102 53.33 51.25 51.25 48.00 D103 56.67 72.50 73.75 100.00 D104 54.58 59.17 66.67 80.00 D105 63.33 50.00 44.58 84.00 D106 44.17 55.83 54.58 100.00 D107 52.50 59.58 60.83 100.00 D108 37.50 28.75 29.58 92.00 D109 78.75 73.75 76.67 96.00 D110 87.92 78.75 75.42 80.00 D111 90.83 90.42 62.92 96.00 D112 61.67 50.42 58.33 56.00 Avg. 73.12 67.41 67.96 89.82
從表1的分類結(jié)果可以看出,支持向量機基于DT-CWT提取的特征向量進行分類的平均準(zhǔn)確率要高于其它方法約 10%~20%,說明 DT-CWT的高頻子帶包含了圖像豐富的邊緣、方向和細節(jié)信息,而低頻子帶只含有圖像的近似信息.但是,DTCWT對一些方向性不明顯、內(nèi)容雜亂且內(nèi)容極其相似的圖像分類精度也非常低,特別是對紋理圖像D43、D69和 D102的分類正確率要明顯低于其它分類方法,主要原因在于圖像 D43的左右 2部分內(nèi)容相差太大,左側(cè)完全沒有方向及邊緣信息,而右側(cè)的方向性非常明顯;圖像 D69沒有明顯的主導(dǎo)性方向,內(nèi)容復(fù)雜且局部內(nèi)容的方向及邊緣相差很大;圖像D102的方向過于單一,上述原因?qū)е聦ζ涮崛〉募y理特征包含的關(guān)于邊緣及方向的可辨別性信息嚴重不足,只是在圖像的局部細節(jié)部分存在微小區(qū)別,由此導(dǎo)致了其分類準(zhǔn)確率明顯低于其它方法.但是,圖像 D43雖然只有 44%的分類準(zhǔn)確率,但是相對于其它方法,卻是提高幅度較大的一類圖像,說明D43的內(nèi)容雖然左右極度不對稱,但 DT-CWT還是較為準(zhǔn)確地提取了其右邊的方向性信息,從而有效地提高了它的分類準(zhǔn)確率.圖像 D69和 D43的分類準(zhǔn)確率低于 50%,主要原因在于其內(nèi)容的復(fù)雜性和方向的不確定性;在利用 DT-CWT提取低頻分量特征進行分類實驗時,圖像 D69和 D43的分類準(zhǔn)確率反而有所提高,主要是圖像中的局部近似信息提供了更好的辨別性信息.
本文實驗中訓(xùn)練樣本集是隨機選擇生成,在實驗過程中發(fā)現(xiàn)通過有針對性地選擇不同的訓(xùn)練樣本可以一定程度地提高上述分類準(zhǔn)確率較低的圖像的區(qū)分能力,但某些情況下會對另外一些圖像的分類準(zhǔn)確率產(chǎn)生影響,所以,選擇那些樣本來組成訓(xùn)練樣本集是一個平衡與折中的問題.通過對基于不同性質(zhì)紋理特征的分類結(jié)果進行比較和分析,可知圖像低頻特征因為只描述了圖像局部近似內(nèi)容,提供了較少的紋理強區(qū)分性信息,對分類的貢獻不大;而小波分解后每層的高頻特征包含了紋理圖像豐富的邊緣、方向和細節(jié)信息,因而有效地提高了分類準(zhǔn)確率.
在本文的分類實驗中,每類紋理圖像只隨機選擇了 8個訓(xùn)練樣本來訓(xùn)練支持向量機,由圖6中的曲線可以發(fā)現(xiàn)隨著訓(xùn)練樣本數(shù)量的增加,支持向量機的分類精度有明顯上升的趨勢,當(dāng)使用 10個以上的訓(xùn)練樣本時,平均分類精度可達到 93.65%左右.由此可見,支持向量機學(xué)習(xí)器具有非常強的學(xué)習(xí)和推廣能力,即使在訓(xùn)練樣本很少的情況下,也能得到相對較好的分類效果.從 Brodatz紋理庫中 112幅紋理圖像的平均分類準(zhǔn)確率來看,基于 DT-CWT提取的紋理特征的平均分類準(zhǔn)確率比其它幾種方法中最好的Gabor小波變換也要高出 15%左右,而且每類紋理圖像的分類準(zhǔn)確率沒有出現(xiàn)很大波動,充分說明了結(jié)合支持向量機方法和 DT-CWT方法在對紋理圖像進行分類時具有的相對穩(wěn)定性和技術(shù)互補性的特點.
本文提取了 Brodatz紋理庫中 112幅圖像的紋理特征,采用支持向量機作為分類器進行了分類與檢索實驗,通過與基于其它特征分類結(jié)果的比較證明,利用二元樹復(fù)小波變換提取的紋理特征更準(zhǔn)確全面地描述了紋理圖像內(nèi)容,從而提高了圖像的分類準(zhǔn)確率,其具有近似的平移不變性、良好的方向選擇性和有限的數(shù)據(jù)冗余性等優(yōu)點得到了充分體現(xiàn)和驗證.下一步的工作將針對支持向量機核函數(shù)及其參數(shù)的最優(yōu)選擇問題進行深入研究,從理論和方法不同的角度進行定性分析和定量化研究,以發(fā)現(xiàn)其中的規(guī)律來指導(dǎo)支持向量機分類模型的建立和應(yīng)用.
[1]MUMTAZ A,ASIF S,G ILAN IM,et al.Enhanceing performance of image retrievel systems using dual tree complex wavelet transform and support vector machines[J].Journal of Computing and Infor mation Technology,2008,16(1):57-68.
[2]黃中美,張小洪,楊舟.基于二元樹復(fù)小波特征表示的人臉識別方法[J].計算機應(yīng)用,2007,27(5):1 135-1 137.
[3]HARAL I CK R,SHANMUGAM K,D INSTE INI.Texture features for image classification[J].IEEE Trans Systems Man Cybernet,1973,3(6):610-621.
[4]MANJUNATH B S,MA W Y.Texture features for browsing and retrieval of image data[J].IEEE Transactions on Pattern Analysis andMachine Intelligence,1996,18(8):837-842.
[5]K INGSBURYN G.The dual-tree complex wavelet transform:a new efficient tool for image restoration and enhancement[C]//Proceedings oftheEUSIPCO’98,Rhodes,1998,319-322.
[6]尚趙偉,張明新,趙平,等.基于不同復(fù)小波變換方法的紋理檢索和相似計算[J].計算機研究與發(fā)展,2005,42(10):1 746-1 751.
[7]CHEN G Y,XIE W F.Pattern recognition with SVM and dual-tree complex wavelets[J]. Image and Vision Computing,2007,25(6):960-966.
[8]解洪勝,張虹,徐秀.基于復(fù)小波和支持向量機的紋理分類法 [J].計算機應(yīng)用研究,2008,25(5):1 573-1 575,1 578
[9]CHANG C C,L IN C J.L IBSVM:A library for support vectormachines[EB/OL].(2010-01-01)http://www.csie.ntu.edu.tw/~cjlin/libsvm,2001.
[10]K IM K I,JUNG K,PARK S H,et al.Support vcctor machines for texture classification[J].IEEE Tronsactions on Pattern Analysis and Machine Intelligence,2002,24(11):1 542-1 550.
(責(zé)任編輯莊紅林)
Design and Application of Image Feature Extraction and Classification by Using Dual-Tree ComplexWavelet Transform
LIZheng
(Modern Technology Education Depar tment,Shandong College of Arts,Jinan 250014,China)
The dual-tree complexwavelet transfor m was used to decompose imageswith four scales,and the 48-dimensional feature vectorwas generated by computingmean and standard deviation from wavelet coefficients of six-direction high-frequency subbands of each scale,using one-vs-one algorithm of the support vectormachine,the texture feature extraction and classification exper imentswere done by using 112 images of Brodatz image database.The results show that the image features of the dual-tree complexwavelet transform can effectively improve the image classification accuracy.
dual-tree complexwavelets transform;wavelet coefficients;support vectormachine;feature extraction
TP 391.41
A
1672-8513(2011)01-0053-05
10.3969/j.issn.1672-8513.2011.01.013
2010-03-09.
山東省研究生教育創(chuàng)新計劃重點項目(SDYZ06001).
李政 (1970-),男,碩士,工程師.主要研究方向:數(shù)據(jù)庫應(yīng)用、圖像檢索.