周 燕,曾凡智,趙慧民
(1.佛山科學(xué)技術(shù)學(xué)院計(jì)算機(jī)系,廣東 佛山 528000;2.廣東技術(shù)師范學(xué)院電子與信息學(xué)院, 廣東 廣州 510665)
一種HSV空間上分層壓縮感知的圖像檢索算法*
周 燕1,曾凡智1,趙慧民2
(1.佛山科學(xué)技術(shù)學(xué)院計(jì)算機(jī)系,廣東 佛山 528000;2.廣東技術(shù)師范學(xué)院電子與信息學(xué)院, 廣東 廣州 510665)
通過構(gòu)建二維壓縮感知測(cè)量模型,提出一種分層HSV特征和分層紋理特征提取與圖像檢索新算法。在圖像HSV空間上引入網(wǎng)格離散劃分和分層映射算子,定義一種基于HSV網(wǎng)格空間上的分層映射矩陣和擬灰度共生矩陣;設(shè)計(jì)歸一化Gauss隨機(jī)矩陣作為測(cè)量矩陣,使用二維壓縮感知測(cè)量模型對(duì)上述兩種矩陣進(jìn)行壓縮采樣;采用PCA(PrincipalComponentAnalysis)方法獲取上述兩種分層采樣矩陣的特征值序列,作為圖像的分層HSV特征與分層紋理特征。最后融合上述兩類特征綜合計(jì)算圖像間的整體相似度并實(shí)現(xiàn)圖像檢索。仿真實(shí)驗(yàn)表明,上述兩類特征具有很好的可區(qū)分性,有效提高了圖像檢索效率,特別對(duì)復(fù)雜背景的圖像檢索性能更優(yōu)
二維壓縮感知;分層紋理特征;分層HSV特征;擬灰度共生矩陣
為了充分利用互聯(lián)網(wǎng)環(huán)境下產(chǎn)生的海量數(shù)字圖片資源,需要對(duì)其進(jìn)行有效的存儲(chǔ)、管理、重用及高效檢索?;趦?nèi)容的圖像檢索(Content-Based Image Retrieval, CBIR)正是解決此類問題的有效方法,也是當(dāng)前圖像分析、計(jì)算視覺中最為活躍的領(lǐng)域之一。CBIR主要以顏色、紋理、形狀等底層物理特征作為圖像內(nèi)容特征,研究重點(diǎn)包括圖像內(nèi)容特征的高效提取及相似度計(jì)算兩個(gè)方面。由于單一的圖像底層特征不能全面概括圖像內(nèi)容,融合多類特征實(shí)現(xiàn)圖像檢索成為主要研究方向。文獻(xiàn)[1]提出了一種綜合顏色、形狀和紋理特征的圖像檢索方法,但權(quán)值系數(shù)的選擇對(duì)檢索精度影響較大。文獻(xiàn)[2]提出了一種融合語義特征和視覺特征的紋理圖像檢索方法,但需要進(jìn)行語義轉(zhuǎn)換及反饋處理。結(jié)合人眼視覺特性,文獻(xiàn)[3]提出了一種基于HSV空間的彩色邊緣圖像檢索方法,但提取邊緣特征豐富程度稍欠缺。文獻(xiàn)[4]提出了在HSV空間上提取均值、標(biāo)準(zhǔn)誤差等顏色特征,并采用灰度共生矩陣提取紋理特征的圖像檢索方法,但相似度計(jì)算過程較為復(fù)雜。文獻(xiàn)[5]基于多尺度幾何分析的Contourlet變換提取分層圖的顏色、紋理特征,結(jié)合相關(guān)反饋機(jī)制提出了一種較有效的圖像檢索方法,但需要人機(jī)交互式參與。文獻(xiàn)[6]提出了一種融合顏色、紋理、邊界及形狀特征的逐步逼近的圖像檢索方法,減少了初始候選集的大小,但未能考慮各類特征融合的相似度計(jì)算。文獻(xiàn)[7]通過量化HSV顏色空間及結(jié)合顏色和紋理特征的特征向量構(gòu)建權(quán)重系數(shù),提出了一種融合顏色特征和紋理特征的圖像檢索方法。文獻(xiàn)[8]通過提取輪廓段序列及計(jì)算基于動(dòng)態(tài)規(guī)劃的近似串匹配鏈的相似性,提出了一種基于用戶繪制草圖的圖像檢索方法。在文獻(xiàn)[9]中,作者對(duì)壓縮感知理論應(yīng)用于圖像快速檢索中做了有益的探索。在文獻(xiàn)[10]中,作者提出了一種行列二維壓縮測(cè)量模型,提取圖像特征并應(yīng)用于圖像檢索,取得較好的效果,但計(jì)算量高度依賴于圖像的分塊數(shù)。綜上所述,目前相關(guān)算法在高效特征提取及相似度計(jì)算等方面仍有待進(jìn)一步提升。
本文基于壓縮感知理論[11-13],采用二維壓縮測(cè)量模型,設(shè)計(jì)滿足RIP條件的行列測(cè)量矩陣[13],通過分層方式對(duì)圖像HSV進(jìn)行分層映射,獲取圖像分層HSV特征及分層紋理特征,設(shè)計(jì)一種融合分層HSV特征和紋理特征的圖像檢索算法。研究圖像HSV空間上的離散劃分與分層映射算子,定義一種基于網(wǎng)絡(luò)空間的擬灰度共生矩陣,采用二維壓縮測(cè)量過程生成圖像壓縮測(cè)量值并構(gòu)成矩陣,采用PCA方法獲取協(xié)方差矩陣特征值序列,作為圖像的兩類內(nèi)容特征向量,并提出多特征融合相似度度量指標(biāo)。
1.1 二維壓縮感知測(cè)量模型
對(duì)二維可稀疏信號(hào)直接采用二維壓縮感知測(cè)量過程能避免設(shè)計(jì)測(cè)量矩陣的維數(shù)災(zāi)難,同時(shí)也能保持圖像像素點(diǎn)之間的相對(duì)位置。自然圖像在離散余弦變換DCT、離散傅里葉變換DFT、離散小波變換DWT等變換下是二維可稀疏信號(hào)[14]。文獻(xiàn)[10]、[14]中提出了一種2D的壓縮感知模型如下:
(1)
其中X∈RN×N代表二維圖像信號(hào),Φ1,Φ2∈RM×N分別是行、列壓縮測(cè)量矩陣,Y∈RM×M代表二維壓縮測(cè)量值。若Φ1、Φ2選取合適歸一化Gauss隨機(jī)矩陣,則通過等價(jià)l1范數(shù)優(yōu)化問題求解能夠高概率地由測(cè)量值Y重構(gòu)二維信號(hào)量X[14]。因此采用公式(1)獲取少量二維測(cè)量值Y可以作為原始圖像X的一類內(nèi)容特征。
1.2 壓縮測(cè)量矩陣
通過對(duì)Gauss隨機(jī)矩陣進(jìn)行列歸一化處理,選定測(cè)量矩陣Φ1=Φ2=Φ,其構(gòu)造如公式(2)所示:
(2)
特征提取算法是CBIR的最重要研究內(nèi)容,檢索的準(zhǔn)確率主要取決于圖像特征的提取。在本文算法中,主要提取分層HSV特征和分層紋理特征。
2.1 分層HSV特征的提取
對(duì)于大小為N×N的二維RGB圖像X,首先通過顏色變換把圖像從RGB空間變?yōu)镠SV空間[3]。然后通過二維壓縮感知模型獲取圖像分層HSV特征,其算法過程如下。
1)二維圖像的HSV空間網(wǎng)格離散化:選取H、S、V軸的離散點(diǎn)對(duì)HSV空間進(jìn)行離散網(wǎng)格劃分,每個(gè)立方體網(wǎng)格單元記為Vl,對(duì)網(wǎng)格單元按照行優(yōu)先次序排序,得到網(wǎng)格單元序列:Vl(l=1,2,…,L),其中L代表網(wǎng)格單元總數(shù)。在網(wǎng)格單元Vl上,定義原始圖像的稀疏分層映射算子
(3)
其中l(wèi)=1,2,…,L;i,j=1,2,…,N。H(i,j),S(i,j),V(i,j)分別代表像素點(diǎn)(i,j)處HSV值。
2)分層HSV特征:對(duì)每個(gè)選定網(wǎng)格單元Vl,矩陣(A(i,j,l))N×N反映了圖像HSV空間上Vl鄰域內(nèi)的像素點(diǎn)在平面坐標(biāo)上相對(duì)位置的分布狀況。若H、S、V各分量的分層數(shù)選取合適,則第l層上矩陣(A(i,j,l))N×N是一個(gè)稀疏二維信號(hào),采用二維壓縮感知模型公式(1),對(duì)其進(jìn)行二維壓縮感知測(cè)量:
Yl=TDCS°A=
(4)
其中l(wèi)=1,2,…,L。
第l層的分層HSV特征向量定義為λl:
(5)
其中l(wèi)=1,2,…,L代表分層的層數(shù)。
3)分層HSV特征的可區(qū)分性:分層二維壓縮感知測(cè)量值Yl∈RM×M及特征向量λl,比傳統(tǒng)顏色直方圖具有更好可區(qū)分性。
設(shè)有如圖1所示的兩個(gè)子圖T,T′,其形態(tài)如下。
圖1 分層測(cè)量特征差異分析圖Fig.1 Difference analysis for Hierarchical measurement feature
如圖1所示,把子圖T,T′劃分為大小N/2×N/2的4個(gè)子塊,子圖T的左上角子塊與子圖T′的左下角子塊有紅色對(duì)角線,其它子塊的顏色都相同。按照顏色直方圖進(jìn)行計(jì)算,這兩個(gè)子圖對(duì)應(yīng)的傳統(tǒng)顏色直方圖完全一樣。
針對(duì)子圖T,T′,下面分析本文提出的分層壓縮測(cè)量特征的差異。
假設(shè)紅色分層在第l層上,經(jīng)過分層映射后,得到如下的分塊矩陣:
其中I,0分別代表N/2×N/2的單位矩陣和零矩陣。
對(duì)測(cè)量矩陣Φ1,Φ2∈RM×N也做如下分塊:
其中Φ11,Φ12,Φ21,Φ22∈RM×(N/2)。
針對(duì)子圖T,T′,采用公式(4)得到如下的分層二維壓縮感知測(cè)量值:
在第l層上,它們的差異如下:
(6)
(7)
其中c0,c0′是只與測(cè)量矩陣Φ1,Φ2相關(guān)的常數(shù)。
公式(6)、(7)表明,針對(duì)子圖T,T′的分層壓縮測(cè)量值Yl以及特征向量λl,由于它們保留了顏色空間分層鄰域與像素點(diǎn)的位置關(guān)系,因此能夠體現(xiàn)更精細(xì)化的差異,比傳統(tǒng)的顏色直方圖具有更好的可區(qū)分性。
2.2 分層紋理特征的提取
擬灰度共生矩陣與分層紋理特征:傳統(tǒng)灰度共生矩陣是用來描述紋理特征的經(jīng)典數(shù)據(jù)結(jié)構(gòu),是關(guān)于圖像灰度級(jí)在空間分布上的綜合描述,通過提取有意義的統(tǒng)計(jì)特性來表達(dá)圖像的紋理特征。灰度共生矩陣的構(gòu)造依賴于像素點(diǎn)之間的方向和距離。在HSV空間網(wǎng)格劃分基礎(chǔ)上,本文提出一種基于網(wǎng)格劃分的擬灰度共生矩陣,是關(guān)于圖像網(wǎng)格鄰域在空間分布上的綜合描述。擬灰度共生矩陣與方向θ和距離d這兩個(gè)參數(shù)有關(guān),其定義如下:
M(θ,d)=(Ml1l2(θ,d))L×L
Ml1l2(θ,d)=
其中l(wèi)1,l2=1,2,…,L代表分層的層數(shù),#(·)表示集合基數(shù)。方向θ和距離d參數(shù)可選取如下序列:
當(dāng)參數(shù)θ,d選取不同角度、不同距離的參數(shù)時(shí),矩陣M(θ,d)可以看作是傳統(tǒng)灰度共生矩陣的推廣,它集中反映了HSV顏色空間分層鄰域間的紋理特征。
矩陣M(θ,d)是二維可稀疏信號(hào),采用公式(1)的二維壓縮感知模型進(jìn)行測(cè)量,得到與紋理相關(guān)的分層測(cè)量值:
(8)
其中l(wèi)=(i-1)×L1+j;i=1,2,…,L1;j=1,2,…,L2;l=1,2,…,L3;L3=L1×L2。
(9)
經(jīng)過歸一化處理后得到圖像間的整體相似度:
(10)
本文采用的開發(fā)平臺(tái)為Matlab2012和VisualStudio2008,測(cè)試平臺(tái)為聯(lián)想M440S個(gè)人電腦,硬件配置:CPU:Intel(R)I5-4200U4×2.4GHz,內(nèi)存:4GBDDR3L,操作系統(tǒng)為32位的Windows7SP1。采用標(biāo)準(zhǔn)Corel圖像集,從中選取1 000幅圖像進(jìn)行仿真實(shí)驗(yàn),共10類,每類100幅圖像,包括非洲、海灘、建筑、公交車、恐龍、大象、花、馬、雪山和食物。圖像大小為256×384和384×256。
4.1 分層HSV特征與分層紋理特征的仿真實(shí)驗(yàn)
為了進(jìn)一步分析分層HSV特征和分層紋理特征,選取Corel 1 000圖像集中的五類圖像,分別是馬、花、非洲、恐龍、食物,對(duì)這五類圖像分層紋理特征值和分層HSV特征值進(jìn)行對(duì)比分析。分層紋理特征值對(duì)比如圖2所示,同類圖像的分層特征有較高的相似度,而不同類別圖像的差別是非常明顯的。對(duì)分層HSV特征作同樣分析,圖3是五種不同類別圖像的HSV分層特征對(duì)比圖,圖中所示是對(duì)應(yīng)的分層HSV特征向量λl的2-范數(shù)值,不同類別圖像的差別是非常明顯的。
以上仿真實(shí)驗(yàn)表明,本文提取的分層HSV特征與分層紋理特征對(duì)不同類別的圖像具有較高的可區(qū)分性,為提高圖像的檢索準(zhǔn)確率奠定了基礎(chǔ)。
圖2 五類圖像的分層紋理特征值對(duì)比圖Fig.2 Comparison of hierarchical texture features for five kinds of images
圖3 五類圖像的分層HSV特征值對(duì)比圖Fig.3 Comparison of hierarchical HSV features for five kinds of images
4.2 本文算法檢索結(jié)果
本文采用256維的分層HSV測(cè)量特征向量和基于擬灰度共生矩陣的分層紋理測(cè)量特征向量進(jìn)行組合檢索。由于非洲和食物這兩類圖像的背景較復(fù)雜,在已有的檢索算法中其檢索準(zhǔn)確率不高。利用本文算法得到的檢索結(jié)果如圖4-5所示,每頁包含25幅圖像,其中第一頁的檢索結(jié)果全部相關(guān),表明本文算法的檢索準(zhǔn)確率較高。
圖4 “非洲”圖像的檢索結(jié)果Fig.4 Retrieval result for African image
圖5 “食物”圖像的檢索結(jié)果Fig.5 Retrieval result for Food image
4.3 不同算法的檢索性能比對(duì)分析
為了客觀地評(píng)價(jià)各種算法的圖像檢索性能,本文以查準(zhǔn)率和查全率作為評(píng)價(jià)指標(biāo),采用Corel1 000作為測(cè)試圖像集,從每類圖像中任意選取20幅圖像作為檢索樣本,對(duì)各類圖像設(shè)置相應(yīng)的權(quán)值。本文算法與文獻(xiàn)[1]、文獻(xiàn)[4]的圖像查準(zhǔn)率和查全率的對(duì)比結(jié)果如圖6-7所示。從圖中可以看出,本文算法具有較好的性能,多種類別圖像的查準(zhǔn)率超過80%,總的平均查準(zhǔn)率達(dá)到82.2%,其中有6類圖像的平均查準(zhǔn)率優(yōu)于文獻(xiàn)中得到的平均查準(zhǔn)率。本文算法的平均查準(zhǔn)率比文獻(xiàn)[1]高出2.45%,比文獻(xiàn)[4]高出5.75%。
多種類別圖像的查全率超過50%,平均查全率達(dá)到47.6%,其中有9類圖像的平均查全率優(yōu)于文獻(xiàn)中得到的平均查全率。本文算法的平均查全率比文獻(xiàn)[1]高出7.9%,比文獻(xiàn)[4]高出10.5%。
圖6 平均查準(zhǔn)率對(duì)比結(jié)果Fig.6 The comparative analysis for average precision
圖7 平均查全率對(duì)比結(jié)果Fig.7 The comparative analysis for average recall
由于用HSV表達(dá)圖像更接近人類對(duì)顏色概念的理解,因此在計(jì)算機(jī)視覺領(lǐng)域獲得廣泛應(yīng)用。首先在圖像HSV空間上引入網(wǎng)格離散和分層映射思想,定義一種基于HSV網(wǎng)格空間的擬灰度共生矩陣。然后構(gòu)建歸一化Gauss隨機(jī)矩陣作為測(cè)量矩陣,采用二維壓縮感知測(cè)量模型對(duì)HSV分層映射矩陣、擬灰度共生矩陣進(jìn)行壓縮采樣。最后采用PCA方法提取圖像的分層HSV特征與分層紋理特征,并融合這兩類特征綜合計(jì)算圖像的相似度。仿真實(shí)驗(yàn)結(jié)果表明這兩類特征具有很好的可區(qū)分性,對(duì)復(fù)雜背景的圖像檢索具有較好的效果。本文對(duì)二維壓縮感知理論與圖像分析的結(jié)合做了有益探索,今后將在形狀、邊界等內(nèi)容特征的壓縮感知采樣方面作進(jìn)一步研究,融入更多內(nèi)容特征以提高圖像檢索效率。
[1] 張永庫,李云峰,孫勁光. 基于多特征融合的圖像檢索[J].計(jì)算機(jī)應(yīng)用,2015, 35(2):495-498.
[2] 李清勇,施智平,史忠植. 綜合語義特征和視覺特征的二階段紋理圖像檢索[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2008,20(4):499-505.
[3] 楊紅穎,吳俊峰,于永健,等.一種基于HSV空間的彩色邊緣圖像檢索方法[J].中國圖象圖形學(xué)報(bào),2008,13(10): 2035-2038.
[4]LAICC,CHENYC.Auser-orientedimageretrievalsystembasedoninteractivegeneticalgorithm[J].IEEETransactionsonInstrumentationandMeasurement, 2011, 60(10): 3318-3325.
[5]KUNDUMK,CHOWDHURYM,BULOSR.Agraph-basedrelevancefeedbackmechanismincontent-basedimageretrieval[J].Knowledge-BasedSystems, 2015,73:254-264.
[6]SHRIVASTAVAN,TYAGIV.Anefficienttechniqueforretrievalofcolorimagesinlargedatabases[J].ComputersandElectricalEngineering, 2014,11(9) :1-14.
[7]YUEJ,LIZB,LIUL,FUZT.Content-basedimageretrievalusingcolorandtexturefusedfeatures[J].MathematicalandComputerModelling, 2011, 54(3/4): 1121-1127.
[8]PARISS,MITTALA.Similarity-invariantsketch-basedimageretrievalinlargedatabases[J].EuropeanConferenceonComputerVision, 2014, 8694: 398-414.
[9] 周燕,曾凡智,盧炎生,等.基于壓縮感知的圖像檢索方法研究[J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,53(1):57-62.
[10] 周燕,曾凡智,盧炎生,等.面向制造領(lǐng)域的三視圖模型組件快速檢索方法研究[J],中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,53(4):62-68.
[11]CANDESE,WAKINM.Anintroductiontocompressivesampling[J].IEEESignalProcessingMagazine, 2008, 25(2): 21-30.
[12] 焦李成,楊淑媛,劉芳,等.壓縮感知回顧與展望[J].電子學(xué)報(bào),2011,39(7):1651-1662.
[13] 許志強(qiáng). 壓縮感知[J]. 中國科學(xué)(數(shù)學(xué)),2012,42(9): 865-877.
[14]CHENG,LIDF,ZHANGJS.Iterativegradientprojectionalgorithmfortwo-dimensionalcompressedsensingsparseimagereconstruction[J].SignalProcessing, 2014, 104:15-26.
An image retrieval algorithm based on hierarchical compressive sensing in HSV space
ZHOUYan1,ZENGFanzhi1,ZHAOHuimin2
( 1.Department of Computer Science, Foshan University, Foshan 528000, China;2.School of Electronic and Information Engineering, Guangdong Polytechnic Normal University,Guangzhou 510665, China)
By constructing a two-dimensional (2D) compressive sensing (CS) measurement model, a new image retrieval algorithm is proposed by extracting hierarchical HSV features and texture features. Firstly, the ideas of grid discrete partition and hierarchical mapping in HSV space are introduced, and hierarchical mapping matrix and similar GLCM in HSV grid space are defined. Secondly, the normalized Gauss random matrix is designed as measurement matrix, and compressive sampling on the above two matrixes is performed by 2D CS measurement model. With using PCA(Principal Component Analysis), the feature sequences as hierarchical HSV features and texture features are obtained from the above two hierarchical sampling matrixes. Finally, the above two features are infused to compute the overall similarity among images. Experimental results show that the above two features have good discrimination. It can improve the efficiency for image retrieval, and has good performance especially for images with complex backgrounds.
two-dimensional compressive sensing; hierarchical texture feature; hierarchical HSV feature; similar GLCM
10.13471/j.cnki.acta.snus.2016.03.013
2015-12-26
廣東省自然科學(xué)基金資助項(xiàng)目(2015A030313635,2015A030313672,2016A030311013);廣東省科技計(jì)劃資助項(xiàng)目(2014A010103037);廣東省教育廳省級(jí)重大資助項(xiàng)目(2014KZDXM060,2015KGJHZ021);廣東省教育廳特色創(chuàng)新類資助項(xiàng)目(2015KTSCX153);佛山市科技創(chuàng)新專項(xiàng)資金資助項(xiàng)目(2015AG10008,2014AG10001);佛山科學(xué)技術(shù)學(xué)院優(yōu)秀青年教師培養(yǎng)計(jì)劃資助項(xiàng)目(fsyq201411)
周燕(1979年生),女;研究方向:圖像處理,數(shù)字水印;E-mail:zhouyan791266@163.com
TP
A
0529-6579(2016)03-0077-06