肖 鋒,李茹娜,胡秀華
(西安工業(yè)大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,西安 710021)
人類在觀察世界時,會將目光集中在部分信息上,使感知具有選擇能力.顯著性檢測正是在這種人類視覺注意基礎(chǔ)上提出并發(fā)展起來的,通過捕獲最吸引人眼興趣的目標(biāo)區(qū)域,以去除圖像中的冗余信息,其在目標(biāo)檢測與識別[1]、圖像分割[2]、圖像檢索[3]、自適應(yīng)壓縮[4]等領(lǐng)域有著廣泛的應(yīng)用.
在顯著目標(biāo)檢測方法中,文獻(xiàn)[5]提出的基于生物啟發(fā)模型和特征整合理論的方法是最早的顯著性計算模型之一,該方法不能得到全分辨率的顯著圖.人類視覺系統(tǒng)具有將事物組合成簡單單元的傾向,隨后研究者采用計算感知單元之間的對比度來度量不同特征的顯著值.文獻(xiàn)[6]通過計算以某像素點(diǎn)為中心的矩形區(qū)域與周圍矩形區(qū)域的顏色直方圖間的歐氏距離來表示顯著性;文獻(xiàn)[7]通過計算一個感知單元的顏色和亮度在不同鄰域的局部對比度來實(shí)現(xiàn)多尺度顯著性計算;文獻(xiàn)[8]以圖像塊為基本單位,在多層次上結(jié)合局部特征和全局特征估計塊的顯著性,得到了較好的結(jié)果.上述使用圖像均勻分塊的方法存在問題,若塊過小,不能體現(xiàn)出像素的結(jié)構(gòu)特性,同時降低計算效率;若塊過大,導(dǎo)致不同特征的像素劃分到同一區(qū)域.這類方法得到的顯著圖更趨向于突出邊緣特征,而非一致地強(qiáng)調(diào)整個顯著目標(biāo).為了解決上述問題,越來越多的算法采用基于區(qū)域?qū)Ρ鹊姆椒ㄓ嬎泔@著性.文獻(xiàn)[9]將基于圖的分割算法運(yùn)用到顯著性檢測中,在區(qū)域顏色對比度的基礎(chǔ)上引入空間信息并結(jié)合基本元素大小來計算圖像的顯著性,可以一致突出顯著目標(biāo),檢測結(jié)果精度高且全面,但其缺陷在于過分依賴顏色特征,對顏色差別不大或高紋理圖像得到的顯著圖中包含較多非顯著信息;文獻(xiàn)[10]提出一種基于多尺度超像素的顯著性目標(biāo)檢測算法,在多尺度超像素分析的基礎(chǔ)上,通過計算局部對比度和中心偏差,并利用貝葉斯增強(qiáng)的方法進(jìn)行不同尺度融合,得到了高質(zhì)量的顯著圖;文獻(xiàn) [11]將低秩表示(Low-Rank Representation,LRR)模型應(yīng)用到顯著性檢測上,將一幅圖像表示為低秩的背景部分和稀疏的顯著部分,應(yīng)用顏色、紋理等底層特征和高層的先驗(yàn)知識得到較好的效果.
文中擬提出一種融合顏色區(qū)域?qū)Ρ榷扰c稀疏低秩的顯著性檢測方法,在超像素分割的基礎(chǔ)上分別計算區(qū)域顏色對比度和紋理對比度,根據(jù)人類視覺注意力容易集中在中心位置,結(jié)合空間位置分布得到初始顯著圖,利用稀疏低秩分解來進(jìn)一步抑制非顯著信息,得到最終顯著圖.
文中提出的顯著性檢測方法主要步驟為:① 利用SLIC方法對原始圖像進(jìn)行超像素分割,得到輪廓清晰的超像素;② 計算分割后圖像的區(qū)域顏色對比度、紋理對比度和空間位置分布,并將三者得到的顯著信息進(jìn)行融合得到初始顯著圖;③ 對初始顯著圖進(jìn)行稀疏低秩分解來抑制非顯著信息,以提高最終顯著圖的質(zhì)量.
人類視覺關(guān)注的是圖像中梯度變化較大的區(qū)域,傳統(tǒng)均勻分塊方法在一定程度上破壞了圖像的邊緣特征,超像素分割可以有效捕捉代表圖像中層的結(jié)構(gòu)化信息,大幅度降低后續(xù)對比度計算的復(fù)雜度.
SLIC(Simple Linear Iterative Clustering)[12]是一種采用聚合分類基本思想的算法,該算法將RGB彩色圖像轉(zhuǎn)換到CIELab顏色空間,利用亮度和有關(guān)色彩的兩個分量以及XY坐標(biāo)構(gòu)成5維特征向量,通過梯度下降方法不斷進(jìn)行聚類,直到所有像素分類完畢.SLIC方法可以自由控制超像素數(shù)目,圖1給出了將一幅大小為400*300的圖像在3個不同尺度下進(jìn)行超像素分割的結(jié)果,分割數(shù)目越多,計算越精細(xì),但同時會增加計算量.文中將每幅圖像分割為400個超像素,由圖1中可以看出花瓣邊緣信息保存完整,有利于顯著性檢測的后續(xù)操作.
圖1 SLIC超像素分割結(jié)果圖Fig.1 SLIC super-pixels segmentation results
對人類視覺系統(tǒng)的研究表明,人眼對于周圍物體顏色差異非常大的部分感知更為強(qiáng)烈[13],因此,圖像的顯著性就可以由區(qū)域間的顏色對比反差來度量.CIELab顏色空間將亮度和色度分量分開表示,在Lab空間上計算的顏色距離符合人類視覺對不同顏色差異性的感知.
由于同一超像素內(nèi)的顏色差異較小,計算超像素在Lab空間上的L、a、b平均值作為該超像素的特征描述,對于超像素pi和pj,它們之間的顏色差異定義為:
dcolor(pi,pj)=‖Im(i)-Im(j)‖
(1)
式中:Im(·)表示區(qū)域的顏色均值;‖·‖為兩個超像素在CIELAB空間的歐氏距離.圖2為獲取顯著圖過程,其中圖2(b)給出了通過區(qū)域顏色對比度得到的顯著圖.
除了顏色對比度之外,空間關(guān)系在人類視覺注意力方面也起到一定的影響,文獻(xiàn)[9]提出相鄰區(qū)域的高對比度比很遠(yuǎn)區(qū)域的高對比度更易導(dǎo)致一個區(qū)域引起視覺注意,即兩個區(qū)域顏色相差越大,且平面距離越近,越容易引起視覺注意.
利用超像素的聚類中心來計算空間距離,將空間距離作為衡量區(qū)域顏色對比度的權(quán)重,得到區(qū)域的顯著度為
(2)
(3)
其中N為超像素數(shù)目,dspace(pi,pj)為兩超像素的聚類中心距離.σ2控制空間距離的強(qiáng)度,σ2越大,空間權(quán)重影響越小,文中σ2的取值范圍為[0.3,0.6].圖2(c)為引入空間距離權(quán)重后得到的顯著圖,可以看到顯著部分得到了增強(qiáng).
人眼在觀察圖像時注意力由中央向周圍遞減,照相選景也總是將所關(guān)注的物體或部位放在取景器的中央位置,這表明圖像的重要性一般是由中央向周圍遞減的.本文將圖像區(qū)域位置信息引入到顯著性檢測過程中,通過計算超像素到圖像中心的距離來度量顯著性,距離越遠(yuǎn),表示離圖像中心的偏離程度越大,成為背景部分的可能性就越大,顯著值就應(yīng)該越小,距離越近則相反.空間位置顯著值的計算方法定義如下:
sal2(pi)=1-‖Ci-Ccenter‖
(4)
式中:Ccenter表示一幅圖像的中心位置;‖·‖表示某超像素聚類中心到圖像中心的歐氏距離.圖2(d)為根據(jù)空間位置得到的顯著圖,可以看到顯著性由圖像中心依次向周圍遞減.
紋理特征是一種不依賴于顏色或亮度的反應(yīng)圖像中同質(zhì)現(xiàn)象的視覺特征.人類視覺系統(tǒng)對不同頻率的信號和方向具有不同的感受,Gabor濾波器對于圖像的邊緣敏感,能夠提供良好的尺度選擇和方向選擇的局部結(jié)構(gòu)信息.
文中在4個尺度3個方向上采用Gabor濾波器響應(yīng)得到12個圖像紋理特征,然后將不同尺度的特征圖取平均值得到3個不同朝向的特征圖,再通過取平均值合并得到圖像的紋理特征向量,由每個超像素的紋理特征向量構(gòu)成矩陣T={t1,t2,…,tN}.紋理可通過相鄰像素間的相關(guān)性來表示,基于前面的超像素分割,定義超像素間的紋理對比度為
(5)
式中:sal3(i)為超像素pi的紋理對比度;‖·‖2為向量的2范數(shù);N為超像素的數(shù)目.
在顯著性檢測中,不同特征可以從不同方面反映圖像的顯著性,通過綜合考慮顏色區(qū)域?qū)Ρ榷取⒖臻g位置、紋理特征后,將它們進(jìn)行融合,以更好的適用于不同場景.將每部分得到的顯著值都?xì)w一化到[0,1],采用式(6)的融合公式,得到的顯著圖如圖2(e)所示.
sal(i)=sal1(pi)*sal2(pi)*sal3(pi)
(6)
由圖2(e)可以看出,初始顯著圖可以粗略的區(qū)分顯著部分和背景信息,但顯著部分中存在著部分非顯著信息,本文采用稀疏低秩分解的方法來進(jìn)行抑制,以提高顯著圖的質(zhì)量.
在對圖像顯著性的先驗(yàn)假設(shè)中,顯著部分的特征往往具有低規(guī)律性且冗余度低,可以進(jìn)行稀疏表示;背景部分的特征冗余度高,其結(jié)構(gòu)具有很大的相似性,可以進(jìn)行低秩表示,這樣對于一幅圖像,可以將其表示為稀疏部分和低秩部分,即X=Z+E.一個矩陣數(shù)據(jù)可以被分解為冗余部分和稀疏部分,但當(dāng)?shù)椭染仃嚭拖∈杈仃囬g有很強(qiáng)一致性時,矩陣分解性能下降,圖2(e)得到的初始顯著圖中只含有少量非顯著性信息,對其進(jìn)行稀疏低秩分解,如下:
(7)
式中:P為輸入圖像矩陣;Z和E分別對應(yīng)低秩部分和稀疏部分.由于這是一個NP-Hard的問題,需要將(7)式轉(zhuǎn)化為如下優(yōu)化問題,式(8)可通過增廣拉格朗日(ALM)的方法進(jìn)行求解.
(8)
式中:X為初始顯著圖,XZ對應(yīng)于圖像背景冗余部分;E為圖像的顯著部分;‖·‖*為矩陣的核范數(shù),即矩陣所有奇異值之和,‖·‖2,1為矩陣的L2,1范數(shù).λ為平衡低秩和稀疏兩部分的系數(shù),實(shí)驗(yàn)中取λ=0.01.經(jīng)過低秩矩陣分解得到的最終顯著圖如圖2(f)所示,花上方的背景信息得到較為明顯的抑制.
為了驗(yàn)證文中算法的效果,在國際上公開的MSRA數(shù)據(jù)集上隨機(jī)選取1000張圖片作為測試集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集提供了由人工精確標(biāo)注的顯著性區(qū)域(Ground Truth)供評價使用.在實(shí)驗(yàn)中,采用主流的數(shù)據(jù)評價方式全面的評價文中算法.
將文中方法與GB[14]、SR[15]、LC[16]、FT[17]、CA[8]、RC[9]6種比較流行的顯著性檢測方法進(jìn)行比較,從數(shù)據(jù)集中挑選7幅圖像來進(jìn)行對比實(shí)驗(yàn),原始圖像及各種方法的實(shí)驗(yàn)結(jié)果如圖3所示.
圖3 7種顯著性檢測算法比較結(jié)果
基于人眼的主觀感受,由圖3顯著性檢測結(jié)果可以看出,GB和SR算法能標(biāo)識出顯著目標(biāo)的位置,得到的顯著圖邊緣輪廓較模糊.LC和FT由于其方法的單一性,對于個別圖像檢測效果較好,但不能有效排除背景中的干擾信息.CA算法檢測效果類似于GB算法,但相比于GB能明顯突出顯著目標(biāo)邊緣,且含有較少的背景信息,但不能完全突出圖像中的整個顯著性區(qū)域.RC算法能夠一致突出整個顯著性目標(biāo),但這種方法過分依賴于顏色,對于背景復(fù)雜或顏色差別不大的圖像檢測效果欠佳,比如圖3中第六、七幅圖像.相比之下,使用本文算法得到的檢測結(jié)果和ground Truth最相近,對于第六幅那種背景復(fù)雜的圖像,我們的方法仍然能夠突出整個顯著目標(biāo),同時抑制背景信息,產(chǎn)生更加合理的顯著圖.從主觀視覺效果角度來看,本文算法要優(yōu)于其他六種傳統(tǒng)經(jīng)典算法.
實(shí)驗(yàn)一 不同幾種算法平均準(zhǔn)確率、平均召回率和F-measure值比較以及PR曲線比較.對實(shí)驗(yàn)結(jié)果進(jìn)行定量評價,使用文獻(xiàn)中的查準(zhǔn)率P(Precision)和查全率R(Recall)兩個指標(biāo)[18]來比較各種算法所生成的顯著圖與基準(zhǔn)圖的差異,采用F-measure[19]值來綜合兩種評價標(biāo)準(zhǔn),使兩者之間保持均衡,各指標(biāo)計算公式如下:
(9)
(10)
(11)
式中:Sd為算法檢測得到的顯著區(qū)域;Sg為基準(zhǔn);β用來確定精確率對于召回率的重要性,一般設(shè)置β2=0.3使得精確率略高于召回率.
為了更加直觀有效地反應(yīng)顯著性檢測結(jié)果,采用自適應(yīng)閾值分割方法對得到的顯著圖進(jìn)行二值化處理,計算得到精確率、召回率和F值三個指標(biāo)如圖4所示.使用固定閾值對顯著圖進(jìn)行分割得到精確率-召回率(PR)曲線如圖5所示.
圖4 不同算法的Precision、Recall和F-measure值
圖5 不同方法PR曲線對比
文中算法的精確率、召回率和F-measure值分別為90.81%、87.63%和90.06%.從圖5中看出PR曲線最靠近右上方,在相同召回率的情況下,相比其他幾種算法具有更高的精度,表明文中算法的檢測結(jié)果優(yōu)于其他幾種對比算法.
實(shí)驗(yàn)二 顏色區(qū)域?qū)Ρ榷戎锌臻g距離權(quán)值系數(shù)σ2對實(shí)驗(yàn)結(jié)果的影響如圖6所示,文中使用式(11)的F-measure來測試σ2變化時對實(shí)驗(yàn)結(jié)果的影響.當(dāng)σ2=0.4時,F(xiàn)-measure取得最大值,檢測結(jié)果最佳;當(dāng)σ2>1時,其變化對算法影響較小,此時相當(dāng)于空間距離權(quán)值在區(qū)域顏色對比度中沒有起到作用;當(dāng)σ2<0.3時,空間權(quán)值對實(shí)驗(yàn)結(jié)果的影響較大,會導(dǎo)致得到的顯著圖只有一小部分.每幅圖像的顯著部分占整個圖像大小的比例不同,結(jié)合圖6,當(dāng)空間距離權(quán)值系數(shù)σ2的取值范圍位于[0.3,0.6]時,F(xiàn)-measure取得較大值,且較穩(wěn)定.
圖6 F-σ2曲線
實(shí)驗(yàn)三 比較基于顏色區(qū)域?qū)Ρ榷忍卣鞯娘@著性結(jié)果、融合三種特征后的顯著性檢測結(jié)果以及經(jīng)過稀疏低秩分解后的顯著性檢測結(jié)果,得到相應(yīng)PR曲線如圖7所示.
圖7 PR曲線
由圖7可知,采用多特征融合(曲線2)比基于單個顏色區(qū)域?qū)Ρ榷?曲線1)的方法提高了算法的準(zhǔn)確率,在經(jīng)過稀疏低秩分解(曲線3)后,由于部分非顯著信息被抑制,使得算法的準(zhǔn)確率有了進(jìn)一步的提升.
文中針對現(xiàn)有顯著性檢測算法在突出顯著目標(biāo)的同時對背景非顯著信息抑制效果不佳的問題,提出一種采用區(qū)域?qū)Ρ榷群拖∈璧椭确纸庀嘟Y(jié)合的方法,該方法將多種特征融入顯著性區(qū)域檢測方法中,生成更加符合人類感知的顯著圖;采用稀疏低秩分解去除初始顯著圖中的背景信息,使得文中方法在處理背景較復(fù)雜的圖像上,改進(jìn)效果明顯,得到更高質(zhì)量的顯著圖,有利于場景與圖像的進(jìn)一步分析與處理.
實(shí)驗(yàn)結(jié)果表明,與其他6種算法相比,文中算法在精確率、召回率和F值上都有所提高,相比于檢測效果較好的RC算法,F(xiàn)-measure提高了2.78%.然而,如何對不同尺度下的場景圖像互補(bǔ)以及復(fù)雜場景下多目標(biāo)檢測仍然是需要研究的問題.