張寶軍, 張麗丹, 吳成茂, 田妮花
(1. 西安郵電大學(xué) 電子工程學(xué)院, 陜西 西安 710121; 2.中國(guó)石油慶陽(yáng)石化公司, 甘肅 慶陽(yáng) 745002)
圖像分割[1-2]是圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域中的核心研究?jī)?nèi)容,圖像分割的好壞直接影響圖像分析、識(shí)別等其它后續(xù)工作。
圖像分割的方法很多,其中模糊C均值(fuzzy C-means,F(xiàn)CM)聚類算法[3-4]被廣泛應(yīng)用于圖像分割,但其只考慮到圖像的灰度信息,未考慮到鄰域像素的相關(guān)性,致使算法對(duì)噪聲的魯棒性差,分割效果不理想[5]。空間約束模糊C均值(fuzzy C-means with spatial constraints,F(xiàn)CM_S)聚類算法[5]將像素鄰域空間信息加入到FCM算法的目標(biāo)函數(shù)中,抗噪性能有一定的提高,但增加了算法的迭代次數(shù)和聚類時(shí)間,其改進(jìn)算法FCM_S1和FCM_S2[6]分別用鄰域矩陣的均值和中值代替FCM_S算法中鄰域像素,降低了算法的計(jì)算復(fù)雜度,前者對(duì)高斯噪聲有很好的魯棒性,但對(duì)椒鹽噪聲的效率較低;后者對(duì)椒鹽噪聲有較好的抑制作用。增強(qiáng)模糊C均值(enhanced fuzzy C-means,EnFCM)聚類算法[7]和快速?gòu)V義模糊C均值(fast generalized fuzzy C-means,F(xiàn)GFCM)聚類算法[8]通過(guò)構(gòu)建權(quán)值和圖像,以圖像的灰度級(jí)來(lái)代替像素點(diǎn)進(jìn)行聚類分割,提高了分割效率,但在聚類過(guò)程中丟失圖像的部分細(xì)節(jié),降低了圖像的聚類精度[8]。模糊局部信息C均值(fuzzy local information c-means,F(xiàn)LICM)聚類算法[9]利用無(wú)參數(shù)模糊因子控制圖像噪聲和圖像細(xì)節(jié)之間的平衡,但這種算法只考慮局部鄰域信息,對(duì)復(fù)雜圖像特別是受強(qiáng)噪聲污染圖像,尚未達(dá)到理想的分割效果。
現(xiàn)有的模糊聚類算法沒(méi)有考慮到圖像的全局結(jié)構(gòu)信息,多數(shù)模糊聚類算法中的聚類數(shù)據(jù)只描述了一種表示圖像樣本的基本物理性質(zhì),如位置,大小和灰度等,沒(méi)有反映樣本間的相關(guān)性。樣本的類內(nèi)相似性和類間差異性有助于聚類。若知道每個(gè)樣本在樣本集中所發(fā)揮的作用,將相似樣本劃分為同一類,有助于實(shí)現(xiàn)理想的聚類結(jié)果。樣本的結(jié)構(gòu)不可預(yù)測(cè),但通過(guò)稀疏表示(sparse repreaentation, SR)方法[10-15]可以挖掘出反映全局結(jié)構(gòu)中任意樣本之間的相關(guān)性。
為了提高噪聲污染圖像分割的魯棒性,本文擬將包含樣本數(shù)據(jù)集全局結(jié)構(gòu)信息的SR技術(shù)和經(jīng)典的FCM算法相結(jié)合,提出一種基于稀疏自表示的模糊C均值聚類(fuzzy C-means clustering based on sparse self-representation, SSR_FCM )的圖像分割算法。不同于傳統(tǒng)的FCM算法基于圖像的灰度值實(shí)現(xiàn)圖像分割,本文算法以超像素為基元,提取超像素特征構(gòu)成圖像特征矩陣,通過(guò)稀疏自表示的方法找出表示樣本間相關(guān)性的系數(shù)矩陣,作為圖像的判別特征,利用FCM算法對(duì)該判別特征分類,實(shí)現(xiàn)圖像分割。對(duì)不同類型的圖像添加高斯噪聲和椒鹽噪聲,比較算法分割后的峰值信噪比(peak signal to noise ratio, PSNR),驗(yàn)證算法的抗噪魯棒性。
模糊C均值聚類算法通過(guò)最小化目標(biāo)函數(shù)將數(shù)據(jù)集劃分成不同的類,其目標(biāo)函數(shù)可描述為
(1)
約束條件為
其中,
Y={yi;i=1,2,…,n}
是待分割圖像,n為像素個(gè)數(shù),yi表示第i個(gè)像素的灰度值;
V={vk,k=1,2,…,c}
表示區(qū)域的聚類中心,c為聚類個(gè)數(shù),vk表示第k個(gè)類別的聚類中心;
d(yi,vk)=‖yi-vk‖
根據(jù)模糊C均值聚類算法,目標(biāo)函數(shù)利用拉格朗日乘子方法得到隸屬度函數(shù)和聚類中心,分別為U={uki}和V={vk},更新迭代公式為
(2)
(3)
利用式(2)和(3)分別更新隸屬度矩陣和聚類中心,直到算法收斂;然后采用最大隸屬度方法將像素i分配到對(duì)應(yīng)類別中,完成圖像的分割。
稀疏表示是將樣本表示為預(yù)先規(guī)定的字典中的少數(shù)原子的線性組合。以樣本數(shù)據(jù)本身作為字典,對(duì)于每個(gè)數(shù)據(jù)點(diǎn)都可以被除它之外的數(shù)據(jù)點(diǎn)線性表示,這種構(gòu)造字典的方式稱為稀疏自表示[16]。該方法能夠反映出數(shù)據(jù)之間的相關(guān)性,同時(shí)也避免了構(gòu)建字典過(guò)程中的計(jì)算復(fù)雜度。稀疏自表示的目標(biāo)模型[12]
(4)
其中,樣本的基本特征矩陣
X=[X1,X2,…,Xn]∈a×n,
n為樣本數(shù),xi(i=1,2,…,n)表示第i個(gè)樣本的具有a維屬性的特征向量(1≤a≤n)?!ぁ?為L(zhǎng)1-范數(shù),即
Z=[Z1,Z2,…,Zn]∈n×n
為X的稀疏自表示系數(shù)矩陣;參數(shù)λ>0用來(lái)平衡式(4)中的權(quán)重,diag(Z)=0表明每一類樣本都不能將自身作為相關(guān)性樣本。本文算法中,圖像以超像素為基元,選擇合適的超像素特征,X為所有超像素特征構(gòu)成的基本特征矩陣,n為超像素塊數(shù),Xi代表一個(gè)超像素的a維特征向量。該模型應(yīng)用于被噪聲干擾的數(shù)據(jù)中。
利用交替方向乘子法(the alternating direction method of multipliers, ADMM)[17]對(duì)(4)式進(jìn)行求解。
消除目標(biāo)函數(shù)中的E,等價(jià)于求解
適當(dāng)引入輔助變量,將約束增加到目標(biāo)函數(shù)中。
首先,引入輔助矩陣H,式(4)可以改寫(xiě)為
其次,引入矩陣W∈Rn×n拉格朗日乘子,構(gòu)造拉格朗日函數(shù)
式中μ為懲罰因子,〈·〉表示標(biāo)準(zhǔn)內(nèi)積。
最后,給出交替方向乘子法實(shí)現(xiàn)稀疏自表示系數(shù)實(shí)現(xiàn)的具體步驟如下。
步驟1輸入X,參數(shù)λ。
步驟2初始化
H(0)=0,Z(0)=0,W(0)=0,
η=10-3,μ=10-4,ε=1.1,k=0。
步驟3更新
步驟4更新
H(k+1)=J-diag(J)。
步驟5更新
W(k+1)=W(k)+μ(Z(k+1)-H(k+1))。
步驟6更新
μ=min (εμ, 1010)。
步驟7判斷是否有‖H(k)-Z(k)‖∞≤η,并且‖H(k)-H(k-1)‖∞≤η,如果滿足條件,則算法迭代結(jié)束,否則返回步驟3。
步驟8輸出最優(yōu)稀疏自表示系數(shù)矩陣Z。
稀疏自表示系數(shù)有較好的類別區(qū)分性能,可以作為圖像的判別特征,將矩陣Z表示為圖像的判別特征矩陣。利用模糊C均值聚類算法聚類圖像的判別特征矩陣,將其代入式(1)中,目標(biāo)函數(shù)、隸屬度函數(shù)和聚類中心分別描述為
(5)
(6)
其中,Zj=[Z1,Z2,…,Zn]∈Rn×n為圖像的判別特征矩陣,n為樣本數(shù);Z=[Zj1,Zj2,…,Zjn]表示Z的第j列,是圖像基本特征矩陣X的線性表示;c是聚類中心數(shù)(1
利用式子(5)和(6)分別更新隸屬度和聚類中心,直到算法收斂;將判別特征Z中的每個(gè)樣本分配到對(duì)應(yīng)類別中。
本文算法主要步驟,如圖1所示。
圖1 算法主要步驟
圖1中,在對(duì)圖像過(guò)分割生成超像素時(shí),對(duì)超像素做標(biāo)記,圖像像素點(diǎn)的標(biāo)簽值與所屬的超像素標(biāo)簽值相同,在FCM算法中采用最大隸屬度方法將判別特征Z中稀疏自表示系數(shù)Zj(1≤j≤n)分配到對(duì)應(yīng)類別中,若Zj隸屬于第p類(1≤p≤c),則標(biāo)簽值為j的超像素中的像素點(diǎn)也隸屬于第p類,從而實(shí)現(xiàn)圖像分割。
選取合成圖像、自然圖像和遙感圖像,驗(yàn)證算法對(duì)受噪聲污染圖像分割的魯棒性,比較改進(jìn)算法與FCM,F(xiàn)CM_S,EnFCM,F(xiàn)GFCM,F(xiàn)LICM五種算法對(duì)待分割圖像的分割結(jié)果。其中實(shí)驗(yàn)運(yùn)行環(huán)境為Matlab.R2014.b,對(duì)所有的比較算法,共同設(shè)置模糊加權(quán)指數(shù)m=2,迭代終止條件ε=0.000 1,局部鄰域窗口的大小為3×3。
對(duì)于FCM_S和EnFCM算法,鄰域信息對(duì)中心像素的影響因子α=2。FGFCM算法[8]中控制鄰域信息對(duì)聚類結(jié)果影響程度的各個(gè)參數(shù)均采用文獻(xiàn)[8]的設(shè)置。改進(jìn)算法中,首先對(duì)原始圖像使用Turbopixels算法[18]進(jìn)行超像素分割,替代單個(gè)像素作為圖像基元,對(duì)Turbopixels算法的分割尺度設(shè)置為600,提取超像素的灰度均值和灰度直方圖2種特征量生成一個(gè)統(tǒng)一整體特征作為圖像的基本特征矩陣。
選取自然圖像、遙感圖像和人造圖像3幅灰度圖像,對(duì)其添加不同均方差的高斯噪聲和不同強(qiáng)度的椒鹽噪聲,利用FCM、FCM_S、ENFCM、FGFCM、FLICM以及本文算法對(duì)其進(jìn)行分割測(cè)試,采用峰值信噪比[19](peak signal to noise ratio, PSNR)作為圖像分割算法抗噪性能好壞的評(píng)價(jià)指標(biāo)。PSNR值越大,表明分割算法抗噪性越好。
3.1.1 高斯噪聲干擾圖的分割結(jié)果及分析
選取遙感圖像,人造圖像,鮮花圖像,如圖2所示。其分別添加均值為0且方差為0.1、0.08、0.15的高斯噪聲。采用FCM算法、FCM_S算法、ENFCM算法、FGFCM算法、FLICM算法以及改進(jìn)算法對(duì)加噪圖像進(jìn)行分割測(cè)試,測(cè)試結(jié)果如表1和表2 所示。
圖2 標(biāo)準(zhǔn)灰度圖像
圖像加噪灰度圖FCM算法FCM_S算法ENFCM算法FGFCM算法FLICM算法改進(jìn)算法遙感圖人造圖鮮花圖
表2 不同算法抗高斯噪聲的PSNR值
由表1和表2可見(jiàn),改進(jìn)算法與另5種算法相比,差異顯著;FCM算法去噪和分割能力較差,加入鄰域信息的FCM_S算法、ENFCM算法、FGFCM算法和FLICM算法比FCM算法效果好;本文的改進(jìn)算法將稀疏自表示技術(shù)嵌入到FCM算法中,所得去噪效果和分割效果優(yōu)于其他5種算法。
3.1.2 椒鹽噪聲干擾圖的分割結(jié)果及分析
針對(duì)遙感圖像、人造圖像和飛機(jī)圖像,如圖3所示。分別添加強(qiáng)度為15%、20%、30%的椒鹽噪聲,采用FCM算法、FCM_S算法、ENFCM算法、FGFCM算法、FLICM算法和本文算法進(jìn)行分割測(cè)試,測(cè)試結(jié)果見(jiàn)表3和表4所示。
圖3 標(biāo)準(zhǔn)灰度圖像
圖像加噪灰度圖FCM算法FCM_S算法ENFCM算法FGFCM算法FLICM算法改進(jìn)算法遙感圖人造圖飛機(jī)圖
表4 不同算法抗椒鹽噪聲的PSNR值
由表3和表4可見(jiàn),在視覺(jué)效果上,改進(jìn)算法的抗噪能力優(yōu)于其他5種算法;FCM_S算法、ENFCM算法、FGFCM算法和FLICM算法在一定程度上去除了噪聲點(diǎn),但圖像的分割結(jié)果中仍含有大量噪聲,改進(jìn)算法獲得的分割結(jié)果幾乎可以完全去除噪聲。相比其他5種算法,本文算法將飛機(jī)模型從背景中完整提取,且提取出的飛機(jī)圖像較為清晰、邊緣輪廓較為完整;對(duì)于遙感圖中的河流能夠準(zhǔn)確地區(qū)分河流信息和背景信息。
由以上實(shí)驗(yàn)分割圖的視覺(jué)效果和相關(guān)數(shù)據(jù)分析可知,對(duì)于噪聲污染的圖片,傳統(tǒng)的FCM算法像素點(diǎn)間沒(méi)有聯(lián)系,對(duì)噪聲較為敏感,分割結(jié)果最差。FCM-S算法、ENFCM算法、FGFCM算法和FLICM算法建立在空間鄰域信息的基礎(chǔ)上,分割結(jié)果比傳統(tǒng)的FCM算法好,但對(duì)于圖像中加入不同強(qiáng)度的高斯噪聲和椒鹽噪聲,分割后的圖中依舊留有大量噪聲。改進(jìn)算法中稀疏自表示模型中通過(guò)2個(gè)范數(shù)的約束不僅能得到樣本間的相關(guān)性表示,有利于相似樣本分為同一類,而且對(duì)包含噪聲的數(shù)據(jù)有魯棒性,增強(qiáng)聚類效果;在基于反映樣本間相關(guān)性和魯棒的判別特征上聚類,清晰地判別出圖像分割類數(shù),雖然聚類結(jié)果沒(méi)有完全去除噪聲,但去除了大部分噪聲,取得較好的分割結(jié)果。
接著來(lái)討論改進(jìn)算法稀疏自表示模型中的保真項(xiàng)參數(shù)λ的選取。如圖2(b)所示的人造圖像是分辨率為256×230的三類灰度圖像,灰度值分別為0,195和255。測(cè)試人造圖像受到均值為0,方差為0.1的高斯噪聲影響下的正確分割率[20],為保證數(shù)據(jù)的準(zhǔn)確性,正確分割率采用算法15次運(yùn)行結(jié)果的均值,不同保真項(xiàng)參數(shù)λ值對(duì)應(yīng)的分割正確率,如圖4 所示。
圖4 不同保真項(xiàng)參數(shù)λ的分割正確率
通過(guò)圖4可以看出,曲線在一小段波動(dòng)后趨于平穩(wěn)。當(dāng)λ≥2時(shí),分割正確率明顯提高,表明參數(shù)λ在稀疏自表示模型中有重要作用。此外,當(dāng)λ較大時(shí),分割正確率緩慢下降,這是因?yàn)槭?4)中第2項(xiàng)的作用不能被無(wú)限放大,第1項(xiàng)的稀疏約束對(duì)算法也起到了作用。