郭桂芳,朱昌杰,彭太樂(lè),葛方振
(淮北師范大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
圖像分割在很多領(lǐng)域中起著重要作用,如計(jì)算機(jī)視覺(jué)、模式識(shí)別和醫(yī)療成像[1-2].模糊C-均值算法(簡(jiǎn)稱(chēng)為FCM)由于將像素的隸屬模糊性應(yīng)用到圖像分割中,在過(guò)去的很長(zhǎng)時(shí)間內(nèi),它在模糊分割方法中應(yīng)用較多.與其他方法相比,F(xiàn)CM能夠從原始圖像中獲取更多的信息[3].但處理對(duì)比度低,噪聲大的圖像存在不足.有的研究者開(kāi)始考慮在FCM引入空間約束信息來(lái)處理對(duì)噪聲敏感的圖像.
近年來(lái),將核聚類(lèi)算法應(yīng)用于圖像分割成為一種發(fā)展趨勢(shì),是一種較權(quán)威的具有較好的魯棒性與普適性的方法[4].來(lái)源于統(tǒng)計(jì)學(xué)習(xí)理論的核方法是一種較新的方法.該方法利用非線性映射,把樣本映射到高維特征空間.判定樣本的類(lèi)別依據(jù)是樣本與聚類(lèi)中心之間的歐氏距離.對(duì)于線性不可分的數(shù)據(jù)能夠較好地進(jìn)行聚類(lèi)[5].而其他傳統(tǒng)的FCM算法,在這種情況下不能實(shí)現(xiàn)較好的分類(lèi)效果.FCM聚類(lèi)是基于準(zhǔn)則函數(shù)的非線性迭代優(yōu)化算法,運(yùn)算復(fù)雜度較大,在特征數(shù)和樣本數(shù)較多時(shí)速度慢;并且,初始值的選擇直接影響到聚類(lèi)結(jié)果及收斂速度的好壞程度.選擇不合適的初始值甚至導(dǎo)致非常慢的聚類(lèi)速度或是收斂到錯(cuò)誤的極小點(diǎn)[6-8].
為了解決傳統(tǒng)方法FCM初始值選擇問(wèn)題,論文中提出基于直方圖信息結(jié)合數(shù)學(xué)期望理論,尋找聚類(lèi)中心的新算法.在圖像直方圖中計(jì)算兩個(gè)相鄰波谷之間的聚類(lèi)中心的灰度級(jí),作為該算法的先驗(yàn)初始值.本文將分類(lèi)算法分為2步:首先,利用直方圖的信息尋找聚類(lèi)中心;隨后,在初始聚類(lèi)中心的前提下,采用模糊核聚類(lèi)KFCM[9-10],得到最終分類(lèi)結(jié)果.
設(shè)輸入空間的樣本xi∈RN,i=1,2,…,l, 通過(guò)某種非線性映射Φ,映射到特征空間Η,得到Φ(x1),Φ(x2),…,Φ(xl).在高維特征空間中用Mercer核函數(shù)形式表示為
模糊核聚類(lèi)算法的目標(biāo)函數(shù):
由非線性映射Φ,得
代入Mercer核函數(shù),可得
在更多的核函數(shù)中,高斯核函數(shù)是普遍使用的核函數(shù)[11].利用Lagrange乘數(shù)法求解,得到
模糊核聚類(lèi)算法的具體步驟如下:
Step1:初始化聚類(lèi)類(lèi)別數(shù)C和加權(quán)指數(shù)m,從樣本點(diǎn)中C個(gè)構(gòu)成初始聚類(lèi)中心,并設(shè)定一個(gè)小的正數(shù)ε為迭代停止閾值;
Step2:選擇核函數(shù),一般為高斯核函數(shù);
Step3:由公式(6)計(jì)算并更新聚類(lèi)中心矩陣Ε;
Step4:由公式(5)更新隸屬度矩陣U;
灰度直方圖表示圖像中具有某種灰度級(jí)的像素個(gè)數(shù),屬于圖像灰度級(jí)的函數(shù).反映了圖像中某種灰度出現(xiàn)的頻率[12-13].通常圖像中的一致性目標(biāo)區(qū)域?qū)?yīng)直方圖中含有1個(gè)波峰的鄰域.也就是說(shuō),要確定圖像中的目標(biāo)區(qū)域,可以在全局直方圖中找到峰值區(qū)域即可.這種閾值技術(shù)即尋找波峰和波谷的方法在圖像分割中已經(jīng)被廣泛運(yùn)用.
大多數(shù)文獻(xiàn)將聚類(lèi)中心視為直方圖中波峰所對(duì)應(yīng)的灰度級(jí),而本文先統(tǒng)計(jì)直方圖中兩相鄰波谷之間的所有像素總數(shù),將這些像素的期望值視為“名義波峰值”;然后將所有相鄰波谷之間所有的灰度級(jí)對(duì)應(yīng)的像素個(gè)數(shù)與這個(gè)期望值比較,把對(duì)應(yīng)像元個(gè)數(shù)與這個(gè)期望值最接近的那些灰度級(jí)作為聚類(lèi)中心.
設(shè)A=f(x,y)是尺度為M×N的8 bit 灰度圖像.其中A=f(x,y)為圖像在像素(x,y)處的灰度值.圖像的灰度直方圖的數(shù)學(xué)定義為:
式中,
假設(shè)圖像中有L個(gè)灰度級(jí),R(i)表示L中第i個(gè)灰度級(jí)所對(duì)應(yīng)的像素總數(shù),則
其中0≤i≤L-int(n/2),z是直方圖中與i相鄰灰度值的個(gè)數(shù),z取整數(shù)值,則Tn(i)表示第i個(gè)灰度級(jí)前后z個(gè)像素灰度值的平均值.
當(dāng)
時(shí),W即為波谷.
在圖像灰度直方圖中一個(gè)波峰處在兩個(gè)波谷之間,這個(gè)波峰可能就是一個(gè)聚類(lèi)中心,設(shè)2個(gè)波谷的灰度級(jí)為(p,q),(p,q)∈V,則p,q灰度級(jí)之間的所有灰度級(jí)對(duì)應(yīng)的像素個(gè)數(shù)的期望值為:
平均灰度級(jí)等于(或接近于)期望值的兩個(gè)值作為聚類(lèi)中心.這樣獲得的聚類(lèi)中心個(gè)數(shù)較多,再把所有的聚類(lèi)中心組成新的灰度統(tǒng)計(jì)圖,利用公式(9)-(11)進(jìn)行運(yùn)算,就可以減少聚類(lèi)中心的個(gè)數(shù),直到聚類(lèi)中心達(dá)到所設(shè)定的初始值.因此,得到聚類(lèi)中心的灰度值即分割閾值.
算法如下:
(1)利用式(7)計(jì)算直方圖的統(tǒng)計(jì)像素個(gè)數(shù);
(2)利用式(9)計(jì)算z個(gè)i相鄰的灰度值的期望值,滿(mǎn)足式(10)的V即為波谷;
(3)求兩個(gè)波谷之間的期望值(利用式(11)),并得到聚類(lèi)中心,以此類(lèi)推,得到所有的聚類(lèi)中心;
(4)把上步驟得到的所有聚類(lèi)中心,再次利用公式(9)-(11)進(jìn)行運(yùn)算篩選,得到初始聚類(lèi)中心.
實(shí)驗(yàn)分別選用比較經(jīng)典的Lena.bmp(像素大小為225×225)圖像、像素大小為275×183的Vege.bmp和像素大小為259×194的hill.bmp圖像.為了檢驗(yàn)算法的有效性,從大量實(shí)驗(yàn)中選取3組實(shí)驗(yàn)結(jié)果.
首先,取聚類(lèi)中心C=4,用本文的核聚類(lèi)算法與標(biāo)準(zhǔn)的FCM算法作對(duì)比,分割的聚類(lèi)中心結(jié)果如表1所示.從表1可以看出,聚類(lèi)中心的差值≤2.669 1.
表1 聚類(lèi)中心(C=4)
其次,用本文算法與其他算法(標(biāo)準(zhǔn)FCM算法、KFCM算法)進(jìn)行分割效果對(duì)比.KFCM算法是假定任意的初始聚類(lèi)中心進(jìn)行分割,而本文算法先對(duì)初始聚類(lèi)中心進(jìn)行優(yōu)化,再進(jìn)行分割.分割效果對(duì)比如圖1、圖2、圖3所示.
在聚類(lèi)方法中,為了更科學(xué)地分析分割效果,評(píng)價(jià)聚類(lèi)效果的標(biāo)準(zhǔn)采用分割系數(shù)(Partition Coeffi?cient,PC)和分割熵(Partition Entropy,PE),這兩個(gè)指標(biāo)基于隸屬度矩陣并最具代表性,其定義如公式(12)-(13):
圖1 Lena圖分割效果
圖2 Vege圖分割效果
圖3 Hill圖分割效果
在公式(12)-(13)中,C是聚類(lèi)中心的數(shù)目,N是圖像像素總數(shù).當(dāng)Vpc取最大值,Vpe取最小值時(shí),即兩個(gè)評(píng)價(jià)函數(shù)為最優(yōu)值,聚類(lèi)分割效果較好.本文提出的算法和標(biāo)準(zhǔn)FCM算法兩個(gè)評(píng)價(jià)函數(shù)的對(duì)比結(jié)果及分割消耗的時(shí)間如表2所示.
通過(guò)以上實(shí)驗(yàn)得到的分割結(jié)果可知,本文提出的算法分割效果比標(biāo)準(zhǔn)的FCM多閾值算法能有效地將目標(biāo)與背景分割開(kāi),本文的算法能夠增強(qiáng)目標(biāo)聚類(lèi)的正確性,有效提高邊緣的模糊性,使聚類(lèi)結(jié)果更趨于完整,每個(gè)聚類(lèi)的邊緣趨于閉合,分割結(jié)果與實(shí)際情況更為接近.雖然利用迭代尋找聚類(lèi)中心,運(yùn)算時(shí)間較長(zhǎng),但得到的最大聚類(lèi)中心之差較小,如表1所示.可見(jiàn),本文算法有著良好的分割效果.
表2 兩種算法的評(píng)價(jià)結(jié)果
[1]PHAM D L,XU C Y,PRINCE J L.A survey of current methods in medical image segmentation[R].Baltimore:Johns Hopkins University,2000,2:315-337.
[2]PHAM D L,PRINCE J L.An adaptive fuzzyC-means algorithm for image segmentation in the presence of intensi?ty in homogeneities[J].Pattern Recognition Lett,1999,20:57–68.
[3]WU Xiaohong,ZHOU Jiangjiang.Possibilistic fuzzyC-means clustering model using kernel methods[C]// Proceed?ings International Conference on Computational Intelligence for Modeling,Control and Automation,CIMCA2005 and International Conference on Intelligent Agents,Web Technologies and Internet,2005,2:465-470.
[4]SAIKUMAR T,ANOOP B K,MURTHY P S.Robust adaptive threshold algorithm based on kernel fuzzy clustering on image segmentation[J].CS&IT,2012,4:99-103.
[5]WU Jin,LI Juan,LIU Jian,et al.Infrared image segmentation via fast fuzzyC-means with spatial information[C]//In?ternational Conference on Robotics and Biomimetics,2004:742-745.
[6]GYIL S,BENY Z,SZIL GYII S M,et al.MR brain image segmentation using an enhanced fuzzyC-means algorithm[C]//Proc of the Annual International Conference of IEEE EMBS,2003:17-21.
[7]佟偉祥,宋凱.模糊C均值聚類(lèi)算法在多元圖像分割中的應(yīng)用[J].微處理機(jī),2008,29(5):135-136.
[8]GOKTEPEAB,ALTUN S,SEZER A.Soil clustering by fuzzyC-means algorithm[J].Advances in Engineering Soft?ware,2005,36(10):691-698.
[9]劉華軍,任明武,楊靜宇.一種改進(jìn)的基于模糊聚類(lèi)的圖像分割方法[J].中國(guó)圖像圖形學(xué)報(bào),2006,11(9):1312-1316.
[10]彭秋生,魏文紅.基于核方法的并行模糊聚類(lèi)算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(8):1881-1883.
[11]張莉,周偉達(dá),焦李成.核聚類(lèi)算法[J].計(jì)算機(jī)學(xué)報(bào),2002,25(6):587-590.
[12]CHEN Songcan,ZHANG Daoqiang.Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure[J].IEEE Trans Systems Man and Cybernetics,2004,34(4):1907-1916.
[13]ZHANG D Q,CHEN S C.Kernel-based fuzzy clustering incorporating spatial constraints for image segmentation[C]//Proceedings of the Second International Conference on Machine Learning and Cybemetics,2003.