周丹,肖滿生,劉麗紅,姚慧丹
(湖南工業(yè)大學(xué)計算機與通信學(xué)院,湖南株洲412007)
改進的模糊C-均值算法在圖像分割中的應(yīng)用
周丹,肖滿生,劉麗紅,姚慧丹
(湖南工業(yè)大學(xué)計算機與通信學(xué)院,湖南株洲412007)
針對傳統(tǒng)的模糊C-均值算法在圖像分割中存在的缺陷,提出了一種基于點密度函數(shù)加權(quán)的模糊C-均值聚類算法。將圖像像素的點密度函數(shù)作為權(quán)值,并依據(jù)類間相關(guān)度定義了一個聚類有效性函數(shù)用以確定最佳聚類數(shù),結(jié)合聚類有效性完成對圖像的分割。理論分析和對比試驗表明,該算法在一定程度上克服了模糊均值算法的缺陷,在圖像分割中具有良好的分類精度。
模糊C-均值;點密度函數(shù);聚類有效性;圖像分割
在對圖像的研究和應(yīng)用中,往往需要從復(fù)雜的圖像背景中將感興趣的目標(biāo)分割出來,這些部分一般對應(yīng)于圖像中具有獨特性質(zhì)的區(qū)域,如像素的灰度值、物體輪廓曲線、紋理等。圖像分割的好壞直接影響計算機視覺對圖像的理解[1],圖像分割[2-4]的方法已有上千種,典型的分割方法大致可分為基于閾值的方法、基于區(qū)域生長和基于邊緣檢測的方法等。由于視覺對色差的模糊性,模糊聚類分析受到了人們普遍的關(guān)注,模糊C-均值聚類[5](fuzzy C-means,F(xiàn)CM)是當(dāng)今最流行的模糊聚類算法之一。它把聚類歸結(jié)成一個帶約束的非線性規(guī)劃問題,通過優(yōu)化求解獲得數(shù)據(jù)集的模糊劃分和聚類,但該算法只考慮了圖像中的數(shù)值特征信息,而忽略了樣本矢量間對聚類結(jié)果的影響。在實際的圖像處理過程中,由于噪聲等因素的干擾及最小化誤差平方和目標(biāo)函數(shù)具有對數(shù)據(jù)集進行等劃分的趨勢,目前已有學(xué)者通過對傳統(tǒng)的FCM算法進行加權(quán)改進如二維直方圖加權(quán),特征加權(quán)等改進方法??紤]到數(shù)據(jù)集在現(xiàn)實生活中的實際分布特征,基于數(shù)據(jù)的分布對分類的不同影響程度,本文提出了一種新的樣本加權(quán)的FCM算法,借助像素樣本本身的分布特性,利用其點密度函數(shù)[6-8]作為權(quán)值對傳統(tǒng)算法進行改進,使聚類中心進行調(diào)整,從而克服了傳統(tǒng)FCM算法對樣本集進行等劃分的缺陷,降低了圖像分割的錯分率,提高了圖像分割的精度。
隨著對模糊聚類算法研究的深入發(fā)展,該算法已經(jīng)有效地應(yīng)用于大規(guī)模數(shù)據(jù)分析、圖像分割與識別、數(shù)據(jù)挖掘等領(lǐng)域,模糊C-均值聚類算法是模糊聚類的基本方法之一。它是一種對數(shù)據(jù)樣本進行自動分類的方法,通過優(yōu)化目標(biāo)函數(shù)得到每個樣本點對類中心的隸屬度,進而決定每個樣本點歸屬于哪一類。這種無監(jiān)督的分類方法被有效地應(yīng)用于圖像自動分割問題上。
式中:Mfc表示模糊c劃分空間;dik表示樣本xk與第i類的聚類原型pi之間的歐式距離量度。其中dik用式(3)計算,即
FCM聚類過程如下。
初始化:給定聚類類別數(shù)c,數(shù)據(jù)的個數(shù)為n,其中2≤c≤n,加權(quán)系數(shù),設(shè)定迭代停止閾值,迭代計數(shù)器b=0,初始化聚類原型模式p(0)。第一步:用以下規(guī)則更新劃分矩陣U(b)。
第二步:用式(4)更新聚類原型矩陣p(b+1),即
J. C. Bezdek指出,傳統(tǒng)的FCM聚類算法在實現(xiàn)過程中,由于最小化誤差平方和目標(biāo)函數(shù)對數(shù)據(jù)集具有等劃分趨勢這一缺陷的存在,針對該問題提出了一種加權(quán)的FCM算法。利用點密度函數(shù)作為加權(quán)系數(shù),一方面充分利用了數(shù)據(jù)集的本身分布特性,另一方面點密度函數(shù)反映樣本點的聚集情況,作為加權(quán)系數(shù)能更貼近樣本點的實際分布情況,在一定程度上克服了數(shù)據(jù)集等劃分趨勢,提高了圖像的分割精度。
2.1 基于點密度函數(shù)的加權(quán)系數(shù)計算
對于一個數(shù)據(jù)集來說,不能十分確切地給出每個樣本的典型程度,即某一對象不是確定屬于某一類,而是在某種程度上屬于某一類。考慮到數(shù)據(jù)集存在一個分布密度問題,將每個數(shù)據(jù)點的影響用一個數(shù)學(xué)函數(shù)來形式化地模擬,它描述一個數(shù)據(jù)點在該區(qū)域的影響,被稱為影響函數(shù)[10]。當(dāng)樣本點周圍的其它樣本點密集程度越高,該樣本點的影響函數(shù)值越大,對分類影響越大;反之,樣本點周圍的其它樣本點密集程度越低,該樣本點的影響函數(shù)值越小,對分類影響越小?;谝陨显颍疚奶岢隽艘环N點密度函數(shù)作為加權(quán)系數(shù)的計算方法。對每個樣本點xk周圍的點密度函數(shù)定義為
對k進行歸一化可得
式(5)~(6)中:n為樣本點個數(shù);djk為2個樣本點xk和xj之間的歐氏距離且djk≤e,e為點密度的范圍限定值;wj為樣本xj對分類的影響程度。由定義式可以看出樣本點周圍的點越多則k的值越大。
2.2 加權(quán)模糊C-均值聚類算法
根據(jù)上面的分析,加權(quán)模糊C-均值(weighted fuzzy C-means,WFCM)聚類算法目標(biāo)函數(shù)定義為
加權(quán)系數(shù)wj的主要作用在于調(diào)整聚類中心,當(dāng)時即認為各樣本對分類的影響是一致的,此時WFCM算法就退化為經(jīng)典的FCM算法了。利用拉格朗日乘數(shù)法求得式(7)的優(yōu)化迭代公式:
2.3 聚類有效性函數(shù)
對于數(shù)據(jù)集的模糊劃分,模糊偏差反映了一個類的樣本點的分布情況。基于此,與聚類有效性[11-12]相關(guān)的概念定義如下。
模糊相關(guān)度:第i類模糊子集Xi和第j類模糊子集Xj的模糊相關(guān)度定義為
聚類有效性函數(shù):對于一個好的分類而言,類與類間的模糊相關(guān)度應(yīng)盡量小。本文基于類間相關(guān)度,定義了一個聚類有效性函數(shù)
2.4 WFCM算法與聚類有效性評定的實現(xiàn)步驟
WFCM算法與聚類有效性評定的步驟如下:1)初始化,加權(quán)指數(shù)m=2(經(jīng)驗值),聚類數(shù)c用for循環(huán)實現(xiàn)從2到6的取值;
2)設(shè)定迭代停止閾值,迭代計數(shù)器b=0,初始化聚類原型模式p(0);通過改進的式(8)~(9)進行迭代更新并計算目標(biāo)函數(shù)Jm(U, P)的值;
5)取c*作為聚類數(shù),比較傳統(tǒng)的FCM算法與加權(quán)的WFCM算法對圖像分割的有效性。
本試驗使用MatlabR2012a,在Pentium3G和4G內(nèi)存的微機上進行。為了驗證算法的有效性,分別采用一幅像素的人腦磁共振圖像和標(biāo)準(zhǔn)的Lena灰度圖像為例進行仿真試驗。加權(quán)指數(shù)m的取值,由于缺乏理論依據(jù)的指導(dǎo),按照聚類有效性研究的結(jié)果,N. R. Pal和J. C. Bezdek提出模糊加權(quán)指數(shù)的取值區(qū)間為[1.5, 2.5]時FCM聚類算法的結(jié)果最優(yōu)。本文取m=2進行試驗,迭代次數(shù)缺省值設(shè)為100,迭代終止閾值為0.01。在Matlab試驗平臺下,對圖像最佳聚類數(shù)的確定過程如圖1所示。
圖1 確定最佳聚類數(shù)過程圖Fig.1The process diagram for determining the optimal number of clusters
在聚類之前分別給定不同的聚類數(shù)并初始化聚類中心,利用傳統(tǒng)的FCM算法,計算聚類有效性函數(shù)(U, c)的值,得到表1所示的結(jié)果。
表1 不同聚類數(shù)時聚類有效性(U, c)的值Table1The effective cluster value(U, c) for different cluster numbers
表1 不同聚類數(shù)時聚類有效性(U, c)的值Table1The effective cluster value(U, c) for different cluster numbers
c (U, c) 23456 0.83210.82970.72540.82680.8432
由表1的試驗數(shù)據(jù)可知,最佳聚類數(shù)為4,當(dāng)c取4時,聚類有效性(U, c)的取值最小。對人腦MR圖像進行試驗,圖像主要包括腦白質(zhì)、腦灰質(zhì)、腦脊髓和背景4個部分,所以最佳聚類數(shù)為c值取4,與試驗預(yù)期結(jié)果相符。
試驗在同等的運行環(huán)境下,借助于Matlab圖像處理工具進行編程實現(xiàn),分別用傳統(tǒng)的FCM算法和本文改進的方法對同一幅圖像進行分割試驗,結(jié)果如圖2所示。
圖2 改進算法與原算法的對比Fig.2Comparison of the improved algorithm and the original algorithm
從圖2的分割效果圖比較結(jié)果可以看出傳統(tǒng)的FCM算法僅根據(jù)當(dāng)前的像素對圖像進行分割,忽略了周圍像素點的影響,分割的效果并不好。本文改進的算法顯示出良好的抗噪能力并考慮了周圍像素點對樣本點的影響程度,得到了很好的分割效果。2種算法處理圖像過程中的迭代次數(shù)和錯分率的比較,如表2所示。
表2 不同的算法對圖像進行分割Table2Different algorithms for image segmentation
由表2可知,本文算法在運行時間和迭代次數(shù)上比傳統(tǒng)的FCM算法高,但在分割過程中的錯分率卻大大降低,WFCM算法因為在特征空間上進行加權(quán)運算,比傳統(tǒng)的算法更為復(fù)雜,因此在迭代次數(shù)和運行時間上會耗時較多,但卻能保證精確度并達到較好的分割效果。
采用Lena圖像進行對比試驗,圖像尺寸為512× 512像素,灰度級為256。算法中參數(shù)取2,其他參數(shù)條件不變。分別采用傳統(tǒng)的FCM算法和點密度加權(quán)的WFCM算法對圖像進行分割處理,分割結(jié)果如圖3所示。從圖中可以看出,傳統(tǒng)的FCM算法不能很好地去除噪聲,在很多細節(jié)方面如人物的鼻梁、嘴角、肩膀、所戴的帽子等都含有噪聲,分割結(jié)果中還存在一些誤分現(xiàn)象,導(dǎo)致有些邊界模糊不清,而WFCM算法能夠很好地克服這一缺點,并在一定程度上降低錯分率,從而較好地分割出目標(biāo)。
圖3 改進算法對Lena圖像的分割Fig.3The improved algorithm for Lena image segmentation
利用傳統(tǒng)的FCM算法非監(jiān)督模糊聚類的特點對圖像進行分割減少人為的干預(yù)。為了彌補傳統(tǒng)的模糊C-均值算法在圖像分割中存在的缺陷,提出聚類相關(guān)度的定義作為聚類有效性函數(shù)先確定最佳聚類數(shù)的取值,然后考慮到周圍像素點對樣本點的影響程度提出點密度函數(shù)作為加權(quán)系數(shù)對算法進行改進,使圖像的分割更為準(zhǔn)確。
[1]張德豐. MATLAB數(shù)字圖像處理[M]. 第二版. 北京:機械工業(yè)出版社,2012:268-295. Zhang Defeng. MATLAB Digital Image Processing[M]. 2nd ed. Beijing:China Machine Press,2012:268-295.
[2]何俊,葛紅,王玉峰. 圖像分割算法研究綜述[J]. 計算機工程與科學(xué),2009,31(12):58-61. He Jun,Ge Hong ,Wang Yufeng. Survey on the Methods of Image Segmentation Research[J]. Computer Engineering and Science,2009,31(12):58-61.
[3]邵罕. 基于自適應(yīng)模糊聚類分析的圖像分割算法研究[D]. 信陽:信陽師范學(xué)院,2012. Shao Han. Study on Image Segmentation Algorithm Based on Auto-Adaption Fuzzy Clustering Analysis[D]. Xin Yang:Xinyang Normal University,2012.
[4]宋寅卯,劉磊. 圖像分割研究方法及進展[J]. 電腦學(xué)習(xí),2010(2):1-3. Song Yinmou,Liu Lei. The Methods and Process of Image Segment[J]. Computer Study,2010(2):1-3.
[5]高新波. 模糊聚類分析及其應(yīng)用[M]. 西安:西安電子科技大學(xué)出版社,2004:49-54. Gao Xinbo. Fuzzy Clustering Analysis and Its Applications [M]. Xi’an:Xi’an University of Electronic Science and Technology Press,2004:49-54.
[6]沈忠陽,覃亞麗. 基于改進模糊均值聚類算法的遙感圖像聚類[J]. 杭州電子科技大學(xué)學(xué)報,2012,32(4):99-101. Shen Zhongyang,Qin Yali. Remote Sensing Image Clustering Based On Modified FCM Clustering Algorithm [J]. Journal of Hangzhou Dianzi University,2012,32(4):99-101.
[7]劉小芳,曾黃麟,呂炳朝. 點密度函數(shù)加權(quán)模糊C-均值算法的聚類分析[J]. 計算機工程與應(yīng)用,2004,40(24):64-65. Liu Xiaofang,Zeng Huanglin,L Bingchao. Clustering Analysis of Dot Density Function Weighted Fuzzy CMeans Algorithm[J]. Computer Engineering and Applications,2004,40(24):64-65.
[8]李金秀,高新波,高玉娥,等. 基于特征加權(quán)的模糊聚類算法研究[J]. 北京電子科技學(xué)院學(xué)報,2007,15(2):74-76. Li Jinxiu,Gao Xinbo,Gao Yu’e,et al. A Feature Weighted Fuzzy Clustering Algorithm[J]. Journal of Beijing Electronic Science and Technology Institute,2007,15(2):74-76.
[9]Bezdek J C. Pattern Recognition with Fuzzy Objective Function Algorithms[M]. New York:Plenum Press,1981:637-641.
[10]孟海東,馬娜娜,宋宇辰,等. 基于密度函數(shù)加權(quán)的模糊C均值聚類算法研究[J]. 計算機工程與應(yīng)用,2012,48 (27):123-127. Meng Haidong,Ma Na’na,Song Yuchen,et al. Research on Fuzzy C-Means Clustering Algorithm Based on Density Function Weighted[J]. Computer Engineering and Applications,2012,48(27):123-127.
[11]陳舵,李雪,崔杜武,等. 一種基于模糊度的聚類有效性函數(shù)[J]. 模式識別與人工智能,2008,21(1):34-41. Chen Duo,Li Xue,Cui Duwu,et al. Clustering Validity Function Based on Fuzzy Degree[J]. Pattern Recognition and Artificial Intelligence,2008,21(1):34-41.
[12]肖滿生,陽娣蘭,張居武,等. 基于模糊相關(guān)度的模糊C均值聚類加權(quán)指數(shù)研究[J].計算機應(yīng)用, 2010,30(12):3388-3390. Xiao Mansheng,Yang Tilan,Zhang Juwu,et al. Research of Weighting Exponent of Fuzzy C-Means Algorithm Based on Fuzzy Relevanc[J]. Journal of Computer Applications,2010,30(12):3388-3390.
(責(zé)任編輯:申劍)
Application of Improved Fuzzy C-Means Algorithm in Image Segmentation
Zhou Dan,Xiao Mansheng,Liu Lihong,Yao Huidan
(School of Computer and Communication,Hunan University of Technology,Zhuzhou Hunan 412007,China)
For the defects of traditional fuzzy C-means algorithm in image segmentation, a weighted fuzzy C-means clustering algorithm based on dot density function are proposed. Takes the dot density function of image pixels as the weight, and on the basis of inter-class correlation defines a cluster validity function to determine the optimal number of clusters and combines with cluster validity to complete the effective image segmentation. Theoretical analysis and comparative experiments show that the algorithm overcomes the shortcomings of fuzzy means algorithm to some extent and has good classification accuracy in image segmentation.
fuzzy C-means;dot density function;cluster validity;image segmentation
TP391
A
1673-9833(2014)05-0079-05
10.3969/j.issn.1673-9833.2014.05.016
2014-03-13
國家自然科學(xué)基金資助項目(61170102),湖南省教育廳重點基金資助項目(12A042)
周丹(1989-),女,湖南工業(yè)大學(xué)碩士生,主要研究方向為智能圖像處理,E-mail:787868810@qq.com