許超
(商洛學(xué)院 陜西省商洛市 726000)
圖像分割是識別圖像中的對象并在所識別的對象之間形成上下文關(guān)系的基礎(chǔ)。模糊C 均值聚類算法是圖像分割中的經(jīng)典聚類算法之一,用于獲得源圖像的顏色量化版本,以進(jìn)一步分割圖像。在圖像分割領(lǐng)域中應(yīng)用模糊C 均值聚類算法會(huì)產(chǎn)生許多固有的復(fù)雜性,首要問題之一是預(yù)先指定簇的數(shù)量,其他問題包括由于隨機(jī)選擇初始中心,F(xiàn)CM 會(huì)陷入局部最優(yōu)。為了解決這個(gè)隨機(jī)初始化問題,目前已經(jīng)提出了許多基于進(jìn)化算法的研究。J.Kennedy 和Russell 提出了一種基于群體智能的優(yōu)化算法[1]。此后,Omran 等人將此粒子群優(yōu)化算法(PSO)應(yīng)用于圖像分類[2]。 近年來,PSO 的混合版本(包括速度和位置計(jì)算的優(yōu)化)與原始PSO 相比具有更好的性能。高尚等人使用PSO 的輸出來初始化K 均值聚類算法,并獲得了更好的結(jié)果[3]。他還證明,與K 均值聚類算法+ PSO 組合相比,PSO + K均值聚類算法組合是更好的選擇。李海陽等人在PSO 的連續(xù)迭代中更新慣性權(quán)重時(shí)使用了相同的方法[4]。本次研究以模糊C-均值代替K 均值來進(jìn)一步改善圖像分割效果。通過與自適應(yīng)粒子群優(yōu)化算法相結(jié)合,模糊C 均值算法將改善圖像分割效果,因?yàn)樗秒`屬度值來分類數(shù)據(jù)點(diǎn),而不是像K 均值那樣嚴(yán)格的0 或1 對數(shù)據(jù)點(diǎn)進(jìn)行分類。
Bezdek 等人引入的模糊C 均值算法根據(jù)目標(biāo)函數(shù)將數(shù)據(jù)點(diǎn)xi,i=1,2,3,...分組為C 群集。
其中,cj代表jth簇的原型值,uij是cj在簇j 中的隸屬度,m 是任何大于1 的實(shí)數(shù)。為了最小化目標(biāo)函數(shù),將高隸屬度值分配給這些像素,這些像素的強(qiáng)度位于其簇的原型值附近。其中uij用(2)式計(jì)算,cj用(3)式計(jì)算。
當(dāng)Jm的值在后續(xù)迭代中停止變化時(shí),該算法收斂。J.Kennedy和Russell 引入粒子群優(yōu)化算法,將問題的最優(yōu)解抽象為在N 維空間中飛行的無質(zhì)量、體積的粒子。一組粒子稱為粒子群或簡稱為“群”。每個(gè)粒子都有自己的飛行速度,空間位置和適合度值。假設(shè)粒子i 在d 維空間中的位置為Xi=(xi1,xi2,...,xid),速度為Vi=(vi1,vi2,...vid)。在迭代過程中,當(dāng)前的個(gè)體最優(yōu)解p-best是Pi=(pi1,pi2,...,pid),當(dāng)前的全局最優(yōu)解g-best 是Pg=(pg1,pg2,...,pgd)??梢苑謩e使用(4)式和(5)式計(jì)算粒子的速度和位置。
其中w 是慣性權(quán)重,它代表繼承到下一飛行速度的當(dāng)前飛行速度的數(shù)量。c1代表粒子的自我學(xué)習(xí)能力,c2代表粒子的社會(huì)學(xué)習(xí)能力。在PSO 算法中,c1和c2是常數(shù),其值在0 到4 之間。通常,c1=c2=2.0。r1和r2都是在0 和1 之間均勻分布的隨機(jī)數(shù)。李海陽等人在PSO 中使用了動(dòng)態(tài)慣性權(quán)重的概念[4]。在本次研究中,我們擴(kuò)展了這種想法以實(shí)現(xiàn)更好的分割效果。通過動(dòng)態(tài)改變慣性權(quán)重可以提高粒子群優(yōu)化算法的性能。保持慣性權(quán)重不變可能導(dǎo)致算法收斂于局部最優(yōu)解,線性減小的慣性權(quán)重甚至可能超出最優(yōu)點(diǎn)。為了克服這些缺點(diǎn),可以使用(6)式動(dòng)態(tài)計(jì)算慣性權(quán)重。
圖1:三種算法的圖像分割結(jié)果
其中wmax是最大慣性權(quán)重,wmin是最小慣性權(quán)重。f 是粒子i的當(dāng)前適應(yīng)值,favg是群的當(dāng)前平均適應(yīng)度,fmin是群中所有粒子的最小適應(yīng)值。該方法具有以下優(yōu)點(diǎn):
(1)適應(yīng)值小于平均適應(yīng)值的粒子被賦予較低的慣性權(quán)重,從而降低飛行速度以保持其位置。
(2)適應(yīng)值大于平均適應(yīng)值的粒子被賦予更高的慣性權(quán)重,從而提高飛行速度,以快速靠近其最適合的鄰居。
粒子群算法的兩個(gè)學(xué)習(xí)因子通常是常數(shù)。分配給這些因子不適當(dāng)?shù)闹悼赡軙?huì)導(dǎo)致不期望的輸出。為了得到更好的結(jié)果,我們分別使用(7)式和(8)式計(jì)算了學(xué)習(xí)因子c1和c2。
為了初始化群體,在圖像X 的N 個(gè)總像素中隨機(jī)選取M 個(gè)像素成為初始聚類中心,作為優(yōu)化問題的解集。確定聚類中心后,圖像X 中的剩余像素應(yīng)根據(jù)以下聚類準(zhǔn)則分配給這些M類。設(shè)xi為數(shù)據(jù)點(diǎn)集X 中的ith數(shù)據(jù)點(diǎn),且cj為jth簇中心。如果則將xi分配給jth簇。粒子的適應(yīng)度使用以下公式進(jìn)行評估:
式中,fi表示粒子i 的適配度,N 為像素總數(shù),M 為解集中粒子的數(shù)目,xi代表ith像素,cj為jth簇中心。群的平均適應(yīng)度favg計(jì)算如下:
群的收斂程度可以通過計(jì)算群適應(yīng)度方差δ2來測量,如下所示:
在優(yōu)化過程中,粒子適應(yīng)度將逐漸趨于相同。當(dāng)發(fā)生這種情況時(shí),該算法被認(rèn)為是收斂的,并且群體適應(yīng)度方差δ2將減小到某個(gè)范圍,這意味著該算法已經(jīng)接近全局最優(yōu)解。該最優(yōu)解作為FCM 算法的初始聚類中心。
使用Berkeley 分割數(shù)據(jù)集和基準(zhǔn)測試的圖像對APSOF 算法進(jìn)行了測試,這是一個(gè)應(yīng)用于圖像分割的標(biāo)準(zhǔn)數(shù)據(jù)集。此數(shù)據(jù)集中的大多數(shù)圖像都是真實(shí)的圖像,并已調(diào)整大小以減小文件大小。在本文中,從所有測試圖像中選擇了四個(gè)圖像進(jìn)行深入分析。為了比較結(jié)果,采用了兩種經(jīng)典的聚類算法,即K 均值聚類算法和模糊C均值聚類算法。簇的初始數(shù)目根據(jù)圖像的不同而不同,通常最多在5 到10 個(gè)簇之間。在模糊C 均值算法和APSOF 中,m 的值為2。分割結(jié)果如圖1所示。APSOF 的性能可以從兩個(gè)方面進(jìn)行分析:定性分析和定量分析。具體情況將在以下各節(jié)中介紹。
定性分析基本上是基于識別圖像中感興趣的區(qū)域或?qū)ο蟮哪芰?,通過肉眼觀察來評估圖像質(zhì)量。從圖1 中,我們可以容易地推斷出,APSOF 的分割結(jié)果比K 均值和模糊 C 均值有優(yōu)勢(表1)。
我們將逐幅圖像進(jìn)行分析,得到分割圖像的視覺差異。
從圖1 的第一行(即人臉),我們可以看到,與其他圖片相比,APSOF 中眼睛和嘴巴附近的部分與面部其余部分有很好的區(qū)別。另外,在APSOF 中,背景偽影,特別是人臉左側(cè)的背景偽影被清晰地分割出來,而在其他算法的分割結(jié)果中卻并不清楚。
表1:模糊C 均值和APSOF 的標(biāo)準(zhǔn)化Jm 值
圖1 的第二行(即花朵),可以觀察到,與趨向于較暗色調(diào)的模糊C 均值相比,APSOF 的輸出中的顏色是明亮和充滿活力的。在這種情況下,K 均值完全失去了背景色。
對于如圖1 第三行所示的金字塔圖像,APSOF 算法在金字塔頂部和云層左端的區(qū)域具有最好的分割效果。模糊C-均值將金字塔頂部誤歸類為云的一部分。盡管K 均值具有與APSOF 相似的結(jié)果,但它在金字塔和云的角部分的像素分類方面表現(xiàn)不佳。
對于圖1 第四行所示的老鷹圖像,除了圖像中下半部分附近的斑點(diǎn)可以忽略之外,所有的算法都產(chǎn)生了相似的分割結(jié)果,因?yàn)樗鼈儗τ谡麄€(gè)圖像沒有太大的意義。
綜上所述,通過定性分析可知,APSOF 算法的性能明顯優(yōu)于K 均值和模糊C 均值算法。
利用兩種算法的最終Jm值,可以比較APSOF 和模糊C 均值的性能。為了便于比較,通過將每個(gè)單獨(dú)的Jm值除以每個(gè)輸出的兩個(gè)Jm值的平均值來對這些值進(jìn)行歸一化。根據(jù)表1 中提供的信息,在大多數(shù)情況下,通過使用APSOF,Jm可以最小化。對于老鷹的圖像,由于APSOF 和模糊C 均值的分割輸出基本相似,所以在Jm值上只有很小的差別。
模糊C 均值算法是一種標(biāo)準(zhǔn)的圖像分割算法,但對初始化比較敏感。像APSOF 這樣的混合算法可以改進(jìn)標(biāo)準(zhǔn)的模糊C 均值算法以獲得更好的圖像分割。性能比較表明,該算法優(yōu)于K 均值和模糊C 均值,但是計(jì)算成本較高。為了滿足實(shí)時(shí)應(yīng)用的需要,需要提高APSOF 的效率。在以后的工作中,可以將空間信息結(jié)合起來,進(jìn)一步提高分割效率,增強(qiáng)算法對圖像數(shù)據(jù)中噪聲的敏感性。