尹欣潔
(1 河北地質(zhì)大學(xué)信息工程學(xué)院 河北 石家莊 050031)
(2 河北地質(zhì)大學(xué)人工智能與機(jī)器學(xué)習(xí)研究室 河北 石家莊 050031)
機(jī)場(chǎng)跑道路面的平整性和完好度直接影響著飛機(jī)起飛的安全,因此,基于圖像處理的機(jī)場(chǎng)跑道路面裂縫檢測(cè)方法,對(duì)機(jī)場(chǎng)跑道路面的維護(hù)和養(yǎng)護(hù)具有非常重要的作用[1]。
圖像分割是指將輸入圖像中特征具有一定相似性的子區(qū)域與其他子區(qū)域區(qū)分出來(lái),圖像分割作為圖像識(shí)別、對(duì)象檢測(cè)和場(chǎng)景解析中預(yù)處理的步驟之一,在計(jì)算機(jī)視覺(jué)中起到了至關(guān)重要的作用。近年來(lái),關(guān)于圖像分割算法大致可以分為4 類,其中包括基于圖論的方法、基于聚類的方法、基于分類的方法以及結(jié)合聚類和分類的方法。基于圖論的方法是一種自頂向下的分割方法,將圖像分割問(wèn)題轉(zhuǎn)換成圖的劃分問(wèn)題,然后對(duì)目標(biāo)函數(shù)的最優(yōu)化求解完成圖像分割。
Ekblad 等[2]提出了一種ICM 模型(The Intersecting Cortical Model),為了增強(qiáng)圖像特征,在PCNN 模型基礎(chǔ)上進(jìn)行了簡(jiǎn)化。即使在參考點(diǎn)不足的情況下,ICM 模型對(duì)飛機(jī)的移動(dòng)檢測(cè)也有效。Frate 等[3]在PCNN 模型前后分別連接去斑濾波器和高頻濾波器,設(shè)置自動(dòng)化迭代停止條件,應(yīng)用于對(duì) X 波段合成孔徑雷達(dá)圖像進(jìn)行邊緣檢測(cè)。Li 等[4]引入自組織數(shù)據(jù)聚類(ISODC)的方法確定PCNN 模型的參數(shù)和循環(huán)迭代條件,提高了圖像的分割速度和良好的分割效果。Guo 等[5]提出了一種基于無(wú)連接的簡(jiǎn)化脈沖耦合神經(jīng)網(wǎng)絡(luò)模型(SPCNN)的混合方法來(lái)提高乳腺X 光片中微鈣化點(diǎn)的檢測(cè)率。首先采用最大連通區(qū)域標(biāo)記乳腺區(qū)域,用區(qū)域生長(zhǎng)方法去除其他肌肉組織,使用雙頂帽變換和灰度調(diào)整函數(shù)增強(qiáng)微鈣化點(diǎn),然后使用非線性函數(shù)修改輪廓波系數(shù)去除噪聲和其他干擾信息,最后連接SPCNN 模型進(jìn)行微鈣化點(diǎn)檢測(cè)。通過(guò)神經(jīng)元釋放同步脈沖,可以找到圖像中相同性質(zhì)的區(qū)域,由此PCNN 模型可以進(jìn)行圖像分割。Du 等[6]通過(guò)改變相鄰神經(jīng)元的耦合系數(shù),并利用梯度算法計(jì)算原始圖像和輸出圖像的邊緣,對(duì)比均方差選取最優(yōu)的絕緣子分割圖像。該方法能夠分割出不同環(huán)境下的絕緣子圖像。Gao 等[7]為了提升神經(jīng)元脈沖發(fā)放的效率,改變了PCNN 模型的連接系數(shù)和動(dòng)態(tài)閾值,并且為了提高灰度不均勻圖像分割的精度,結(jié)合Bayes 聚類方法。Waldemark 等[8]根據(jù)設(shè)置神經(jīng)元在周期內(nèi)的發(fā)放脈沖的次數(shù),將衛(wèi)星圖像中的陸地和海洋進(jìn)行分割。Karvonen[9]為了更新神經(jīng)元的閾值和連接系數(shù),采用期望最大化將數(shù)據(jù)化后的圖像信息歸一為混合高斯分布,在每次迭代中的,選取兩個(gè)高斯分布的值計(jì)算其均值和方差。將該模型成功地應(yīng)用于波羅的海冰塊的合成孔徑雷達(dá)圖像分割。Wang 等[10]首先采用改進(jìn)的具有二進(jìn)制性質(zhì)的高斯濾波正則化水平集,對(duì)微型CT 圖像中單個(gè)牙齒分割,之后利用改進(jìn)的PCNN 模型用于復(fù)雜牙齒結(jié)構(gòu)的分類。Ruan等將和聲搜索優(yōu)化策略引入PCNN 模型中,該算法可以優(yōu)化參數(shù),提高PCNN 模型的分割精度和運(yùn)行效率,該算法已經(jīng)應(yīng)用于視覺(jué)導(dǎo)航系統(tǒng)的圖像分割。
脈沖耦合神經(jīng)網(wǎng)絡(luò)(Pulse Coupled Neural Network,PCNN)[11]被稱為典型的第三代人工神經(jīng)網(wǎng)絡(luò)。20 世紀(jì)90年代初期,由Eckhorn 等人根據(jù)哺乳動(dòng)物貓的視覺(jué)皮層建立的模型。PCNN 網(wǎng)絡(luò)由神經(jīng)元相互連構(gòu)成,每個(gè)神經(jīng)元都有兩個(gè)輸入,分別為饋入輸入和連接輸入。饋入輸入控制脈沖點(diǎn)火時(shí)刻,使相似特征的神經(jīng)元產(chǎn)生同步振蕩。饋入輸入和連接輸入會(huì)形成電勢(shì),與動(dòng)態(tài)閾值相比較產(chǎn)生神經(jīng)元的輸出。PCNN 模型已經(jīng)被應(yīng)用在邊緣提取、圖像分割、凹點(diǎn)檢測(cè)、圖像融合和運(yùn)動(dòng)處理等方面。與傳統(tǒng)的方法不同的是,PCNN 模型可以用硬件實(shí)現(xiàn),根據(jù)其局部連接的特性可以使用電路搭建大型網(wǎng)絡(luò)。不僅如此,PCNN網(wǎng)絡(luò)具有高效性、強(qiáng)魯棒性和不需要訓(xùn)練等優(yōu)點(diǎn),這使得PCNN 模型是一個(gè)具有廣闊前景的研究領(lǐng)域。
PCNN 模型是從哺乳動(dòng)物的視覺(jué)皮層系統(tǒng)演化而來(lái)的圖像預(yù)處理器[12],由公式(1)可知,PCNN 模型中一個(gè)神經(jīng)元由反饋單元Fij和連接單元Lij組成,其中反饋單元會(huì)受到S 的外部激勵(lì)。饋入單元和連接單元在權(quán)值的作用下會(huì)產(chǎn)生出內(nèi)部電勢(shì)Uij,神經(jīng)元的脈沖輸出與內(nèi)部電勢(shì)和動(dòng)態(tài)閾值Θij有關(guān),當(dāng)電勢(shì)大于動(dòng)態(tài)閾值,神經(jīng)元會(huì)被激發(fā)產(chǎn)生脈沖輸出Y,接著動(dòng)態(tài)閾值會(huì)迅速上升,此時(shí)動(dòng)態(tài)閾值大于內(nèi)部電勢(shì),隨著動(dòng)態(tài)閾值逐漸衰減,神經(jīng)元會(huì)再次被激發(fā)出,該過(guò)程持續(xù)發(fā)生產(chǎn)生脈沖流[12]。
其中:i,j表示在二維神經(jīng)元矩陣中坐標(biāo)為(i,j)的神經(jīng)元,同理,k,l表示二維神經(jīng)元矩陣中坐標(biāo)為(k,l)的神經(jīng)元;VF和VL是常量;Mijkl和Wijkl分別表示反饋單元和連接單元的連接權(quán)矩陣;β、和表示連接系數(shù);VΘ表示很大的常量。
針對(duì)PCNN 在圖像分割時(shí)受燈光昏暗等影響,出現(xiàn)脈沖誤傳導(dǎo)、分割效果不理想和分割精度低等問(wèn)題,提出了一種融合灰度值均方差和最大模糊散度的PCNN 圖像分割算法。該算法計(jì)算單個(gè)像素及四周的像素均方差,與相鄰的均方差比較,均方差大的作為饋入單元的外部激勵(lì)輸入,有效提高了分割算法的準(zhǔn)確度,根據(jù)目標(biāo)圖像與背景圖像的最大模糊散度,作為迭代終止條件。傳統(tǒng)PCNN 模型中,二值圖像的局部區(qū)域內(nèi)單個(gè)灰度值可作為外部激勵(lì),考慮到局部區(qū)域內(nèi)的像素具有關(guān)聯(lián)性,原始模型進(jìn)行圖像分割時(shí)無(wú)法準(zhǔn)確獲取目標(biāo)圖像的特征信息。因此,本文將灰度值均方差作為外部激勵(lì),更好的保留了圖像局部特征,實(shí)現(xiàn)對(duì)圖像的準(zhǔn)確分割。將圖像進(jìn)行子塊劃分,滑動(dòng)窗口為3×3,滑動(dòng)步長(zhǎng)為1,計(jì)算每個(gè)子塊q(a,b) 的均方差,如式(2)所示。
其中(a,b) 表示(a,b) 子塊像素的均值,當(dāng)前子塊與(a+1,b) 子塊的均方差進(jìn)行比較,值越大表明特征相對(duì)明顯,即可作為外部激勵(lì)S,公式如(3)所示。
模糊集合理論的閾值化分割利用人類視覺(jué)的模糊性和隨機(jī)性實(shí)現(xiàn)圖像分割的方法,可以降低圖像分割時(shí)累積的誤差。模糊散度一方面能反映出集合中成員對(duì)所在集合的隸屬度,另一方面可以根據(jù)概率分布反映出兩個(gè)集合的相似程度。模糊散度的公式如(4)所示。
其中,M×N為圖像的大小,模糊散度的公式中目標(biāo)相對(duì)于背景的對(duì)稱交叉熵
oμ表示目標(biāo)的隸屬度,,bμ表示背景的隸屬度,背景相對(duì)于目標(biāo)的交叉熵。
由于原始PCNN 模型并不是根據(jù)圖像分割的實(shí)時(shí)情況設(shè)定的迭代終止條件,而是根據(jù)經(jīng)驗(yàn)值設(shè)置的,本文采用最大模糊散度的閾值作為本算法的終止迭代條件,加強(qiáng)PCNN 模型分割圖像的能力,有益于提高圖像分割的精度。目標(biāo)模糊集μo(g;t,P)的隸屬度函數(shù)如公式(5)所示。
式中目標(biāo)和背景像素的灰度均值mo(t)、mb(t)可從直方圖h(g)中估計(jì)出來(lái),t為二值化閾值,L為灰度上界。當(dāng)μo(g;t,P)>時(shí),表明輸出區(qū)域達(dá)到分割的要求,本算法不再進(jìn)行迭代。
為了驗(yàn)證本文提出的算法分割性能,基于Python 語(yǔ)言編寫(xiě),實(shí)驗(yàn)環(huán)境為GPU(型號(hào):NVIDIA GeForce GTX TITAN X)。將本文的PCNN-MMF 算法與兩個(gè)基于PCNN 的圖像分割算法進(jìn)行比較,分別是參數(shù)可調(diào)的改進(jìn)脈沖耦合神經(jīng)網(wǎng)絡(luò)的分割算法(PA-MSPCNN)和基于迭代自組織數(shù)據(jù)聚類閾值的圖像分割算法(ISODC-PCNN)。為了全面驗(yàn)證本文算法的圖像分割性能,另外選擇近幾年分割性能好的算法,分別為基于核矩陣與閾值加權(quán)模糊因子的C-means 分割算法(KW-FLICM)和基于區(qū)域邊界最優(yōu)映射的圖像分割算法(ORBM)進(jìn)行對(duì)比實(shí)驗(yàn)。
性能指標(biāo)PRI 的值越大,表示算法分割的效果越優(yōu)秀,其他3 個(gè)性能指標(biāo)恰恰相反。由表1 可知,本文算法在PRI 和VoI 上明顯要比其他對(duì)比算法要好,說(shuō)明采用像素值均方差作為激勵(lì)輸入,大大提高了圖像分割的精確度。在GCE和BDE上,本文算法和ISODC-PCNN相差分別為0.004和0.016,差距微弱。
表1 性能指標(biāo)和運(yùn)行時(shí)間對(duì)比
在PRI、BDE、VoI 和GCE 4 個(gè)性能評(píng)價(jià)指標(biāo)上進(jìn)行仿真實(shí)驗(yàn),選擇近幾年分割效果顯著的PA-MSPCNN、ISODC-PCNN、KW-FLICM 和ORBM 為對(duì)比算法,結(jié)果表明本文算法在魯棒性、分割精確度和分割效率上有著優(yōu)秀的表現(xiàn)。本文算法適應(yīng)于分割細(xì)小且易受環(huán)境變化影響的機(jī)場(chǎng)跑道路面裂縫。