尚方信 郭浩 李鋼 張玲
摘 要:為解決現(xiàn)有無監(jiān)督圖像分割模型對強噪聲環(huán)境魯棒性差、無法適應(yīng)復(fù)雜混合噪聲的問題,提出了一種基于One-class SVM方法的改進后的噪聲魯棒圖像分割模型。首先,基于One-class SVM構(gòu)建一種數(shù)據(jù)離群程度檢測機制;然后,將離群程度值引入能量泛函,令分割模型可以在多種噪聲強度下獲得較為準(zhǔn)確的圖像信息,同時避免現(xiàn)有方法在強噪聲環(huán)境下,降權(quán)機制失效的問題;最后,通過最小化能量函數(shù),驅(qū)動分割輪廓向目標(biāo)邊緣演化。在噪聲圖像分割實驗中,當(dāng)選取不同類型和強度的噪聲時,該模型均能得到較為理想的分割結(jié)果。在F1-score評估標(biāo)準(zhǔn)下,該模型比基于局部相關(guān)熵的K-means(LCK)模型高0.2~0.3,在強噪聲環(huán)境下具有更高的穩(wěn)定性,且在分割收斂時間上僅略大于LCK模型0.1s左右。實驗結(jié)果表明,所提模型在未顯著增加分割耗時的前提下,對于概率、極值及混合噪聲均有著更好強的魯棒性,并且可以分割帶有噪聲的自然圖像。
關(guān)鍵詞:圖像分割;圖像噪聲;單類支持向量機;離群檢測;能量項
中圖分類號: TP391.41
文獻標(biāo)志碼:A
文章編號:1001-9081(2019)03-0874-08
Abstract: To deal with poor robustness in strong noise environment, weak adaptability to complex mixed noise that appear in the existing unsupervised image segmentation models, an improved noise-robust image segmentation model based on One-class SVM (Support Vector Machine) method was proposed. Firstly, a data outlier detection mechanism was constructed based on One-class SVM. Secondly, an outlier degree was introduced into the energy function, so that more accurate image information could be obtained by the proposed model under multiple noise intensities and the failure of weight-descend mechanism in strong noise environment was avoided. Finally, the segmentation contour was driven to the target edge by minimizing the energy function. In noise image segmentation experiments, the proposed model could obtain ideal segmentation results with different types and intensities of noise. Under F1-score metric, the proposed model is 0.2 to 0.3 higher than LCK (Local Correntropy-based K-means) model, and has better stability in strong noise environments. The segmentation convergence time of the proposed model is only slightly longer than that of LCK model by about 0.1s. Experimental results show that the proposed model is more robust to probabilistic, extreme values and mixed noise without significantly increase of segmentation time, and can segment natural images with noise.
Key words: image segmentation; image noise; One-class Support-Vector-Machine (SVM); outlier detection; energy term
0 引言
作為計算機視覺技術(shù)的基礎(chǔ),圖像分割一直以來就是圖像處理研究領(lǐng)域中的重點和難點。其主要目標(biāo)是根據(jù)圖像像素值或其他統(tǒng)計指標(biāo)構(gòu)建圖像特征,將圖像劃分為若干個互不重疊的子區(qū)域,每一子區(qū)域內(nèi)部具有相同或相似的圖像特征。近年來,結(jié)合多種統(tǒng)計方法的分割模型[1],在解決各種類型的圖像分割問題中得到了較為廣泛且成功的應(yīng)用,但應(yīng)用于模糊圖像、噪聲圖像和目標(biāo)邊界不平滑的自然圖像的分割問題時,仍存在諸多問題。
C-V(Chan-Vese)模型[2]開創(chuàng)了依據(jù)圖像區(qū)域特征完成分割的先河,它使用分片常數(shù)函數(shù)對分割輪廓線兩側(cè)的圖像區(qū)域進行擬合,在像素值與所屬區(qū)域均值差異最小時,達到穩(wěn)定狀態(tài)。C-V模型對邊界較不清晰的目標(biāo)分割性能良好,但無法分割非同質(zhì)不均勻圖像。針對C-V模型的不足,局部二值擬合(Local Binary Fitting, LBF)[3]和局部圖像擬合(Local Image Fitting, LIF)[4]為代表的局部區(qū)域型模型利用局部窗的思想,以每一個像素點為中心,將圖像劃分為多個有重疊的局部區(qū)域。上述局部模型可較準(zhǔn)確地分割不均勻圖像,但由于其僅考慮了圖像局部信息,能量函數(shù)在迭代過程中容易陷入局部極小值,同時對初始位置的敏感性也較強。
研究人員在LBF、LIF的基礎(chǔ)上提出了許多改進方法,Wang等[5]提出LCK(Local Correntropy-based K-means)方法,假設(shè)異常數(shù)據(jù)與局部均值具有顯著差異,對以椒鹽噪聲為代表的極值噪聲具有較好的分辨能力,但不能準(zhǔn)確分辨沒有顯著極值的概率噪聲(如高斯噪聲)。Jiang等[6]于2016年提出的模糊C聚類(Fuzzy C-Means, FCM)方法認(rèn)為在分割過程中,像素點對每一個子區(qū)域均應(yīng)具有從屬概率,最終選擇從屬概率最大的區(qū)域作為分割結(jié)果。該方法可較準(zhǔn)確地分割椒鹽噪聲圖像,但像素點從屬區(qū)域的結(jié)果被概率化,該模型在高斯噪聲圖像、或弱邊界圖像的邊界處易受到異常信息的干擾,無法準(zhǔn)確估計圖像灰度依賴的概率分布而造成混淆,最終導(dǎo)致分割失敗。Li等[7]于2016年提出的RLSF模型(Region-based model via Local Similarity Factor) 考慮了圖像局部像素的相對位置與空間信息(像素點間的歐氏距離),結(jié)合較小的自適應(yīng)迭代步長,可實現(xiàn)對弱椒鹽噪聲圖像的有效分割,但在強噪聲環(huán)境或概率噪聲環(huán)境下,均表現(xiàn)不佳。2018年趙怡等[8]認(rèn)為進行圖像分割時,不僅要考慮每一子區(qū)域內(nèi)部圖像特征的相似性,還需最大化不同區(qū)域之間圖像特征的差異性,并引入圖像熵分別度量每一區(qū)域內(nèi)部的均勻程度。2018年李鋼等[9]在目標(biāo)邊界灰度變化相對顯著的區(qū)域使用可變形鄰域去除弱相關(guān)圖像信息,結(jié)合LCK降權(quán)方法提升模型在弱邊界模糊圖像和噪聲圖像的性能。該方法的可變形鄰域為模型提供了更多的靈活性,但仍屬于作者賦予的先驗信息。模型不具有機器學(xué)習(xí)能力,未能充分適應(yīng)復(fù)雜的圖像數(shù)據(jù),在輪廓復(fù)雜的噪聲自然圖像和混合噪聲圖像上表現(xiàn)仍有提升空間。上述改進使得該模型對于非均勻和弱邊界圖像的分割問題具有良好的適應(yīng)能力,但在椒鹽噪聲環(huán)境下,噪聲顆粒原本就與其所屬區(qū)域的圖像特征差異較大,容易導(dǎo)致分割失敗。
上述模型分別對特定類別的圖像具有良好的分割效果,但大多未考慮噪聲圖像或僅考慮使模型適應(yīng)弱噪聲環(huán)境,且適應(yīng)的噪聲類別各有不同。因而這些模型在噪聲強度較高或噪聲分布復(fù)雜時,會出現(xiàn)過分割或分割失敗的現(xiàn)象。針對這些問題,本文基于單類支持向量機(One-class Support Vector Machine, One-class SVM)方法提出一種更加合理的像素點賦權(quán)方案,在考慮圖像局部信息的基礎(chǔ)上,在圖像全局范圍內(nèi)利用所有的局部均值構(gòu)造一個離群程度檢測機制。實驗表明,本文模型對不同強度和多種類別的圖像噪聲有著良好的適應(yīng)能力,并且可以在噪聲環(huán)境下處理背景較為復(fù)雜的自然圖像。
1 相關(guān)理論
1.1 基于K-means的局部相關(guān)系數(shù)方法
2013年,Wang等[6]提出了一種名為LCK(Local Correntropy-based K-means)的噪聲魯棒模型。其核心思想是根據(jù)K-means無監(jiān)督聚類方法構(gòu)建一種介于0~1的相關(guān)性系數(shù),衡量鄰域內(nèi)像素點與鄰域中心在像素空間中的相似程度。某一像素點處的相關(guān)性系數(shù)越接近0,該像素點與鄰域內(nèi)圖像內(nèi)容的相關(guān)性越低,被噪聲污染的可能性越大。
椒鹽噪聲是產(chǎn)生自圖像傳輸過程中的極值點狀噪聲,噪聲顆粒與其鄰域灰度均值的差異較大。在LCK模型中,該類噪聲顆粒被分配較小的相關(guān)性系數(shù),對模型能量函數(shù)的計算影響較小。因此LCK對椒鹽噪聲具有較好強的魯棒性,模型能量函數(shù)如式(1)所示:
該方法通過計算圖像中各像素點的灰度值與其鄰域灰度的相關(guān)性,減少了水平集函數(shù)迭代過程中噪聲點對分割結(jié)果的影響,但該模型在圖像包含較多噪聲時,可能會對過多的像素點降權(quán),拋棄過多圖像內(nèi)容,以至出現(xiàn)分割失敗的情況。
1.2 One-class SVM異常檢測算法
圖1是數(shù)據(jù)空間維度n=3時的分類機制示意圖,展示了超平面在映射空間中對數(shù)據(jù)的分類機制。
One-class SVM有兩種實現(xiàn)方式,即構(gòu)造與數(shù)據(jù)分離的超平面和構(gòu)造包裹數(shù)據(jù)的超球體??梢宰C明,在映射核函數(shù)K是高斯核函數(shù)時,兩種方法等價。無論哪一種實現(xiàn)方式,都以現(xiàn)有樣本作為正樣本構(gòu)造數(shù)據(jù)域描述,并將異常值標(biāo)記為負(fù)樣本。為使決策分類超平面在描述數(shù)據(jù)特征的同時盡可能地遠(yuǎn)離負(fù)樣本,需要求解下式的受限優(yōu)化問題:
其中:N為樣本數(shù)量;xi代表數(shù)據(jù)點; ρ為常數(shù),代表分類超平面的截距;ξi為松弛變量,用于在一定范圍內(nèi)忽略分類誤差,降低分類超平面對異常數(shù)據(jù)的敏感性;ν∈(0,1]是模型超參數(shù),與正樣本側(cè)的訓(xùn)練數(shù)據(jù)量成反比,它反映了分類平面最大化正樣本一側(cè)的訓(xùn)練數(shù)據(jù)數(shù)量和最小化到每一訓(xùn)練樣本間距離的折中,即盡可能多且緊密地將訓(xùn)練數(shù)據(jù)包含在分類超球內(nèi)部。對于有條件限制的參數(shù)優(yōu)化問題,構(gòu)造形式如式的拉格朗日函數(shù)求解:
One-class SVM作為一種異常值檢測算法,通過擬合數(shù)據(jù)得到最大化邊界的分類超平面,兼顧了對正常數(shù)據(jù)的泛化能力和對異常數(shù)據(jù)檢測的敏感性。但該模型僅能完成“正常/異?!睌?shù)據(jù)的二分檢測,無法判定數(shù)據(jù)離群程度。若直接將該方法應(yīng)用于圖像分割,模型將只能“接受”或“拋棄”圖像像素點,而無法獲取中間狀態(tài),這對具有復(fù)雜目標(biāo)的自然圖像分割是極為不利的。
2 異常值檢測與噪聲圖像分割方法
基于噪聲顆粒降權(quán)的噪聲圖像分割模型利用圖像統(tǒng)計特征衡量區(qū)域與特定點的相似關(guān)系,與區(qū)域特征差距較大的像素點被判定為噪聲點,可根據(jù)差異值平滑地對噪聲點進行降權(quán),降低圖像噪聲對分割過程的干擾。此類噪聲魯棒方法處理弱椒鹽噪聲效果顯著,但噪聲點判定方法在高斯噪聲和強椒鹽噪聲環(huán)境下容易失效,影響分割結(jié)果,出現(xiàn)分割失敗的情況。
如圖2所示,取一邊長為3、包含9個像素點的正方形鄰域。圖中分塊顏色代表該處的像素值,數(shù)字代表LCK模型在該像素點處的權(quán)值。該區(qū)域正常像素信息為淺色,在圖2(a)所示的弱噪聲環(huán)境中,僅有少量像素點被胡椒顆粒污染,變?yōu)樯钌?,此時LCK模型為該異常點賦予了一個較低的權(quán)值,因此該異常點對能量函數(shù)的計算和分割迭代影響較小;而在圖2(b)所示的強噪聲環(huán)境下,多個像素點被噪聲污染,此時噪聲點被降權(quán),但原本正常的淺色像素也被賦予了較低的權(quán)值,此加權(quán)灰度均值的計算相當(dāng)于僅依賴少數(shù)像素顆粒,從而使加權(quán)的鄰域均值失去了對鄰域信息的代表性,而只包含了其中某一個像素點的信息。這顯然是不合理的。
研究[12]表明,常見圖像噪聲可分為概率噪聲和極值脈沖噪聲。其中,以高斯噪聲、伽馬噪聲為代表的隨機噪聲均服從某種具有均值和方差的概率分布;以椒鹽噪聲為代表的極值脈沖噪聲具有較穩(wěn)定的均值。
針對圖像噪聲的上述類型和特性,本文將基于支持向量方法構(gòu)建一種噪聲魯棒的局部型圖像分割模型LSV(Localized Support Vector)。在如圖3(a)所示的弱噪聲環(huán)境下,鄰域內(nèi)僅有少量像素點被噪聲污染,且噪聲點處像素值離群程度較大,距離包裹大部分?jǐn)?shù)據(jù)的SVM分類超球面較遠(yuǎn)。此時噪聲點將被賦予較小的權(quán)重以避免其對能量泛函的干擾。如圖3(b)所示的強噪聲環(huán)境下,雖然多個噪聲點被污染,鄰域內(nèi)像素方差較大,但SVM仍致力于通過核函數(shù)將數(shù)據(jù)點映射至高維空間中分類超球體內(nèi)側(cè),即對多個噪聲點賦予接近的權(quán)重,使鄰域均值的計算方式趨近于算術(shù)平均數(shù)。LSV模型對噪聲點的降權(quán)機制如圖3所示。
以圖4所示的多幅弱邊界人工合成圖像為例,在疊加方差0.3的高斯噪聲的強噪聲環(huán)境下,基于算術(shù)平均數(shù)的全局均值濾波可有效去除圖像噪聲,并保留部分圖像內(nèi)容;在弱噪聲環(huán)境下,圖像被疊加方差0.05的高斯噪聲。顯然,在噪聲強度較弱時,均值濾波會損失過多的圖像信息,可能導(dǎo)致分割模型無法捕捉到足夠的圖像信息而造成過分割或誤分割,是一種相對低效的預(yù)處理方式。而對于給定的圖像,本文方法中離群程度的檢測機制可在圖像的每一個局部區(qū)域?qū)γ恳粋€像素點計算出一個合理的權(quán)值,我們使用這種權(quán)值作為濾波算子對噪聲圖像進行濾波,其結(jié)果也一并展示在圖4中。
可以發(fā)現(xiàn)基于本文方法的濾波結(jié)果清晰程度要優(yōu)于均值濾波的結(jié)果。這是由于圖像噪聲服從某概率分布或具有較穩(wěn)定的均值,被噪聲污染的像素點仍然可能保留著部分圖像信息,強噪聲場景下在整個圖像上使用接近算術(shù)平均數(shù)的計算方式是合理的,但弱噪聲環(huán)境下仍應(yīng)對噪聲點進行有效的降權(quán),均值濾波算子在弱噪聲環(huán)境下仍會對所有像素點進行無差別的平均運算。
值得注意的是,本文方法中,One-class SVM在整個圖像域上進行異常值判斷,并將計算得到的離群程度應(yīng)用于能量函數(shù)。而LBF的局部均值方法僅考慮每一個特定鄰域內(nèi)的圖像數(shù)據(jù),考慮的樣本數(shù)量較少,因而無法去除噪聲數(shù)據(jù)的影響。
根據(jù)變分法和Euler-Lagrange方程,設(shè)本文模型的水平集演化方程如下:
3 實驗結(jié)果與分析
為驗證本文模型在強噪聲環(huán)境下,對內(nèi)容較為復(fù)雜的自然圖像及弱邊界圖像的處理能力,本章將本文模型、LBF模型、LCK模型、FCM模型應(yīng)用于解決上述類型的圖像分割問題中,并對分割結(jié)果進行直觀展示和量化對比。實驗表明本文模型在疊加多種噪聲的弱邊界圖像、光照和灰度不均勻圖像、復(fù)雜自然圖像等多類型目標(biāo)上均可以呈現(xiàn)出較為理想的分割結(jié)果。特別是在強噪聲環(huán)境中其他對比模型均出現(xiàn)不同程度誤分割時,本文模型能保持較好的有效性、分割精度和初始輪廓位置魯棒性,基于局部支持向量的噪聲數(shù)據(jù)檢測方法對噪聲數(shù)據(jù)的檢測和抑制作用得到充分展示。實驗在Lenovo臺式機上使用Matlab R2018a完成。如無特別說明,本文實驗參數(shù)設(shè)置為:μ=0.003×255×255,λ1=1, λ2=1,ν=1,Δt=0.1,ε=1, σ=1。
為便于定量分析本文模型與其他對比模型的分割精度,作為分割結(jié)果的水平集函數(shù)需要被二值化,即:
對于定義在圖像域Ω上的每一個像素點x,均有模型預(yù)測分割結(jié)果r(x)與參考分割結(jié)果g(x)。真陽類(True Positive, TP)代表模型預(yù)測為前景,且參考分割結(jié)果也為前景的像素點個數(shù);假陽類(False Positive, FP)代表模型預(yù)測為前景,但參考分割結(jié)果為背景區(qū)域的像素點個數(shù);假陰類(False Negative, FN)代表模型預(yù)測為背景,但參考分割結(jié)果為前景區(qū)域的像素點個數(shù)。模型的分割結(jié)果與參考分割結(jié)果重合程度越高,得到的F1-score越高。上述內(nèi)容的直觀表達如表1所示。
3.1 合成圖像
Mnist數(shù)據(jù)集[13]是一個知名的手寫字符圖像數(shù)據(jù)集,包含大量手寫數(shù)字圖像,尺寸均為28px(pixel)×28px,其圖像內(nèi)容具有較強的空間復(fù)雜性。本段實驗從Mnist數(shù)據(jù)集中隨機選取50幅手寫字符圖片,進行如下預(yù)處理步驟:
1)使用雙線性插值方法將待分割圖像處理至128px×128px,增加像素總數(shù)以便準(zhǔn)確評估圖像噪聲對分割結(jié)果的干擾;
2)進行散焦處理,弱化目標(biāo)區(qū)域邊界;
3)依據(jù)實驗需要疊加圖像噪聲。
圖5展示了從Mnist數(shù)據(jù)集中隨機抽取的5幅經(jīng)預(yù)處理的圖像,及對比模型在這些圖像上的分割結(jié)果。
為確保對比實驗的有效性和公平性,本段實驗的初始輪廓均位于圖像中心,半徑為8px,且設(shè)定了相同的分割參數(shù)??梢园l(fā)現(xiàn),隨著高斯噪聲強度增加,圖像內(nèi)容被污染程度同步增加。在方差為0.01的高斯噪聲環(huán)境下,圖像基本沒有被噪聲污染,且模糊的目標(biāo)邊緣并未影響大多數(shù)模型的分割。RLSF模型由于迭代步長較小,易被噪聲點干擾,且鄰域不服從高斯分布,分割結(jié)果較不理想。LBF、LCK、FCM和RLSF模型均在強度為0.05以上的高斯噪聲環(huán)境下,出現(xiàn)了不同程度的誤分割。由于高斯噪聲服從高斯概率分布,每個噪聲點與正常像素點的灰度差異不明顯,其局部均值卻與無噪聲圖像的局部均值差異較大,LCK模型相關(guān)性系數(shù)方法易被干擾,導(dǎo)致降權(quán)機制失效;FCM模型對高斯噪聲的適應(yīng)能力優(yōu)于前述模型,但模糊聚類的特性使得圖像噪聲密度較大時像素點被正確分類的概率不顯著,進而出現(xiàn)誤分割現(xiàn)象。本文模型中使用局部均值和圖像灰度值作為像素點的特征向量,且高斯噪聲服從的概率分布參數(shù)為均值和方差。One-class SVM具有的偏置項使得離群程度判斷機制不受概率噪聲的均值影響。方差(噪聲強度)較小時,圖像各像素點與無噪聲圖像相差不大,模型可完成準(zhǔn)確分割;方差(噪聲強度)較大時,大多數(shù)噪聲點與無噪聲圖像差異依然較小,但少量噪聲點的偏差值較大。擬合的SVM超球面將盡可能地緊密包裹大多數(shù)像素點,而將少量差異較大的像素點判定為異常,確保離群程度檢測機制的正常,使模型在強噪聲環(huán)境下依然可以有效抽取出較為明顯的目標(biāo)邊界,完成準(zhǔn)確分割。
按照上述預(yù)處理步驟,本段實驗從Mnist數(shù)據(jù)集中隨機抽取500幅圖像,利用未散焦且未疊加噪聲的原始圖像,經(jīng)二值化處理后作為參考分割結(jié)果。上述數(shù)據(jù)被分為5組,并分別疊加方差為0.01、0.05、0.1、0.2、0.3的高斯噪聲。使用LBF、LCK、FCM、RLSF和本文方法分別進行分割,記錄分割結(jié)果并按照F1-score的計算方式二值化,所得分值誤差棒圖如圖6所示。其中折線中心點處代表對應(yīng)噪聲強度下該模型所得分?jǐn)?shù)的均值,上下兩側(cè)橫線代表該場景下分值的最大值和最小值。
與圖5所示的分割結(jié)果相比,在更廣泛的數(shù)據(jù)上進行的實驗進一步證明,與其他對比模型相比,本文模型可在弱邊界圖像、高斯噪聲圖像上實現(xiàn)準(zhǔn)確且穩(wěn)定的分割。
3.2 自然圖像
在弱邊界噪聲合成圖像上進行的對比實驗,證明了本文模型可以準(zhǔn)確分割該類型圖像。為了證明本文模型對被分割圖像具有廣泛的適應(yīng)性,本節(jié)實驗引入Weizmann Horse Database自然圖像數(shù)據(jù)集[14]。該數(shù)據(jù)集包含上百幅以馬為主體的圖像,圖像背景覆蓋多種自然環(huán)境。本節(jié)實驗從該數(shù)據(jù)集中隨機抽取30幅圖像,對每幅圖片都進行散焦模糊并分別疊加椒鹽噪聲和高斯噪聲。由于自然圖像中灰度、紋理等局部信息較豐富,本段實驗將圖像尺寸調(diào)整至256px×256px,以保留大部分圖像信息,并使用與上節(jié)實驗相同的量化方法評估各個模型的分割性能。以下選取了部分具有代表性的圖像展示實驗結(jié)果。
圖7展示了LBF模型、LCK模型、FCM模型和RLSF模型和本文模型在部分高斯噪聲圖像上的分割結(jié)果對比,圖8展示的是全部分割結(jié)果的F1-score量化分值對比情況。
與目標(biāo)較簡單的人工合成圖像相比,自然圖像具有更豐富的背景內(nèi)容和圖像細(xì)節(jié),容易造成分割模型的誤分割和過分割。即使在方差為0.01的弱高斯噪聲環(huán)境下,LBF、LCK、FCM和RLSF模型在圖像全局范圍內(nèi)均出現(xiàn)了不同程度的誤分割。這是由于高斯概率噪聲在局部范圍內(nèi)造成了與原始圖像不同的灰度差異,且這種差異在局部無法被LBF的均值計算方式消除;同時概率噪聲的特性使得大多數(shù)差異值位于概率分布的均值附近,未能觸發(fā)有效的降權(quán)或模糊聚類機制,導(dǎo)致LCK和FCM模型的分割失敗。RLSF模型試圖使用較小的迭代步長獲得水平集函數(shù)的穩(wěn)定迭代,但概率噪聲的特性使水平集函數(shù)極易被局部的不均勻性質(zhì)干擾,造成局部的誤分割。但由于噪聲分布的方差處于相對較低的水平,各模型在對噪聲點的誤分割以外,仍舊識別了期望的目標(biāo)輪廓,即水平集函數(shù)在噪聲點處的取值在±0附近波動,而期望的目標(biāo)輪廓兩側(cè)函數(shù)值則具有較大的差異,體現(xiàn)為誤分割結(jié)果與目標(biāo)輪廓間的空白。在中等強度的高斯噪聲環(huán)境下(噪聲強度0.1),由于噪聲分布的方差變大,使得噪聲圖像與原始圖像的差異值相對增加,LCK模型和FCM模型基于聚類和相關(guān)性系數(shù)的降權(quán)機制生效,減小了局部誤分割的概率,體現(xiàn)為全局范圍內(nèi)誤分割結(jié)果的降低。但隨著噪聲強度進一步升高,傳統(tǒng)的噪聲魯棒方法對鄰域內(nèi)多個像素點進行降權(quán),損失了較多的圖像信息,最終導(dǎo)致模型在全局范圍內(nèi)出現(xiàn)較為嚴(yán)重的誤分割。本文模型基于像素值、分割輪廓兩側(cè)的鄰域灰度均值等圖像特征構(gòu)建的One-class SVM離群程度檢測方法,將上述圖像特征數(shù)據(jù)映射至高維空間中,并構(gòu)建一個盡可能緊密包裹數(shù)據(jù)的超球面,而異常數(shù)據(jù)位于超球面以外,受高斯噪聲污染越嚴(yán)重的像素點,與局部其他像素點的差異越大,與超球面的距離越遠(yuǎn)。因此在弱噪聲環(huán)境下,本文模型對異常值的靈敏檢測,有效降低了異常點對能量泛函的干擾,確保分割迭代的正常運行。強噪聲環(huán)境下,One-class SVM方法中包含的偏置項使降權(quán)機制可有效適應(yīng)局部噪聲均值非0的情況,并且為鄰域內(nèi)大多數(shù)像素點賦予較高的權(quán)重,即傾向使用大范圍內(nèi)的平均灰度數(shù)據(jù)引導(dǎo)目標(biāo)輪廓的分割。上述機制使得本文模型對高斯噪聲和自然圖像背景或目標(biāo)區(qū)域內(nèi)的干擾信息不敏感,可獲得理想且穩(wěn)定的分割結(jié)果。
原始圖像像素值位于[pmin,pmax]范圍內(nèi),pmin≥0,pmax≤255。以椒鹽噪聲為代表的極值脈沖噪聲實質(zhì)上是從圖像域內(nèi)所有像素點中,隨機選取一部分像素點,其值被替換為pmin或pmax。與服從概率分布、隨機修改圖像域內(nèi)每一個像素點的高斯噪聲相比,被椒鹽噪聲污染的圖像只丟失了一部分圖像信息。但椒鹽噪聲點與局部灰度均值的差異較大,極易干擾能量泛函的最小化過程。這一特性導(dǎo)致局部模型傾向?qū)⒃肼朁c識別為與鄰域大多數(shù)像素點不同的類別,體現(xiàn)為誤分割或過分割。與LBF模型相比,LCK和FCM模型的降權(quán)機制對椒鹽噪聲具有一定適應(yīng)能力,在弱噪聲環(huán)境下降低了噪聲點對分割過程的干擾;但隨著噪聲強度增加,鄰域內(nèi)正常像素點的數(shù)量減少,上述模型的降權(quán)機制使得模型中鄰域均值的計算依賴于極少數(shù)像素點,因而出現(xiàn)誤分割的結(jié)果。RLSF模型較小的迭代步長使模型對弱邊界和非均值圖像具有較好的適應(yīng)能力的同時,也使模型容易被噪聲干擾,陷入局部極小值而無法脫離,最終在全圖像域上出現(xiàn)誤分割。本文方法基于SVM構(gòu)建的離群程度檢測機制,在弱噪聲環(huán)境下對異常值進行更為強烈的降權(quán)。在強噪聲環(huán)境下,雖然噪聲點的密度較高,但鄰域內(nèi)像素的平均值依然保留著部分圖像信息。本文模型盡可能全面地利用圖像信息,得到更為合理的鄰域均值,并引導(dǎo)分割輪廓向期望的目標(biāo)運動,最終在噪聲環(huán)境下得到了較為理想的分割結(jié)果。相關(guān)量化對比分值,如圖10所示。
本段實驗對各模型運算耗時進行了統(tǒng)計,即從運算代碼初始化完成,迭代函數(shù)開始第一次迭代時起開始計時,至分割輪廓不再顯著變化,兩次迭代狀態(tài)之間差異小于閾值時停止計時。各對比模型運算用時如表2所示,本節(jié)涉及實驗均在Lenovo臺式機(i3-4170 CPU,4G RAM)上使用Matlab R2018a完成,數(shù)值單位均為秒??梢园l(fā)現(xiàn),圖像噪聲對于各模型收斂速度影響相對不顯著,無論能否準(zhǔn)確分割目標(biāo),各模型均能在一定時間后收斂。其中,僅計算鄰域均值的LBF模型用時最短,采用較小迭代步長的RLSF模型達到穩(wěn)定收斂狀態(tài)所需的時間遠(yuǎn)大于其他模型,本文方法與LCK模型、FCM模型用時接近。這是由于LCK模型和FCM模型是在LBF模型的基礎(chǔ)上,對鄰域內(nèi)像素點進行加權(quán),單次迭代中因計算鄰域權(quán)值導(dǎo)致的額外運算量與計算鄰域均值的運算量接近。而本文方法雖然引入了運算更為復(fù)雜的One-class SVM異常值檢測機制,但該檢測機制對數(shù)據(jù)的魯棒性允許降權(quán)機制與分割模型的迭代計算異步進行,即經(jīng)過分割輪廓變化相對較小的若干次迭代后,重新在整個圖像范圍內(nèi)進行一次異常值檢測機制的運算,而無需在每次迭代中針對每一個像素點所屬的所有鄰域計算權(quán)值。此外,在基于One-class SVM的降權(quán)機制指引下,本文模型達到穩(wěn)定收斂所需的迭代步數(shù)也少于對比模型。因此,與LCK和FCM等基于降權(quán)思想的噪聲魯棒模型相比,本文模型綜合耗時并未顯著增加。
3.3 混合噪聲圖像
在疊加高斯噪聲的人工合成圖像與疊加椒鹽噪聲的自然圖像上分別進行的分割實驗,證實本文方法與傳統(tǒng)噪聲魯棒分割模型相比,具有更強的噪聲適應(yīng)能力與分割穩(wěn)定性。為更好地展現(xiàn)本文模型對圖像噪聲的魯棒性,本節(jié)實驗從Weizmann Horse Database自然圖像數(shù)據(jù)集[13]中隨機選取25幅自然圖像,統(tǒng)一將圖像尺寸調(diào)整至256px×256px,疊加多種強度的混合噪聲,并使用骰子相似系數(shù)法(Dice Similarity Coefficient, DSC)和分割錯誤比(Ratio of Segmentation Error, RSE)與參考分割結(jié)果進行定量比較。DSC與RSE定義如式:
其中:Area(S)表示S區(qū)域包含的像素個數(shù),即S區(qū)域的面積,S1,S2分別表示模型分割結(jié)果與基準(zhǔn)分割結(jié)果中的前景目標(biāo)區(qū)域。實驗結(jié)果中,模型分割結(jié)果越接近基準(zhǔn)分割結(jié)果,則DSC值越接近1,RSE值越接近0,代表模型分割精度越高。
圖11展示了本文模型在不同強度組合的概率極值混合噪聲環(huán)境下,對自然圖像的分割結(jié)果??梢园l(fā)現(xiàn),在弱混合噪聲環(huán)境下,本文模型的表現(xiàn)出色,對噪聲具有較強的魯棒性;在強椒鹽噪聲與弱高斯噪聲的環(huán)境下,仍可以實現(xiàn)較為理想的分割結(jié)果,這是由于本文模型基于One-class SVM的異常值檢測機制仍然可以有效判別被椒鹽噪聲污染的極值點,而分割模型的鄰域均值計算機制基于高斯核函數(shù),結(jié)合異常值檢測的權(quán)值,可以在一定強度范圍內(nèi)適應(yīng)高斯噪聲并平滑椒鹽噪聲,保留了大部分圖像信息為分割提供了依據(jù);在弱椒鹽噪聲與強高斯噪聲環(huán)境下,極值噪聲對異常值檢測機制造成影響,同時高斯噪聲強度超出了高斯核函數(shù)的適應(yīng)能力,因此分割結(jié)果中出現(xiàn)了少量誤分割區(qū)域,但未嚴(yán)重影響主要目標(biāo)的分割精度;在實際應(yīng)用中出現(xiàn)概率較低、人眼也很難判別目標(biāo)區(qū)域的強混合噪聲環(huán)境下,噪聲嚴(yán)重干擾了圖像信息,本文模型的分割輪廓形態(tài)受到較為嚴(yán)重的影響,出現(xiàn)過分割與誤分割的現(xiàn)象,但仍能識別大部分邊緣形狀平滑的目標(biāo)區(qū)域。
圖12展示了上述分割結(jié)果的量化分值,即DSC與RSE。其中每一條折線包含25個數(shù)據(jù)點,分別對應(yīng)25個噪聲強度組合下的分割分值。其中,數(shù)據(jù)點按橫軸方向排列,并以縱軸方向代表該噪聲強度下的分割精度。
4 結(jié)語
本文提出一種新的噪聲圖像分割模型,根據(jù)基于One-class SVM離群程度檢測機制的圖像噪聲檢測方法,在強噪聲環(huán)境下對圖像噪聲實現(xiàn)更為合理的降權(quán),增強了分割模型對噪聲的魯棒性。One-class SVM具有將數(shù)據(jù)映射到高維空間的能力,并總是試圖尋找一個緊密包裹數(shù)據(jù)的超球面。本文方法將位于球面內(nèi)的數(shù)據(jù)視作正常數(shù)據(jù),反之則為異常,與球面距離越遠(yuǎn)的數(shù)據(jù)點,其離群程度越高,得到的權(quán)值也越小。此外,One-class SVM方法屬于機器學(xué)習(xí)方法,相比于傳統(tǒng)的相關(guān)性降權(quán)方法,其適應(yīng)性和靈活性更強。與傳統(tǒng)噪聲魯棒模型相比,本文模型的降權(quán)機制在強噪聲環(huán)境下更加合理,同時在弱噪聲環(huán)境下加強了對異常點的懲罰。最后,本文通過多組實驗定量分析驗證了本文模型相對于其他模型在處理噪聲圖像時的優(yōu)越性。
參考文獻 (References)
[1] KASS M, WITKIN A, TERZOPOULOS D. Snakes: active contour models [J]. International Journal of Computer Vision, 1988, 1(4):321-331.
[2] CHAN T F, VESE L A. Active contour without edges [J]. IEEE Transactions on Image Processing, 2001, 10(2): 266-277.
[3] LI C, KAO C-Y, GORE J C, et al. Implicit active contours driven by local binary fitting energy [C]// CVPR 2007: Proceedings of the 2007 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2007: 1-7
[4] ZHANG K, SONG H, ZHANG L. Active contours driven by local image fitting energy [J]. Pattern Recognition, 2010, 43(4): 1199-1206.
[5] WANG L, PAN C. Robust level set image segmentation via a local correntropy-based K-means clustering [J]. Pattern Recognition, 2014, 47(5): 1917-1925.
[6] JIANG X-L, WANG Q, HE B, et al. Robust level set image segmentation algorithm using local correntropy-based fuzzy c-means clustering with spatial constraints [J]. Neurocomputing, 2016, 207(C): 22-35.
[7] LI C, XU C, GUI C, et al. Level set evolution without re-initialization: a new variational formulation [C]// CVPR '05: Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2005: 430-436.
[8] 趙怡,鄧紅霞,張玲,等.基于最大類間方差的權(quán)重自適應(yīng)活動輪廓模型[J].計算機工程與設(shè)計,2018,39(2):486-491.(ZHAO Y, DENG H X, ZHANG L, et al. Weight-self adjustment active contour model based on method of maximum classes square error [J]. Computer Engineering and Design, 2018,39(2):486-491.)
[9] 李鋼,李海芳,尚方信,等.基于梯度信息的自適應(yīng)鄰域噪聲圖像分割模型[J].計算機工程,2018,44(5):227-233.(LI G, LI H F, SHANG F X, et al. Noise image segmentation model with adaptive neighborhood based on gradient information [J]. Computer Engineering, 2018, 44(5): 227-233.)
[10] SCHLKOPF B, PLATT J C, SHAWE-TAYLOR J, et al. Estimating the support of a high-dimensional distribution [J]. Neural Computation, 2001, 13(7): 1443-1471.
[11] 李昊奇,應(yīng)娜,郭春生,等.基于深度信念網(wǎng)絡(luò)和線性單分類SVM的高維異常檢測[J].電信科學(xué),2018,34(1):34-42.(LI H Q, YING N, GUO C S, et al. High-dimensional outlier detection based on deep belief network and linear one-class SVM [J]. Telecommunications Science, 2018, 34(1): 34-42.)
[12] 楊成佳.圖像去噪及其效果評估若干問題研究[D].長春:吉林大學(xué),2016:4-5.(YANG C J. Research on image denoising and its effect evaluation [D]. Changchun: Jilin University, 2016:4-5.)
[13] LeCUN Y, BOTTOU L, BENGIO Y, et al. MNIST [DB/OL]. (2012-01-01) [2018-08-27]. http://yann.lecun.com/exdb/mnist/.
[14] BORENSTEIN E. Weizmann horse database [DB/OL]. (2005-01-19) [2018-08-27]. http://www.msri.org/m/people/members/eranb/.