盧印舉,段明義,蘇玉
(鄭州工程技術(shù)學(xué)院 信息工程學(xué)院,鄭州 450044)
圖像分割是數(shù)字圖像處理、計(jì)算機(jī)視覺領(lǐng)域中的基本問題之一,目前已取得了良好的應(yīng)用成果,包括遙感圖像分析技術(shù)[1]、磁共振成像(magnetic resonance imaging,MRI)技術(shù)[2]、合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像技術(shù)[3]以及目標(biāo)檢測(cè)技術(shù)[4]等應(yīng)用領(lǐng)域。它主要是利用各類圖像所具有紋理、顏色以及灰度等各方面的特征來劃分圖像,使各個(gè)區(qū)域展現(xiàn)出某一類特性。但是,在實(shí)際成像處理時(shí),由于一系列因素包括場(chǎng)偏移效應(yīng)、局部容積效應(yīng)以及噪音等的影響,導(dǎo)致所采集到的圖像出現(xiàn)了一些不同的特點(diǎn),如復(fù)雜的場(chǎng)景分布、更為模糊的界線、比較低的對(duì)比度以及減低的特征易變性等,從而進(jìn)一步降低了圖像分割精度。因此,圖像分割被認(rèn)為是計(jì)算機(jī)視覺領(lǐng)域的核心探索問題。
到目前為止,有許多圖像分割方法及其改進(jìn)形式。由于本文研究的是基于概率圖模型圖像分割方法,因此,僅對(duì)以概率統(tǒng)計(jì)作為基礎(chǔ)的圖像分割處理進(jìn)行介紹與分析,主要有高斯混合模型(Gaussian mixture model,GMM)和馬爾科夫隨機(jī)場(chǎng)(Markov random field,MRF) 2種分割模型。
傳統(tǒng)的高斯混合模型[5]在進(jìn)行圖像分割的過程中,只是利用了像素的灰度,但是并未對(duì)各個(gè)像素間所對(duì)應(yīng)的空間信息給予充分的關(guān)注,所以圖像噪聲顯著地影響了圖像分割的最終結(jié)果,從而導(dǎo)致分割精度水平低下。針對(duì)干擾噪聲容易影響常規(guī)的高斯混合模型這一難點(diǎn),文獻(xiàn)[6]在圖像預(yù)處理的基礎(chǔ)上,提出了一種基于圖像重塑的新型分割方法。該方法通過引入相似性度量因子,利用權(quán)值將鄰域像素值加權(quán)和的結(jié)果作為中心像素重塑后的具體像素值,進(jìn)而分析重塑之后的有關(guān)圖像。
馬爾科夫隨機(jī)場(chǎng)理論[7]是以統(tǒng)計(jì)學(xué)相關(guān)模型為基礎(chǔ),Geman等[8]在1984年提出并廣泛應(yīng)用于圖像處理領(lǐng)域,標(biāo)注有關(guān)的圖像像素從而達(dá)到圖像分割的目的。利用MRF與GRF的等價(jià)關(guān)系,吳一全等[9]闡明MRF的聯(lián)合分布是具有特殊形式的Gibbs分布。以馬爾科夫隨機(jī)場(chǎng)理論為基礎(chǔ),許多面向圖像分割融合高斯混合模型或者聚類的方法也被相繼開發(fā)出來。Roula等[10]利用MRF參數(shù)對(duì)紋理進(jìn)行了描述,從而提出基于紋理特征的高斯混合模型圖像分割技術(shù)。同時(shí),科研人員對(duì)MRF分割算法做出了進(jìn)一步的完善,提出了一系列改進(jìn)的MRF分割模型算法[11]。典型的模型有快速馬爾可夫隨機(jī)場(chǎng)、融合其他分割算法的混合模型以及隱馬爾可夫隨機(jī)場(chǎng)。以圖像像素的灰度特征信息為主的學(xué)者們[12]將圖像的形狀特征信息和紋理特征信息引入到馬爾科夫隨機(jī)場(chǎng)中,利用不同的特征提取方法實(shí)現(xiàn)對(duì)圖像特征信息的提取,以各類圖像特征信息為基礎(chǔ)來改善圖像分割效果。
上述分割方法未對(duì)相鄰像素間所具有的內(nèi)在關(guān)聯(lián)以及圖像空間的信息等因素給予充分的考慮,使得不能以連續(xù)的方式來合理地分割某些圖像,從而導(dǎo)致所得的結(jié)果中形成了數(shù)量眾多的噪點(diǎn)。本文提出了一種基于有向空間關(guān)系高斯混合模型的遙感圖像分割算法,主要貢獻(xiàn)為:1)設(shè)計(jì)了一個(gè)改進(jìn)高斯混合模型,合并了像素之間的空間信息對(duì)高斯混合模型的先驗(yàn)概率和后驗(yàn)概率進(jìn)行約束,以提高觀測(cè)數(shù)據(jù)場(chǎng)對(duì)圖像理解的敏感性并進(jìn)行對(duì)應(yīng)關(guān)系的評(píng)估和更新;2)引入馬爾科夫隨機(jī)場(chǎng)并和高斯混合模型相結(jié)合,通過能量函數(shù)中灰度信息的分量控制,解決傳統(tǒng)期望極大算法在M步驟無法最大化優(yōu)化求解缺陷;3)定義的空間約束能夠確保圖像在進(jìn)行空間更新時(shí)算法結(jié)構(gòu)的穩(wěn)定,通過交替進(jìn)行評(píng)估像素與類別之間的對(duì)應(yīng)關(guān)系和空間約束變換,實(shí)現(xiàn)圖像的精準(zhǔn)分割。與當(dāng)前流行的3種算法相比,本文所提出的遙感圖像分割算法展現(xiàn)出了卓越的分割性能。
給定獲取到的遙感圖像X={xi}1≤i≤N,N是像素總數(shù)量,xi表示第i個(gè)像素的灰度值,同時(shí)將圖像分割為K個(gè)類別標(biāo)簽,第j區(qū)域的統(tǒng)計(jì)參數(shù)用μj、∑j分別表示均值和方差矩陣。模型的參數(shù)描述為:
Θ={μj,∑j}1≤j≤K
(1)
圖像觀測(cè)數(shù)據(jù)對(duì)數(shù)似然函數(shù)是關(guān)于圖像分割參數(shù)的一個(gè)函數(shù),描述為:
L(Θ|X)=logP(X;Θ)
(2)
由于缺失數(shù)據(jù)的存在,即像素xi所屬的混合高斯模型分量直接對(duì)式(2)進(jìn)行最大化求解十分困難,因此,引入隱含變量Z={zi=j}1≤j≤K。zi=j表示將像素點(diǎn)xi分配給高斯混合模型的第j個(gè)高斯分量。(X,Z)構(gòu)成了高斯混合模型的完整數(shù)據(jù),以給定的圖像為觀測(cè)條件,在隱藏事件空間中將完整數(shù)據(jù)對(duì)數(shù)似然函數(shù)的數(shù)學(xué)期望替代式(2)所述的圖像對(duì)數(shù)似然函數(shù),得到式(3)。
ε(Θ|X,Z)=EZ[log(P(X,Z;Θ)]
(3)
給定zi=j即xi屬于第j區(qū)域條件下,圖像像素xi的條件概率分布服從高斯分布,圖像像素xi的邊緣分布用式(4)表示。
(4)
令πij=P(zi=j)(i=1,2,…,N,j=1,2,…,K),遙感圖像分割模型的完整參數(shù)集合用式(5)表示。
Φ={μj,∑j,πij}(i=1,2,…,N,j=1,2,…,K)
(5)
取圖像完整數(shù)據(jù)對(duì)數(shù)似然期望最大化,利用式(4)~式(5),將式(3)改寫為式(6)。
ε(Φ|X,Z)=∑ZP(Z|X,Φ)logP(X,Z;Φ)
(6)
根據(jù)貝葉斯定理,計(jì)算給定圖像像素xi條件下zi=j的后驗(yàn)概率αij=P(zi=j|xi):
(7)
將馬爾科夫隨機(jī)場(chǎng)模型的圖像空間信息以先驗(yàn)概率[13]的方式引入到高斯混合模型,將式(7)代入式(6)并取負(fù)對(duì)數(shù),得到遙感圖像分割的條件期望似然函數(shù),用式(8)表示。
L(,
(8)
式中:β為馬爾科夫隨機(jī)場(chǎng)的溫度系數(shù)。
根據(jù)最大后驗(yàn)概率理論判斷圖像中每個(gè)像素的分類標(biāo)簽,從而得到分割結(jié)果。對(duì)式(8)目標(biāo)函數(shù)求偏導(dǎo),?φ/?uj=0,?j∈[1…K],得到式(9)。
(9)
令?φ/?∑j=0,?j∈[1…K]可以實(shí)現(xiàn)對(duì)∑j的估計(jì),得到式(10)。
(10)
忽略式(8)中不依靠先驗(yàn)的常數(shù)項(xiàng),并利用拉格朗日乘數(shù)法,目標(biāo)函數(shù)變?yōu)椋?/p>
(11)
令偏導(dǎo)函數(shù)等于0,得到:
(12)
(13)
根據(jù)圖像分割的標(biāo)簽類別數(shù)量,基于K均值算法選擇一個(gè)計(jì)算出的GMM參數(shù)的初始值,通過交替進(jìn)行評(píng)估像素與類別之間的對(duì)應(yīng)關(guān)系和空間約束變換實(shí)現(xiàn)圖像的精準(zhǔn)分割。具體步驟如下。
1)利用K均值算法進(jìn)行參數(shù)初始化μj和∑j。
2)E步驟。用當(dāng)前的uj和∑j從式(7)估計(jì)αij的后驗(yàn)概率。
3)M步驟。首先利用當(dāng)前新的αij,從式(9)估計(jì)新的均值向量μj;其次,利用當(dāng)前新的αij,從式(10)估計(jì)新的方差∑j。
4)收斂。算法達(dá)到最大迭代次數(shù)或者小于給定閾值。
實(shí)驗(yàn)樣本圖像來自在遙感圖像場(chǎng)景分類數(shù)據(jù)集NWPU-RESISC45[14],樣本為bridge_321,像素大小為256像素×256像素。本次實(shí)驗(yàn)選擇的操作環(huán)境為:Intel(R)Core(TM) i5 7 200 CPU@2.50 GHz處理器、Windows 10 64位操作系統(tǒng),以MATLAB R2010b為工具開展算法驗(yàn)證以及相關(guān)性能的測(cè)試活動(dòng)。
實(shí)驗(yàn)步驟:1)測(cè)試本文所提出遙感圖像分割算法的分割效果及收斂性;2)測(cè)試溫度系數(shù)對(duì)遙感圖像分割結(jié)果的影響;3)與其他分割算法的性能對(duì)比分析。算法參數(shù)初始值由K均值方法獲取,分割類別數(shù)量K=3,溫度系數(shù)β取值范圍為[0.5,8]。
算法在下面的條件之一將停止:1)連續(xù)2次分割結(jié)果的改變比率不超過0.001;2)迭代次數(shù)超過50。
1) 算法收斂性實(shí)驗(yàn)。本節(jié)實(shí)驗(yàn)主要驗(yàn)證本文算法的分割效果和算法的收斂性,溫度系數(shù)β設(shè)置為1,圖1所示為樣本圖像的分割結(jié)果。圖1(a)為原始遙感樣本圖像;圖1(b)~圖1(d)分別為不同迭代次數(shù)下的分割效果,迭代次數(shù)依次為2、5和50。從遙感圖像的分割過程來分析,在迭代開始時(shí),圖像中的孤立像素不僅數(shù)量較多,同時(shí)分布也十分密集,部分背景區(qū)域容易被劃分為目標(biāo)區(qū)域,而且不同目標(biāo)區(qū)域之間處于連貫狀態(tài),不滿足原始影像的要求。隨著迭代次數(shù)的增加,遙感樣本圖像線條復(fù)雜細(xì)節(jié)區(qū)域的分割邊緣細(xì)節(jié)更為精確和完美,圖像余留的噪聲點(diǎn)逐漸減少,同時(shí)較小的區(qū)域能夠被良好分割,盡管仍然存在少量的錯(cuò)分情況,但是由于對(duì)數(shù)函數(shù)減弱了權(quán)重造成的影響,所以能夠較好地劃分所有像素的能量。
圖1 分割結(jié)果
圖2顯示本文的條件期望似然函數(shù)最大化過程中的量化值。通過連續(xù)5次迭代操作,實(shí)現(xiàn)了快速收斂的目的,所以本文方法可以直接通過EM算法來達(dá)到優(yōu)化參數(shù)的目的,與其他方法相比,具有速度快、容易操作、效率高等優(yōu)勢(shì)。
圖2 收斂過程
2) 溫度系數(shù)對(duì)分割影響實(shí)驗(yàn)。本節(jié)實(shí)驗(yàn)主要驗(yàn)證不同溫度系數(shù)因子對(duì)樣本圖像分割效果的影響,實(shí)驗(yàn)結(jié)果如圖3所示。圖3(a)~圖3(d)分別為溫度系數(shù)β為0.5、2、4、8時(shí)的分割結(jié)果。通過分析,如果選擇β值足夠小,能夠?qū)崿F(xiàn)高精度的分割,同時(shí)目標(biāo)輪廓與真實(shí)輪廓之間也更加接近。然而分割結(jié)果圖像中會(huì)存在較多的噪聲點(diǎn),無法準(zhǔn)確地分割較小的區(qū)域且較小區(qū)域的分割結(jié)果呈離散狀,此時(shí)該方法魯棒性很弱,易于誤分類。如果所選擇的β值足夠大,圖像中的噪聲點(diǎn)大量減少,但是,分割的細(xì)節(jié)會(huì)丟失(例如左上角的橋梁),較小的區(qū)域容易連通(例如河道中間的橋梁)。圖4顯示了不同溫度系數(shù)下本文所提出的遙感圖像分割算法對(duì)測(cè)試遙感樣本圖像分割結(jié)果的誤分率曲線。分割誤分率曲線顯示在β為4的時(shí),遙感圖像正確分割性最高。
圖3 不同溫度系數(shù)β下分割效果
圖4 溫度系數(shù)β對(duì)誤分率影響曲線
本節(jié)對(duì)深度學(xué)習(xí)[15]、GMM以及MRF傳統(tǒng)分割算法進(jìn)行了定性和定量對(duì)比分析,以驗(yàn)證本文算法的優(yōu)勢(shì)。實(shí)驗(yàn)參數(shù)設(shè)置為:類別區(qū)域數(shù)為3,β=4,并且選用Jaccard相似度RJ及分類正確率RCCR作為性能衡量指標(biāo)[16],RJ和RCCR的取值范圍為0到1,數(shù)值越大說明算法的分割效果越佳。
圖5顯示不同算法的遙感圖像分割結(jié)果。圖5(a1)~圖5(a4)分別為傳統(tǒng)GMM算法、深度學(xué)習(xí)算法、MRF算法及本文算法的遙感圖像分割結(jié)果,圖5(b1)~圖5(b4)為圖5(a1)~圖5(a4)中紅色方框區(qū)域放大2倍顯示結(jié)果。圖5說明,參與對(duì)比的3種分割算法盡管能夠?qū)崿F(xiàn)分割目標(biāo)區(qū)域的目的,然而分割區(qū)域存在著部分噪聲以及無效區(qū)域,尤其是類之間的邊界難以檢測(cè),所以傳統(tǒng)分割算法會(huì)受到噪聲影響,導(dǎo)致分割存在較為嚴(yán)重的錯(cuò)誤。圖5(a1)GMM算法的分割效果較差,圖像中的孤立像素不僅數(shù)量較多,且分布十分密集,部分背景區(qū)域容易被劃分為目標(biāo)區(qū)域,而且不同目標(biāo)區(qū)域之間處于連貫的狀態(tài),不滿足原始影像的要求;圖5(b1)中河道內(nèi)出現(xiàn)了大量錯(cuò)分點(diǎn),并且河岸的邊界輪廓產(chǎn)生階梯和毛刺干擾現(xiàn)象;圖5(b2)為深度學(xué)習(xí)的分割結(jié)果,由于缺少大量訓(xùn)練樣本,雖然分割效果較好,但是橋梁出現(xiàn)不完整的過分割顯現(xiàn);圖5(b3)的河道內(nèi)出現(xiàn)錯(cuò)分點(diǎn)且背景出現(xiàn)較多的干擾;圖5(b4)為本文所提出分割算法的圖像分割結(jié)果,能夠?qū)崿F(xiàn)精準(zhǔn)分割,同時(shí)受噪聲影響較小,與其他算法相比,分割效果最佳。
表1是不同分割算法的性能評(píng)價(jià)參數(shù)。性能評(píng)價(jià)結(jié)果表明:1)在深度學(xué)習(xí)算法、GMM算法、MRF算法分割結(jié)果圖像中均存在十分明顯的錯(cuò)誤分類情況以及大量的噪聲點(diǎn),所以它們的指標(biāo)參數(shù)水平較低,而本文采用的分割方法能夠?qū)崿F(xiàn)更準(zhǔn)確的分類,同時(shí)對(duì)噪音的抑制能力也越強(qiáng);2)因?yàn)楸疚乃惴梢酝ㄟ^EM算法方式來優(yōu)化目標(biāo)似然函數(shù),其他方法不能夠進(jìn)行先驗(yàn)分布操作,所以本文算法方法具有易操作、效果好的優(yōu)勢(shì)。
表1 不同算法定量分析統(tǒng)計(jì)結(jié)果
本文詳細(xì)介紹了一種基于馬爾科夫隨機(jī)場(chǎng)的高斯混合模型的遙感圖像分割方法。首先,根據(jù)圖像區(qū)域特征,利用像素之間的空間信息對(duì)高斯混合模型的先驗(yàn)概率和后驗(yàn)概率進(jìn)行約束,定義的空間約束能夠確保圖像在進(jìn)行空間更新時(shí)結(jié)構(gòu)的穩(wěn)定;其次,根據(jù)空間像素區(qū)域分類信息,通過能量函數(shù)中灰度信息的分量控制,確保圖像灰度和空間信息的自適應(yīng)分配,同時(shí)通過鄰域相關(guān)性定義先驗(yàn)概率的引入,提高分割算法對(duì)噪聲的魯棒性;最后,利用K均值方法初始化高斯混合模型參數(shù),通過EM算法準(zhǔn)確地完成圖像的分割。通過性能測(cè)試和比較實(shí)驗(yàn),驗(yàn)證了本文算法的分割性能。