陳 超
(江蘇省基礎(chǔ)地理信息中心,江蘇 南京 210013)
一種基于GMM和Graph Cuts的圖像分割方法
陳 超
(江蘇省基礎(chǔ)地理信息中心,江蘇 南京 210013)
圖像分割是圖像處理中的基礎(chǔ)問題。研究利用GMM構(gòu)造T鏈的可行性,并探索一種可以兼顧精度與速度的確定GMM中K值的方法,結(jié)合GMM和Graph Cuts理論完成了對不同圖像的分割實驗。實驗表明,文中的分割方法準確、有效。
圖像分割;高斯混合模型;圖割;圖論;T鏈
圖像分割是圖像處理的一個基礎(chǔ)問題,是實現(xiàn)目標檢測、圖像分析和模式識別的首要工作。按照圖像分割模型,可將圖像分割分為基于區(qū)域分割、基于邊緣分割、結(jié)合區(qū)域與邊緣分割以及一些基于特定理論的方法等3種類型?;趨^(qū)域分割的代表方法有閾值法[1]、區(qū)域生長法[2]和模糊聚類法[3];基于邊緣的分割方法包括微分算子法[4]和邊界跟蹤法[5];基于特定理論的算法則有小波變換[6]、Snake模型[7]、水平集算法[8]以及一些其它相關(guān)理論算法[9-10]。
本文首先研究了利用高斯混合模型GMM(Gaussian Mixture Model)構(gòu)造T鏈的可行性,并探索了一種可以兼顧精度與速度的確定GMM中K值的方法,最后結(jié)合了GMM和Graph Cuts理論得到了一種分割圖像的方法。
高斯混合模型是單高斯模型的混合、疊加,它能夠平滑地近似任意形狀的密度分布,近年來在語音識別、圖像處理等方面得到大量運用[11-13]。高斯混合模型的概率密度函數(shù)為
(x|μk,∑k),
(1)
其中,
(2)
式(1)表示高斯混合模型由K個單高斯模型組成,式(2)為第k個單高斯模型的概率密度函數(shù)。
式(1)、式(2)中,x為已知的D維樣本數(shù)據(jù);αk為第k個單高斯模型,μk和∑k分別為樣本數(shù)據(jù)的均值和協(xié)方差,3個參數(shù)均未知。當(dāng)通過樣本數(shù)據(jù)獲得未知參數(shù)后,就得到了高斯混合模型的概率密度函數(shù)。本文通過EM(Expectation Maximum)算法獲得模型中所有未知參數(shù)。
1.1 GMM構(gòu)造T鏈的可行性
在利用EM算法得到GMM的概率密度函數(shù)后,首先將GMM用于圖像的聚類分析,并且分別與K均值、FCM算法獲得的結(jié)果比較,以驗證利用GMM構(gòu)造T鏈的可行性。
聚類分析實驗1如圖1所示。圖1(a)為隨機生成的散亂樣本數(shù)據(jù),分別利用FCM、K均值和GMM將樣本數(shù)據(jù)分為3類。從圖1(b)、圖1(c)、 圖1(d)中可看出,由于數(shù)據(jù)簡單,3種方法最終的分類結(jié)果完全一致。
圖1 聚類分析實驗1
實驗2選擇了武漢地區(qū)分辨率為30 m的TM影像,實驗影像由近紅外、紅、綠3個波段組成。人眼可以從影像中區(qū)分的類別大致包括長江、城區(qū)、深色湖泊、淺色湖泊、森林、農(nóng)田和裸地等七大類。對該影像聚類分析時,考慮到可能存在漏判的區(qū)域,將影像分為9類。
從聚類分析實驗2的結(jié)果(見圖2)可知:與FCM以及K均值的聚類結(jié)果相比較,GMM的聚類結(jié)果更平滑,不存在過多零散區(qū)域,更符合實際情況。
圖2 聚類分析實驗2
由以上兩組聚類實驗可知:①對于簡單數(shù)據(jù),GMM、FCM和K均值3種方法獲得的結(jié)果一致。②對于表現(xiàn)形式復(fù)雜的數(shù)據(jù),GMM可得到更準確、更符合實際情況的結(jié)果。由分析可知,利用高斯混合模型構(gòu)建T鏈是可行的。
1.2 一種確定K值的方法
觀察式(2)可知,高斯混合模型中唯一需要人工確定的參數(shù)為K,一般通過目視觀察的方法確定。對同一幅影像而言,不同的K值會對運行時間、最終的結(jié)果產(chǎn)生不同的影響。一般情況下,K值越小,運行時間越短,但是精度將受到影響;K值越大,精度將得到保證,但運行速度可能會變慢。本文探討了一種可以兼顧精度與速度的確定K值的方法,該方法最終得到可供選擇的K值范圍。
以圖2中的實驗影像為例,確定K值的方法如下:
1)從影像中選擇樣本數(shù)據(jù);
2)為影像構(gòu)造一個高斯混合模型;
3)選擇不同的K值,利用步驟1)的樣本數(shù)據(jù)并結(jié)合EM算法獲取高斯混合模型中的所有參數(shù),同時記錄解算參數(shù)所需的運行時間,獲得“K值—時間”曲線圖。
圖3 圖2的“K值-時間” 曲線圖
按照上述3個步驟,獲得圖2中實驗影像的“K值—時間”曲線圖,見圖3。從曲線圖中可以看出:當(dāng)K值在2~5之間時,消耗的時間較少,但K值與實際情況明顯不符;當(dāng)K值在6~9之間時,消耗的時間處于平穩(wěn)的狀態(tài);當(dāng)K值大于9時,時間代價迅速增加。而在圖2的聚類實驗中,通過人眼判斷分辨出7類地物,最終將K值設(shè)定為9。因此可知,將K值設(shè)為曲線圖中處于平穩(wěn)狀態(tài)的6~9時,可兼顧精度與速度。
再選擇另外一幅實驗影像圖4(a),同樣獲得其 “K值—時間”曲線圖,見圖4(b)。首先目視觀察圖4(a),可知影像中大致可分為6類不同的地物。再觀察圖4(b),該圖與圖3的分布規(guī)律基本一致:當(dāng)K分別為2、3和4時,運行時間較短,但此時K值明顯過少,因此精度并不可靠;當(dāng)K分別為5~7中的一個值時,消耗的時間基本維持在一個較為平緩的狀態(tài);當(dāng)K的取值大于7時,運行時間開始增加,尤其當(dāng)K的取值大于10時,時間代價迅速上升。結(jié)合對圖4(a)的分析可知,將K選取為5~7中的一個數(shù)將兼顧精度與速度。
圖4 “K值-時間” 曲線圖
兩組實驗說明可將K值設(shè)置為曲線圖中呈平穩(wěn)狀態(tài)的一個數(shù)值。
不過該方法自動化程度較低,因此對簡單的圖像有較好的效果;而對地物要素復(fù)雜的影像,不同的樣本間差異較大,本文方法未必能獲得理想的K值。
2.1 圖割基本理論
圖割(Graph Cuts)是一種基于圖論的圖像分割方法,近年來在圖像分割中已得到較為深入的研究[14-16]。
(3)
式(3)為圖割所需的能量函數(shù),等號右邊第1項為數(shù)據(jù)項,體現(xiàn)了像素點p與某一類別的相似性;右邊第2項Vpq(fp,fq)為邊緣項,體現(xiàn)了相鄰像素點之間的相似性;λ1是數(shù)據(jù)項和邊緣項之間的權(quán)值,用于調(diào)節(jié)兩者間的比例,為非負值,數(shù)據(jù)項和邊緣項分別對應(yīng)一幅圖像的T鏈與N鏈。圖割不能直接解算式(3),必須先由圖像構(gòu)造出滿足式(3)的T鏈與N鏈。解算T鏈與N鏈后才能完成對圖像的分割。
2.2 T鏈與N鏈的構(gòu)造
按照上文所述,利用GMM構(gòu)造T鏈,具體步驟如下:
1)在待分割影像上分別選擇若干有代表性的目標樣本和背景樣本;
2)利用1)的樣本,得到目標區(qū)域模型和背景區(qū)域模型的概率密度函數(shù)pF(x)和pB(x);
3)將待分割影像的像素值分別代入pF(x)和pB(x),得到每一像素點分別屬于目標模型和背景模型的概率密度值,并進行相關(guān)后處理即得到T鏈。
沿用Boykov[15]的方法構(gòu)造N鏈。得到N鏈與T鏈之后,利用最大流最小割算法[16]解算即得到分割結(jié)果。
第1組分割實驗選擇來自Berkeley數(shù)據(jù)庫的4幅影像,見圖5。影像上的橢圓與矩形區(qū)域分別表示選擇的目標樣本與背景樣本數(shù)據(jù),同時分別代表了前景高斯混合模型和背景高斯混合模型中的K值數(shù)目。
圖5 分割實驗1原圖
分割結(jié)果見圖6、圖7。從分割結(jié)果可得出結(jié)論:①較為完整、有效地得到了目標物體,并且基本排除了其它物體的干擾;②部分目標未被分割出來(圖6橢圓標記處),或者部分背景物體被誤分割出來(圖6矩形標記處)。
圖6 分割實驗1結(jié)果
圖7 分割實驗2
第2組實驗選擇了前文已出現(xiàn)的兩幅遙感影像,分別分割圖中的道路和長江。結(jié)果顯示,已基本完整地得到了道路和長江。但由于遙感影像較為復(fù)雜,尤其道路和周圍地物非常相似,同時分割出了大量的干擾物
兩組實驗表明,本文的分割方法能較為有效地分割出目標,但當(dāng)目標和背景的光譜值非常相似時,即使利用高斯混合模型構(gòu)造T鏈也不能將其區(qū)分開。如果在分割過程中加入除光譜信息外的其它信息,如紋理信息和形狀先驗信息,則可能會消除這些問題。
本文首先驗證了GMM用于圖像分割的可行性;然后探索了一種獲取GMM中K值的方法。該方法兼顧了模型運算精度和速度;最后利用GMM構(gòu)造T鏈,并基于圖割理論分割影像。分割實驗表明,該方法能夠較為準確地得到目標物體。
對于較為復(fù)雜的影像,可能會產(chǎn)生誤分割和未分割的現(xiàn)象。如果在分割過程中引入紋理特征、形狀先驗等一系列其它信息,有可能會消除這些問題。
[1]韓思奇,王蕾.圖像分割的閾值法綜述[J].系統(tǒng)工程與電子技術(shù),2002,24(6):91-94.
[2]潘婷婷,李朝鋒.基于區(qū)域生長型分水嶺算法的衛(wèi)星圖像道路提取方法[J].計算機工程與設(shè)計,2008,29(19):4987-4989.
[3]王明華.一種基于模糊聚類的車牌圖像分割方法[J].黑龍江工程學(xué)院學(xué)報:自然科學(xué)版,2013,27(1):41-44.
[4]雷麗珍.數(shù)字圖像邊緣檢測方法的探討[J].測繪通報,2006(3):40-42.
[5]田軍委,尚雅層,王洪喜,等.基于方向預(yù)估計的邊界跟蹤算法[J].應(yīng)用光學(xué),2011,32(3):441-445.
[6]韓冰,趙銀娣,戈樂樂.遙感圖像分割的迭代上下文融合小波域HMT模型[J].測繪學(xué)報,2013,42(2):233-238.
[7]石云峰.基于Snake模型的圖像分割方法研究及應(yīng)用[D].西安:西安電子科技大學(xué),2009.
[8]王昆,賈士軍,朗博.先驗形狀約束的水平集分割模型[J].測繪通報,2013(6):31-34.
[9]魏超,劉智,王番,等.壓縮感知理論及其在圖像融合中的應(yīng)用[J].測繪工程,2013,22(2):30-33.
[10]楊智翔,何秀鳳,危來龍.一種多極化SAR圖像融合研究[J].測繪科學(xué),2014,39(2):14-18.
[11]李賀,秦志遠,許龍.基于多尺度圖分解的極化SAR圖像分割算法[J].測繪科學(xué),2014,39(1):110-113.
[12]余鵬,封舉富.基于高斯混合模型的紋理圖像分割[J].中國圖象圖形學(xué)報,2005,10(3):281-285.
[13]崔宣,孫華.基于SVM-GMM混合高斯模型說話人辨認的研究[J].黑龍江工程學(xué)院學(xué)報:自然科學(xué)版,2009,23(4):54-57.
[14]劉嘉,王宏琦.一種基于圖割的交互式圖像分割方法[J].電子與信息學(xué)報,2008,30(8):1937-1976.
[15]BOYKOV Y,JOLLY M P.Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images[J].Imaging and Visualization Department Siemens Corporate Research,2001:105-112.
[16]BOYKOV Y,KOLMOGOROV V.An Experimental Comparison of Min-Cut Max-Flow Algorithms for Energy Minimization in Vision [J].IEEE Transactions on PAMI.2004,26:1124-1137.
[責(zé)任編輯:劉文霞]
An image segmentation method based on GMM and Graph Cuts
CHEN Chao
(Jiangsu Geomatics Center,Nanjing 210013,China)
Image segmentation is a foundational task in image processing.The possibility of obtainingT-link is presented based on GMM in the first place,and a method of determiningKwith accuracy and speed is proposed. Finally the segment experiments are made on different images successfully with GMM and Graph Cuts.Experiments show that the method is accurate and feasible.
image segmentation;Gaussian mixture model;graph cuts;graph theory;T-Link
2013-11-03;最后修改日期:2014-12-03
國家自然科學(xué)基金資助項目(41271420);江蘇省測繪地理信息科研項目(JSCHKY201421)
陳 超(1987-),女,碩士研究生.
TP391.41
:A
:1006-7949(2014)12-0052-04