黃芳
(廈門東海職業(yè)技術(shù)學院,福建 廈門 361100)
圖像分割方法研究
黃芳
(廈門東海職業(yè)技術(shù)學院,福建 廈門 361100)
圖像分割是圖像處理中最重要的預處理技術(shù),是圖像高質(zhì)量處理的決定性前提,分割方法研究至今已經(jīng)提出很多經(jīng)典的算法,卻沒有評價標準.本文通過對一些經(jīng)典圖像分割方法進行分析與比較,簡要介紹經(jīng)典分割方法的優(yōu)缺點和適用場合,并探討了圖像分割技術(shù)的未來發(fā)展趨勢.
圖像分割;比較;優(yōu)缺點;趨勢
圖像處理是計算機、通信、軍事、交通、醫(yī)學、心理學等等眾多領(lǐng)域研究的一門關(guān)鍵的技術(shù),而圖像分割是圖像處理的最重要的預處理技術(shù),是圖像高質(zhì)量處理的決定性前提,分割方法研究至今已經(jīng)提出很多經(jīng)典的算法,主要分成三大類,一類是基于區(qū)域的,一類是基于邊緣的,還有一類是基于紋理的.基于紋理,通常等同于基于區(qū)域的,所以分割方法分成基于邊緣和區(qū)域兩大類.
基于區(qū)域的圖像分割方法經(jīng)典的有閾值分割法、區(qū)域生長法、分裂合并法、聚類算法等.
2.1 閾值分割法
灰度閾值檢測是區(qū)域分割的最常用的方法,其基本思想是:首先,在圖像灰度范圍中選取一個或多個灰度閾值,將其與圖像中各點灰度值進行對比,根據(jù)比較結(jié)果來劃分各個像素點屬于背景還是圖像的某個目標區(qū)域,從而實現(xiàn)分割.
閾值法的數(shù)學描述如下:
針對要分割的圖像,假設(shè)其灰度級的范圍為G=(0,1,2,…,N-1)(0表示灰度級別最低,最暗;N-1表示灰度級別最高,亮度最亮),而(x,y)是該二維圖像的一個像素點,它的灰度級函數(shù)為f(x,y).從灰度級集合G中選取t作為分割的閾值,假設(shè)A=(b0,b1)表示一個二值灰度級,而且有b0,b1∈G.那么像素點(x,y)的灰度級別函數(shù)f(x,y)在閾值等于t時的分割結(jié)果可以表示為
其中t為閾值,對于目標的圖像元素G(x,y)=1,對于背景的圖像元素G(x,y)=0[1].
閾值分割方法的優(yōu)點是計算簡單,技術(shù)上容易實現(xiàn),特別適用于各個區(qū)域的灰度對比明顯或各個區(qū)域特征對比鮮明的圖像分割中,采用閾值法可以進行有效分割.閾值算法的缺陷是對區(qū)域特征值不明顯的圖像不好用,各個子區(qū)域灰度相差不明顯,各區(qū)域的灰度取值范圍相近的圖像,難以實現(xiàn)準確的分割結(jié)果.此外,由于閾值分割在灰度處理上較為常用,比較擅長,但空間處理薄弱,在噪聲干擾或灰度不均勻等情況下分割效果不甚理想.
2.2 區(qū)域生長與分裂合并法
區(qū)域生長的基本思想是根據(jù)類似的特性調(diào)用匯總的像素,在圖像中選一組種子作為生長點,找到類似的像素,進行收納,使區(qū)域增長[2].
區(qū)域生長方式的優(yōu)點是可以自由指定生長方式,還可以挑選多個生長方式.區(qū)域生長方法的缺陷是計算代價大,種子點選取比較困難,通常需要人工干預,智能性低,另外,區(qū)域生長方式對噪聲比較敏感,若圖像灰度分布不均衡,或存在噪聲干擾都可能會造成空洞和過分割,區(qū)域生長方式很少單獨使用,一般與其他分割方法配合使用,適合分割小的對象.
區(qū)域生長是由點發(fā)展到區(qū)域,分裂合并方法則是區(qū)域生長方法的逆過程:先確立一個分裂合并的約束條件,當圖像中區(qū)域特質(zhì)不同時,分裂成4個區(qū)域,若相鄰子區(qū)域特質(zhì)相同進行合并,重復不斷分裂合并直到?jīng)]有一個區(qū)域能夠滿足分裂的條件.
分裂合并法的關(guān)鍵技術(shù)是設(shè)計合理可行的分割和合并規(guī)則,適合于復雜圖像分割,該方法與區(qū)域生長基本是一個原理,多了一個分裂的過程,該法計算量大,算法較為復雜,并且分裂時還會帶來分割區(qū)域邊界被損壞的風險.
2.3 聚類算法
目前常用的聚類方法有:劃分法中的K-均值、模糊C-均值、EM和層次劃分法的分層聚類方法.
K-均值聚類算法基本思想是:自由選擇K個像素點作為最早的聚類原點,繼而計算其他像素與各原點之間的間隔距離,把每個像素點劃給離它最近的種子聚類區(qū)域,種子聚類區(qū)域與收納到的像素就構(gòu)成一個聚類,直至所有對象都被分配,在根據(jù)現(xiàn)有對象從頭計算聚類焦點,不斷重復上述步驟直到?jīng)]有像素可被再分配,如果無聚類原點點再發(fā)生改變,誤差平方和局部即已達到最小[3].
模糊C-均值(Fuzzy C-Means)是目前運用最廣泛也最為成功的一種模糊聚類法,它的基本思想是首先確定聚類的個數(shù)和參數(shù),然后初始化每一個聚類中心,利用聚類中心計算當前隸屬度函數(shù),再利用隸屬度函數(shù)重新計算每一個聚類中心,如此反復運算直至每個取樣的隸屬度值穩(wěn)定.FCM算法的基本思想是:把所有n個向量Ri(i=1,2,…,n)分為C個小組,然后得到各小組的聚類中心,使非相似性指數(shù)的函數(shù)值最小[4].
EM算法為期望最大化算法的英文簡寫,是在幾率模型里找到最接近分割參數(shù)的算法,屬于迭代算法領(lǐng)域,用通俗的方法解釋該算法,我們可以想象若要用兩個相同的杯子平分一杯水,可以隨意地把水分到兩個杯子中,然后查看是否一樣的量,若哪一杯的水多就勻點到另外一杯水中,這個過程一直迭代實施,直到兩杯水看起來一樣多為止.EM聚類分析普遍應用于圖像視覺、機器學習等方面數(shù)據(jù)聚類.
聚類方法通常用于模型分析、決策、聚集和機器學習,但聚類分析算法沒有涉及訓練集,但要有一個初始分割參數(shù),此參數(shù)是影響最后分類結(jié)果的重要因素;此外,聚類沒能統(tǒng)計空間相關(guān)信息,對噪聲干擾和灰度分布都比較敏感.
邊緣檢測是圖像分割中常用的方法之一.所謂邊緣,是指圖像區(qū)域中顯著變化的那些象素的集合,它是圖像分割中最重要的依據(jù),使用邊緣檢測可以大幅減少計算數(shù)據(jù)量,可以快捷剔除不需要的信息,快速提取特征,很多方法都用到邊緣檢測,基于邊緣的分割方法是最早開始研究的分割方法之一.
3.1 微分算子邊緣檢測
盡管圖像邊緣位置的像素的灰度不連續(xù),但可以通過求導進行檢測.許多邊緣檢測使用一階導數(shù)描述像素點的亮度梯度;也有一些使用二階導數(shù)計算像素點的亮度梯度的變化率.常用的一階導數(shù)算子有Roberts(羅伯特)算子、Prewitt算子、Sobel算子、Kirsch算子等,二階導數(shù)算子有拉普拉斯算子和Canny算子等等.不管一階還是二階梯度算子都對邊緣信息和噪聲相對敏感.
微分算子一般通過模板卷積對圖像進行邊緣檢測,優(yōu)點是算法簡單,運算速度快.主要缺點是一階算子檢測到的邊緣比較粗糙,而二階算子對噪聲很敏感,無法直接用于背景噪聲豐富的圖像.
3.2 基于形變模型的方法
形變模型分三個過程:首先是建立初始模型,就是在圖像邊界引一個起點,作一條閉曲線;然后結(jié)合本身信息和圖像信息的相互指引開始運動,這過程就是模型的形變過程;最后曲線運動到邊界的終點,停止,這就是模型的收斂.從物理力學方面來說,形變模型就是曲線或曲面在內(nèi)、外力共同作用下產(chǎn)生的結(jié)果.
形變模型的主要優(yōu)點是形變不規(guī)則,自由度大,使模型具備對象形狀的先驗性,對噪聲和偽邊界有較強的魯棒性,尤其是基于幾何形變模型的方法提取的邊界精度高,還保證邊界曲線的拓撲性.也有一些變形模型,使用先驗知識的先驗知識或標記點的集合,其分割結(jié)果更準確,更穩(wěn)定.然而,利用先驗知識要先訓練樣本,這一過程需要人工干預,要人工針對特定對象形狀的變化信息進行統(tǒng)計,智能性欠缺.
除了傳統(tǒng)的邊緣檢測和閾值分割方法外,目前常用的是一種通過動態(tài)過程確定目標物邊緣的思想.下面介紹兩種動態(tài)提取邊緣的方法.
4.1 Level Set(水平集)方法
水平集方法早在1988由美國數(shù)學家Osher和Sethian合作提出,它的基本思想[21]換成高維的表示,通過曲線將平面分為內(nèi)外兩個區(qū)域,定義S(x,y,t)=±d為點(x,y)到曲線的距離,結(jié)果為正表示點在外區(qū)域,結(jié)果為負,表示點在內(nèi)區(qū)域,t為時間,曲線上的任意一個點在任一時刻d=0,那么該曲線為距離函數(shù)S的零水平集.雖然轉(zhuǎn)化會把問題復雜化,但是求解上帶來不少好處,它可以適應拓撲結(jié)構(gòu)變化的能力強,不需要重構(gòu)界面,可以獲得唯一熵解.Level Set方法的另一個優(yōu)點是捕獲邊界能力好,能相對精確貼合圖像的邊緣,而且,水平集方法是利用曲率正負來收縮擴張邊界曲線,具有一定去噪的能力.但在尖角位置會產(chǎn)生圓角化現(xiàn)象,需要更高階格式來化解,而對于分界不明顯的區(qū)域,使用Level Set方法會造成比較嚴重的誤差,必須做一些預處理來避免這個問題[5].
4.2 Watershed(分水嶺)變換
Watershed(分水嶺)分割算法就是把圖像看成一片地理區(qū)域,有山有湖的地理區(qū)域,為了分割哪是山,哪是水,就要找到區(qū)分山與水的分界線,湖與湖的間隔,就是分水嶺,把圖像中的每個點的灰度值就是這點的海拔,進行排序,找到每個區(qū)域的最小點,然后往里面不斷灌溉,實現(xiàn)從低到高的淹沒過程,直到淹沒到趨近該區(qū)域的高點,得到比較集中的集水盆,從而實現(xiàn)分割.
分水嶺法奠定在圖像的梯度的基礎(chǔ)上,集水位置在理論上應該為灰度變化最小的部分,分水嶺就對應灰度變化最大的部分.由于噪聲影響或者局部分布不均勻而引起的“過度分割”是分水嶺算法的最大弊端.過分割的原因是圖像中存在局部極小值.因此,分水嶺算法一般不能獨立使用,而要配合一些去噪和減少灰度波動的措施,如灰度重建來減少過分割.
對圖像分割算法研究至今已經(jīng)有上千種方法,但卻無一種通用方法,前面的幾種分割方法都有自己的特色,都有各自的優(yōu)缺點,都有各自的適用場合.所以進行圖像的分割時,要先對分割算法進行性質(zhì)和數(shù)量的評估.組合分割方法技術(shù)更是近年來的研究走向,如何將基于區(qū)域信息的分割方法與別的方法進行組合,尤其是與邊緣檢測方法,形成結(jié)合區(qū)域與邊界技術(shù)的方法.例如,可以考慮先在梯度幅值圖像中檢測線條和波谷點,通過確定最大梯度路徑獲得初始圖像分割,最后采用區(qū)域合并技術(shù)獲得最終結(jié)果.通過技術(shù)結(jié)合不斷創(chuàng)新和突破,圖像分割方法正朝著更精確、更快速的方向發(fā)展.
〔1〕韓思奇,王蕾.圖像分割的閾值法綜述[J].系統(tǒng)工程與電子技術(shù),2002,(24)06.
〔2〕米娟芳.基于背景重構(gòu)的視頻分割算法設(shè)計[D].太原理工大學,2011.
〔3〕蔣帥.K均值聚類算法研究[D].陜西師范大學,2010.
〔4〕曹易,張寧.一種改進的模糊C-均值聚類算法[J].上海理工大學學報,2012(04).
〔5〕楊長才.基于水平集方法的圖像分割技術(shù)研究[D].三峽大學,2008.
TP391.41
A
1673-260X(2016)11-0020-02
2016-08-21