侯紅英 高甜 李桃
摘要:圖像分割是圖像處理中的一項(xiàng)關(guān)鍵技術(shù),并且在工業(yè)、醫(yī)學(xué)、軍事等諸多領(lǐng)域得到了廣泛應(yīng)用。該文主要對(duì)傳統(tǒng)的圖像分割方法和近年來(lái)出現(xiàn)的一些新方法進(jìn)行了綜述。介紹了傳統(tǒng)方法中的閾值法、區(qū)域法、邊緣檢測(cè)法以及新方法中的超像素法和語(yǔ)義分割法,分析了各種方法的原理及特點(diǎn)。
關(guān)鍵詞:圖像分割;傳統(tǒng)方法;語(yǔ)義
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2019)05-0176-02
1 引言
圖像分割是對(duì)圖像進(jìn)行分析的重要步驟之一。圖像分割是根據(jù)相似性規(guī)則將一幅圖像劃分為多個(gè)子圖像區(qū)域的過(guò)程 [1]。 每個(gè)子區(qū)域中的每個(gè)像素在某些度量或計(jì)算的特征(如灰度,顏色,紋理和形狀)下是相似的。我們還可以從數(shù)學(xué)的角度來(lái)理解圖像分割:整個(gè)圖像區(qū)域用集合R來(lái)表示,那么圖像分割則是要把R分成一組連通且非空的子集
2 傳統(tǒng)的圖像分割方法
圖像有低級(jí)、中級(jí)和高級(jí)三種語(yǔ)義。傳統(tǒng)圖像分割方法主要是利用了圖像的低級(jí)語(yǔ)義,比如顏色、文理以及形狀等。常用方法主要有閾值法、區(qū)域法以及邊緣檢測(cè)法。
2.1 閾值法
閾值法的基本原理是結(jié)合圖像的灰度特征計(jì)算一個(gè)或多個(gè)灰度閾值,并將圖像中每個(gè)像素的灰度值與閾值進(jìn)行比較,最后根據(jù)比較的結(jié)果將像素劃分到相應(yīng)的類別[2]。 因此,閾值法的關(guān)鍵是根據(jù)一定的準(zhǔn)則來(lái)求出最優(yōu)灰度閾值。典型的全局單閾值分割方法是由Prewitt等人提出的直方圖雙峰法。該方法假設(shè)圖像具有不同的目標(biāo)和背景,并且其灰度直方圖具有雙峰分布特性,選擇兩個(gè)峰值之間的谷相對(duì)應(yīng)的灰度級(jí)作為閾值。通常,目標(biāo)和背景之間的對(duì)比度在圖像中的每個(gè)地方都各不相同,并且難以用一個(gè)全局閾值將目標(biāo)與背景分離。因此,有必要根據(jù)圖像的局部特征使用不同的閾值進(jìn)行圖像分割。在處理過(guò)程中,需要根據(jù)實(shí)際問(wèn)題將圖像劃分為若干個(gè)子區(qū)域來(lái)求解閾值,從而進(jìn)行圖像分割。 閾值分割的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單、快速。然而,由于閾值的確定取決于灰度直方圖,沒(méi)有考慮圖像像素的空間位置關(guān)系,因此如果圖像的背景復(fù)雜且目標(biāo)和背景灰度值差別不大時(shí),部分邊界信息很容易丟失。
2.2 區(qū)域法
區(qū)域分割是具有相似屬性像素的連接,以形成所需的分割區(qū)域。該方法結(jié)合了圖像的局部空間信息,可有效地克服圖像分割時(shí)空間不連續(xù)的缺點(diǎn),但同時(shí)也會(huì)造成圖像的過(guò)分割。區(qū)域法主要包括區(qū)域生長(zhǎng)法和區(qū)域分裂合并法。區(qū)域生長(zhǎng)法的基本思想如下:從能夠表示每個(gè)生長(zhǎng)區(qū)域的一組種子像素開(kāi)始,將滿足條件的種子像素鄰域內(nèi)的像素合并到由種子像素表示的生長(zhǎng)區(qū)域中,并將合并的新像素作為種子像素繼續(xù)之前的合并過(guò)程,直到找不到符合條件的新像素時(shí)停止合并操作[3]。所以,區(qū)域生長(zhǎng)法的關(guān)鍵點(diǎn)在于選擇恰當(dāng)?shù)某跏挤N子像素并確定有效的生長(zhǎng)規(guī)則。通常還要受到具體問(wèn)題的限制和影響,初始種子像素和生長(zhǎng)準(zhǔn)則決定了最后形成的分割區(qū)域,對(duì)這兩個(gè)因素的不恰當(dāng)處理可能會(huì)導(dǎo)致過(guò)度分割或者欠分割的問(wèn)題。區(qū)域分裂合并算法有分裂與合并兩個(gè)步驟,可以先進(jìn)行分裂,再進(jìn)行合并,也可以分裂和合并同時(shí)進(jìn)行,在連續(xù)的分裂和合并之后,獲得圖像的分割結(jié)果。該方法是結(jié)合圖像中的區(qū)域特征指定分裂準(zhǔn)則,如果區(qū)域的特征不一致,則會(huì)繼續(xù)分裂成四個(gè)相鄰的區(qū)域,然后再對(duì)分裂后的每個(gè)區(qū)域進(jìn)行相同的操作,直到不再滿足給定的分裂準(zhǔn)則。
2.3 邊緣檢測(cè)法
邊緣是圖像中兩個(gè)不同區(qū)域的邊界線上連續(xù)像素點(diǎn)的集合,體現(xiàn)了圖像特征的變化,如灰度、顏色、紋理。邊緣檢測(cè)則是檢測(cè)圖像的結(jié)構(gòu)或灰度級(jí)突然變化的位置,這通常是一個(gè)區(qū)域的開(kāi)始和另一個(gè)區(qū)域結(jié)束的地方。由于邊緣灰度值會(huì)產(chǎn)生屋頂型和階躍型兩種變化,基于邊緣的分割方法則是基于灰度值的邊緣檢測(cè)。圖像的灰度級(jí)變化可以通過(guò)圖像灰度分布的梯度來(lái)表示,可以使用微分算子進(jìn)行邊緣檢測(cè)[4]。其中比較常用的有Roberts算子、Sobel算子、Prewitt算子、Laplace算子和Canny算子等。 在實(shí)際的應(yīng)用中,微分算子常用小區(qū)域模板加以表示,微分運(yùn)算則是利用小區(qū)域模板與圖像進(jìn)行卷積來(lái)實(shí)現(xiàn)的。這些算子對(duì)噪聲敏感,適用于低噪聲且不太復(fù)雜的圖像。因?yàn)檫吘壓驮肼暥季哂谢叶炔贿B續(xù)性,所以一般會(huì)在使用微分算子檢測(cè)邊緣之前,對(duì)圖像先進(jìn)行平滑濾波處理。
3 圖像分割的新理論
在利用低級(jí)語(yǔ)義信息對(duì)圖像進(jìn)行分割時(shí),如果只是針對(duì)一些簡(jiǎn)單場(chǎng)景中的物體,該方法是可行的,但如果是場(chǎng)景較為復(fù)雜的圖像,僅采用低級(jí)語(yǔ)義進(jìn)行圖像分割的效果則不是很理想。此時(shí),可以結(jié)合圖像的中、高級(jí)語(yǔ)義來(lái)提高分割效果。
3.1 超像素法
在2000年左右,研究者將圖論的理論引入到圖像分割,將待分割圖像映射為帶權(quán)無(wú)向圖,根據(jù)圖的頂點(diǎn)以及邊的信息構(gòu)造代價(jià)函數(shù),并對(duì)其進(jìn)行優(yōu)化。圖像分割轉(zhuǎn)換為圖的頂點(diǎn)標(biāo)注,頂點(diǎn)標(biāo)號(hào)相同像素屬于同一個(gè)圖像塊,這些圖像塊則稱為超像素[5]。另一種方法是根據(jù)圖像中單個(gè)像素的信息以及像素之間的相互關(guān)系,借鑒無(wú)監(jiān)督學(xué)習(xí)的思想,結(jié)合聚類算法,將具有相似特征的相鄰像素劃分到同一超像素。在超像素方法中,主要有NCut、Graph Cuts、Meanshift等經(jīng)典算法,這類算法的時(shí)間復(fù)雜度較高。針對(duì)不足之處,在上述經(jīng)典算法的基礎(chǔ)上加以改進(jìn),產(chǎn)生了SEEDS、LSC、SLIC等算法,改進(jìn)后的算法在生成圖像塊的質(zhì)量和算法的時(shí)間復(fù)雜度上都有著更好的表現(xiàn)[6]。
3.2 語(yǔ)義分割法
采用高級(jí)語(yǔ)義的圖像分割稱為語(yǔ)義分割,Ohta等人于1978年最早提出圖像語(yǔ)義分割的概念,認(rèn)為語(yǔ)義分割是為圖像中每個(gè)像素分配一個(gè)預(yù)先定義的表示其語(yǔ)義目標(biāo)類別的標(biāo)簽[7]。語(yǔ)義分割分為兩種形式:自頂向下和自底向上。自頂向下則是使用物體的形狀模型在待分割圖像中做匹配搜索,由于每種物體的形狀差異性很大,所以這種方法的適應(yīng)性不理想。自底向上的方法不需要物體形狀的先驗(yàn)知識(shí),先從圖中生成候選區(qū)域,然后對(duì)候選區(qū)域進(jìn)行分類預(yù)測(cè)[8]。在自底向上方法中的另一種思路是直接以圖像像素或超像素為處理單位,提取其本身及領(lǐng)域的特征用于語(yǔ)義分割。該方法是以大量帶有像素級(jí)標(biāo)注的圖像為樣本,訓(xùn)練諸如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等的分類器[9],然后對(duì)圖像中每個(gè)像素進(jìn)行分類。
隨著圖像分割應(yīng)用范圍的不斷擴(kuò)大,對(duì)圖像分割的質(zhì)量要求也越來(lái)越高。但到目前為止,還沒(méi)有任何的分割算法可以適用于所有的圖像,而且隨著應(yīng)用的不斷深入,算法的復(fù)雜性越來(lái)越高,需要解決的問(wèn)題也會(huì)越來(lái)越多。因此應(yīng)該把圖像分割方法的研究與新理論、新技術(shù)相結(jié)合,圖像分割技術(shù)將會(huì)向著更精確、快速的方向發(fā)展。
參考文獻(xiàn):
[1] 羅希平,田捷,諸葛嬰,等.圖像分割方法綜述[J].模式識(shí)別與人工智能,1999,12(3):300-312.
[2] Otsu N. A threshold selection method from gray-level histograms. IEEE Trans. on Systems Man and Cybernetics, 1979,9(1):62-66.
[3] Adams R, Bischof L. Seeded region growing. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1994,16(6):641-647.
[4] Ziou D, Tabbone S. A study of edge detection techniques for segmentation computing approaches. Intl Journal of Computer Applications, 2010,CASCT(1):35-41.
[5] Ren X, Malik J. Learning a classification model for segmentation. In: Proc. of the 10th Intl Conf. on Computer Vision. IEEE, 2003:10-17.
[6] 姜楓,顧慶,郝慧珍,等.基于內(nèi)容的圖像分割方法綜述[J].軟件學(xué)報(bào),2017,28(1):160-183.
[7] Csurka G, Perronnin F. An efficient approach to semantic segmentation. Intl Journal of Computer Vision, 2011,95(2):198-212.
[8] Todorovic S, Ahuja N. Learning subcategory relevances for category recognition. In: Proc. of the IEEE Conf. on CVPR.Washington: IEEE Computer Society, 2008. 1-8.
[9] Bai X, Wang W. Saliency-SVM: An automatic approach for image segmentation. Neurocomputing, 2014,136(8):243-255.
【通聯(lián)編輯:代影】