王 芬,馬 濤,馬 旭
(寧夏師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,寧夏 固原 756000)
基于SVM分類的圖像邊緣檢測(cè)研究
王 芬,馬 濤,馬 旭
(寧夏師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,寧夏 固原 756000)
針對(duì)經(jīng)典邊緣檢測(cè)算子檢測(cè)含噪聲圖像邊緣結(jié)果不理想的問題,提出采用基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(Support Vector Machine,SVM)方法建立分類模型,并對(duì)圖像進(jìn)行邊緣檢測(cè).實(shí)驗(yàn)基于 MATLAB平臺(tái),運(yùn)用OSU_SVM3.0和LS_SVM工具箱建立模型,實(shí)驗(yàn)表明:該方法不僅可以有效地檢測(cè)圖像邊緣,還在一定程度上克服了噪聲干擾,并可以將被測(cè)圖像中的特定圖形檢測(cè)出來.
邊緣檢測(cè);機(jī)器學(xué)習(xí);SVM
邊緣是圖像中像素灰度有階躍變化或屋頂狀變化的像素集合,它存在于目標(biāo)與背景、目標(biāo)與目標(biāo)、區(qū)域與區(qū)域以及基元與基元之間[1],屬于圖像的最基本特征.邊緣包含了豐實(shí)的信息,如方向、階躍性質(zhì)和形狀等,是在圖像識(shí)別過程中需要抽取的重要屬性[2],在邊界檢測(cè)、圖像分割、模式識(shí)別和機(jī)器視覺中具有重要作用.邊緣檢測(cè)是圖像處理與識(shí)別中最基本的內(nèi)容之一[3],圖像的邊緣檢測(cè)是圖像分割、目標(biāo)區(qū)域識(shí)別以及區(qū)域形狀提取等圖像分析領(lǐng)域非常重要的基礎(chǔ),圖像理解和分析首先要做到邊緣檢測(cè),目前它已成為機(jī)器視覺研究領(lǐng)域最活躍的課題之一,在工程應(yīng)用中占有非常重要的地位.對(duì)于邊緣檢測(cè),有很多經(jīng)典算子,如Roberts算子、Sobel算子、Prewitt算子、Laplacian算子和Canny算子等[4].Roberts算子對(duì)含有陡峭低噪聲的圖像處理效果較好,但提取的邊緣較粗,定位不準(zhǔn);Sobel算子對(duì)灰度漸變和噪聲較多的圖像處理效果較好,且定位準(zhǔn)確;Prewitt算子對(duì)灰度漸變的圖像處理效果較好;Laplacian算子對(duì)圖像中的階躍性邊緣定位準(zhǔn)確,但對(duì)噪聲非常敏感;Canny算子不易受噪聲干擾,能檢測(cè)出真正的弱邊緣,但這些算子由于其模板相對(duì)固定,在檢測(cè)被噪聲污染的復(fù)雜圖像的邊緣時(shí)效果欠佳.針對(duì)具體的應(yīng)用場(chǎng)景,邊緣提取算法的各種改進(jìn)層出不窮,但大部分改進(jìn)都表現(xiàn)在邊緣算子模板的不同構(gòu)造方法上[5-7].近年來,出現(xiàn)了如基于小波與分形理論、基于模糊理論和基于形態(tài)學(xué)等多種檢測(cè)手段,但它們都存在自身的缺陷,有的抗噪性能較差,有的檢測(cè)精度不夠[1].因此,找到一種算法簡(jiǎn)單,既能較好的檢測(cè)邊緣又能抑制噪聲的邊緣檢測(cè)算法是圖像處理的目標(biāo).
投稿日期:2011-06-21
統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)方法在模式識(shí)別中對(duì)解決小樣本、非線性及高維問題具有顯著優(yōu)勢(shì),它從數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,并利用這些規(guī)律對(duì)未來數(shù)據(jù)或無法觀測(cè)的數(shù)據(jù)進(jìn)行分類、預(yù)測(cè)和插值,已在諸如生物信息學(xué)、文本和手寫識(shí)別等許多領(lǐng)域取得了成功的應(yīng)用.本研究將支持向量機(jī)方法應(yīng)用于圖像邊緣檢測(cè),發(fā)揮其在模式識(shí)別中解決小樣本、非線性及高維問題的優(yōu)勢(shì),以期在抑制噪聲的同時(shí)可以有效地檢測(cè)出圖像邊緣.
支持向量機(jī)(SVM)是統(tǒng)計(jì)學(xué)習(xí)理論的一種具體實(shí)現(xiàn),SVM分類器應(yīng)用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,不僅要求最優(yōu)分類面無錯(cuò)誤的分開各類,而且要使類間間隔最大,以保證真實(shí)風(fēng)險(xiǎn)最?。?-10].
設(shè){x i,yi},i=1,2,…l為包含l個(gè)樣本的訓(xùn)練集,其中x i∈Rm為輸入向量,y i∈(+1,-1)為類別標(biāo)識(shí),l為樣本數(shù),m為輸入維數(shù).對(duì)于邊緣檢測(cè)問題,+1代表邊緣點(diǎn),-1代表非邊緣點(diǎn).
當(dāng)樣本數(shù)據(jù)線性可分時(shí),判別函數(shù)的一般形式為g(x)=wx+b,即有一個(gè)超平面使兩類樣本完全分開.將函數(shù)歸一化,使兩類樣本滿足 |g(x)|≥1,離分類面最近的樣本的 |g(x)|≥1,其分類間隔等于1/(2‖w‖),故要使間隔最大等價(jià)于使‖w‖最小,并要求沒有錯(cuò)誤分類的樣本,滿足上述條件且使‖w‖2最小的分類面就是最優(yōu)分類面.過兩類樣本中離分類面最近的點(diǎn)且平行于最優(yōu)分類面的超平面H1和H2上的訓(xùn)練樣本就是支持向量(Support Vector,SV).
當(dāng)樣本數(shù)據(jù)非線性可分時(shí),SVM分類通過一個(gè)非線性函數(shù)Φ(x)將訓(xùn)練集數(shù)據(jù)x i映射到一個(gè)高維線性特征空間[11],在這個(gè)維數(shù)可能為無窮大的線性空間中構(gòu)造最優(yōu)分類超平面:
式(2)中,‖w‖2是描述復(fù)雜度的結(jié)構(gòu)化項(xiàng),ξi為松弛項(xiàng),C為懲罰因子.利用拉格朗日乘子法求解此二次規(guī)劃問題的對(duì)偶形式,即最優(yōu)化下式
經(jīng)典算子在理想場(chǎng)景的效果很好,但在處理復(fù)雜場(chǎng)景時(shí),很難在提取邊緣的同時(shí)有效抑制圖像噪聲,也基本不能選擇提取圖像中具有特定形狀的邊緣,只能應(yīng)用于有限的較理想場(chǎng)合.故經(jīng)典算子失效時(shí),基于機(jī)器學(xué)習(xí)的邊緣提取方法就顯現(xiàn)出其優(yōu)勢(shì)來.為了實(shí)現(xiàn)邊緣檢測(cè),本研究將圖像的邊緣點(diǎn)看作一類,其他像素點(diǎn)看作另一類,利用分類算法建模后,對(duì)圖像中全部像素進(jìn)行處理,提取相應(yīng)邊緣.
邊緣檢測(cè)算法的流程如圖1所示.
圖1 邊緣檢測(cè)算法流程圖Figure 1 Edge detection algorithm flow chart
邊緣檢測(cè)算法流程的具體描述為:
(1)構(gòu)建訓(xùn)練樣本.通過提供不同的訓(xùn)練數(shù)據(jù)改變檢測(cè)模型的性能,不同目的的訓(xùn)練數(shù)據(jù)經(jīng)學(xué)習(xí)后得到的模型具有不同的分類目的.本研究分別對(duì)理想圖像(圖2(a))、含噪聲圖像(圖2(b))和含有特定圖形的圖像(圖2(c))進(jìn)行邊緣檢測(cè),所選訓(xùn)練樣本的圖像既有目標(biāo)圖像,又有背景的Lena圖像和人工繪制的含有特殊圖形的圖像,如圖2所示.
圖2 訓(xùn)練樣本圖像實(shí)例Figure 2 Image examples of training samples
在對(duì)理想圖像(圖2(a))進(jìn)行邊緣檢測(cè)時(shí),由于canny算子在無噪聲污染時(shí)邊緣提取效果較好,故認(rèn)為由canny算子得到的圖像邊緣是圖像中像素灰度有階躍變化或屋頂狀變化的像素集合,因此將這些像素點(diǎn)作為正樣本點(diǎn),如圖3所示;其他像素點(diǎn)作為負(fù)樣本點(diǎn).對(duì)含噪聲圖像(圖2(b))進(jìn)行檢測(cè)時(shí),同樣選取圖3所示的邊緣點(diǎn)作為正樣本,其他非邊緣像素點(diǎn)和噪聲點(diǎn)作為負(fù)樣本.對(duì)于提取含有特定圖形的圖像(圖2(c)),則選取預(yù)提取的特定圖形的邊緣像素點(diǎn)作為正樣本點(diǎn),其他像素點(diǎn)為負(fù)樣本點(diǎn),本研究要提取圖2(c)中的圓形,則用圖2(c)中圓形的邊緣點(diǎn)作為正樣本,如圖4所示,其他邊緣點(diǎn)作為負(fù)樣本.
圖3 正樣本Figure 3 Positive samples
圖4 提取圖像中圓形的正樣本Figure 4 Circular image of the extracter samples
(2)訓(xùn)練分類器.實(shí)驗(yàn)選用 OSU-SVM3.0工具箱,利用徑向基核函數(shù)訓(xùn)練SVM分類器,通過k重交叉驗(yàn)證的驗(yàn)證方法確定懲罰參數(shù)C和RBF核參數(shù)r的值,然后分別建立樣本圖像的8鄰域和24鄰域分類模型.
(3)測(cè)試環(huán)節(jié).利用訓(xùn)練環(huán)節(jié)得到的8鄰域和24鄰域檢測(cè)模型分別對(duì)被測(cè)圖像逐像素進(jìn)行分類,得到測(cè)試圖像的邊緣像素.
SVM分類模型的建立需要通過學(xué)習(xí)訓(xùn)練.在應(yīng)用中,如果訓(xùn)練樣本已經(jīng)確定,則該過程是對(duì)懲罰因子C和核函數(shù)參數(shù)的選擇過程.實(shí)驗(yàn)采用k重交叉驗(yàn)證的驗(yàn)證方法,即訓(xùn)練時(shí)將N個(gè)樣本分為k(1≤k≤N)個(gè)子集,其中的(k-1)個(gè)子集構(gòu)成訓(xùn)練集,剩余的1個(gè)子集作為測(cè)試集;驗(yàn)證步驟重復(fù)進(jìn)行k次,使所有樣本子集都參加過測(cè)試,實(shí)驗(yàn)中選取k=2.
實(shí)驗(yàn)通過對(duì)不同的8鄰域和24鄰域邊緣檢測(cè)模型進(jìn)行訓(xùn)練得到如表1所示的參數(shù)集.表1中,懲罰參數(shù)C和RBF核參數(shù)r都在2重交叉驗(yàn)證下對(duì)應(yīng)于最高分類識(shí)別率參數(shù)集.
表1 邊緣檢測(cè)模型參數(shù)?Table 1 Edge detection model parameters
模型對(duì)人物圖像的檢測(cè)結(jié)果以及與傳統(tǒng)算子的比較如圖5所示.由圖5可以看出,利用Canny算子對(duì)圖像進(jìn)行檢測(cè)的效果較好,但存在偽邊緣,如人物的肩上;而8鄰域模型的檢測(cè)結(jié)果并沒出現(xiàn)偽邊緣,這說明即使在訓(xùn)練集中含有干擾樣本,利用本研究提出的基于機(jī)器學(xué)習(xí)的邊緣檢測(cè)模型也可以較好地提取邊緣;檢測(cè)模型對(duì)24鄰域模型的檢測(cè)效果優(yōu)于對(duì)8鄰域模型的檢測(cè)效果.
圖5 無噪聲圖像的邊緣檢測(cè)結(jié)果與傳統(tǒng)算子的檢測(cè)結(jié)果對(duì)比Figure 5 Compare of the edge detection results of noise-freeimage with the traditional operator
模型對(duì)含噪聲人物圖像的檢查結(jié)果以及與傳統(tǒng)算子的比較如圖6所示.由圖6可以看出,在canny算子對(duì)噪聲圖像的檢測(cè)結(jié)果中,人物的臉部被噪聲污染嚴(yán)重;而8鄰域模型的檢測(cè)結(jié)果則表明即使在訓(xùn)練集中含有一些干擾樣本,本研究提出的邊緣檢測(cè)模型不僅可以有效地提取邊緣,而且可以抑制噪聲,這得益于SVM基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的噪聲抑制的推廣性能;同時(shí),比較24鄰域模型與8鄰域模型的檢測(cè)結(jié)果,二者均能有效提取邊緣,24鄰域模型抑制噪聲的效果要優(yōu)于8鄰域模型.
圖6 有噪聲圖像的邊緣檢測(cè)結(jié)果與傳統(tǒng)算子的檢測(cè)結(jié)果對(duì)比Figure 6 Compare of the edge detection results of noise image with the traditional operator
圖7(a)所示圖像為特定圖形邊緣檢測(cè)的測(cè)試圖像,圖7(b)和圖7(c)分別為8鄰域模型和24鄰域模型檢測(cè)訓(xùn)練圖形中特定圖形即圓形的訓(xùn)練圖形;圖7(d)和圖7(e)分別為8鄰域模型和24鄰域模型檢測(cè)測(cè)試圖形中特定圖形即圓形的檢測(cè)結(jié)果.結(jié)果表明:利用機(jī)器學(xué)習(xí)算法通過訓(xùn)練學(xué)習(xí),建立分類模型,可以有效地提取特定圖形,并且24鄰域模型提取效果均優(yōu)于8鄰域模型.
圖7 特定圖形邊緣提取的測(cè)試圖像和2種模型的檢測(cè)結(jié)果Figure 7 Test image of extracting Specific graphicand the detection of results of two models
上述實(shí)驗(yàn)中建立的模型(簡(jiǎn)稱為9點(diǎn)模型)只考慮了每個(gè)像素點(diǎn)的灰度和它8鄰域像素的灰度,造成模型對(duì)目的圖形的提取結(jié)果存在缺失,因此考慮加入像素點(diǎn)的位置信息,構(gòu)建包含8鄰域和像素點(diǎn)位置信息的模型(簡(jiǎn)稱為11點(diǎn)模型),結(jié)果如圖8所示.
圖8 11點(diǎn)模型提取的目的圖像Figure 8 Purpose image of the model 11
由圖8可以看出,11點(diǎn)模型的提取質(zhì)量很好.但是構(gòu)建的11點(diǎn)模型只能用來檢測(cè)原訓(xùn)練圖像,檢測(cè)出的圓形位置與訓(xùn)練時(shí)的樣本位置相關(guān),但如果用該模型來檢測(cè)任意圖像,則可能檢測(cè)不出任何圖像,這說明11點(diǎn)模型表現(xiàn)出一種排他性.鑒于2種模型各自的優(yōu)點(diǎn),本實(shí)驗(yàn)在檢測(cè)圖形時(shí),將上述2種方法貫穿使用,9點(diǎn)模型作為一種粗略檢測(cè)方法,可以檢測(cè)任何圖像中的相應(yīng)圖形,但圖形可能不完整,本實(shí)驗(yàn)將9點(diǎn)模型檢測(cè)到的不完整邊緣結(jié)果作為11點(diǎn)模型的訓(xùn)練樣本,再次構(gòu)建檢測(cè)模型,這樣就將9點(diǎn)模型丟失的邊緣提取出來,結(jié)果如圖9所示.
圖9 9點(diǎn)+11點(diǎn)模型的檢查結(jié)果Figure 9 Purpose image of the model 9 and 11
改進(jìn)方法用11點(diǎn)模型插補(bǔ)9點(diǎn)模型缺失邊緣的過程就像人類視覺中的掃視和注視過程,掃視可以檢測(cè)和定位特定圖形,但不精確,注視對(duì)掃視定位后的特定圖形進(jìn)行進(jìn)一步的檢測(cè),考慮像素位置信息,視覺感知因此變得更為準(zhǔn)確.
本研究提出用SVM分類方法對(duì)圖像進(jìn)行邊界檢測(cè),介紹了算法在圖像邊緣檢測(cè)時(shí)對(duì)不同模型的構(gòu)建方法,說明了算法的訓(xùn)練策略.從實(shí)驗(yàn)仿真結(jié)果可以看出:本研究提出的算法使得模型在檢測(cè)邊緣的同時(shí),可以一定程度地克服噪聲干擾,并利用SVM分類器將被測(cè)圖像中的特定圖形有效地檢測(cè)出來.
[1] 張小琳.圖像邊緣檢測(cè)技術(shù)綜述[J].高能量密度物理,2007,22(1):37-40.
[2] 吳炯,張秀彬,張峰,等.數(shù)字圖像中邊緣算法的實(shí)驗(yàn)研究[J].微計(jì)算機(jī)信息,2004,120(5):106-107.
[3] 甘玲,李濤,趙輝,等.CP神經(jīng)網(wǎng)絡(luò)在圖像邊緣檢測(cè)中的應(yīng)用[J].四川大學(xué)學(xué)報(bào):工程科學(xué)版,2003,35(3):93-96.
[4] 肖峰.基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像邊緣檢測(cè)算法的研究[J].西安科技大學(xué)學(xué)報(bào),2005,25(3):372-375.
[5] 薛麗霞,李濤,王佐成.一種自適應(yīng)的canny邊緣檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用研究,2010,27(9):3588-3590.
[6] 陳志強(qiáng),郭永亮,陳詩哲.基于小波變換與改進(jìn)的Roberts算子融合的圖像邊緣檢測(cè)[J].傳感器世界,2011,24(4):15-17.
[7] 王鯤鵬.基于Otsu算法和Sobel算子的連接件圖像邊緣檢測(cè)[J].現(xiàn)代計(jì)算機(jī),2011,19(7):17-19.
[8] Vapnik V N.統(tǒng)計(jì)學(xué)習(xí)理論[M].許建華,張學(xué)工,譯.北京:電子工業(yè)出版社,2004:21-24.
[9] Jeng J T.Hybrid approach of selecting hyper-parameters of support vector machine for regression[J].Systems,Man,and Cybernetics,Part B:Cybernetics,2006,36(3):699-709.
[10] Jin B,Tang Y C,Zhang Y Q.Support vector machines with genetic fuzzy feature transformation for biomedical data classification[J].Information Sciences,2007,177:476-489.
[11] 邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,1999:105-110.
[12] 陳其松.智能優(yōu)化支持向量機(jī)預(yù)測(cè)算法及應(yīng)用研究[D].貴陽:貴州大學(xué),2009:23-25.
[13] Vapnik V N.Statistical Learning Theory[M].New York:Wiley-Interscience,1998:198-203.
[14] 吳濤.核函數(shù)的性質(zhì)、方法及其在障礙檢測(cè)中的應(yīng)用[D].北京:國防科學(xué)技術(shù)大學(xué),2003:27-32.
Study on image edge detection based on classification using SVM
WANGFen,MATao,MAXu
(Institute of Mathematics and Computer Science,Ningxia Normal University,Guyuan 756000,Ningxia Province,China)
According to the problem of bad edge of the image with noise detected using the classical edge detectors,a method based on support vector machine(SVM)of statistical learning theory is proposed to create classification model and detect the image edge.The experiment is based on MATLAB and OSU_SVM3.0 and LS_SVM toolbox are used to create the model.The experiment shows that the method can detect edges of the image very well,and overcomes the noise disturbance in some degree.The specific graphic image can be detected using the method.
edge detection;machine learning;SVM
TP391
A
1671-1114(2011)04-0050-05
寧夏自然科學(xué)基金資助項(xiàng)目(NZ11257);寧夏高等學(xué)??茖W(xué)研究基金資助項(xiàng)目(NGNS201003);寧夏師范學(xué)院資助項(xiàng)目(ZD2010002,YB2010013)
王 芬(1979—),女,講師,主要從事圖像處理與分析方面的研究.
(責(zé)任編校 紀(jì)翠榮)