王明靜,張學峰
(中國空空導彈研究院,河南洛陽471009)
如何從背景雜亂和噪聲影響較大的圖像重準確提取目標的感興趣邊緣,是視頻監(jiān)控、遙感影像中實現(xiàn)自動目標檢測的關鍵技術之一。常用的邊緣檢測算法首先獲取一幅特征圖像(大多數(shù)情況是梯度幅值圖像),然后對特征圖像進行分割獲取邊緣,但因為常用的閾值分割方法的性能取決于特征圖像的選擇,而且特征圖像的直方圖常常是單峰的,因此分割閾值較難自適應確定[1]。文獻[2]提出了遲滯閾值,使邊緣檢測的效果得到了一定的提升,但遲滯閾值的確定也不是一件容易的事情。文獻[3]和[4]分別提出了一種遲滯閾值的確定方法,其基本思想是在閾值空間內(nèi)搜索最優(yōu)的遲滯閾值,存在計算量大、邊緣圖像評價準則難以確定等缺點,影響了算法的使用范圍。閾值選擇過高,則可能導致感興趣目標的邊緣不能被完整提取出來,而閾值選擇過低,則可能導致提取出的邊緣過多,增加后續(xù)處理的難度。以上基于閾值的邊緣檢測算法都只關注那些強度較強的邊緣,而在實際中,可能會更關注具有某些結構特征的邊緣,如線性邊緣或具有特定形狀的閉合邊緣。另外,在前下視圖像中,由于景深差距很大,近距離處的邊緣和遠距離的邊緣強度可能有較大差別,所以邊緣強度已不能作為一個有效的判據(jù)。
針對以上問題,研究人員提出了一些不需要確定閾值的新方法。如文獻[5]把邊緣檢測看成統(tǒng)計推理過程,不同于基于模型的邊緣檢測算法,它是數(shù)據(jù)驅(qū)動的,但是使用之前需要先進行訓練,限制了算法的應用范圍,而且提取的邊緣可能會缺失或者多像素寬。文獻[6]介紹了一種基于線性預測的邊緣檢測方法,試驗證明該算法對噪聲不敏感。雖然這些方法展示了較好的應用前景,但這些方法都還處于理論研究中,在實際應用中的效果還有待進一步驗證。
針對邊緣檢測算法閾值難確定和提出的干擾邊緣較多的問題,本文提出了一種基于兩級濾波的感興趣邊緣檢測算法,并與Canny算法、Sobel算法進行了對比試驗。
基于知識的感興趣邊緣檢測算法包含以下四個步驟:
1)對圖像進行平滑濾波,濾除噪聲;
2)用梯度算子分別提取水平方向和垂直方向的梯度,并獲取梯度幅值圖像和梯度方向圖像;
3)根據(jù)梯度方向圖像對梯度幅值圖像進行濾波,濾除那些由噪聲形成的邊緣,同時對梯度幅值圖像進行非最大值抑制;
“你看那邊,是不是還是昨天那倆人?”雖然感冒了,精神不佳,但一點也不影響王施凱掃視四周,一眼就看到了路口徘徊的黑衣人。
4)對濾波后的梯度幅值圖像進行分割,形成初始的邊緣映射圖,并進行邊緣跟蹤,獲取所有的邊緣段及其特征,從中濾除不滿足特征約束的邊緣,保留感興趣的邊緣。
圖像平滑的主要作用是濾除圖像噪聲、平滑區(qū)域內(nèi)部的弱小邊緣和較復雜紋理內(nèi)部的雜亂邊緣。本文采用高斯模板對圖像進行平滑濾波操作。高斯模板的方差根據(jù)圖像噪聲水平確定。
梯度特征圖像包括梯度幅值圖像和梯度方向圖像。梯度特征圖像的計算方法為:首先對二維高斯函數(shù)分別求X和Y方向的偏導數(shù),得到X方向和Y方向的梯度算子;然后對圖像進行卷積運算,得到X方向和Y方向的梯度圖像,記為Grad X和Grad Y;最后按式(1)和式(2)計算梯度幅值圖像Grad和梯度方向圖像Dir:
將0°~360°的梯度方向均勻量化為32個方向,編號為0~31,其分布如圖1所示,水平向右為方向0,按逆時針分別為0~31。
圖1 梯度方向示意圖
在視頻圖像中,感興趣物體的邊緣一般是連續(xù)的具有一定形狀的較為平滑的邊緣,而噪聲的邊緣一般沒有固定形狀,或者只是一個孤立的梯度幅值點,所以可以利用先驗知識對梯度幅值圖像進行濾波處理,刪除不感興趣的邊緣點。感興趣的邊緣點具有如下特征:
1)在邊緣的方向上至少有另外四個邊緣方向相近的邊緣點;
2)在邊緣的法線方向上至少有另外兩個邊緣方向相近的邊緣點;
條件1)是為了剔除那些由噪聲點形成的邊緣,它包含三種情況:
a)邊緣點的兩邊各有兩個邊緣方向相近的邊緣點;
b)邊緣點的某一邊有四個邊緣方向相近的邊緣點;
c)邊緣點的一邊有一個邊緣方向相近的邊緣點而另一邊有三個邊緣方向相近的邊緣點。
條件2)是考慮到圖像中真實的邊緣一般會有一個過渡區(qū),而那些干擾形成的邊緣則更陡峭,它包含兩種情況:
a)邊緣點的法線方向兩邊各有一個邊緣方向相近的邊緣點;
b)邊緣點的法線方向的某一邊有兩個邊緣方向相近的邊緣點。
邊緣方向相近指邊緣方向相差在45°以內(nèi),即梯度方向相差在4以內(nèi)。
條件3)完成對邊緣點的非最大值抑制,以便能提取單像素寬的邊緣。
經(jīng)過對梯度幅值圖像濾波操作后,保留下來的邊緣點大部分位于感興趣的邊緣處,因此可以采用一個動態(tài)范圍很小的閾值對梯度幅值圖像進行分割,獲取初始邊緣圖像。此處根據(jù)圖像的空域噪聲確定分割閾值,即將那些由噪聲引入的邊緣排除,而保留其他邊緣。
獲取初始邊緣圖像后,對各邊緣進行細化、平滑操作,然后進行跟蹤邊緣,獲取所有的邊緣段,最后統(tǒng)計各邊緣段的特征。邊緣跟蹤時,如果遇到分叉邊緣點,則根據(jù)已經(jīng)獲取的邊緣段上的邊緣點來預測邊緣的方向,選擇與預測邊緣方向最接近的邊緣點作為下一個跟蹤邊緣點。本文采用的邊緣方向預測方法為:選擇已經(jīng)獲取的邊緣段上最近的8個點,按其邊緣走向作為預測邊緣方向,如果已獲取的邊緣段上邊緣點的個數(shù)不足8個,則根據(jù)所有邊緣點的邊緣走向生成預測邊緣方向。在邊緣跟蹤的同時,記錄邊緣段上每個點的坐標、邊緣段上邊緣點的最大梯度幅值和所有邊緣點的平均梯度幅值等信息。
獲取所有邊緣段后,即可對邊緣段進行濾波,從中刪除不滿足特征要求的邊緣,保留感興趣的邊緣,邊緣濾波的準則為:如果邊緣段所有邊緣點的平均梯度幅值小于閾值或者所有邊緣點的最大梯度幅值小于閾值,則刪除該邊緣段。此處的閾值在梯度幅值圖像中按分位數(shù)法選取,即閾值應該使梯度幅值圖像中所有有效邊緣點的梯度幅值小于閾值的點的個數(shù)占總的有效邊緣點的個數(shù)的比例為P。通常,平均梯度幅值閾值的分位數(shù)設置為0.2,最大梯度幅值閾值的分位數(shù)設置為0.5,即可滿足大部分需求。
本文主要從兩個方面對算法的性能進行評估:一是算法參數(shù)的設置對邊緣檢測結果的影響,二是將本文算法與通用的對邊緣檢測效果較好的Canny算法、Sobel算法進行了比較,以驗證本文算法的先進性。
本文算法共需設置三個閾值參數(shù):
1)對濾波后的梯度幅值圖像進行分割的參數(shù);
2)對跟蹤得到的邊緣的平均梯度幅值進行限制的閾值;
3)對跟蹤得到的邊緣的最大梯度幅值進行限制的閾值。
這三個閾值均按分位數(shù)法選取。由于對梯度幅值圖像進行濾波后,需盡可能保留感興趣的邊緣,因此算法中第一個閾值分位數(shù)的設置值不能太大,本文中選擇為0.05,即保留濾波后95%的邊緣點作為候選邊緣點。對另兩個閾值的分位數(shù)分別取為{0.2,0.5}、{0.1,0.25}、{0.05,0.15},得到的邊緣圖像分別如圖2(d)~圖2(f)所示。
圖2(a)為原始圖像,圖2(b)為提取的梯度幅值圖像,圖2(c)為濾波后梯度幅值圖像的分割結果??梢钥闯?,隨著閾值的降低,檢測出的邊緣數(shù)量逐漸增多,在高閾值下不能檢測出的弱小邊緣逐漸顯現(xiàn)出來,但圖像中比較顯著的能量較強的邊緣幾乎沒有變化,而這些邊緣正是進行目標識別所感興趣的邊緣,所以本文算法對參數(shù)設置具有較好的適應性。
圖2 不同參數(shù)的邊緣檢測結果
采用道路圖像和建筑圖像對Canny算法、Sobel算法、本文算法進行了對比試驗,試驗結果如圖3和圖4所示。圖3為道路圖像的邊緣檢測結果,圖3(a)為原始圖像,圖3(b)為Canny算法結果,圖3(c)為Sobel算法結果,圖3(d)為本文算法結果,可以看出,Canny算法雖然檢測出了道路邊緣,但保留了太多道路內(nèi)部和草地的細節(jié)邊緣,增加了后續(xù)處理的難度,Sobel算法效果不錯,但依然保留了圖像下方的許多草地邊緣,本文算法較好的提取了道路邊緣,且保留的干擾邊緣最少。
圖3 道路邊緣檢測結果
圖4 為建筑圖像的邊緣檢測結果,圖4(a)為原始圖像,圖4(b)為Canny算法結果,圖4(c)為Sobel算法結果,圖4(d)為本文算法結果,可以看出,Canny算法較好的檢測出了建筑邊緣,但同樣檢測出了太多的干擾邊緣,增加了后續(xù)處理的難度,Sobel算法檢測出的建筑邊緣不完整,且保留了圖像下方很多干擾邊緣,本文算法較完整的提取了建筑邊緣,且很好的抑制了圖像下方的干擾邊緣。
圖4 建筑邊緣檢測結果
本文提出了一種基于多級濾波的感興趣邊緣檢測算法,該算法基于感興趣的邊緣一般都表現(xiàn)為直線或曲率較干擾邊緣小的事實,首先根據(jù)梯度方向?qū)μ荻确祱D像進行濾波和非最大值抑制操作,保留所有可能的感興趣邊緣;然后進行邊緣跟蹤,提取邊緣的特征,進一步濾除干擾邊緣。這種做法融合了梯度幅值大小和梯度方向信息,使邊緣提取與邊緣段識別同步進行。能更有效的提取圖像中感興趣的邊緣,同時排除干擾邊緣,減少后續(xù)處理的難度。同時算法中需要設置的參數(shù)數(shù)量少,而且算法性能對參數(shù)設置不敏感,所以算法的適應能力更強,使用范圍更廣。通過用大量視頻監(jiān)控圖像和遙感圖像對算法進行測試,并與經(jīng)典的邊緣檢測算法進行對比,證明本文算法適應范圍廣,能有效濾除較復雜紋理產(chǎn)生的雜亂邊緣,提取圖像中形狀規(guī)則的感興趣邊緣,降低后續(xù)目標識別過程的復雜性,提高目標識別概率。
但本文算法也存在一些不足,比如沒有考慮多尺度邊緣的提取,對算法參數(shù)的優(yōu)化選擇考慮不夠。在進一步的研究中,將在邊緣檢測算法中引入多尺度思想,在不同尺度下檢測出更多感興趣的邊緣,綜合各尺度下的邊緣以更好的濾除干擾邊緣,同時對算法參數(shù)的選擇和設置對算法性能的影響進行定量分析,給出參數(shù)選擇的理論依據(jù)。
[1] Y J Zhang.A survey on evaluation methods for image segmentation[J].Pattern Recognition,1996,29:1335 -1346.
[2] M D Heath,S Sarkar,T Sanocki,et al.A robust visual method for assessing the relative performance of edgedetection algorithms[J].IEEE Transactions on Pattern A-nalysis and Machine Intelligence,1997,19:1338 -1359.
[3] R Medina-Carnicer,A Carmona-Poyato,R Munoz-Salinas.Determining hysteresis thresholds for edge detection by combining the advantages and disadvantages of thresholding methods[J].IEEE Transactions on Image Processing,2010,19(1):165 -173.
[4] Yitzhak Yitzhaky,Eli Peli.A method for objective edge detection evaluation and detector parameter selection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(8):1027 -1033.
[5] Scott Konishi,Alan L Yuille,James M Coughlan.Statistical edge detection:learning and evaluating edge cues[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(1):57 -74.
[6] James Z Zhang,Peter C Tay,Robert D Adams.A novel image edge detection method using linear prediction[J].IEEE,2010,:620 -623.