火元蓮,秦 梅,宋亞麗
?
基于邊緣特征和多幀差分法的運動目標檢測算法
火元蓮,秦 梅,宋亞麗
(西北師范大學 物理與電子工程學院,甘肅 蘭州 730070)
針對傳統(tǒng)的邊緣檢測算法檢測結果不連續(xù)、細節(jié)信息易丟失等缺點,提出了一種用于運動目標檢測的邊緣檢測方法。首先在背景差分的基礎上用平移法檢測目標邊緣,該方法能夠提取到更為精確、細節(jié)特征更加豐富、閉合性更好的目標邊緣;然后將邊緣檢測與多幀差分法相結合進行運動目標檢測。該方法的優(yōu)勢在于,在目標檢測的過程中不需要進行背景建模與更新。實驗結果表明,該方法思路簡單,易于實現(xiàn),檢測結果精準,實時性較好。
邊緣檢測;平移法;目標掩碼;目標檢測;多幀差分法
在智能交通監(jiān)控系統(tǒng)中,運動目標檢測的精確性直接影響到后期的行為理解和對監(jiān)控事件所要采取的處理措施[1-2]。幀差法[3-5]、光流法[6-8]和背景差分法[9-10]是3種經(jīng)典的運動目標檢測方法。其中,幀差法的實時性和對環(huán)境的適應能力較好,但容易受圖像采樣率和目標運行速度的影響,檢測到的目標內(nèi)部會存在不同程度的空洞現(xiàn)象;光流法在無需預知場景任何信息的情況下便可完整地檢測到運動目標,但對噪聲和光線變化敏感,算法計算量大,實時性較差,難以得到廣泛的應用;背景差分法是目前最為常用的一種方法,具有原理簡單、計算速度快等優(yōu)點,但需要構建背景模型,并通過不斷地更新來適應背景的變化?;旌细咚鼓P秃痛a本模型是背景模型構建中較為經(jīng)典的方法,前者能夠克服光照、物體停留、背景混亂等干擾因素的影響,但當場景中存在緩慢運動的物體時,會出現(xiàn)漏檢情況;后者具有魯棒性強、計算速率高的優(yōu)點,但容易出現(xiàn)虛檢和漏檢[11-13]。背景差分法檢測結果的準確性和實時性很大程度上依賴于背景更新的可靠性和及時性[14-15]。
為了克服上述方法的不足,本文將幀差法和運動目標的邊緣特征相結合,提出了一種基于邊緣特征的運動目標檢測方法。物體的邊緣可以極為精簡地描述物體的輪廓、形狀等特征信息,而且不易受到噪聲和亮度突變的影響,被廣泛地用于目標的檢測[16]。但是,普通的邊緣檢測算法檢測到的是整幅圖像中所有物體的邊緣,包括背景中物體的邊緣,而運動目標檢測只關注前景中動態(tài)物體的邊緣特征,為了從整幅圖像的邊緣信息中去除背景中物體的邊緣,通常是在前景圖像和背景圖像分別提取邊緣后做差分便可以得到前景物體的邊緣。傳統(tǒng)的Sobel、Prewitt等邊緣檢測算子的檢測結果往往存在目標邊緣不完整、輪廓不清晰、斜向邊緣信息易丟失等缺點,使得提取的目標邊緣不夠精準,這會給后續(xù)的方案選擇帶來很大的困難[17-19]。針對這些問題,本文在前景圖像與背景圖像差分的基礎上,用平移法提取運動目標邊緣的方法,提取到的邊緣與原目標的大小和形狀十分接近,且其邊緣閉合性比傳統(tǒng)邊緣檢測算子更好。
圖像邊緣檢測可以大幅度地減少數(shù)據(jù)量,剔除與后續(xù)檢測不相關的信息,并且可以保留有用信息的重要特征。精準的邊緣信息有助于運動目標快速準確地提取。
首先從視頻序列中提取一幀圖像作為前景圖像f(,),另外提取一幀圖像作為背景圖像b(,)(這里的背景圖像可以是背景建模算法建立的初始化背景,也可以是從與前景圖像相差30幀以上的視頻圖像中隨機提取的圖像,具體區(qū)別見1.3節(jié)實驗結果部分所述),兩幀圖像做差分并進行二值化,得到運動目標的二值圖像BW(,)。
式中:為二值化閾值,可根據(jù)前景與背景的亮暗程度來設置,本文取固定閾值35。
將二值化圖像BW(,)分別向上下左右及4個邊角方向做平移,得到八方向平移后的圖像,將這8幅圖像疊加在一起,便可以得到運動目標的邊緣圖像。這里提到的向某個方向平移,是指將運動目標的二值圖像整體做平移,如圖1所示。
背景差分法檢測到的目標圖像具有準確性好、完整度高的優(yōu)點,但因為對光線及其他干擾因素較為敏感,會導致檢測到的目標信息存在一定程度的丟失。圖1(a)是基于背景差分法提取到的運動目標二值圖像的模擬圖,代表目標原圖像。圖中標1的點代表二值圖像中運動目標的輪廓,為了方便表示,這里只標出了目標的邊緣。為了更加逼真地模擬差分法得到的目標二值圖像,圖中特意將目標的3個邊角地方留出了缺口,表示丟失的目標信息。圖1(b)是將圖1(a)中目標二值圖像做八方向平移后的圖像,從圖中可以看出,原目標邊角的缺口經(jīng)過平移之后已經(jīng)較好地連接起來,目標邊緣成為了一個閉合圖像,角點信息更加完整,細節(jié)特征也更加豐富。
圖1 平移法示意圖
為了更好地說明該算法的實用性,本小節(jié)作了兩個實驗,均采用某小區(qū)的安全監(jiān)控視頻作為視頻序列,視頻為AVI格式,對其分辨率無特殊要求。兩個實驗的區(qū)別在于背景圖像的選擇上,實驗一中的背景圖像是采用文獻[20]中的區(qū)間分布密度法建立的,實驗二的背景圖像則是從視頻中隨機提取的,條件是與前景圖像相差30幀以上,避免前景目標在差分過程中與自身重合。實驗中分別用Sobel算子、Canny算子、PS算子和平移法提取運動目標的邊緣,將各個算法的檢測結果予以對比,如圖2和圖3所示。
圖2和圖3均是目標邊緣的提取過程示意圖,其中,圖(a)和圖(b)分別是前景和背景圖像,圖(c)為背景差分法提取的運動目標的二值圖像,這里得到的目標圖像比較完整,是因為背景圖像中不存在更新過程產(chǎn)生的誤差,但在實際的目標提取過程中,往往因為背景圖像質量的影響,前景圖像的完整度很難達到此程度;圖(d)、(e)、(f)、(g)分別是Sobel算子、Canny算子、PS算子、平移法提取到的目標邊緣。從4種算法的檢測結果中可以看出,Sobel算子檢測到的邊緣會有部分信息缺失,而Canny算子檢測到的邊緣太細、信息不夠完整,由于PS算子是Prewitt算子和Sobel算子的結合,與前兩種算子相比,它包含更為豐富的細節(jié)信息,邊緣也更為完整一些,但仍然存在部分信息缺失、目標邊角不閉合的缺點;而平移法更加有效地利用了背景差分法準確度高的優(yōu)點,通過八方向的平移之后,提取到的邊緣圖像紋理更加清晰,結構更加完整,與背景中物體具有清晰地分界線,而且邊緣的閉合性更好,這為后續(xù)的處理步驟帶來了極大的方便。
圖2 實驗一結果對比
圖3 實驗二結果對比
由于實驗一中的背景圖像是由背景初始化算法建立的,因此,提取到的目標邊緣中只有前景中的動態(tài)目標。這種情況適用于只需要檢測運動目標的輪廓信息,而不關心后續(xù)的檢測、識別等其他環(huán)節(jié)。而實驗二中的背景圖像是從視頻中隨機提取的,因此圖3的結果中不僅包括前景中的動態(tài)目標,還包括背景中的動態(tài)目標,但是如果每次邊緣檢測過程都進行背景建模,會極大程度地拖慢算法的運算速度,降低算法效率,針對這種情況,下文給出了一種解決辦法,即將邊緣檢測與幀差法相結合進行運動目標檢測。
目標檢測算法在保證檢測準確性的同時,實時性也是一個很重要的方面。對于運動目標檢測算法來說,背景建模及更新是一個很重要的部分,目標檢測的準確性在很大程度上依賴于背景更新的準確程度,而復雜多變的環(huán)境給背景更新帶來了很大的困難,是目標檢測過程中的一個難點問題。因此,為了實時而準確地檢測到運動目標,本文針對上述提到的運動目標邊緣檢測結果中存在非前景目標的缺點,提出了將邊緣特征與幀差法相結合的運動目標檢測方法,該算法不僅可以克服此缺點,還具有無需進行背景建模的優(yōu)點,節(jié)省了檢測過程所需時間,提高了檢測效率。
步驟一 提取隨機掩碼
按照1.3節(jié)中實驗二的步驟提取到如圖3(g)所示的運動目標邊緣,并用形態(tài)學填充算法對邊緣圖像做區(qū)域填充,得到目標的隨機掩碼s,如圖4(a)所示。
這里稱為隨機掩碼,是因為在提取目標邊緣的過程中,背景圖像是從視頻中隨機提取的,檢測到的邊緣圖像中不僅包含前景動態(tài)目標,還包含背景中的動態(tài)目標。
步驟二 三幀差分法提取真實掩碼
1)從視頻序列中提取3幀連續(xù)圖像1、2、3,利用3幀差分法求取運動目標的二值圖像(,)。
(,)=BW(2-1)+BW(3-2) (2)
式中:BW代表二值化函數(shù)。
2)將二值圖像(,)用形態(tài)學閉合及填充算法做處理得到目標的真實掩碼t,如圖4(b)所示,它只包含前景中的動態(tài)目標。
步驟三 提取前景運動目標
將隨機掩碼s與真實掩碼t做與運算,便可以去除隨機掩碼中的非前景目標,得到前景目標m,從而完成運動目標檢測,結果如圖4(c)所示。
m=s×t(3)
圖4(a)是由平移法提取到的隨機掩碼,它具有與原目標形狀及大小更為接近的優(yōu)點,但是它包含背景中的運動目標;圖4(b)是三幀差分法得到的運動目標圖像,該方法具有不受光線及復雜環(huán)境干擾的優(yōu)點,檢測結果中只包含前景動態(tài)目標,但是提取到的目標內(nèi)部會存在空洞現(xiàn)象,為了將空洞填充起來,在后期處理過程中用到了形態(tài)學膨脹和填充算法,在此過程中,目標的尺寸和形狀會發(fā)生變化,通過與原目標對比可以看出,目標尺寸在原來的基礎上擴大了很多;圖4(c)為前景目標,從圖中可以看出,兩者結合之后,不僅去除了隨機掩碼中的非前景目標,而且克服了三幀差分法將目標尺寸擴大的缺點,在不需要建立背景模型的情況下,便可以提取到準確逼真的前景目標。
為了證明該方法的可行性,下述實驗除了采用上文用到的小區(qū)安全監(jiān)控視頻以外,還選取了某會議室的監(jiān)控視頻作為實驗樣本,視頻均為AVI格式,對其分辨率無特殊要求。從各個視頻中提取一幀圖像作為前景圖像,并按照1.3節(jié)實驗二中背景的選取條件從視頻序列中提取一幀圖像作為背景圖像,按照2.1節(jié)的步驟檢測動態(tài)目標。實驗結果如圖5所示。
將圖5中的運動目標圖像和幀差法提取到的真實掩碼及前景圖像作對比可以看出,將邊緣特征與幀差法相結合的方法可以準確地提取到更加逼真的運動目標圖像,目標與背景的分界線更加清晰。同時為了驗證本文算法的準確性,以直接背景差分法的檢測結果為參考(此處的直接是指,背景差分法中的每一幀背景圖像均由背景初始化算法計算得到,經(jīng)驗證無誤的情況下再進行前景目標檢測),在同條件、同圖像的前提下,計算三幀差分法、基于混合高斯背景建模的目標檢測方法和本文算法相對于直接背景差分法的檢測準確率[21],以及3種算法的時間復雜度和空間復雜度。統(tǒng)計結果如表1所示。從表中可以看出,3幀差分法的相對檢測準確率為67.43%,這就意味著幀差法經(jīng)過形態(tài)學處理后的結果中有32.57%的像素點
圖4 邊緣檢測與幀差法相結合的過程
Fig.4 The combination process of edge detection and frame difference
圖5 運動目標檢測((a)~(e)是小區(qū)安全監(jiān)控視頻運動目標檢測,(f)~(j)是某會議室的監(jiān)控視頻運動目標檢測)
不屬于目標本身。而混合高斯模型法的檢測準確率相對于直接背景差分法而言,因為受到背景更新準確度及更新過程中累計誤差的影響,準確率只能達到95.19%,而本文算法的相對檢測準確率可達97.01%。另外,經(jīng)統(tǒng)計發(fā)現(xiàn),在程序運行過程中所占內(nèi)存空間相差不多的情況下,混合高斯模型法所用時間卻是本文算法的5.14倍。
表1 三種算法的性能比較
綜上可知,本文算法不僅檢測準確率較高,實時性較好,而且具有在目標檢測過程中無需進行背景建模及更新的優(yōu)點,擺脫了因背景建模不準確或更新不及時帶來的誤檢測問題,在保證了檢測準確性的前提下,節(jié)省了算法的運行時間,提高了算法的計算效率。另外,經(jīng)過大量實驗證明,本文的算法因為結合了幀差法對環(huán)境變化適應性強的特點,對場景的變化如背景中物體的離開、樹葉的擾動、玻璃的反光等具有較強的適應性。但是算法的缺點是不能處理陰影問題,在檢測過程中還需借助其它算法進行處理。
本文提出了一種基于平移法的動態(tài)目標邊緣檢測算法,采取先差分后檢測的方法,可以去除背景中的動態(tài)目標,提取到只包含前景動態(tài)目標的邊緣圖像。由于平移法是通過將背景差分結果做平移來檢測目標邊緣的,因此與傳統(tǒng)的邊緣檢測算法相比,具有準確度高、細節(jié)信息豐富、閉合性好等優(yōu)點,然后將該邊緣檢測算法與多幀差分法相結合進行運動目標檢測。實驗結果表明,在不出現(xiàn)車輛擁堵的情況下,該方法能夠準確地提取到動態(tài)目標而無需進行背景建模與更新,因此,算法原理簡單,計算速度快,實時性好。但是該算法不能處理陰影問題,且不適于動態(tài)目標過于密集的場景。希望在以后的工作中,能夠較好地解決這兩方面問題,使算法通用性得到進一步提高。
[1] 郝毫剛, 陳家琪. 基于五幀差分和背景差分的運動目標檢測算法[J]. 計算機工程, 2012, 38(4): 146-148.
HAO Haogang, CHEN Jiaqi. Moving object detection algorithm based on five frame difference and background difference[J]., 2012, 38(4): 146-148.
[2] 侯宏錄, 李寧鳥, 劉迪迪, 等. 智能視頻監(jiān)控中運動目標檢測的研究[J]. 計算機技術與發(fā)展, 2012, 22(2): 49-52.
HOU Honglu, LI Ningniao, LIU Didi, et al. Research on moving target detection of intelligent video surveillance[J]., 2012, 22(2): 49-52.
[3] Neto B, Goutsias J. Object-based image analysis using multiscale connectivity[J]., 2005, 27(6): 892-907.
[4] Barron J L, Fleet D J, Beauchemin S S. Performance of optical flow techniques[J]., 1994, 12(1): 43-77.
[5] 王圣男, 郁梅, 蔣剛毅. 智能交通系統(tǒng)中基于視頻圖像處理的車輛檢測與跟蹤方法綜述[J]. 計算機應用研究, 2005, 22(9): 9-14.
WANG Shengnan, YU Mei, JIANG Gangyi. Review on vehicle detection and tracking techniques based on video processing in intelligent transportation systems[J]., 2005, 22(9): 9-14.
[6] Rene V, Ravichandran A. Optical flow estimation and segmentation of multiple moving dynamic textures[C]//2005(S. 1.), 2005: 516-521.
[7] 佘青山, 楊偉健, 田卓, 等. 基于運動輪廓標記提取的分水嶺運動目標檢測[J]. 大連理工大學學報, 2014, 54(6): 656-661.
SHE Qingshan, YANG Weijian, TIAN Zhuo, et al. A watershed moving target detection based on motion contour marks and extraction[J]., 2014, 54(6):656-661.
[8] 董久敏, 王枚, 潘國華, 等. 一種基于邊緣特征的背景差分運動目標檢測方法[J]. 海軍航空工程學院學報, 2011, 26(2): 173-176.
DONG Jiumin, WANG Mei, PAN Guohua, et al. A background difference moving target detection method based on edge character[J]., 2011, 26(2): 173-176.
[9] Herrero E, Orrite C, Senar J. Detected motion classification with a double background and a neighborhood-based difference[J]., 2003, 24(12): 2079-2092.
[10] ZANG Huaiquan, CHEN Shuanyong. Electric power steering simulation analyze based on fuzzy PID current tracking control[J]., 2011, 7(1): 119-126.
[11] 余燁, 曹明偉, 岳峰. 一種改進的Vibe運動目標檢測算法[J]. 儀器儀表學報, 2014, 35(4): 924-931.
YU Ye, CAO Mingwei, YUE Feng. An improved Vibe algorithm for detecting moving objects[J]., 2014, 35(4): 924-931.
[12] 雷飛, 黃文路, 張澤. 基于邊緣檢測與碼本模型的運動目標檢測算法[J]. 科學技術與工程, 2013, 13(24): 7234-7239.
LEI Fei, HUANG Wenlu, ZHANG Ze. Motion targets detection algorithm based on edge detection and codebook model[J]., 2013, 13(24): 7234-7239
[13] 劉軍, 梁久禎, 柴志雷. 基于DM642的運動目標檢測[J]. 計算機工程與科學, 2013, 35(1): 107-112.
LIU Jun, LIANG Jiuzhen, CHAI Zhilei. Motion target detection based on DM642[J]., 2013, 35(1): 107-112.
[14] Titsias M K, Williams C K. Unsupervised learning of multiple aspects of moving objects from video[R].(including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2005, 3476: 746-756.
[15] 郭春生, 王盼. 一種基于碼本模型的運動目標檢測算法[J]. 中國圖象圖形學報, 2010, 15(7): 1079-1083.
GUO Chunsheng, WANG Pan. An algorithm based on codebook model to moving objects detection[J]., 2010, 15(7): 1079-1083.
[16] 魏國劍, 侯志強, 李武. 基于邊緣差分的運動目標檢測方法[J]. 計算機工程與設計, 2013, 34(10): 3530-3534.
WEI Guojian, HOU Zhiqiang, LI Wu. Moving object detection algorithm based on edge subtraction[J]., 2013, 34(10):3530-3534.
[17] 王小俊, 劉旭敏, 關永. 基于改進Canny算子的圖像邊緣檢測算法[J]. 計算機工程, 2012, 38(14): 196-202.
WANG Xiaojun, LIU Xumin, GUAN Yong. Image edge detection algorithm based on improved Canny operator[J]., 2012, 38(14):196-202.
[18] 王東霞, 許偉昶. 基于改進的數(shù)字形態(tài)學邊緣檢測算法研究[J]. 實驗室研究與探索, 2014, 33(2): 89-92.
WANG Dongxia, XU Weichang. Edge detection algorithm based on improved mathematical morphology[J]., 2014, 33(2): 89-92.
[19] 何春, 葉永強, 姜斌, 等. 一種基于分數(shù)階次微積分模板的新型邊緣檢測方法[J]. 自動化學報, 2012, 38(5): 776-786.
HE Chun, YE Yongqiang, JIANG Bin, et al. A novel edge detection method based on fractional-order calculus mask[J]., 2012, 38(5): 776-786.
[20] 火元蓮, 秦梅, 邱振. 基于區(qū)間分布密度的背景初始化方法[J]. 計算機工程與科學, 2015, 37(9): 67-72.
HUO Yuanlian, QIN Mei, QIU Zhen. Background initialization method based on interval distribution density[J]., 2015, 37(9): 67-72.
[21] 李鵬飛, 陳朝武, 李曉峰. 智能視頻算法評估綜述[J]. 計算機輔助設計與圖形學學報, 2010, 22(2): 352-360.
LI Pengfei, CHEN Chaowu, LI Xiaofeng. An overview for performance evaluation of intelligent video algorithms[J]., 2010, 22(2): 352-360.
Moving Target Detection Method Based on Edge Character and Multiple Frame Difference
HUO Yuanlian,QIN Mei,SONG Yali
(College of Physics and Electronic Engineering, Northwest Normal University, Lanzhou 730070, China)
Aiming at the shortcomings of traditional edge detection algorithms, whose results are discontinuous and easy to lose detailed information, the paper proposes an edge detection method which can be used for moving target detection. First, the target edge is detected on the basis of background difference by translation, whose result is more accurate containing more detailed information and closing better; then the moving targets are detected by combining the edge detection with multiple frame difference. The advantage of this method is that it doesn’t need background modeling and update in the whole process of target detection. Results show that this method is simple, accurate and easy to implement, and it could get a better time-consuming.
edge detection,translation,target mask,target detection,multiple frame difference
TP751.1
A
1001-8891(2017)02-0157-06
2016-06-22;
2016-09-06.
火元蓮(1973-),女,博士,副教授,研究方向為信號與信息處理。
國家自然科學基金(61561044);西北師范大學青年教師科研能力提升計劃骨干項目(NWNU-LKQN-13-2);2013年甘肅省高?;究蒲袠I(yè)務費項目。