摘 要:監(jiān)控視頻圖像的背景多種多樣,簡單背景和動態(tài)復雜背景中的運動目標的特點不同、所采取的檢測方法也要有所不同。主要對目前的運動目標檢測算法進行了闡述,根據(jù)各自算法的特點做了區(qū)分,選取了幀間差法和背景差法用于簡單背景下的運動目標檢測,而動態(tài)復雜背景下的運動目標檢測算法則主要采用光流法、高斯建模、ViBe算法,最后對五種算法進行了總結和對比。
關鍵詞:復雜背景;運動目標;檢測;光流法;高斯模型
1 概述
運動目標檢測是智能視頻監(jiān)控系統(tǒng)的重要的基礎技術,也是視頻系統(tǒng)中行為識別、目標跟蹤等智能分析技術的基礎,在國家和社會公共安全、航空航天等重要領域以及很多民用領域都有著舉足輕重的作用,在目標跟蹤、人機交互、交通管控、視頻檢索等領域都有實踐價值。視頻系統(tǒng)中的運動目標檢測的應用前景非常巨大,市場需求廣泛,所以受到了全球相關領域研究者的高度關注,很多研究者提出了自己的算法。但是,各種算法都有自己的特點和適用對象,在不同的背景情況下,選取不同的算法實現(xiàn)運動目標的檢測是較為合理的思路。
2 運動目標檢測的概念
(1)運動目標檢測的概念
運動目標檢測是指在將圖像畫面中的運動目標及運動軌跡利用特殊的方法從圖像背景中提取出來,并利用技術手段消除或抑制圖像的背景噪聲和前景噪聲,得到需要檢查的目標[1]。
(2)運動目標的分類以及各自特點
小目標,是指在圖像中的成像投影小到沒有形狀的目標(與目標本身的尺寸大小無關,而是由于距離檢測點較遠)[2]。小目標在圖像中的成像很小,它在整個圖像序列中連續(xù)運動,與圖像背景和圖像噪聲的運動情況有明顯的差異,一般以幀為單位檢測目標。
大目標,是指在圖像背景中先初步確定目標的輪廓和軌跡,然后再利用幀間信息進行確認與對比。
(3)背景的分類以及各自常用的檢測方法
視頻信息中的背景大致分為兩種:第一種是攝影機器保持不動,只有目標運動,這種場景叫簡單背景,也叫靜態(tài)背景;第二種是目標在運動而且攝影機器也在運動,這樣的場景叫復雜背景,也叫動態(tài)背景[3]。
在拍攝靜態(tài)背景的視頻時,攝像頭不動,所以得到的視頻圖像的背景是靜止的、多幅圖像的背景是相同的。靜態(tài)背景中運動目標的檢測就變得簡單很多。適合靜態(tài)背景中的最為經典的檢測算法有背景差法、幀間差分法等。然而,復雜背景(動態(tài)背景)中,被檢測目標和攝像頭都在運動,除了由于運動目標產生的圖像變化之外,還有圖像背景本身的變化,以及運動目標運動過程中運動目標與背景物體相互影響所產生的光照陰影等,使得檢測不但受環(huán)境的改變而且還會受到目標和背景本身的影響,這種變化不但復雜而且毫無規(guī)律可循。因此,動態(tài)背景中運動目標檢測非常困難。
3 運動目標檢測算法
運動目標的主流檢測算法主要有幀間差分法、背景差法、光流法、高斯建模和vibe算法等[3-12]。幀間差分法和背景差法需要檢測背景相對平穩(wěn),更適合靜態(tài)背景中運動目標的檢測。在動態(tài)復雜背景中常用的檢測算法是光流法、混合高斯建模、Vibe算法等。
3.1 簡單背景下運動目標檢測算法
(1)幀間差分法
幀間差分法即幀差法,它是視頻圖像的運動目標檢測中最為經典的算法。幀間差分法常常使用在環(huán)境變化很小的情況下。目前的攝影機每秒可以拍攝至少8/12/24幀圖像,所以相鄰的兩幀圖像時間間隔很短,可以利用前后兩幅圖像的差值來判斷圖像中的運動目標。將相鄰兩幀圖像進行像素值相減,如果所得到的像素差值很小,則可以認為此處目標是靜止的,反之,如果得到的像素差值很大,則此處為運動物體。由算法原理可以看出幀間差分法的本質是利用相鄰幀圖像的對應像素值之差來確定運動目標的輪廓[13],所以它適合于背景變化很小的情形。幀差法雖然對各種環(huán)境均有較好的適應性和穩(wěn)定性,但是,該法不能提取運動目標的所有相關的特征像素點,因此在運動目標內部會產生所謂的空洞現(xiàn)象。
(2)背景差法
背景差法也是常用的運動目標的檢測算法之一,它的基本原理是將運動目標與背景模型進行比較,通過判定圖像的特征變化或直方圖等統(tǒng)計數(shù)據(jù)的變化來檢測運動目標[14]。
背景差法在圖像背景沒有變化或者變化很小時,可以比較完整地檢測出視頻圖像中運動目標。但是對于背景經常變化的情形,需要頻繁地更新背景。背景的更新使得背景差法非常復雜、計算量很大,難以用于運動目標的實時檢測。背景差法的實現(xiàn)方法和幀間差分法大致相同,都是進行相減操作,不同之處在于幀間差分法的相減是相鄰幀之間的差分運算,而背景差法中需要建立背景模型,把背景模型和檢測幀進行差分運算。
3.2 復雜背景下運動目標檢測算法
(1)光流法
光流是運動目標的被觀測面上的像素點因為目標運動所產生的瞬時速度場,包含了目標物體的表面結構和動態(tài)運動的重要特征[15]。光流法利用像素點速度場的補償來檢測運動目標,可以有效地去除背景動態(tài)變化對運動目標檢測所帶來的不良影響。光流法大致可分為三類:
基于匹配的光流計算法:包括基于特征匹配和基于區(qū)域匹配的兩種。前者是連續(xù)地對運動目標的主要特征點進行定位和跟蹤,這種算法優(yōu)點在于對大目標的運動和亮度變化具有很好的適應性,其缺點是是光流通常很稀疏,且特征提取和匹配都很十分困難。后者先對相似度很高的區(qū)域進行定位,然后根據(jù)相似區(qū)域的位移計算光流,這種基于區(qū)域的匹配方法在視頻編碼中非常普及,但它計算的光流不完整,難以用于運動目標的檢測定位。
基于頻域的光流計算法:利用濾波調節(jié)輸出頻率或相位信息,獲得高精度的初始光流估計,這種方法計算復雜,且要想得到可靠性數(shù)據(jù)也十分困難,所以,同樣不適合于運動目標的檢測定位。
基于梯度的光流計算法:此種方法是指用圖像序列的時空微分計算光流。對畫面中圖像像素點首先進行逐個矢量賦值,當畫面中出現(xiàn)運動目標時,運動目標在畫面總所占據(jù)的像素點和背景像素點之間的矢量必然出現(xiàn)差異,利用運動目標與背景之間的差異,檢測出運動目標在畫面中的像素點[15]。如果沒有運動目標出現(xiàn),則畫面中的像素點的矢量變化是平滑的。相對而言,基于梯度的光流計算方法更實用。
光流法適合于攝影機運動的情況,但是光流法時間復雜度高,不能滿足實時檢測的要求。
(2)混合高斯模型算法
混合高斯模型是一種典型的背景建模算法,其原理是將運動目標的像素與背景模型進行統(tǒng)計對比,和背景模型相似度比較高的像素點看作背景,相似度比較低的像素點視為前景,選擇中心點和對應的系數(shù)更新模型,再利用形體特征進行運動目標檢測[16]。在混合高斯模型算法中,背景模型對應一個更新參數(shù),如果背景發(fā)生變化,只要更新背景模型就能重新檢測到目標。
混合高斯模型是由M個(一般為3到5個)單高斯模型組成的。在獲取新的一幀圖像之后,如果當前圖像中的像素點與該像素的M個模型中的某一個相似度比較高,則視為背景,并將當前幀的像素作為一個新模型,對已存在的M個模型進行更新。如果匹配度比較低,則為前景點。圖像中每個像素點的值在短時間內都是圍繞特定的中心值呈正態(tài)分布。整個混合高斯模型算法主要有方差和均值兩個參數(shù),這兩個參數(shù)直接影響該算法的正確性、穩(wěn)定性[17~18]。
3.3 ViBe算法
ViBe算法在2011年被Marc Van Droogenbroeck和Olivier Barnich提出,ViBe算法也是背景建模算法的一種,其主要特點是Vibe算法背景的更新是隨機的,更利于復雜背景中運動目標實時檢測,是現(xiàn)階段較為前沿的算法之一。ViBe算法主要是利用單幀視頻序列初始化背景模型,對于每一個像素點,隨機選擇它的鄰域點的像素值作為它的模型樣本值[17]。
Vibe算法中,更新方式采用八鄰域方法,可以抑制由于獲取視頻時因攝像機抖動、目標微動而產生的重影和誤差,讓檢測目標更加準確。由于每次背景模型更新的個數(shù)相近,所以我們把第一幀背景更新的次數(shù)作為比較值,對背景模型進行重新初始化,這樣可以避免由于大面積的光照變化導致的誤判。ViBe算法的背景更新是隨機的。在時間上,在背景模型中隨機抽取一幀圖像的像素值作為比較值,重新選擇一幀的新圖像,如果新圖像的像素值與比較值相差太大,則圖像就被判斷為背景,需要被更新;在空間上,從背景鄰域中隨機抽取一個像素點,用這個像素點的來替換掉這個鄰域周圍的像素點[17,19]。
Vibe算法對噪聲的反應比較靈敏,計算量小、速度快,可以很快地進行運動目標的檢測。
4 結束語
運動目標的檢測容易受到環(huán)境的影響,面臨的主要問題有:光照變化、局部遮擋、目標尺度變化、圖像抖動,噪聲干擾,光線變化,陰影,區(qū)域內部反光,運動目標緩慢移動等。在根據(jù)背景做運動目標檢測時,可以根據(jù)不同情況選取不同的檢測算法。在簡單背景情形中,可以選擇幀間差分法和背景差法。幀間差分法動態(tài)性強,能夠適應動態(tài)背景下的運動目標檢測。但是該法的實現(xiàn)原理導致了該法檢測出的運動目標輪廓內部很可能出現(xiàn)許多空洞,有時甚至無法得到目標的邊界。背景差法在背景不變或變化很小時可以準確地獲取運動目標,但是由于通常需要緩沖若干幀來完成背景減除,因此需要消耗大量的內存,這使其使用范圍受到了限制。在復雜背景也就是動態(tài)背景情形下,適合采用光流法、高斯混合模型、Vibe算法。光流法在攝像機運動、背景變化時,也能檢測出運動目標,并且它能同時完成運動目標檢測和跟蹤,但是該方法的計算復雜度高,也容易受到噪聲、光照變化和背景擾動的影響。高斯混合模型通過對背景的不斷更新,使系統(tǒng)能對背景變化自適應。但是,高斯混合模型對于全局光照變化、陰影非常敏感,對于緩慢的運動目標檢測效果也不理想。Vibe算法是較為前沿的背景建模的運動目標檢測算法,在更新模型時利用了圖像像素值的空間傳播特性,背景模型逐漸向外擴散,能快速識別并且消除Ghost區(qū)域,在前景檢測和背景模型更新上都存在顯著優(yōu)勢。
參考文獻
[1]BERND Jahne. Digital Image Processing[J].Springer,2000:7-13.
[2]LOWE D. Distinctive Image Features from Scale Invariant Keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
[3]白曉方.復雜背景下運動目標檢測與跟蹤技術研究[D].中北大學,2014.
[4]王歡.復雜背景下運動目標檢測與跟蹤研究[D].北京理工大學,2015.
[5]C.Harris, M. Stephens. A Combined Corner and Edge Detector[C].In Proceedings of the Fourth Alvey Vision Conference,1988:147-151.
[6]解曉萌.動態(tài)背景下運動目標檢測關鍵技術的研究[D].華南理工大學,2012.
[7]駱勇.復雜場景下運動目標檢測關鍵技術研究[D].上海交通大學,2012.
[8]鐘必能.復雜動態(tài)場景中運動目標檢測與跟蹤算法研究[D].哈爾濱工業(yè)大學,2010.
[9]徐功益.復雜背景下運動目標檢測方法[D].中國科學院研究生院,2007.
[10]黃大衛(wèi).復雜場景下的運動目標檢測算法研究[D].安徽大學,2016.
[11]張輝.復雜場景圖像序列中運動目標檢測與跟蹤研究[D].北京理工大學,2010.
[12]張森悅.復雜背景下運動目標檢測方法研究[D].沈陽航空工業(yè)學院,2009.
[13]HOWZE JW. Robust tracking, error feedback and two-degree-of-freedom controller[J].IEEE Trans AC, 1997,47(7):980-983.
[14]CHRIS Stauffer, W.E.L Grimson. Learning Patterns of Activity Using Real-time Tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):747-757.
[15]張金林,萬蔚,芮挺,等.基于改進的Lucas-Kanade光流估算模型的運動目標檢測[J].微計算機信息,2010.
[16]郝毫剛.基于五幀差分和背景差分的運動目標檢測算法[D].上海理工大學,2012.
[17]王小霞.復雜場景運動目標檢測[D].東華大學,2014.
[18]李博川,丁軻.結合陰影抑制的混合高斯模型改進算法[J].計算機工程與科學,2016,3.
[19]洪飛.復雜背景下運動目標跟蹤算法研究[D].西安電子科技大學,2013.
作者簡介:王春蘭(1980,2-),女,重慶,碩士,講師,研究方向:圖像處理。