張冬梅 武杰 李丕丁
摘要:近年來,機器視覺技術的發(fā)展越來越迅速,對視覺圖像信息的智能處理也成為了研究重點,基于人工智能算法和資源構架的運動目標檢測算法作為機器視覺領域的核心技術,在很多領域中發(fā)揮著關鍵性作用,具有重要的研究意義,本文首先對運動的目標檢測過程中所用到的相關圖像處理方法進行了描述,包括圖像的預處理、分割、特征提取等方法。其次描述了這幾年來常用的運動目標檢測算法,即光流法、幀間差分法、背景差分法。簡單分析了方法原理、對比了3個方法的優(yōu)缺點,并介紹了這幾個算法的適用場景。
關鍵詞: 機器視覺技術; 圖像預處理; 圖像分割; 特征提取; 運動目標檢測
【Abstract】 In recent years, The development of machine vision technology is more and more rapid, and the intelligent processing of visual image information has also become a research focus. The motion target detection algorithm based on artificial intelligence algorithm and resource architecture is the core technology in the field of machine vision, which plays an important role in many fields and has great research significance. This paper first describes the related image processing methods used in the detection of moving target, including image preprocessing, segmentation and feature extraction. Secondly, the paper describes the moving target detection algorithms commonly used in recent years , including optical flow method, interframe difference method and background difference method. Finally, the paper briefly analyzes the corresponding theories, compares the advantages and disadvantages of the three methods and introduces the applicable scenarios of these algorithms.
【Key words】 ?machine vision; image preprocessing; image segmentation; feature extraction; ?moving target detection
0 引 言
機器視覺是一個可以自動獲取有關目標圖像,并對所得圖像的各種特征進行分析、處理及對結果做出解釋,從而得到有關目標的某種認識來做出決策的系統(tǒng)。運動目標檢測技術是機器視覺系統(tǒng)的功能之一,是指在序列圖像中檢測出變化區(qū)域并將運動目標從背景圖像中提取出來的過程,該項研究旨在通過檢測出視頻圖像序列中與攝像頭發(fā)生相對移動的運動物體,為后續(xù)目標的提取和跟蹤提供具有說服力的數(shù)據(jù)源。運動目標檢測算法通常面向于特定的應用場景,目前還沒有一個通用的算法能適用于所有場合,也就是說每個算法都有其一定的應用范圍。即使這些檢測算法在同一環(huán)境下工作,也是各有優(yōu)缺點。運動目標檢測算法從應用對象的角度來看,主要分為2種:光流法和圖像相鄰幀間的差分算法。其中,基于圖像相鄰幀間的差分算法還可以分為幀差法和背景相減法。
1 機器視覺圖像預處理
通常情況下,因為有很多噪聲的干擾和條件上的限制,運動目標檢測系統(tǒng)獲取的圖像不能直接在視覺系統(tǒng)中使用,而是先要進行圖像預處理來提高所獲取的圖片的質量。圖像預處理的目的是消除圖像中無用的噪聲來改善有用信息的可檢測性,通常包含著灰度化、幾何變換、圖像增強這幾個流程[1],主要方法有平均值法、最大值法、加權平均值法和分量法[1]。其中,圖像幾何變換通過圖像平移、圖像鏡像、圖像轉置、圖像旋轉、圖像縮放等幾何變換對采集的圖像進行處理[1],用于修正圖片采集儀器位置的隨機誤差和采集系統(tǒng)中的系統(tǒng)誤差。圖像增強可分為空域法和頻域法[1]。目前使用較多的是空域法,空域法大致可分為3種類型,分別為:灰度變換、用于消除噪聲的各類平滑方法以及用于增強邊緣的各類銳化方法。其中,灰度變換是在圖像的單個像素上操作的,通過點運算來改變圖像像素的灰度值;而平滑和銳化都是通過圖像濾波來進行操作的。圖像濾波可分為線性濾波和非線性濾波[2-3]。因為非線性濾波既可以保護圖像細節(jié)又可以去除噪聲,所以成為了當前圖像濾波方法中的研究熱點。非線性濾波最常用的方法有Kalman濾波和粒子濾波。Kalman濾波簡單易實現(xiàn),具有良好的魯棒性[4],被普遍應用在機器視覺跟蹤領域 。雖然粒子濾波算法[5]可以作為解決SLAM問題的有效手段,但是仍然存在需要用大量的樣本數(shù)量、樣本貧化、樣本數(shù)量的自適應采樣策略等問題,是當前該算法的研究重點。圖像的預處理在機器視覺圖像目標識別的過程中起到了重要的作用。
2 機器視覺圖像分割
圖像分割是指利用顏色、灰度、紋理和空間幾何等特征把圖像分成若干個特定的區(qū)域,使這些特征在同一塊區(qū)域里顯示出相似性或者相同性,但是在不同的區(qū)域又顯示出明顯的差異性。圖像分割是機器視覺中對圖像目標自動識別的關鍵步驟,其分割后的圖像質量對后面圖像分析處理有著重要的影響。如何快速、精確地把目標從復雜的圖像中分割出來是國內(nèi)外學者一直以來的研究重點[2]。圖像分割的常用方法有區(qū)域分割法、閾值分割法、邊緣檢測法[6]。近年來還提出了深度學習分割法[7],其基本思想是通過建立神經(jīng)網(wǎng)絡,對樣本進行訓練來達到分割的目的。但是該方法也有一定不足,就是需要對大量的數(shù)據(jù)進行訓練、沒有一個通用的網(wǎng)絡結構。
3 機器視覺特征提取
在機器視覺圖像目標識別研究中,特征提取對目標識別的精確度和速度有著重要的影響。目前,圖像特征提取的方法主要可分為顏色特征、形狀特征、空間關系特征和紋理特征[8]。其中,顏色特征提取[9]是一種全局特征,用來描述圖像或者圖像的區(qū)域相對應的景物的表面性質。該方法適用于描述難以進行自動分割的圖像。其缺點是對圖像的區(qū)域的方向、尺寸等變化不敏感,對于圖像中目標的局部特征不能很好地檢索到[9]。形狀特征提取能夠利用圖像中某個有用的目標來檢索[10],但是卻缺乏完好的數(shù)學模型,目標發(fā)生形變時檢索得到的結果不可靠[11-12],對目標進行全面描述時對計算時間和存儲量的要求比較高。空間關系特征的提取能夠加強對圖像的內(nèi)容的描述及區(qū)別能力,其缺點是對圖像目標的尺度變化、反轉、旋轉較敏感。此外在實際應用中,為了更好地檢索到目標,除空間關系特征外,還需與其他特征相結合。圖像紋理特征提取可以有效地描述區(qū)域性的特征,與此同時,紋理特征還具有旋轉不變性,抗噪抗干擾能力也較強[13-14]。但其缺點是可能受到光照和反射的影響,紋理偏差可能隨圖像分辨率發(fā)生變化而變大。圖像特征提取方法的提取效率較高,因此近年來圖像特征提取方法吸引了國內(nèi)外眾多學者的高度關注,并得到了廣泛應用。但是還存在一些問題,比如系統(tǒng)的計算較復雜、沒有統(tǒng)一的評價標準。
4 基于機器視覺的運動目標檢測方法
4.1 幀間差分法
幀間差分法對時間上連續(xù)的2幀或若干個幀圖像進行差分運算,不同幀對應的像素點相減,判斷灰度差的絕對值,當絕對值超過一定閾值T時,即判斷為現(xiàn)運動目標,從而實現(xiàn)運動目標的檢測功能。
幀間差分法的優(yōu)點是受緩慢變化的背景和光線的影響較小,能根據(jù)幀序列的移動來較快的適應。該算法簡單易實現(xiàn),程序設計也不復雜,整體來說運動目標檢測的靈敏度比較高。但經(jīng)過分析可知,其缺點主要是檢測位置并不準確,目標運動速度過快、相鄰幀間的目標運動位移比較大時會影響運動目標區(qū)域的定位以及運動目標特征參數(shù)的準確提取[15]。另外,閾值的選擇對檢測結果有直接影響,一般情況下會決定目標檢測的范圍。特別地,若閾值是預先定義而非自適應得到的,則會增加差分圖像中的噪聲點和運動目標點的誤判率。雖然幀間差分法可能無法提取完整的目標圖像,但該方法計算量小、簡單快速、易于優(yōu)化[16]。因此被廣泛應用。
4.2 背景差分法
背景差分法是指通過當前的幀圖像減去背景圖像來獲取運動區(qū)域的方法。和幀間差分法相似,其基本思想是用不同圖像的差分運算來提取運動目標區(qū)域。但是與幀間差分法不同的是,背景減法是將當前幀圖像與一個連續(xù)更新的背景模型相減,在差分圖像中提取運動目標,而不是將當前幀圖像與相鄰幀圖像相減。背景差分法流程如圖2所示。
背景差分法進行目標檢測主要包括4個步驟:背景建模、背景更新、目標檢測和后期處理。其中,背景建模和背景更新是核心與關鍵。背景模型的建立將直接影響到目標檢測的效果。背景建模是指通過數(shù)學方法,構建一種可以表示“背景”的模型。獲取背景的最好方法是在沒有運動目標的情況下獲取一幀靜態(tài)的圖像作為背景,但在現(xiàn)實生活中,由于光照變化、天氣變化、目標運動陰影等諸多因素的影響,這種情況卻很難實現(xiàn)。
背景差分法計算上較為簡單,容易實現(xiàn)[17]。 在實際運用時,依據(jù)實際情況來確定閾值,從結果中可以直接看出運動目標的大小、位置等信息,能夠獲得較準確的運動目標信息。該算法可以用于固定背景或目標運動速度緩慢變化的情況,其核心是場景靜態(tài)背景圖像的準確獲取。缺點是容易受到外部因素的干擾,例如背景的變化、光照的變化[18]都會影響最終的檢測結果。
4.3 光流法
光流法是指圖像中圖案的移動速度,屬于二維瞬時速度場的范圍。運動目標的光流法檢測的原理為:首先,對圖像中每個像素的一個速度矢量進行初始化,形成圖像運動場;其次,在運動中的一個特定的時刻里,根據(jù)投影關系對圖像區(qū)域的點圖進行映射;最后,根據(jù)圖像中每個像素的速度矢量的特點,對其進行動態(tài)分析。在此過程中,若圖像中無運動目標,則整個圖像區(qū)域的光流矢量會呈現(xiàn)出不斷變化的趨勢;若有運動目標,圖像中背景和運動目標存在相對運動,從而導致相鄰背景的速度矢量與運動目標所形成的速度矢量存在差異,如此以來即可檢測到運動物體及其位置。在實際運用中,光流法的計算量非常大,對噪聲免疫力差,不能用于實時處理[19]。
分析表1可知,幀間差分法的優(yōu)點是對光線強度變化不敏感;缺點是對快速運動的目標提取的目標區(qū)域很大;可能提取不到緩慢移動的目標邊界,簡而言之就是對運動目標的檢測是不精確,易出現(xiàn)“空洞”;并主要適用于動態(tài)環(huán)境[18]。背景差分法易受光線變化、運動陰影[15]和外部條件引起的場景變化的影響,但是在提取目標時更為準確。光流法檢測運動目標無需預先知道任何與場景有關的信息[21],可以直接應用在攝像機移動下的目標檢測和跟蹤。但是,該方法的不足就是計算非常復雜,對噪聲免疫力差,使其無法應用于實時處理。
針對上述3種傳統(tǒng)方法的不足,國內(nèi)外學者已提出了諸多改進算法,例如背景相減法結合幀差法、混合高斯模型、單個高斯模型、基于統(tǒng)計的方法等[16]。雖然如此,但到現(xiàn)在為止卻仍未推出一種可適用于任何場景、任何情況的通用算法。
5 結束語
目前,運動目標檢測技術已廣泛應用在日常生活、工業(yè)、軍事、醫(yī)療、農(nóng)業(yè)等方面,因而現(xiàn)已成為學界的研究熱點。但是到目前為止還未給出一個統(tǒng)一的目標檢測算法。隨著時代的發(fā)展,運動目標檢測算法的應用越來越多,其復雜性也不斷提升,需要解決的問題也在增多。所以應該把基于機器視覺的目標檢測算法的研究與算法理論、新技術相結合,這樣運動目標檢測技術將會發(fā)展得更快速、更精確。
參考文獻
[1] Joaming. 圖像處理之預處理方法[EB/OL]. [2018-08-28]. https://blog.csdn.net/joaming/article/details/82146604.
[2]張中良. 基于機器視覺的圖像目標識別方法綜述[J]. 科技與創(chuàng)新,2016(14):32.
[3]王靖,李少華,謝守勇. 基于機器視覺的目標識別方法研究[J]. 西南師范大學學報(自然科學版),2015,40(6): 130.
[4]HOUTEKAMER P L,MITCHELL H L. A sequential ensemble Kalman filters for atmospheric data assimilation[J]. Monthly Weather Review,2001,129(1):123.
[5]王法勝,魯明羽,趙清杰,等. 粒子濾波算法[J]. 計算機學報,2014,37(8):1679.
[6]侯紅英,高甜,李桃. 圖像分割方法綜述[J]. 電腦知識與技術,2019,15(5):176.
[7]王秋萍,張志祥,朱旭芳. 圖像分割方法綜述[J]. 信息記錄材料,2019,20(7):12.
[8]王志瑞,閆彩良. 圖像特征提取方法的綜述[J]. 吉首大學學報(自然科學版),2011,32(5):43.
[9]LI P. An adaptive binning color model for mean shift tracking[J]. IEEE Transactions on Circuits and Systems for Video Technology,2008,18(9):1293.
[10]CLAUSI D A. Comparison and fusion of co-occurrence,Gabor and MRF texture for clasification of SAR sea ice imagery [J]. Atmosphere Oceans,2001,39(4):183.
[11]RANGAYYAN R M,EI-FARAMAWY N M,LEO DE-SAUTELS J E,et al.Measures of acutance and shape for classification of breast tumors [J]. IEEE Transactions on Medical Imaging,1997,16(6):799.
[12]LIANG Shen,RANGAYYAN R M,LEO DESAULTELS J E.Detection and classification of mammographic calcification [J]. International Journal of Pattern Recognition and Artificial Intelligence,1993,7(6):1403.
[13]OHANIAN P P,DUBES R C.Performance evaluation for four classes of textural features [J]. Pattern Recognition,1992,25(8):819.
[14]CLAUSI D A,YUE B. Comparing co-occurrence probabilities and Markov random fields for texture analysis of SAR sea ice imagery [J]. IEEE Transactions on Geoscience and Remote Sensing,2004,42(1):215.
[15]王慧. 運動目標檢測和跟蹤算法綜述[J]. 電腦知識與技術,2018,14(24):194.
[16]常向魁. 視頻運動目標跟蹤算法研究[D]. 開封:河南大學,2007.
[17]程愛靈,黃昶,李小雨. 運動目標檢測算法研究綜述[J]. 信息通信,2017(1):12.
[18]彭艷芳. 視頻運動目標檢測與跟蹤算法研究[D]. 武漢:武漢理工大學,2010.
[19]MISHRA S K, BHAGAT K S. Human motion detection and video surveillance using MATLAB[J]. International Journal of Scientific Engineering and Research (IJSER) ,2014,3(7): 154.
[20]CHO H, RYBSKI P E, BAR-HILLEL A, et al. Real-time pedestrian detection with deformable part models[C]//2012 IEEE ?Intelligent Vehicles Symposium (IV). Alcala de Henares, Spain:IEEE, 2012:1035.
[21]朱宏. 基于視頻序列的運動目標檢測與跟蹤技術研究[D]. 成都:西南交通大學,2008.
[22]KANKANHALLI M S,MEHTRE B M,WUR K.Cluster-based color matching for image retrieval[J]. Pattern Recognition,1996,29(4):701.
[23]LIANG Shen,RANGAYYAN R M,LEO DESAUTELS J E. Application of shape analysis to mammo-graphic calcification [J]. IEEE Transactions on Medical Imaging,1994,13(2):263.