◆張海霞 朱泰全 鄧宇航 蘭汶鑫 許燕
基于跟蹤算法的圖像識別方法研究
◆張海霞 朱泰全 鄧宇航 蘭汶鑫 許燕指導(dǎo)老師
(西北民族大學(xué)數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院 甘肅 730124)
當(dāng)今社會處于信息技術(shù)高速發(fā)展的階段,隨著人工智能的興起,計算機(jī)技術(shù)被應(yīng)用于各個行業(yè)的各個方面,其中圖像識別技術(shù)的運(yùn)用得到了很大程度的普及,很多個領(lǐng)域都在使用圖像識別技術(shù),圖像識別技術(shù)也越來越成熟,變得越來越多元化,本文旨在深入研究跟蹤算法,并結(jié)合現(xiàn)在的圖像識別技術(shù),探討并研究基于跟蹤算法的圖像識別方法的實(shí)現(xiàn)以及優(yōu)化,以及將其應(yīng)用于智能化教學(xué)視頻錄播系統(tǒng)。
跟蹤算法;圖像識別;目標(biāo)檢測
對于運(yùn)動目標(biāo)的跟蹤屬于視頻分析的知識,也需要對圖像序列進(jìn)行處理,從而研究運(yùn)動目標(biāo)的規(guī)律,或者為系統(tǒng)的決策報警提供語義和非語義的信息支持,包括運(yùn)動檢測、目標(biāo)分類、目標(biāo)跟蹤、行為理解、事件檢測等。由于線上教育的快速發(fā)展,現(xiàn)在越來越多的人通過線上的錄播課、直播課等進(jìn)行學(xué)習(xí),而往往這種線上課堂相對于線下課堂的教學(xué)來說會有一定的限制,為了從各個方面提高線上教育的效率以及縮小其劣勢,研究基于跟蹤技術(shù)的圖像識別技術(shù)有著重大的實(shí)用價值。
本項目研究的主要問題以及難點(diǎn)的概要解決方案如下。
在視頻中目標(biāo)往往具有運(yùn)動特性,這些特性來源有目標(biāo)本身的形變,目標(biāo)本身的運(yùn)動,以及相機(jī)的運(yùn)動。所以需要引入多幀,這樣我們不僅可以獲得好多幀目標(biāo)的外觀信息,還能獲得目標(biāo)在幀間的運(yùn)動信息。
具體可采用以下三種方式:
第一種:側(cè)重于目標(biāo)的運(yùn)動信息。
先基于motion segmentation或是background extraction (光流法和高斯分布等)實(shí)現(xiàn)對前景和背景的分離,也就是說,我們借助運(yùn)動信息挑出了很有可能是目標(biāo)的區(qū)域;再考慮連續(xù)幀里目標(biāo)的持續(xù)性(大小、顏色、軌跡的一致性),可以幫助刪去一部分不合格的候選的目標(biāo)區(qū)域;然后對挑出的區(qū)域打分做判斷。
第二種:動靜結(jié)合。
即在第一種的基礎(chǔ)上,加入目標(biāo)的外觀形變。有些目標(biāo)在視頻中會呈現(xiàn)幅度較大的,有一定規(guī)律的形變。這時我們可以通過學(xué)習(xí)形變規(guī)律,總結(jié)出目標(biāo)特殊的運(yùn)動特征和行為范式,然后看待檢測的目標(biāo)是否滿足這樣的行為變化。常見的行為特征表示有3D descriptors,Markov-based shape dynamics,pose/primtive action-based histogram等等。這種通過綜合目標(biāo)靜態(tài)和動態(tài)信息來判斷是否是特定目標(biāo)的方法,有些偏向action classification。
第三種:頻域特征的利用。
在基于視頻的目標(biāo)檢測中,除了可以對目標(biāo)空間和時間信息進(jìn)行分析外,目標(biāo)的頻域信息在檢測過程中也能發(fā)揮巨大的作用。比如,在鳥種檢測中,我們可以通過分析翅膀扇動頻率實(shí)現(xiàn)鳥種的判別。值得注意的是,這里基于視頻的目標(biāo)檢測(video-based detection)存在兩種情況,一種是你只想知道這個場景中有沒有這種目標(biāo),如果有,它對應(yīng)的場景位置是哪;另一種是這個場景有沒有這種目標(biāo),它在每一幀中的位置是哪。我們這里介紹的方法側(cè)重的是后一種更復(fù)雜的。
基于邊緣的分割常用方法之一,用于區(qū)域已分出(二值或已標(biāo)注),但邊界未知的情況。
首先在圖像中找到一個邊界點(diǎn),然后從這個邊界點(diǎn)出發(fā),按照某種策略尋找下一個邊界點(diǎn),以此跟蹤出目標(biāo)邊界。對于邊界跟蹤法,重要的是三個部分,邊界的起始點(diǎn)、搜索規(guī)則(邊界判別準(zhǔn)則),搜索終止條件。
起始點(diǎn):確定邊界的起始搜索點(diǎn),起始點(diǎn)的選擇很關(guān)鍵,對某些圖像,選擇不同的起始點(diǎn)會導(dǎo)致不同的結(jié)果。
搜索規(guī)則(邊界判別準(zhǔn)則):確定合適的邊界判別準(zhǔn)則和搜索準(zhǔn)則,判別準(zhǔn)則用于判斷一個點(diǎn)是不是邊界點(diǎn),搜索準(zhǔn)則則指導(dǎo)如何搜索下個邊緣點(diǎn)。
搜索終止條件:確定搜索的終止條件。
這里搜索終止條件對于封閉輪廓和非封閉輪廓有不同的處理(本項目主要討論非封閉輪廓),對于封閉輪廓:直至跟蹤的后續(xù)點(diǎn)回到起始點(diǎn)。
圖1 原圖像與邊界提取后的圖像
我們這里對封閉輪廓的跟蹤算法進(jìn)行討論,具體算法如下:
(1)找到起始點(diǎn),記錄該點(diǎn)。
(2)初始跟蹤方向為左上方0方向。
(3)判斷該點(diǎn)是否為目標(biāo)點(diǎn),是則把該置為新的跟蹤的起始點(diǎn)。
(4)將找到該點(diǎn)目標(biāo)點(diǎn)的方向逆時針旋轉(zhuǎn)90度,作為新的跟蹤方向,繼續(xù)檢測新的跟蹤方向上的點(diǎn)。
(5)若不是目標(biāo)點(diǎn),則沿順時針旋轉(zhuǎn)45度,一直找到目標(biāo)點(diǎn)。
(6)找到目標(biāo)點(diǎn)后,在當(dāng)前跟蹤方向的基礎(chǔ)上,逆時針旋轉(zhuǎn)90度作為新的跟蹤方向,用同樣的方法跟蹤下一個邊界點(diǎn)。
(7)直到回到起始點(diǎn)。
利用python以及OpenCv對該基于追蹤算法的圖像識別技術(shù)進(jìn)行實(shí)現(xiàn)。
(1)運(yùn)動檢測
首先,目標(biāo)跟蹤是對攝像頭視頻中的移動目標(biāo)進(jìn)行定位的過程。實(shí)時目標(biāo)跟蹤是許多計算機(jī)視覺應(yīng)用的重要任務(wù),如監(jiān)控、基于感知的用戶界面、增強(qiáng)現(xiàn)實(shí)、基于對象的視頻壓縮以及輔助駕駛等。實(shí)現(xiàn)一般的運(yùn)動物體檢測,關(guān)于實(shí)現(xiàn)視頻目標(biāo)跟蹤的方法有很多,當(dāng)跟蹤所有移動目標(biāo)時,幀之間的差異會變得有用;當(dāng)跟蹤視頻中移動的手時,基于皮膚顏色的均值漂移方法是最好的解決方案;當(dāng)知道跟蹤對象的一方面時,模板匹配是不錯的技術(shù)。
常用的目標(biāo)跟蹤方法有:
①背景法(本次用的方法):是將一幅圖作為背景,然后和每一幀對比;缺點(diǎn)是一開始存入的背景可能隨光照變法而造成錯誤,但是可以用在光照環(huán)境穩(wěn)定的地方,優(yōu)點(diǎn)是可以檢測之前背景沒有的景象。
②差幀法:是將前一幀和后一幀進(jìn)行對比;缺點(diǎn)是無法對運(yùn)動后突然又靜止的景象進(jìn)行識別,優(yōu)點(diǎn)是光照不影響。
(2)運(yùn)動方向預(yù)測
可利用光流法,光流是進(jìn)行視頻中運(yùn)動對象軌跡標(biāo)記的一種很常用的方法,在OpenCV中實(shí)現(xiàn)光流也很容易??衫胏v2.calcOpticalFlowPyrLK函數(shù)計算一個稀疏特征集的光流,使用金字塔中的迭代Lucas-Kanade方法。
首先選取第一幀,在第一幀圖像中檢測Shi-Tomasi角點(diǎn),然后使用LK算法來迭代地跟蹤這些特征點(diǎn)。迭代的方式就是不斷向cv2.calcOpticalFlowPyrLK()中傳入上一幀圖片的特征點(diǎn)以及當(dāng)前幀的圖片。函數(shù)會返回當(dāng)前幀的點(diǎn),這些點(diǎn)帶有狀態(tài)1或者0,如果在當(dāng)前幀找到了上一幀中的點(diǎn),那么這個點(diǎn)的狀態(tài)就是1,否則就是0。
本文討論了跟蹤算法以及圖像識別技術(shù)以及二者的結(jié)合使用,論述了實(shí)現(xiàn)對目標(biāo)進(jìn)行識別、動態(tài)跟蹤、視頻移動識別等的技術(shù)算法,分析各種技術(shù)以及跟蹤算法的優(yōu)劣性以及圖像識別技術(shù)的實(shí)現(xiàn),并討論該算法技術(shù)在智能化教學(xué)視頻錄播系統(tǒng)方面的應(yīng)用前景。
[1]https://www.cnblogs.com/-wenli/p/11719012.html.
[2]方青,梅曉春,張育平.用于機(jī)動目標(biāo)跟蹤的Kalman濾波器的設(shè)計[J].雷達(dá)科學(xué)與技術(shù),2006,1(4):50-553.
[3]嵇成新,許江湖,陳康.跟蹤機(jī)動目標(biāo)的多模型算法進(jìn)展[J].系統(tǒng)工程與電子技術(shù),2003,25(7):882-888.
[4]Reid D B.An algorithm for tracking multiple targets.IEEE Trans. Automatic Control.1978,24(6):843-854.
[5]Singer R A,Stein J J.An optimal tracking filter for processing sensor data imprecisely.
[6]determined origin in surveillance systems[A].Proceedings of the 1971 IEEE Conferenceon Decision and Control. Miami Beach:1971,171-175.
西北民族大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)資助資助本科生科研能力項目訓(xùn)練項目(項目編號:XBMU21192)