甘志英
(唐山學(xué)院 智能與信息工程學(xué)院,河北 唐山 063000)
目標跟蹤指根據(jù)初始圖像給定的目標位置和尺寸,對后續(xù)幀中的目標進行檢測,預(yù)測目標運動軌跡。目標跟蹤是人工智能領(lǐng)域重要組成部分,在無人駕駛、安保監(jiān)控、視頻索引、圖像檢索等方面具有非常廣泛的應(yīng)用。
近年來目標跟蹤算法的研究逐漸轉(zhuǎn)向判別類算法,如TLD 跟蹤、IVT跟蹤、相關(guān)濾波類目標跟蹤等。Bolme等[1]將目標跟蹤轉(zhuǎn)化為求兩個信號的相關(guān)問題,通過目標特征和訓(xùn)練出的濾波模型在頻域計算得到目標位置,跟蹤速度明顯提高。此外,Ross等提出的IVT[2]跟蹤效果好,但實現(xiàn)復(fù)雜,運行速度慢,不適合實時視頻跟蹤;Zhang等[3]使用稀疏矩陣壓縮跟蹤,雖然處理速度很快,但跟蹤精度有待提高。
盡管上述算法在一定程度上提高了跟蹤準確性,但由于訓(xùn)練樣本有限,跟蹤精度較低,且模型更新策略也存在不足。為此,本文在MOSSE算法的基礎(chǔ)上,針對訓(xùn)練樣本不足、分類精度差等問題,采用循環(huán)采樣訓(xùn)練濾波器,使用核函數(shù)支持向量機對目標區(qū)域建模分類,并仿真實現(xiàn)目標的快速跟蹤。
本文算法是利用循環(huán)矩陣結(jié)構(gòu)對樣本進行密集采樣,提高跟蹤能力。并且引入核函數(shù)處理非線性分類問題[4-7]。
為了提高跟蹤效果,在高維空間改善分類效果,使用高斯核函數(shù)將樣本xi映射到高維特征空間。
k(x,x′)=
(1)
根據(jù)嶺回歸,權(quán)重向量ω為
ω=∑iαiφ(xi)
(2)
其中αi為對偶空間系數(shù)。
高斯核函數(shù)滿足k(x,x)=φT(x)φ(x),則分類函數(shù)可表示為:
f(xj)=
(3)
據(jù)式(2)、(3)則目標函數(shù)(1)可表示為:
(4)
其中,K為k(x,x′)循環(huán)移位構(gòu)造矩陣,λ為正則化參數(shù)。
求得改進濾波器
α=(K+λI)-1y
(5)
利用循環(huán)矩陣性質(zhì)得出系數(shù)向量的頻域變量:
(6)
其中,∧符合表示對應(yīng)頻域變量
通過所有的訓(xùn)練樣本x和待檢測樣本z構(gòu)建一個核循環(huán)矩陣Kz,且Kz=C(kxz),其中kxz表示訓(xùn)練樣本x與檢測樣本z生成的互相關(guān)核函數(shù)向量,C(*)表示構(gòu)造循環(huán)矩陣。利用核循環(huán)矩陣Kz計算當(dāng)前圖像中所有待檢測樣本z的回歸響應(yīng)值,計算方式如下:
f(z)=(Kz)Tα
(7)
其中f(z)包含了所有待檢測樣本的響應(yīng)值。利用循環(huán)矩陣對角化的性質(zhì),可以將式(7)簡化:
(8)
對待檢測樣本z求解回歸函數(shù)相當(dāng)于是在kxz上的濾波操作,輸出的二維響應(yīng)圖f(z)最大值位置就是當(dāng)前幀中的預(yù)測目標位置。
為增強算法跟蹤魯棒性,采用實時在線更新策略,樣本目標特征和濾波器的更新:
xt=(1-η)xt-1+ηxt
(9)
(10)
其中,η為學(xué)習(xí)率,xt為第t幀樣本目標特征,αt代表第t幀濾波器。將訓(xùn)練和濾波同時進行,以適應(yīng)目標運動中的形變,實現(xiàn)目標的持續(xù)跟蹤。
用于完成文中算法的計算機硬件配置為:CPU為AMD Ryzen 7 3700U,主頻2.30 GHz,內(nèi)存8 GB;算法的軟件開發(fā)平臺為Matlab R2018b。訓(xùn)練相關(guān)濾波器的正則化因子λ取0.01,高斯核函數(shù)σ取0.02,濾波器更新學(xué)習(xí)率η取0.075。
實驗選擇業(yè)內(nèi)標準OTB2015數(shù)據(jù)集用于目標跟蹤測試,數(shù)據(jù)集包含帶目標位置標注的視頻,并且提供了合理的評價體系[8]。
TRE評估方法:從不同幀的真實目標位置開始跟蹤,對多次跟蹤指標取平均值。
Precision指標:算法估計目標位置與真實位置之間的距離小于給定閾值的幀數(shù)與總幀數(shù)的比值。一般閾值取20像素。
Success指標:算法估計目標區(qū)域與真實區(qū)域重合部分與二者合并區(qū)域比值定義為重合率。重合率大于給定閾值的幀數(shù)占總幀數(shù)的比值即為成功率。一般閾值為0.5。
為了驗證本文算法,從OTB2015數(shù)據(jù)集上選取8個具有尺度變化、快速運動、目標形變、旋轉(zhuǎn)、復(fù)雜背景的視頻序列進行測試,并使用中心位置誤差和重疊率來評估算法。此外本文還與目前比較先進的跟蹤算法MOSSE、CT、IVT進行對比。
為全面直觀分析算法效果,對目標跟蹤實驗分別進行了定量分析、定性分析。
所有跟蹤算法對8個視頻序列進行TRE測試得到的Precision指標、Success指標與跟蹤處理速度見表1。不同算法的Precision曲線和Success曲線如圖1、2所示,可以很明顯看出本文算法明顯優(yōu)于其它算法。
表1 算法的精度、成功率、處理速度
為了更直觀對比不同跟蹤算法的結(jié)果,本文算法對具有快速運動、目標形變、復(fù)雜背景、尺度變化、旋轉(zhuǎn)、遮擋等因素的視頻序列上的跟蹤結(jié)果如圖3所示。其中紅色方框標識MOSSE算法跟蹤結(jié)果,綠色橢圓對應(yīng)CT算法,藍色虛線框標識IVT算法,黃色圓角矩形對應(yīng)本文算法。
圖1 Precision曲線
圖2 Success曲線
(a)car1尺度
(b)car4尺度 光照
(c)coke旋轉(zhuǎn) 遮擋
(e)football 復(fù)雜背景
(f)sufer 快速移動
(g)bolt快速移動 形變
(h)soccer旋轉(zhuǎn) 遮擋 背景復(fù)雜圖3 不同因素的視頻序列上的跟蹤結(jié)果
(1)快速運動。表現(xiàn)為相同時間內(nèi),目標移動跨度大,幀間偏移量大,帶來計算量的增多及誤差的增大,如圖3(e)(g),其它算法出現(xiàn)了跟蹤偏差,而本文算法密集采樣使用卷積特征,能保持較好跟蹤效果。
(2)形變旋轉(zhuǎn)。在圖3(g)(d)中,目標人的肢體運動帶來輪廓形狀變化,(c)(h)目標旋轉(zhuǎn)帶來其外觀不同,CT(綠色橢圓框)、IVT(藍色虛線框)算法未能很好地融合目標前幀與后幀信息,而在視頻的中后段部分跟蹤失敗,相反本文算法在保留前幀目標特征信息的基礎(chǔ)上,又學(xué)習(xí)了后幀目標的特征,這樣在目標形變的過程中就能實現(xiàn)更好的跟蹤。
(3)復(fù)雜背景。在圖3(e)(h)中,隨著目標運動,出現(xiàn)目標周圍梯度密集變化,顏色變化劇烈,背景愈加復(fù)雜。由于四種算法對目標突出特征的描述,區(qū)別于復(fù)雜背景,跟蹤效果良好。(h)中后段目標在被遮擋的情況下其它算法容易出現(xiàn)跟蹤漂移。
(4)尺度問題。從圖3(a)(b)中看出,目標尺度和姿態(tài)變化。四種算法跟蹤良好,但本文算法未能隨目標尺度變化而調(diào)整跟蹤窗大小,說明其欠缺尺度適應(yīng)性。
(5)遮擋問題。圖3(c)(h)序列存在遮擋。本文算法使用高斯混合模型,在更新時,受到的影響較小,仍能夠正確跟蹤目標,具有較強的旋轉(zhuǎn)適應(yīng)性。其它算法目標被遮擋后,將錯誤信息更新到模型中,產(chǎn)生了較大誤差。
(6)光照變化。圖3(b)序列中,目標從高光照進入陰影區(qū)再到高光區(qū),本文算法使用卷積特征表示目標的外觀模型,能正確跟蹤目標,說明具備一定光照適應(yīng)性。
在相關(guān)波跟蹤算法的基礎(chǔ)上,采用密集采樣擴充訓(xùn)練樣本集,借助核函數(shù)嶺回歸在高維空間對目標區(qū)域分類以實現(xiàn)目標跟蹤的方法,克服了傳統(tǒng)相關(guān)算法特征表達不足造成的跟蹤漂移等問題,在改善跟蹤精度的同時,通過頻域運算,提高了跟蹤速度。
在OTB2015數(shù)據(jù)集上,與多種常見跟蹤算法比較,本文算法在一些復(fù)雜場景下,具有較強的魯棒性、精確性及較高的處理速度,整體綜合性能較好,但不能自適應(yīng)跟隨目標尺度變化,調(diào)整跟蹤窗大小,缺少跟蹤窗的尺度適應(yīng)性。未來研究將在尺度變化場景下,朝著實現(xiàn)穩(wěn)定的目標跟蹤方向展開進一步研究,在實時性要求下,提高跟蹤效能。