侯建華,劉 倩,笪邦友,馬曉路
(中南民族大學(xué)電子信息工程學(xué)院,武漢430074)
在目標(biāo)跟蹤領(lǐng)域,當(dāng)系統(tǒng)的狀態(tài)方程和觀測(cè)方程是線性時(shí),普通的卡爾曼濾波可以達(dá)到較好的跟蹤效果[1].而在實(shí)際應(yīng)用中,現(xiàn)實(shí)背景復(fù)雜多變,導(dǎo)致系統(tǒng)方程或觀測(cè)方程往往是非線性的,因此若采用線性的卡爾曼濾波跟蹤,就會(huì)變得不穩(wěn)定甚至發(fā)散,導(dǎo)致跟蹤失敗.傳統(tǒng)的解決非線性估計(jì)問題的方法是采用擴(kuò)展卡爾曼濾波器,1995年,Baumberg等提出了基于擴(kuò)展卡爾曼濾波(EKF)的跟蹤方法[2].該算法是對(duì)非線性的系統(tǒng)方程或觀測(cè)方程進(jìn)行泰勒展開,取其一階近似項(xiàng),這種把非線性問題線性化的處理會(huì)不可避免地引入線性化誤差,此外,系統(tǒng)方程或觀測(cè)方程的Jacobian矩陣計(jì)算非常復(fù)雜、耗時(shí),影響整個(gè)算法的實(shí)時(shí)性.為了解決此問題,Julier等提出了用Unscented卡爾曼濾波器來解決非線性濾波的問題[3].Unscented卡爾曼濾波的核心部分是Unscented變換,它采用一組精心選擇的加權(quán)采樣點(diǎn)(Sigma)來表達(dá)系統(tǒng)的統(tǒng)計(jì)特性,這些采樣根據(jù)真正的非線性方程進(jìn)化而無需將其線性化.研究表明,UKF 算法與 EKF 算法[4,5]相比,能夠?yàn)榭柭鼮V波器提供更好的非線性均值和方差近似解,對(duì)系統(tǒng)狀態(tài)的估計(jì)精度和穩(wěn)定性都有不同程度的提高.
本文在傳統(tǒng)UKF對(duì)稱采樣策略的基礎(chǔ)上,引入了比例修正框架[6]以保證協(xié)方差的半正定性,減少非局部效應(yīng)的發(fā)生.此外,UKF采樣過程中,傳統(tǒng)的設(shè)定尺度因子的方法是根據(jù)實(shí)時(shí)的環(huán)境人工的調(diào)整尺度因子α,以得到最優(yōu)經(jīng)驗(yàn)值.為了提高UKF跟蹤算法的實(shí)際應(yīng)用性和智能性,有必要研究一種更優(yōu)的自適應(yīng)的尺度因子調(diào)整方法.因此,本文將一種尺度因子自適應(yīng)的UKF算法應(yīng)用于不同場(chǎng)景的目標(biāo)跟蹤中,實(shí)驗(yàn)證明該算法具有很好的跟蹤性能和實(shí)用性.
Unscented變換是計(jì)算非線性變換的隨機(jī)變量的統(tǒng)計(jì)特征的一種新方法,它使用一組適當(dāng)選擇的帶權(quán)重的離散采樣點(diǎn)(Sigma點(diǎn))來表征系統(tǒng)狀態(tài)概率密度的均值和方差.U具體實(shí)現(xiàn)步驟是:把被估計(jì)的狀態(tài)視為一個(gè)隨機(jī)變量,在原先狀態(tài)分布中按照某種采樣策略[7]采樣一些點(diǎn),使這些點(diǎn)的均值和協(xié)方差與原狀態(tài)分布中的均值和協(xié)方差相同,然后將非線性變換作用于每一個(gè)采樣,得到相應(yīng)的函數(shù)值點(diǎn)集,再求取這些點(diǎn)集的均值和方差,最后通過觀測(cè)值調(diào)節(jié)樣本點(diǎn)的位置,使采樣點(diǎn)集的均值和方差以二階精度逼近原狀態(tài)的均值和方差.
假設(shè)n是隨機(jī)變量x的維數(shù),x的均值為ˉx,協(xié)方差為Px,y=f(x)是一個(gè)非線性函數(shù),通過Unscented變換估計(jì)隨機(jī)變量y的均值和協(xié)方差的過程如下[8,9].
(1)根據(jù)以下方程確定一組隨機(jī)采樣點(diǎn)Xi和采樣點(diǎn)所對(duì)應(yīng)的均值權(quán)值W(tm)和方差權(quán)值W(ic):其中κ是自由參數(shù),用來捕捉給定分布的高階矩信息,一般對(duì)于高斯分布,考慮到4階矩的統(tǒng)計(jì)量,通常取n+κ=3.α是尺度因子,控制采樣點(diǎn)和均值ˉx之間的距離.β是用于考慮分布的先驗(yàn)知識(shí)[10],通常取是矩陣平方根的第i列.
(2)根據(jù)非線性變換Yi=f(Xi)計(jì)算隨機(jī)變量Yi的采樣.
(3)計(jì)算隨機(jī)變量Yi的均值和協(xié)方差:這里列出的Unscented變換是采用對(duì)稱采樣策略,文獻(xiàn)[6]證明y均值的計(jì)算精度可以精確到三階,對(duì)于協(xié)方差的精度可以精確到二階.在利用公式(5)求權(quán)值時(shí)加入了比例修正(1-α2+β),確保輸出y的協(xié)方差的半正定性[11].在目標(biāo)跟蹤算法中,就是用這些離散采樣點(diǎn)來表征目標(biāo)狀態(tài)的.
文獻(xiàn)[3]證明可以通過調(diào)整尺度因子α的值來控制采樣點(diǎn)到中心點(diǎn)的距離di,在對(duì)稱采樣方式下的該距離越遠(yuǎn)相應(yīng)的采樣點(diǎn)的參考價(jià)值就越小,即會(huì)產(chǎn)生非局部效應(yīng).在仿真實(shí)驗(yàn)時(shí)可以通過對(duì)α取不同的值,從中選擇最優(yōu)的值以達(dá)到最好的跟蹤效果.但在實(shí)時(shí)環(huán)境中,不允許嘗試,必須給出一個(gè)具體的尺度因子的取值方案.所以,參考文獻(xiàn)[12],本文將尺度因子α隨環(huán)境自適應(yīng)變化的算法應(yīng)用于UKF的目標(biāo)跟蹤.
假設(shè)t時(shí)刻的UKF濾波值為x^t/t,真實(shí)值為xt/t,而由公式(9)可知,Pt/t表征了預(yù)測(cè)值與真實(shí)值的關(guān)系(也就是誤差),可以近似的計(jì)算出x^t/t與xt/t之間的距離dt/t,為了方便計(jì)算,利用公式(10)近似計(jì)算dt/t:
這種方法的基本思路就是用第k步的濾波值近似覆蓋真值的鄰域O(^xt/t,dt/t),此作為第t+1樣范圍,使Sigma點(diǎn)(采樣點(diǎn))到中心點(diǎn)的距離di不超過dt/t,即令:
利用公式(11)求出的 αt+1/t,重新采樣生成Sigma點(diǎn)和相應(yīng)的權(quán)值,完成相應(yīng)的更新.這樣循環(huán)的更新的 α值,就可以得到尺度因子自適應(yīng)的Unscented變換.
UKF是在普通卡爾曼濾波的框架上,將Unscented變換分別應(yīng)用于均值和協(xié)方差的求解,并不斷遞推,就可得到UKF非線性濾波器.
考慮一般的目標(biāo)跟蹤問題,目標(biāo)的狀態(tài)方程和觀測(cè)方程分別為:
其中A為表征運(yùn)動(dòng)模型的參數(shù),xt表示t時(shí)刻系統(tǒng)的狀態(tài)向量,zt為時(shí)刻的觀測(cè)向量,vt為系統(tǒng)噪聲,ωt為觀測(cè)噪聲.
本文UKF濾波過程的實(shí)現(xiàn)步驟如下:
1)初始化,根據(jù)初始狀態(tài)變量x得到均值^x和協(xié)方差P0.
2)計(jì)算2n+1個(gè)加權(quán)Sigma點(diǎn)xi(t-1/t-1)來表征系統(tǒng)的狀態(tài)分布(其中i=0,1,…,2n,是狀態(tài)向量的維數(shù)):
得到采樣點(diǎn)集xi(t-1/t-1);根據(jù)公式(9)~(11)更新α;最后將更新的αt+1/t代入公式(4)~(7)計(jì)算相應(yīng)的權(quán)值W(m)i,W(c)i.
3)預(yù)測(cè).由系統(tǒng)狀態(tài)方程和觀測(cè)方程對(duì)各個(gè)采樣的Sigma點(diǎn)集里的每個(gè)采樣點(diǎn)進(jìn)行非線性變換,得到變換后的Sigma點(diǎn)集:
計(jì)算預(yù)測(cè)的狀態(tài)均值和協(xié)方差:
4)觀測(cè)更新.計(jì)算觀測(cè)均值、自相關(guān)函數(shù)和觀測(cè)的互相關(guān)函數(shù):
計(jì)算狀態(tài)更新的濾波增益:
狀態(tài)更新后的濾波值:
狀態(tài)后驗(yàn)概率方差陣:
若繼續(xù)跟蹤t=t+1,轉(zhuǎn)(2);否則結(jié)束.
為了驗(yàn)證尺度因子自適應(yīng)的UKF跟蹤算法的效果,分別對(duì)傳統(tǒng)的UKF算法和自適應(yīng)的UKF算法進(jìn)行了仿真,并對(duì)新算法的實(shí)用性進(jìn)行了測(cè)試.
4.1.1 仿真條件
在二維直角坐標(biāo)系中,假設(shè)目標(biāo)做勻速運(yùn)動(dòng),取目標(biāo)的位置和速度為系統(tǒng)的狀態(tài)變量,即→x=[x,y,vx,vy],x和y表示目標(biāo)中心點(diǎn)的坐標(biāo),vx,vy分別表示x,y的導(dǎo)數(shù),即速度.觀測(cè)向量zt的兩個(gè)分量分別表示t時(shí)刻目標(biāo)中心處的斜距和方位角,xct和yct分別表示t時(shí)刻目標(biāo)中心處的觀測(cè)值.vt是從傳感器得到的噪聲,ωt是從觀測(cè)樣本得到的噪聲(仿真時(shí)加入隨機(jī)噪聲以模擬復(fù)雜環(huán)境).具體仿真條件如下:
初始狀態(tài)向量→x0=[15000,30,15000,30],Δt=10是采樣間隔.
4.1.2 仿真結(jié)果與分析
首先對(duì)標(biāo)準(zhǔn)的UKF算法進(jìn)行仿真,分別取α為0.1,0.3,0.5,0.8,1(其中 α=1 是為最優(yōu)經(jīng)驗(yàn)值).其次,對(duì)本文提出的尺度因子α自適應(yīng)的UKF算法進(jìn)行仿真.
實(shí)驗(yàn)結(jié)果如表1.表1中真值與UKF濾波值的誤差比公式為:
表1 不同α下的跟蹤精度Tab.1 Tracking performance with difference α
從表1可以看出,尺度因子α的不同取值時(shí)對(duì)跟蹤精度有很大的影響,濾波精度有明顯的差異,因此實(shí)際應(yīng)用時(shí)需要人工反復(fù)調(diào)節(jié)α的大小以獲得最優(yōu)值(α=1),使真值和濾波值的差異最小.此操作復(fù)雜,智能性和實(shí)用性不高.
圖1(a)和圖1(b)對(duì)比可知,尺度因子α自適應(yīng)的UKF算法能夠取得和最優(yōu)經(jīng)驗(yàn)值(α=1)時(shí)的UKF算法基本相同的跟蹤精度.
圖1 不同α下的跟蹤精度Fig.1 Tracking performance with difference α
4.2.1 實(shí)驗(yàn)條件
為了測(cè)試本文算法的實(shí)用性和智能性,本文分別對(duì)動(dòng)態(tài)背景下的行人行走視頻(實(shí)驗(yàn)一)和多干擾復(fù)雜環(huán)境下的車輛行駛視頻(實(shí)驗(yàn)二)進(jìn)行試驗(yàn),并將仿真結(jié)果與卡爾曼濾波的跟蹤算法進(jìn)行對(duì)比.兩組實(shí)驗(yàn)的狀態(tài)向量設(shè)置為二維空間的目標(biāo)的位置、速度,即→x=[x,y,vx,vy],狀態(tài)初始值由手動(dòng)選取目標(biāo)區(qū)域完成,考慮到實(shí)時(shí)視頻任意相鄰兩幀幀差為幾十毫秒,目標(biāo)速度基本不會(huì)發(fā)生變化,所以設(shè)置系統(tǒng)運(yùn)動(dòng)模型為勻速即狀態(tài)轉(zhuǎn)移矩陣:
A=[1,1,0,0;0,1,0,0;0,0,1,1;0,0,0,1]T,觀測(cè)模型參數(shù)為t時(shí)刻目標(biāo)中心處的斜距和方位角,如公式(21),系統(tǒng)噪聲和觀測(cè)噪聲均調(diào)到最佳.
4.2.1 實(shí)驗(yàn)結(jié)果與分析
如圖2所示,本組實(shí)驗(yàn)是在視頻第三幀時(shí),人工的選取要跟蹤的目標(biāo)(也就是確定初始狀態(tài)值),黑色矩形框是目標(biāo)的跟蹤框.視頻中的樹木和其他行人構(gòu)成了變化的背景,地面顏色與選定的目標(biāo)人物上衣顏色相仿,圖2(a)~(c)中,由于動(dòng)態(tài)背景和周圍雜物的影響,普通的卡爾曼跟蹤算法在第30幀時(shí)跟蹤框已經(jīng)逐漸偏離目標(biāo),在第60幀時(shí)已經(jīng)無法對(duì)目標(biāo)進(jìn)行跟蹤.而圖2(d)~(f)(本文算法實(shí)驗(yàn)結(jié)果)具有明顯的優(yōu)勢(shì),在動(dòng)態(tài)背景環(huán)境下,本文算法卻仍然能夠穩(wěn)定地跟蹤目標(biāo).
(1)普通卡爾曼濾波進(jìn)行人體跟蹤結(jié)果如圖2(a)~(c);本文算法進(jìn)行人體跟蹤結(jié)果如圖2(d)~(f).
圖2 卡爾曼濾波和本文算法的比較Fig.2 Comparisons between Kalman filter and improved UKF
(2)普通卡爾曼濾波進(jìn)行交通車輛跟蹤結(jié)果如圖3(a)~(c);本文算法進(jìn)行交通車輛跟蹤跟蹤結(jié)果如圖3(d)~(f).
圖3 卡爾曼濾波和本文算法的比較Fig.3 Comparison between Kalman filter and improved UKF
圖3是普通卡爾曼濾波和本文算法用于監(jiān)測(cè)交通車輛的實(shí)驗(yàn)結(jié)果,初始狀態(tài)也是通過人工選取,即圖3(a)中的第5幀和圖3(d)中的第2幀中黑色矩形框選定的卡車.視頻中其他來往的車輛構(gòu)成復(fù)雜的非線性背景.實(shí)驗(yàn)表明,在復(fù)雜的非線性環(huán)境下,普通卡爾曼算法不能達(dá)到跟蹤的目的,如圖3(b)所示,在視頻第10幀時(shí)黑色跟蹤框已經(jīng)偏離目標(biāo),基本上失去了跟蹤的意義.而本文算法如圖3(f)所示,可以一直很穩(wěn)定的對(duì)目標(biāo)進(jìn)行跟蹤,具有很好的跟蹤效果.
綜合圖2和圖3可以看出,不同場(chǎng)景條件下,不用人為的調(diào)節(jié)尺度因子,本文算法都具有很好的跟蹤效果,自適應(yīng)能力很強(qiáng),實(shí)用性很好.
本文提出的尺度因子自適應(yīng)的UKF跟蹤算法能夠取得和最優(yōu)經(jīng)驗(yàn)值條件下的普通UKF算法大致相同的精度;在不同的實(shí)際環(huán)境下都能取得理想的跟蹤效果,提高了非線性濾波的實(shí)時(shí)跟蹤能力和濾波的數(shù)值穩(wěn)定性,具有非常好的實(shí)用價(jià)值.
[1]付東莉,柴 毅.基于滾動(dòng)時(shí)域估計(jì)的帶約束運(yùn)動(dòng)目標(biāo)跟蹤[J].計(jì)算機(jī)應(yīng)用研究,2011,28(3):1-3.
[2]Baumberg A,Hogg D C.Learning spatiotemporalmodels from training exemples[C]//Proc.British Machine Vision Conference.Birmingham:Proc,1995:45-74.
[3]Simon J.Julier,Jeffrey K.unlmann.A new extension of the kalman filter to nonlinear systems[C]//Proc.The 11th International Symposium on Automatic Control,Aerosense:Proc,2000,21(45):447-482.
[4]Zhu Anfu,Jing Zhanrong.UKF and its application to target tracking[J].Fire Control and Command Control,2008,33(8):2-3.
[5]Mathicu ST-Pierre,Denis Gingars Dr Ing.Comparison between the unscented kalman filter and the extended kalman filter for the position estimation module of an intergrated navigation information system[J].IEEE Intelligent Vehicles Symposium University of Parma,2004,34(7):832-834.
[6]Julier S,Unlmann J,DurrantWhf.A new method for the nonlinear transformation ofmeans and covariance in filters and estimators[J].IEEE Transactions on Automatic Control,2000,45(3):477-482.
[7]劉 錚.UKF算法及其改進(jìn)算法的研究[D].長(zhǎng)沙:中南大學(xué),2009:25-28.
[8]Julier S J,Uhlmann JK.Reduced sigma point filters for the propa-gation of means and covariance through nonlinear transformations[C].//Proc.American Control Conf.Jefferson:Proc,2002:887-892.
[9]Yong Rui,Chen Yunqiang.Better proposal distributions:object tracking using unscented particle filter[J].Computer Vision and Pattern Recognition,2001,10(21):47-51.
[10]MOSHE BEN-ALIVA.Nonliner kalman filtering algorithms for on-line calibration of dynamic traffic assignmentsmodels[J].IEEE Transaction on Intelligent Transportation Systems,2007,8(4):664-665.
[11]Julie S J.The scaled unscented transformation[C]//Proc.American Control Conf.Jefferson:Proc,2002:4555-4559.
[12]Jiang Weinan,Zhou Haiyin.Self-adaptive selectingmethod for scaling factor of scaled unscented transformation[J].Chinese Space Science and Technology,2008,6(3):3-5.