耿利祥,尹曉燕,蔡文彬,李 偉
(中國船舶重工集團(tuán)公司第七二四研究所,南京 211153)
傳統(tǒng)的α-β濾波和卡爾曼濾波對線性系統(tǒng)高斯過程的跟蹤性能好,但對于非線性非高斯過程性能較差,擴(kuò)展卡爾曼濾波以及不敏卡爾曼濾波是針對非線性過程進(jìn)行改進(jìn)的?;诿商乜宸椒ǖ牧W訛V波算法在非線性、非高斯系統(tǒng)均表現(xiàn)出一定優(yōu)越性,近年來得到了研究人員的青睞[1]。交互多模型跟蹤算法在機(jī)動目標(biāo)跟蹤方面表現(xiàn)出了強(qiáng)大的能力[2],另一類算法是利用檢測的方法跟蹤目標(biāo)。Collin[3]通過尋找最具分辨率的特征空間計(jì)算其與目標(biāo)和背景的相似度比值,選擇比值高的候選樣本作為目標(biāo)。Grabner[4]提出了基于在線Boosting的跟蹤算法,利用了集成學(xué)習(xí)算法的思想。為了能夠解決長時(shí)間目標(biāo)穩(wěn)定跟蹤問題,Kalal Z[5]在視頻跟蹤中引入跟蹤—學(xué)習(xí)—檢測(Tracking-Learning-Detection,TLD)的跟蹤機(jī)制,從而達(dá)到目標(biāo)長時(shí)間穩(wěn)定跟蹤的目的。在長時(shí)間雷達(dá)目標(biāo)跟蹤任務(wù)中,雜波的干擾和目標(biāo)本身的機(jī)動性是導(dǎo)致目標(biāo)跟蹤不穩(wěn)定的兩個主要原因。一方面,復(fù)雜的雜波環(huán)境直接導(dǎo)致目標(biāo)被遮蔽、誤檢,使目標(biāo)跟蹤很容易關(guān)聯(lián)到雜波,導(dǎo)致目標(biāo)跟丟跟錯。另一方面,機(jī)動目標(biāo)運(yùn)動模式參數(shù)變化較大,單一模型很難及時(shí)準(zhǔn)確辨識機(jī)動參數(shù),造成模型的不準(zhǔn)確,導(dǎo)致算法性能下降。
本文采用了TLD跟蹤框架,引入了在線學(xué)習(xí)機(jī)制,將雷達(dá)目標(biāo)檢測器和跟蹤器通過在線學(xué)習(xí)算法結(jié)合在一起,充分發(fā)揮了檢測器和跟蹤器的優(yōu)勢,同時(shí)將多模型算法作為雷達(dá)TLD框架中的跟蹤器,提出了多模型優(yōu)化的在線學(xué)習(xí)雷達(dá)目標(biāo)跟蹤算法(Multiple Model Tracking Learning Detection,MM-TLD),從而提高目標(biāo)長時(shí)間跟蹤過程中目標(biāo)跟蹤的魯棒性,減少目標(biāo)狀態(tài)變化和干擾引起的不穩(wěn)定性。
作為一種全新的跟蹤架構(gòu),TLD將跟蹤任務(wù)分為跟蹤、學(xué)習(xí)和檢測3個部分。通過引入P-N學(xué)習(xí)[6],將單純的跟蹤器和檢測器聯(lián)系起來,利用目標(biāo)更多的時(shí)間和空間的信息,使目標(biāo)更加穩(wěn)定。其流程如圖1所示。檢測器不斷地修正跟蹤器。跟蹤器對目標(biāo)進(jìn)行跟蹤,并且更新檢測器。學(xué)習(xí)器估計(jì)出檢測器和跟蹤器中的錯誤并及時(shí)對它們進(jìn)行更新。
作為解決目標(biāo)機(jī)動的有效方法,在目標(biāo)的長時(shí)間跟蹤過程中,多模型針對不同的過程噪聲級建立不同模型,并將不同濾波結(jié)果經(jīng)由專家學(xué)習(xí)機(jī)制生成目標(biāo)檢測分類器的輸入樣本。
1.2.1 多模型跟蹤器
多模型算法(Multiple Model,MM)[7]可以在目標(biāo)運(yùn)動模式的結(jié)構(gòu)和參數(shù)起伏很大的情況下利用不同的模型估計(jì)變化的運(yùn)動參數(shù),以適應(yīng)目標(biāo)多種參數(shù)變化,減少目標(biāo)跟丟的情況。對于雷達(dá)目標(biāo)而言,掃描時(shí)所產(chǎn)生的屬性量測均可作為目標(biāo)屬性特征建立目標(biāo)的狀態(tài)向量X。令Mj表示具有先驗(yàn)概率Pr{Mj}=μj(0),(j=1,2,…,r)的模型j是正確的事件。在模型j的假定下,k時(shí)刻的量測的似然函數(shù)為
(1)
μj(k)
(1)
利用上述概率作為權(quán)重進(jìn)行加權(quán)平均就是目標(biāo)的狀態(tài)估計(jì),因此最終得到的組合狀態(tài)和協(xié)方差估計(jì)為
(2)
(3)
跟蹤器中多個濾波器并行工作,每個模型對應(yīng)的概率在根據(jù)學(xué)習(xí)器學(xué)習(xí)后模型反饋結(jié)果進(jìn)行更新,糾正跟蹤器中的模型估計(jì),以提高模型估計(jì)的概率的準(zhǔn)確性。
1.2.2 檢測器
目標(biāo)檢測器采用了Adaboost算法[8],利用一組串行的弱分類器級聯(lián)成一個強(qiáng)分類器。在對待識樣本分類時(shí),前一級分類器判決為正樣本則送入后一級分類器,負(fù)樣本則直接輸出。每一級的分類器均判決為正的樣本作為正樣本輸出。Adaboost算法結(jié)構(gòu)的示意圖如圖2所示。
1.2.3 學(xué)習(xí)器
P-N學(xué)習(xí)是一個新的基于結(jié)構(gòu)化、未標(biāo)記數(shù)據(jù)的學(xué)習(xí)訓(xùn)練方法。數(shù)據(jù)中的結(jié)構(gòu)被稱為正約束和負(fù)約束。正約束指定正樣本可接受特征。負(fù)約束指定負(fù)樣本可接受特征。具體實(shí)現(xiàn)步驟如下:
首先以有監(jiān)督學(xué)習(xí)的方式利用被標(biāo)注為正負(fù)樣本的目標(biāo)學(xué)習(xí)訓(xùn)練一個初始的分類器。然后,將正樣本加入到正樣本庫內(nèi),將負(fù)樣本訓(xùn)練分類器輸出給檢測器,檢測器根據(jù)輸入的新分類樣本把結(jié)果輸出給P-N專家學(xué)習(xí);P-N專家檢查分類結(jié)果,將漏檢目標(biāo)更新到正樣本庫,將虛假檢測更新到負(fù)樣本庫,再次訓(xùn)練分類器,重復(fù)迭代直到滿足收斂條件為止。將P-N專家約束得到的結(jié)果送給跟蹤器,更新每個模型的概率。
基于多模型優(yōu)化的在線學(xué)習(xí)雷達(dá)目標(biāo)跟蹤算法流程如圖3所示。
為了驗(yàn)證本文算法在長時(shí)間雷達(dá)目標(biāo)跟蹤過程中的魯棒性和穩(wěn)定性,實(shí)驗(yàn)運(yùn)用蒙特卡洛仿真方法仿真了多次長時(shí)間跟蹤的數(shù)據(jù)集,并對每一組數(shù)據(jù)采用了經(jīng)典的卡爾曼濾波算法和本文算法作對比。
考慮到雷達(dá)回波的起伏以及受雜波的影響,由于雷達(dá)回波受雷達(dá)目標(biāo)散射截面的影響,因此利用RCS的分布特征χ2分布來表征雷達(dá)目標(biāo)回波起伏。χ2分布概率密度函數(shù)為
(4)
其中,λ為雙自由度。
試驗(yàn)中,地雜波采用瑞利分布,航跡噪聲采用高斯分布。χ2分布雙自由度λ取2,σ為瑞利系數(shù)取0.5,疊加高斯噪聲均值取0,方差取50,時(shí)間間隔取2 s。仿真實(shí)驗(yàn)中采用了500組目標(biāo)作為實(shí)驗(yàn)對象,以相同的算法對該組目標(biāo)進(jìn)行跟蹤,其中一個機(jī)動目標(biāo)的仿真航跡和跟蹤結(jié)果如圖4所示。
從圖4中可以看出,目標(biāo)機(jī)動性較強(qiáng)的情況下,卡爾曼濾波在跟蹤過程中由于受到了雜波影響導(dǎo)致跟蹤到錯誤的量測,造成了目標(biāo)跟丟;而本文MM-TLD算法由于利用在線學(xué)習(xí)機(jī)制,當(dāng)有錯誤跟蹤或者跟丟情況發(fā)生時(shí)學(xué)習(xí)機(jī)制通過P-N學(xué)習(xí)及時(shí)發(fā)現(xiàn),并且可以通過檢測器重新初始化跟蹤器,最終及時(shí)糾正模型中錯誤跟蹤,達(dá)到長時(shí)間穩(wěn)定魯棒跟蹤的效果。
為了測試目標(biāo)跟蹤受雜波影響,實(shí)驗(yàn)?zāi)M了虛警概率10e-3、探測概率0.9條件下的500組目標(biāo)。每組目標(biāo)個數(shù)為10個勻速運(yùn)動目標(biāo),并計(jì)算每批目標(biāo)跟蹤航跡與模擬的真實(shí)航跡的均方根誤差(RMSE),同時(shí)測量了算法的平均耗時(shí)。實(shí)驗(yàn)?zāi)M了虛警3*10e-3、探測概率0.8條件下500組目標(biāo)。每組目標(biāo)為10個勻速運(yùn)動目標(biāo),并采用了文獻(xiàn)[9]的方法計(jì)算了目標(biāo)的平均穩(wěn)定跟蹤周期數(shù)。最后,實(shí)驗(yàn)?zāi)M了虛警概率10e-3、探測概率0.9條件下的500組目標(biāo)。每組目標(biāo)個數(shù)為10個最大加速度為3 g的機(jī)動運(yùn)動目標(biāo),將跟丟的目標(biāo)個數(shù)除以總的目標(biāo)個數(shù)作為目標(biāo)跟丟率。實(shí)驗(yàn)中,算法采用了目標(biāo)的9種屬性特征,其中包括點(diǎn)跡中心、高度及俯仰質(zhì)量、解模糊識別碼、點(diǎn)跡回波數(shù)、幅度、環(huán)境估值、回波展寬度、多普勒特性、關(guān)聯(lián)質(zhì)量。跟蹤數(shù)據(jù)率2 s。算法運(yùn)行平臺為CPU:Intel?CoreTMi5-3230M,主頻:2.6 GHz,內(nèi)存4 GB;算法運(yùn)行環(huán)境:matlab。表1反映了兩種算法實(shí)驗(yàn)的跟蹤結(jié)果均方根誤差、跟丟率、每一離散時(shí)刻平均耗時(shí)和平均穩(wěn)定跟蹤時(shí)間。
表1 算法性能比較
表1中結(jié)果反映出卡爾曼濾波和本文MM-TLD算法在跟蹤性能上有明顯差異。長時(shí)間跟蹤任務(wù)對目標(biāo)跟蹤的穩(wěn)定性要求較高,因此保證目標(biāo)一直不跟丟很重要。MM-TLD算法的跟丟率較之傳統(tǒng)的算法有了顯著的改善。雖然本文MM-TLD算法的耗時(shí)高于卡爾曼濾波算法,但在2 s數(shù)據(jù)率的數(shù)據(jù)處理中,本文算法的多批目標(biāo)的處理時(shí)間可以滿足數(shù)據(jù)處理的實(shí)時(shí)性,在高穩(wěn)定性的長時(shí)間跟蹤任務(wù)中可以滿足任務(wù)要求,在此基礎(chǔ)上MM-TLD算法的魯棒性和穩(wěn)定性更優(yōu)越。
本文提出了一種基于在線學(xué)習(xí)的MM-TLD雷達(dá)目標(biāo)跟蹤算法。該算法能夠在雜波環(huán)境中準(zhǔn)確地對雷達(dá)目標(biāo)進(jìn)行長時(shí)間精確跟蹤。算法通過引入P-N學(xué)習(xí),將目標(biāo)檢測和目標(biāo)跟蹤結(jié)合使用,在TLD架構(gòu)的基礎(chǔ)上利用多模型跟蹤器產(chǎn)生多個跟蹤訓(xùn)練正樣本,并利用P-N學(xué)習(xí)糾正模型中的錯誤,在跟丟情況下通過檢測器重新初始化跟蹤器成功在雜波環(huán)境中對雷達(dá)目標(biāo)實(shí)現(xiàn)長時(shí)間穩(wěn)定跟蹤。相較于傳統(tǒng)的跟蹤方法,本文MM-TLD算法在保證實(shí)時(shí)性的基礎(chǔ)上目標(biāo)跟丟率遠(yuǎn)比傳統(tǒng)卡爾曼算法低,取得了更為精確而穩(wěn)定的跟蹤效果。