胡濤+胡軍+郭杭
摘 要: 針對傳統(tǒng)SVM普通學(xué)習(xí)模型無法適應(yīng)視頻中目標(biāo)姿態(tài)變化、有遮擋或復(fù)雜背景的局限性,提出一種新的SVM鄰域?qū)W習(xí)模型。鄰域?qū)W習(xí)是基于視頻相鄰幀在時間和空間上的高度相關(guān)性,每個測試幀在其相鄰幀上抽取訓(xùn)練數(shù)據(jù)進(jìn)行SVM模型的學(xué)習(xí)與更新,隨著視頻的更新,SVM模型將不斷更新來適應(yīng)目標(biāo)檢測的各種變化。通過大量樣本在各種復(fù)雜環(huán)境下實驗,采用統(tǒng)計學(xué)分析結(jié)果,證明SVM鄰域?qū)W習(xí)比傳統(tǒng)SVM普通學(xué)習(xí)準(zhǔn)確率更高、魯棒性更好。
關(guān)鍵詞: SVM模型; 鄰域?qū)W習(xí); 視頻目標(biāo)檢測; 統(tǒng)計學(xué)分析
中圖分類號: TN948.6?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)14?0095?04
Abstract: Since the common learning model of traditional support vector machine (SVM) can′t adapt to the change target posture in video, and is limited with occlusion or complex background, a new SVM neighborhood learning model is proposed. The neighborhood learning is based on the high correlation of video adjacent frame both in time and space. The training data of each testing frame is extracted from its adjacent frame to learn and update the SVM model. With the updating of the video, the SVM model is updated continually to adapt to the changes of target detection. A large number of samples were experimented in complex environment. The statistics is used to analyze the results to verify that the SVM neighborhood learning has higher accuracy and better robustness than the traditional SVM common learning.
Keywords: SVM model; neighborhood learning; video target detection; statistics analysis
0 引 言
目標(biāo)檢測是模式識別、運動圖像編碼、智能監(jiān)控等研究領(lǐng)域的重點和難點,在經(jīng)濟(jì)、工業(yè)和軍事等領(lǐng)域有著廣闊的應(yīng)用前景。目前目標(biāo)檢測方法主要有幀間差分法、光流法、背景減除法等。幀間差分法計算簡單、適應(yīng)能力強(qiáng),但檢測結(jié)果內(nèi)部容易產(chǎn)生空洞現(xiàn)象[1?2]。光流法計算復(fù)雜、運算量大,很難滿足實時性的要求[3?4]。背景減除法算法易實現(xiàn),但對外部動態(tài)場景變化非常敏感[5]。目標(biāo)跟蹤分為在線跟蹤和離線跟蹤,Kalal等在TLD在線跟蹤中提出了自適應(yīng)校準(zhǔn)跟蹤模型[6],它通過在線學(xué)習(xí)機(jī)制可以不斷更新檢測模塊以及跟蹤模塊的有關(guān)參數(shù),很適合目標(biāo)的跟蹤,但當(dāng)可形變目標(biāo)在具有背景相似的環(huán)境中跟蹤效果不理想。傳統(tǒng)支持向量機(jī)(Support Vector Machine,SVM)在解決目標(biāo)檢測問題中很有優(yōu)越性,但依然無法很好適應(yīng)目標(biāo)姿態(tài)發(fā)生變化、被遮擋或者復(fù)雜背景下的目標(biāo)檢測,對此,提出一種適用性更強(qiáng)的SVM鄰域?qū)W習(xí)模型來提升檢測效果。
1 支持向量機(jī)和K?means算法
1.1 支持向量機(jī)
支持向量機(jī)是一種具有強(qiáng)大非線性處理能力的高效分類器,SVM解決分類問題時系統(tǒng)結(jié)構(gòu)簡單,不僅保證了分類器較好的魯棒性,還可以得到全局最優(yōu)解,普適性很強(qiáng)。引入核函數(shù)可以將線性SVM推廣到非線性SVM,對高維樣本幾乎不增加額外的計算量,能很好地解決維數(shù)災(zāi)難問題。SVM 的核心思想是尋找一個滿足分類要求的最優(yōu)分類超平面[7?8], 該超平面在滿足分類精度的同時,使得分類間隔最大化。
目標(biāo)檢測問題可以簡化為一個二分類問題[9],給定分類樣本集為:,設(shè)超平面方程為:
1.2 K?means算法
K?means聚類算法是一種基于樣本間相似性度量的無監(jiān)督聚類方法。算法首先由實驗者給定所要聚類的種類,并隨機(jī)選擇k個對象種子,每個種子代表一個類的均值或中心,對剩余的每個對象,根據(jù)其與各類中心的距離將它分給最近的類,然后重新計算每個類中對象的平均值形成新的聚類中心,不斷重復(fù)此過程,直到式(9)的準(zhǔn)則函數(shù)收斂為止[10?12],如下:
無監(jiān)督聚類從研究對象的特征數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,在圖像像素點的特征空間中進(jìn)行聚類就可以在此空間中發(fā)現(xiàn)特征相似的像素點組。K?means用于目標(biāo)檢測時分為兩類,即是目標(biāo)物體類或者不是目標(biāo)物體類。首先計算檢測圖像內(nèi)每個像素點與兩個聚類中心的距離,根據(jù)距離分類,然后更新兩個聚類的像素成員,更新聚類中心,計算待分圖像內(nèi)每個像素點到新聚類中心的距離,重復(fù)上述操作直到聚類中心不再發(fā)生改變,分類即完成。
2 SVM鄰域?qū)W習(xí)
2.1 理論基礎(chǔ)
(1) 圖像預(yù)處理。圖像預(yù)處理的目的是在保留足夠多的圖像信息前提下,提高圖像質(zhì)量,便于后續(xù)的圖像處理分析。圖像噪聲會影響圖像質(zhì)量,進(jìn)而影響實驗的結(jié)果,為了提高實驗的準(zhǔn)確性,這里采用高斯濾波去除噪聲。
(2) 特征提取。HSI彩色空間適合視覺系統(tǒng)中彩色感知有關(guān)的彩色圖像處理,用色調(diào)(Hue)、飽和度(Saturation)和強(qiáng)度(Intensity)來描述,通過HSI提取目標(biāo)對象特征參數(shù)。
(3) 圖像后處理。腐蝕可以消除物體邊界點,使目標(biāo)縮小,除去一部分噪聲點;膨脹使目標(biāo)增大,可添補目標(biāo)中的空洞,將這兩種操作對目標(biāo)物體檢測的結(jié)果所形成的二值圖像進(jìn)行后期處理。
2.2 SVM鄰域?qū)W習(xí)模型
2.2.1 無學(xué)習(xí)模型
將K?means用于目標(biāo)檢測實驗中,k值取2,圖像中分為是目標(biāo)類和不是目標(biāo)類,K?means學(xué)習(xí)是一種無學(xué)習(xí)的聚類方法,K?means無學(xué)習(xí)作為SVM其他學(xué)習(xí)模型檢測效果的一種參照。
2.2.2 SVM普通學(xué)習(xí)模型
SVM在傳統(tǒng)的模式識別學(xué)習(xí)中,是將視頻的第一幀或者前幾幀正負(fù)特征樣本數(shù)據(jù)在LIBSVM工具箱中訓(xùn)練SVM模型,LIBSVM工具箱是林智仁等開發(fā)設(shè)計的關(guān)于SVM模式識別與回歸的軟件包,將訓(xùn)練的SVM模型結(jié)合工具箱中SVM?predict對后續(xù)幀的正負(fù)樣本進(jìn)行預(yù)測,將預(yù)測結(jié)果轉(zhuǎn)化成二值圖像。該模型不能隨著視頻的變化而及時更新,適應(yīng)性較差,當(dāng)后續(xù)幀圖像發(fā)生復(fù)雜變化時,前期學(xué)習(xí)的SVM模型不會隨著這些變化而更新,這將直接影響視頻目標(biāo)檢測的效果。
2.2.3 SVM在線鄰域?qū)W習(xí)模型
SVM普通學(xué)習(xí)模型不能滿足視頻中目標(biāo)檢測的準(zhǔn)確率,通常視頻中相鄰幀間細(xì)節(jié)變化很小,相鄰幀之間存在著時間和空間上的高度相關(guān)性。SVM在線鄰域?qū)W習(xí)選取測試幀之前的相鄰若干幀的正負(fù)樣本訓(xùn)練SVM檢測模型。用此模型在SVM?predict工具箱中預(yù)測測試幀中數(shù)據(jù)點的分類,即每次都使用測試幀之前的相鄰若干幀圖像的正負(fù)特征樣本訓(xùn)練SVM模型。這樣SVM模型將隨著視頻的推演不斷自動更新成新的模型,即便視頻中目標(biāo)的姿態(tài)發(fā)生變化。有遮擋或者遇到復(fù)雜背景時,模型依舊能自適應(yīng)其變化,理論上該模型具有很好的適應(yīng)性,相比SVM普通學(xué)習(xí)模型應(yīng)用范圍更廣。
2.2.4 SVM離線鄰域?qū)W習(xí)模型
SVM在線鄰域?qū)W習(xí)雖然很好地解決了一些視頻中目標(biāo)檢測問題,但在非常復(fù)雜的環(huán)境下檢測效果依然不夠理想。為了適應(yīng)更多復(fù)雜情況下的目標(biāo)檢測,提出一種更有效的目標(biāo)檢測模型,即SVM離線鄰域?qū)W習(xí)模型。視頻中相鄰幀畫面之間存在著時間和空間的相關(guān)性。測試幀不僅與其之前的相鄰幀具有很強(qiáng)的時間和空間連續(xù)性,與其之后的相鄰幀也有很強(qiáng)的時間和空間連續(xù)性。如果測試者事先可以獲取完整檢測視頻,那么實驗前便可以獲得測試幀前后的臨近幀信息,將前后相鄰的若干幀信息同時訓(xùn)練SVM模型,兩者結(jié)合進(jìn)行結(jié)果預(yù)測,通常能獲取更準(zhǔn)確的檢測結(jié)果,這就是SVM離線鄰域?qū)W習(xí)。SVM在線鄰域?qū)W習(xí)和SVM離線鄰域?qū)W習(xí)合稱為SVM鄰域?qū)W習(xí)。
SVM離線鄰域?qū)W習(xí)的好處顯而易見,它不僅可以直接對未進(jìn)行實驗過的視頻進(jìn)行目標(biāo)檢測,還可以對SVM在線鄰域?qū)W習(xí)模型已完成的檢測結(jié)果進(jìn)行校正,由于SVM離線鄰域?qū)W習(xí)模型的監(jiān)督信息量比在線鄰域?qū)W習(xí)模型多,理論上可以猜想,SVM離線鄰域?qū)W習(xí)模型檢測準(zhǔn)確性更好,魯棒性更強(qiáng)。SVM離線鄰域?qū)W習(xí)在監(jiān)控視頻等可在實驗前獲取完整視頻再進(jìn)行分析的應(yīng)用領(lǐng)域作用不可估量。
實驗流程圖如圖1所示。
3 實驗結(jié)果與分析
為了驗證SVM鄰域?qū)W習(xí)的有效性,從國際物體跟蹤研究領(lǐng)域中的標(biāo)準(zhǔn)視頻數(shù)據(jù)庫中選取了8段視頻,超過1 200幀圖像作為樣本數(shù)據(jù)庫,這些視頻中包含了目標(biāo)姿態(tài)變化、有遮擋和復(fù)雜背景等各種復(fù)雜情況,使用OpenCV對圖像進(jìn)行各種方法的實驗[13]。圖 2是4幀樣本示例檢測結(jié)果圖。圖2中紅色框表示SVM離線鄰域?qū)W習(xí)預(yù)測結(jié)果,藍(lán)色框表示SVM在線鄰域?qū)W習(xí)預(yù)測結(jié)果,黃色框表示SVM普通學(xué)習(xí)預(yù)測結(jié)果,紫色框表示K?means無學(xué)習(xí)預(yù)測結(jié)果,橙色框是圖像檢測標(biāo)準(zhǔn)結(jié)果。為了提高標(biāo)準(zhǔn)框的準(zhǔn)確率,請未參加過實驗的人認(rèn)真反復(fù)觀看所有視頻,對實驗幀進(jìn)行手動標(biāo)注。圖2中被檢測的魚不僅身處背景復(fù)雜的環(huán)境中,姿態(tài)也在不停地改變,后期還被其他魚遮擋,從圖2中可以看出紅色框和藍(lán)色框比黃色框和紫色框更接近橙色框,可以定性判斷SVM鄰域?qū)W習(xí)(包括離線和在線)要比SVM普通學(xué)習(xí)和K?means無學(xué)習(xí)檢測效果更好。
進(jìn)一步定量驗證SVM鄰域?qū)W習(xí)的有效性,引入覆蓋率,覆蓋率指預(yù)測框和標(biāo)準(zhǔn)框重疊區(qū)域面積占標(biāo)準(zhǔn)框面積的比例,覆蓋率越大則檢測方法準(zhǔn)確率越高。
采用多重比較判斷各方法的有效性,表1統(tǒng)計樣本數(shù)據(jù)庫所有檢測結(jié)果中方法1和方法2覆蓋率之間的差值,用覆蓋差估計表示。當(dāng)覆蓋差估計為正值時,表明第一種方法比第二種方法檢測效果好;反之,則第一種方法不如第二種方法。置信區(qū)間是表示覆蓋差估計落入該區(qū)間有95%的置信水平。
表1實驗覆蓋差估計都是正值,證明SVM離線鄰域?qū)W習(xí)方法最優(yōu),SVM在線鄰域?qū)W習(xí)方法次優(yōu),即SVM鄰域?qū)W習(xí)在視頻目標(biāo)檢測中比SVM普通學(xué)習(xí)和K?means無學(xué)習(xí)準(zhǔn)確率更高,魯棒性更好。
4 結(jié) 語
本文設(shè)計一種更接近視頻目標(biāo)檢測問題本質(zhì)的SVM鄰域?qū)W習(xí)模型(包括離線和在線),通過與SVM普通學(xué)習(xí)和K?means無學(xué)習(xí)比較,SVM鄰域?qū)W習(xí)模型具有更高的準(zhǔn)確率和更好的魯棒性,SVM鄰域?qū)W習(xí)可以更好地滿足視頻中的目標(biāo)檢測。
參考文獻(xiàn)
[1] 鄔大鵬,程衛(wèi)平,于盛林.基于幀間差分和運動估計的Camshift目標(biāo)跟蹤算法[J].光電工程,2010,37(1):55?60.
[2] 萬纓,韓毅,盧漢清.運動目標(biāo)檢測算法的探討[J].計算機(jī)仿真,2006,23(10):221?226.
[3] 施家棟,王建中,王紅茹.基于光流的人體運動實時檢測方法[J].北京理工大學(xué)學(xué)報,2008,28(9):794?797.
[4] 李建,藍(lán)金輝,李杰.一種新型快速運動目標(biāo)檢測算法[J].中南大學(xué)學(xué)報(自然科學(xué)版),2013,44(3):978?983.
[5] 連曉峰,張弢,劉載文,等.一種改進(jìn)的運動人體目標(biāo)檢測方法研究[J].計算機(jī)仿真,2011,28(2):308?311.
[6] KALAL Z, MIKOLAJCZYK K, MATAS J. Tracking?learning?detection [J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(7): 1409?1422.
[7] 郭明瑋,趙宇宙,項俊平,等.基于支持向量機(jī)的目標(biāo)檢測算法綜述[J].控制與決策,2014,29(2):193?198.
[8] 劉松松,張輝,毛征,等.基于HRM特征提取和SVM的目標(biāo)檢測方法[J].國外電子測量技術(shù),2014,33(10):38?41.
[9] 曾文華,馬健.支持向量機(jī)增量學(xué)習(xí)的算法與應(yīng)用[J].計算機(jī)集成制造系統(tǒng),2003,9(z1):144?148.
[10] 楊善林,李永森,胡笑旋,等.K?means算法中的k值優(yōu)化問題研究[J].系統(tǒng)工程理論與實踐,2006,26(2):97?101.
[11] 李燦燦,王寶,王靜,等.基于K?means聚類的植物葉片圖像葉脈提取[J].農(nóng)業(yè)工程學(xué)報,2012,28(17):157?162.
[12] 徐黎明,呂繼東.基于同態(tài)濾波和K均值聚類算法的楊梅圖像分割[J].農(nóng)業(yè)工程學(xué)報,2015,31(14):202?208.
[13] 孫建偉,薛秀萍,劉曉東,等.基于OpenCV的視頻序列目標(biāo)檢測與跟蹤技術(shù)研究[J].電子技術(shù),2013(6):20?23.