摘要:采用簡(jiǎn)化的混合高斯模型提取背景并保持跟新,利用背景差法提取前景目標(biāo),并最終提取目標(biāo)的輪廓特征。CENTRIST特征[4]可以很好的編碼相鄰像素的比較信息,而且隱式的表達(dá)了全局的輪廓, 與傳統(tǒng)的Adaboost算法結(jié)合起來可以很好的檢測(cè)行人。當(dāng)CENTRIST與線性分類器結(jié)合使用時(shí),可以不必生成特征向量,也不需要對(duì)圖像進(jìn)行預(yù)處理和特征向量的規(guī)范化處理,還可以進(jìn)一步用硬件加速(使用GPU),在一個(gè)1.2GHZ的CPU機(jī)器中,檢測(cè)速度可以達(dá)到20fps。
關(guān)鍵詞:輪廓特征;CENTRIST特征;線性分類器;特征向量;直方圖交叉核
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)02-0370-03
近年來,隨著綜合國(guó)力的提升以及人民生活水平的不斷提高,銀行、交通、安檢、軍事設(shè)施、國(guó)家安全設(shè)施以及高檔私人住宅等領(lǐng)域?qū)Π踩婪逗同F(xiàn)場(chǎng)及時(shí)記錄報(bào)警系統(tǒng)的需求與日劇增,并且要求越來越高。視頻監(jiān)控已經(jīng)廣泛應(yīng)用于在上述的各個(gè)方面,并得到普遍認(rèn)可和好評(píng)。但是,在大多數(shù)情況下,普遍采用的是人工完成,無法滿足實(shí)時(shí)性和智能性的要求。隨著圖像處理和模式識(shí)別技術(shù)的發(fā)展,行人檢測(cè)成為智能監(jiān)控的領(lǐng)域的一項(xiàng)重要課題,由于行人具有各種各樣的姿勢(shì)及大小數(shù)量不等附屬物,也使得行人檢測(cè)成為一項(xiàng)極具挑戰(zhàn)性的課題。
1 現(xiàn)狀
視頻監(jiān)控系統(tǒng)已經(jīng)擁有了 20 多年的發(fā)展與積累,共經(jīng)歷三代的發(fā)展過程:第一代, 20 世紀(jì) 90 年代初以前主要是模擬視頻監(jiān)控時(shí)代。以 VCR(Video Cassette Recorder)傳統(tǒng)閉路電視系統(tǒng)為技術(shù)代表,通過大量連接電纜以及視頻矩陣切換設(shè)備來實(shí)現(xiàn)。在智能化方面,完全依靠監(jiān)控人員來觀察視頻畫面來實(shí)現(xiàn)。第二代,20世紀(jì) 90 年代中期,借助與數(shù)字視頻壓縮編碼技術(shù)的發(fā)展,形成了以 DVR(Digital Video Recorder)為代表的半數(shù)字視頻監(jiān)控時(shí)代。借助于網(wǎng)絡(luò)技術(shù)將壓縮的視頻數(shù)據(jù)傳送到監(jiān)控中心,并存儲(chǔ)在電腦硬盤上。在智能化方面。第三代,最早出現(xiàn)在21 世紀(jì)初,全數(shù)字視頻監(jiān)控時(shí)代。可以利用現(xiàn)有的計(jì)算機(jī)網(wǎng)絡(luò),通過標(biāo)準(zhǔn)的 TCP/IP協(xié)議進(jìn)行任意場(chǎng)景的智能監(jiān)控,并可以把經(jīng)過壓縮的視頻數(shù)據(jù)保存在磁盤陣列中或者光盤中,以便于查詢快捷方便。
這樣計(jì)算的量階就為一個(gè)超塊大小。不但節(jié)省了計(jì)算時(shí)間,也節(jié)省了內(nèi)存空間。
該方法不用對(duì)圖像預(yù)處理,也不用得出特征向量,提取圖像特征過程中各個(gè)圖像分塊的特征與線性分類器完美地銜接一起,使得該方法成功應(yīng)用于實(shí)時(shí)行人檢測(cè)系統(tǒng)。
2.3 分類器地訓(xùn)練
分類器訓(xùn)練階段,采用108X36大小的圖像作為正樣本訓(xùn)練集合P,用完整的不含行人的圖像作為負(fù)樣本集N,首先從N中隨機(jī)抽取少量108X36大小圖像塊作為負(fù)樣本訓(xùn)練集N1,用P∪N1集合訓(xùn)練一個(gè)線性SVM分類器H1。接著用H1檢測(cè)集合N,生成一個(gè)新的負(fù)樣本集合N2,N2縮放后與集合P再訓(xùn)練生成一個(gè)線性分類器H2。如此下去直至N中所有的圖像至少被H1,H2……中的一個(gè)分類器判定為負(fù)樣本。最后用正樣本集P和所有的負(fù)樣本集Ni訓(xùn)練出一個(gè)線性SVM分類器Hlin。
線性分類器能夠保證較快的檢測(cè)速度,但是在直方圖特征的檢測(cè)上SVM的HIK(Histogram Intersection Nuclear)核要比線性核具有較高的檢測(cè)精度。所以我們訓(xùn)練了一個(gè)HIK核SVM分類器,采用之前的方法:Hlin檢測(cè)負(fù)樣本集N生成一個(gè)負(fù)樣本訓(xùn)練集Nfinal,
用P和Nfinal訓(xùn)練一個(gè)HIK核SVM分類器Hhik,這樣檢測(cè)時(shí),可以級(jí)聯(lián)使用這倆種分類器,既達(dá)到實(shí)時(shí)要求又提高了檢測(cè)精度。
3 結(jié)果
訓(xùn)練樣本中均來自 INRIA 的行人數(shù)據(jù)庫(kù), 共包含1126個(gè)正樣本和3000多個(gè)負(fù)樣本。在正樣本圖像中, 行人穿著不同顏色、式樣和花紋的服裝, 有著不同的動(dòng)作, 而且面對(duì)攝像機(jī)的角度變化很大, 是在不同的光照條件和季節(jié)拍攝的。負(fù)樣本圖像都是自然場(chǎng)景圖像。訓(xùn)練樣本的尺寸為 108X36像素大小。
在 PC 機(jī)(Intel Celeron 2CPUs E3300 2.5GHz,2GB 內(nèi)存)上對(duì)系統(tǒng)進(jìn)行了測(cè)試,可以達(dá)到 20fps 的處理速度,可以精確地捕捉到視頻中的路人。視頻圖像的大小為 1080×768。對(duì)一個(gè)場(chǎng)景拍攝了若干視頻片段進(jìn)行試驗(yàn),每個(gè)視頻段長(zhǎng)度為10分鐘左右,實(shí)驗(yàn)結(jié)果部分截圖如圖2所示。
(a) (b) (c)
圖2
表1 與目前最流行的HOG算法比較結(jié)果
從表1中可以看出CENTRIST算法具有較高的檢測(cè)速度,主要是因?yàn)樘崛ENTRIST描述子不需對(duì)圖像進(jìn)行預(yù)處理和后處理,而且可以邊提取邊計(jì)算。相比之下,HOG需要對(duì)圖像進(jìn)行處理并且使用SVM分類器高斯核,使得檢測(cè)時(shí)間較長(zhǎng),而檢測(cè)效果要高些。
4 總結(jié)與展望
提出了CENTRIST特征描述符:對(duì)行人圖像的sobel邊緣圖像進(jìn)行像素級(jí)比較處理,得出圖像的局部比較信號(hào),并對(duì)此局部比較信號(hào)采取類似LBP形式的編碼,得到行人圖像的特征描述符,將該特征描述符與線性分類器無縫隙拼接實(shí)現(xiàn)行人的檢測(cè)。
使用兩種不同類型的SVM分類器,線性分類器保證較高的檢測(cè)速率,使得HIK核SVM檢測(cè)少量的,經(jīng)線性SVM檢測(cè)過的圖像。這樣不但縮短了檢測(cè)時(shí)間,更是提高了檢測(cè)精度。
行人檢測(cè)在國(guó)計(jì)民生的各個(gè)領(lǐng)域里有很重要的用途。并可以在此基礎(chǔ)上進(jìn)一步智能化,如識(shí)別人體的姿勢(shì),判斷人的行為。行人檢測(cè)的一套方法還可以運(yùn)用到其他類型的目標(biāo)檢測(cè),比如車輛檢測(cè)等。
參考文獻(xiàn):
[1] 劉亞,艾海舟,徐光佑.一種基于背景模型的運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤算法[J].信息與控制,2002,31(4):315-319.
[2] 朱齊丹,張智,邢卓異.支持向量機(jī)改進(jìn)序列最小優(yōu)化學(xué)習(xí)算法[J].哈爾濱工程大學(xué)學(xué)報(bào),2007,28(2):183-188.
[3] Wojek C, Dork′o C, Schulz A, et al. Sliding-windows for rapid object class localization: A parallel technique[R]. in DAGM-Symposium, 2008.
[4] Wu Jian-xin, Geyer C,Rehg J M. Real-time human Detection Using Contour Cues[R]. IN ICRA, 2011:860-867.
[5] Dalal N,Triggs B. Histograms of oriented gradients for human Detection[R]. IN CVPR,2005: 886-893.
[6] Leibe B,Seemann E, Schiele B. Pedestrian detection in crowded scenes[R]. IN CVPR:878-885.
[7] Wu J. A fast dual method for HIK SVM learning[R]. IN ECCV:552–565.
[8] Wang X,Han T H,Yan S. An HOG-LBP human detector with partial occlusion handling[R].IN ICCV,2009.