国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進HOG 特征值的行人檢測

2015-11-26 02:59:26張桂寧
計算機與現(xiàn)代化 2015年2期
關鍵詞:梯度方向直方圖行人

張桂寧

(陜西省行政學院,陜西 寶雞 710068)

0 引言

隨著智能監(jiān)控系統(tǒng)的普及,如何使用計算機代替人工進行監(jiān)控,以緩解人工壓力并提高工作效率,已成為當前研究熱點。其中一個非常重要的工作就是從圖像或視頻中進行目標檢測,而行人檢測技術就是當前典型代表。目前,行人檢測技術已在游戲中的人機交互、機器人導航、智能汽車等領域得到諸多應用。然而,由于行人服飾和姿態(tài)的多樣性、行人相互遮擋、光線多變、背景復雜等原因,使得提高行人檢測精度依舊面臨挑戰(zhàn)。

為此,研究人員已經(jīng)將多種特征應用于行人檢測技術,包括:Haar 特征、LBP 特征、自適應輪廓特征、形狀隱模型以及梯度方向直方圖(HOG)等[1-3]。其中,HOG 特征是由文獻[4]首次提出,以應對梯度直方圖(HG)特征在明暗背景中梯度方向產(chǎn)生變化的情況。由于HOG 特征對圖像窗口中的梯度信息進行了充分的描述,并且對小幅旋轉和平移變化具有較強的魯棒性。因此,基于HOG 特征的行人檢測算法被廣泛研究和改進。如朱向軍[5]等人通過大量的實驗分析表明:HOG 特征在不同光照條件下對行人具有敏感的識別能力。Paisitkriangkrai S[6]等人詳細研究了不同參數(shù)的HOG 特征對結果的影響,其結果也顯示HOG 特征能夠提高行人檢測精度。雖然HOG 特征能夠改善行人檢測算法的性能;然而HOG 特征在行人表達上依然存在缺陷。為此,諸多學者將多特征與HOG 結合,以改善其表達能力。如Wu Jiefa[7]等人證明了對行人的多特征聯(lián)合表達,比HOG 單特征表達會取得更好的效果,并將Haar 特征和HOG 特征相結合。相似的想法也出現(xiàn)在文獻[8]中,它們分別將局部保持投影(LPP)特征和局部二值模式(LBP)與HOG 特征相結合,都取得較好的效果。Pierre Sermanet 等人[9]針對HOG 特征在遮擋情況下的失效問題,提出一種改進的HOG 特征,提高了行人檢測的速度。趙瑞宇[10]等人使用垂直邊緣進行預處理,在使用HOG +Adaboost 框架進行行人檢測,加快了系統(tǒng)處理速度。

綜上所述,現(xiàn)有的HOG 特征研究及其改進方向是如何通過其他手段進一步提高基于HOG 特征的行人檢測的準確率,但這些方法都忽視了HOG 特征本身的改進。

對此,本文從HOG 特征本身表達能力出發(fā),提出一種改進HOG 特征,進一步增加HOG 特征的表達能力和魯棒性,并將其用于行人檢測。最后,借助仿真平臺測試了本文行人檢測技術的性能。

1 HOG 特征

HOG 特征是基于局部信息統(tǒng)計的特征描述子,其主要思想是一幅圖像中的局部目標的表象和形狀能夠被梯度或邊緣的方向密度分布很好的描述。首先將圖像劃分成多個不重疊的細胞,每個細胞大小為n×n,在計算出每個像素的梯度后,使用直方圖統(tǒng)計每個細胞的梯度信息。然后合并多個細胞,組成一個塊,將各個細胞的直方圖組合就成為HOG 特征。具體步驟如下:

Step 1圖像標準化。

由于顏色信息并不大,首先將圖像轉化為灰度圖。為了避免光照因素的影響,需要對整個灰度圖像進行規(guī)范化,以降低圖像局部的陰影和光照變化。

Step 2梯度計算。

首先使用梯度算子Sobel[11]對原圖像做卷積運算,計算每個像素在橫縱坐標方向的梯度,并據(jù)此計算每個像素位置的梯度方向值;這種求導操作不僅能夠捕獲輪廓、人影和一些紋理信息,還能進一步弱化光照的影響。

Step 3細胞方向直方圖建立。

以細胞為單位,對每個細胞建立方向直方圖。為了避免因為前景-背景光線差的問題,即物體在明亮的背景時,將梯度方向朝內(nèi),在黑暗的背景時,梯度方向朝外。首先將[0,2π]區(qū)間縮小為[0,π],即[π,2π]區(qū)間的方向全部減去。然后將[0,π]分為若干個區(qū)間,使用細胞中所有像素的梯度對直方圖進行投票。該區(qū)間稱為投票方向區(qū)間;而投票的權重,則為其對應的梯度幅值。

Step 4細胞合并和歸一化。

將塊內(nèi)所有細胞的梯度方向直方圖按一定次序串聯(lián),組成一條大的方向直方圖,用于表示整個塊的梯度統(tǒng)計信息。由于局部光照以及前景-背景對比度的變化,使得梯度強度的變化范圍非常大,故需對梯度強度做歸一化。歸一化能夠進一步地對光照、陰影和邊緣進行壓縮[12-13]。為了消除噪聲對直方圖的影響,首先對直方圖中大于閾值的元素做截斷處理,即這些元素的值等于閾值,然后對剩余的元素進行歸一化,得到新的直方圖。

2 改進的HOG 特征

雖然傳統(tǒng)的HOG 特征對一定的光照變化有較強的魯棒性,但是HOG 特征的表達能力依然存在不足。首先,為了避免因為背景明暗變化帶來的梯度方向改變而導致HOG 對同一目標表達的迥異,HOG 將區(qū)間變?yōu)橹狈綀D統(tǒng)計,其中一個示例如圖1 所示,從圖中可以看到,由于背景明暗變化,使目標梯度方向相反,在[0,π]區(qū)間下投影可使梯度方向直方圖不受影響,見圖1(c)所示。

圖1 方向區(qū)間壓縮對背景的魯棒性

然而,自動忽略相反方向差異會導致HOG 忽略一些目標本身表現(xiàn)出的差異信息。其中的幾個示例如圖2 所示,由于這類不同形狀物體的梯度方向相反,且大小和數(shù)量相等,導致HOG 特征描述符是一樣的,產(chǎn)生相同的直方圖,見圖1 中的右圖。因此,HOG特征對這類物體不具有區(qū)分能力。

圖2 HOG 對某些目標的表達問題

針對上述問題,本文提出了改進的HOG 直方圖表示方法。令[0,2π]劃分為L 個區(qū)間,其中L 為偶數(shù),將每個細胞內(nèi)的像素進行投票,得到梯度方向直方圖Hg:

其中Hog(i) 和Hg(i) 分別是HOG 和Hg中的第i 個元素值。

為了提高HOG 表達能力,本文在HOG 之后,串聯(lián)一組新的直方圖Hng,其長度和HOG 相等,每個元素值為:

令新的梯度方向直方圖為差分HOG(DHOG),當相同物體出現(xiàn)在背景明暗條件下時,Hog和Hng是一樣的,從而使得Hnew在2 種條件下也是一樣的。而對于圖2 中的這類物體,Hnew的表達如圖3 所示。對比圖3(b)與圖3(c)可知,顯然,Hnew比Hog的表達能力更強。

通過將細胞組合變成塊,可使HOG 更為魯棒地表達復雜物體,但是這一過程中的截斷處理會使HOG 的表達能力變?nèi)?。如圖4 所示,對于僅有長邊緣差異的2 個物體,傳統(tǒng)的HOG 在每個區(qū)間(bin),會對這2 個物體產(chǎn)生相同的直方圖。為此,本文提出一種新的歸一化方法:

圖3 HOG 和DHOG 對比

其中,N 是每個塊中細胞的個數(shù),Hd(i) 表示細胞的DHOG,Hdcn為歸一化的結果。

以圖4 中的物體為例,DHOG 的表達如圖5 所示。對比圖4 和圖5 可知,歸一化后的DHOG 表達能力更強。

圖4 傳統(tǒng)HOG 歸一化結果

圖5 DHOG 歸一化結果

基于改進HOG 特征,設計了相應的行人檢測機制,見圖6。

圖6 本文機制流程圖

3 實 驗

本節(jié)將通過在INRIA、Daimler 數(shù)據(jù)庫上的實驗來驗證改進HOG 的有效性和魯棒性。為了便于實驗,令本文設計的HOG 描述符為DHOG;對照組為當前HOG 以及文獻[14]的HG 描述符-VJ 方法。

整個實驗在頻率為4 核1.6 GHz、4 G 內(nèi)存的電腦上運行,代碼使用Matlab 編寫。實驗數(shù)據(jù)庫使用INRIA、Daimler 數(shù)據(jù)庫。對于INRIA 數(shù)據(jù)庫,訓練樣本包括2416 張已裁剪的正樣本和1218 張未裁剪的負樣本圖片,滑動窗口尺寸為128×64。對于Daimler 數(shù)據(jù)庫,訓練數(shù)據(jù)包含3 組裁剪的正負樣本,每組分別包含尺寸為36×18 的4 800 張正樣本和5 000 張負樣本。

為了比較不同特征的性能差異,本文使用固定誤檢率(False Positives per Window,F(xiàn)PPW)、下漏檢率(Miss Rate,MR)、log 平均誤檢率(Log-Average Miss Rate,LAMR)和正確率(Accuracy)為評價標準[15-16]。

實驗中,細胞的大小為3 ×3、分塊大小為12 ×12、投票方向區(qū)間為[0,2π]、區(qū)間數(shù)L=10、每個塊中細胞量N 為16。每個塊由不重疊細胞組成。每個細胞直方圖長度為18。在歸一化中截斷閾值設置為0.08。分類器采用線性SVM,檢測過程從INRIA 中選擇288張圖片,圖片進行多尺度縮放,每次縮放比例為1.05,從Daimler 中選擇大小為36 ×18 的4 800 張正樣本和5 000 張負樣本圖片進行測試。

在上述2 個圖像庫中測試,檢測結果見圖7。從圖中可知,本文機制的檢測效果比較好,行人姿勢等細節(jié)清晰可見。

圖7 本文機制檢測實例

為了測試DHOG 特征的性能,實驗選用傳統(tǒng)HOG 和HG 特征在2 個數(shù)據(jù)庫中作對比試驗,首先不對特征做處理,直接送入分類器,然后先對特征進行PCA 降維處理,再送入分類器,實驗結果見表1。同時,為進一步測試DHOG 特征的綜合性能,本文使用經(jīng)典HIKSVM 框架[17],在這個框架下,分析了HOG 特征和DHOG 特征對結果的影響,如表1 所示。從表1 可以看出,DHOG 在2 個數(shù)據(jù)庫中的結果都比HOG 和HG 性能優(yōu)越,在HIKSVM 框架下,DHOG 特征也比HOG 特征有更好的性能。

表1 DHOG 特征在INRIA 和Daimler 中的性能比較

圖8 各方法的ROC 曲線

圖8 給出了HOG+HIKSVM、DHOG+HIKSVM和Viola 提出的VJ 方法[14]在INRIA、Daimler 中的ROC 曲線??梢钥闯觯疚乃岣倪MHOG 特征能夠在窗口誤檢率(FPPW)一定的情況下,比傳統(tǒng)HOG和VJ 方法有更低的漏檢率。在Daimler 庫中,當誤檢為0.2 時,傳統(tǒng)HOG 的漏檢率為9.52%,VJ 方法的漏檢率為13.17%,而所提DHOG 特征僅有6.23%。

4 結束語

特征值表達能力的好壞直接影響行人檢測的性能,本文針對HOG 特征固有的目標表達缺陷問題,提出了改進HOG 特征描述符。首先分析了HOG 特征在投票區(qū)間處理和歸一化處理中所存在的表達缺陷問題,然后提出對應的改進操作,最后在INRIA、Daimler 數(shù)據(jù)庫中進行了實驗。實驗結果表明,與傳統(tǒng)HOG 特征相比,本文提出的改進HOG 描述符在行人檢測上具有更好的性能。

[1]李暉,曲仕茹.基于分層梯度方向直方圖和SVM 的人體識別[J].計算機測量與控制,2010,18(11):2602-2606.

[2]蘇松志,李紹滋,陳淑媛.行人檢測技術綜述[J].電子學報,2012,40(4):814-820.

[3]張春鳳,宋加濤,王萬良.行人檢測技術研究綜述[J].電視技術,2014,38(3):157-162.

[4]孫銳,陳軍,高雋.基于顯著性檢測與HOG-NMF 特征的快速行人檢測方法[J].電子與信息學報,2013,35(8):1922-1925.

[5]朱向軍,王潔,馮志林.基于統(tǒng)計分類的多行人檢測跟蹤算法[J].電視技術,2012,36(11):118-120.

[6]Paisitkriangkrai S,Shen C,Zhang J.Performance evaluation of local features in human classification and detection[J].IET Computer Vision,2008,2(4):236-246.

[7]Wu Jiefa,Yang Sheng,Zhang Lingling.Pedestrian detection based on improved HOG feature and robust adaptive boosting algorithm[J].Image and Signal Processing,2011,79(26):1535-1539.

[8]Andres Sanin,Conrad Sanderson.K-Tangent spaces on Riemannian manifolds for improved pedestrian detection[J].Computer Vision and Pattern Recognition,2014,56(1):35-37.

[9]Pierre Sermanet,Koray Kavukcuoglu,Soumith Chintala.Pedestrian detection with unsupervised multi-stage feature learning[J].Computer Vision and Pattern Recognition,2013,42(2):1-8.

[10]趙瑞宇,孫首群,呂曉軍,等.高鐵閘機智能監(jiān)控系統(tǒng)中的行人檢測算法研究[J].計算機應用與軟件,2013,30(3):25-28.

[11]夏清,張振鑫,王婷婷.基于改進Sobel 算子的紅外圖像邊緣提取算法[J].激光與紅外,2014,43(10):1158-1161.

[12]Yang Jian,Liu Chengjun,Zhang Lei.Color space normalization:Enhancing the discriminating power of color spaces for face recognition[J].Pattern Recognition,2010,43(4):1454-1466.

[13]Vu N S,Caplier A.Enhanced patterns of oriented edge magnitudes for face recognition and image matching[J].IEEE Trans.Image Processing,2012,21(3):1352-1365.

[14]Viola P,Jones M J,Snow D.Detecting pedestrians using patterns of motion and appearance[J].International Journal of Computer and Vision,Springer Link,2005,63(2):153-161

[15]Zheng Yongbin,Shen Chunhua,Richard Hartley.Effective pedestrian detection using center-symmetric local binary/trinary patterns[J].Computer Vision and Pattern Recognition,2010,14(2):1-11.

[16]姚雪琴,李曉華,周激流.基于邊緣對稱性和HOG 的行人檢測算法[J].計算機工程,2012,8(5):179-182.

[17]孫銳,侯能干,陳軍.基于特征融合和交叉核SVM 的快速行人檢測方法[J].光電工程,2014,41(2):53-62.

猜你喜歡
梯度方向直方圖行人
統(tǒng)計頻率分布直方圖的備考全攻略
符合差分隱私的流數(shù)據(jù)統(tǒng)計直方圖發(fā)布
毒舌出沒,行人避讓
意林(2021年5期)2021-04-18 12:21:17
基于機器視覺的鋼軌接觸疲勞裂紋檢測方法
鐵道建筑(2021年11期)2021-03-14 10:01:48
基于梯度方向一致性引導的邊緣檢測研究
科技風(2019年13期)2019-06-11 15:48:29
路不為尋找者而設
揚子江(2019年1期)2019-03-08 02:52:34
用直方圖控制畫面影調(diào)
基于光譜上下文特征的多光譜艦船ROI鑒別方法
我是行人
基于支持向量機的分類器訓練研究
宝鸡市| 昭觉县| 新和县| 凉山| 青岛市| 若羌县| 崇明县| 阳信县| 金堂县| 寿阳县| 弋阳县| 丽江市| 巴林右旗| 广汉市| 类乌齐县| 高清| 高雄县| 福海县| 汉沽区| 五峰| 浪卡子县| 陕西省| 孟州市| 金湖县| 丽水市| 灵台县| 延吉市| 敦煌市| 新巴尔虎右旗| 房产| 南昌县| 昌宁县| 巴林左旗| 海南省| 波密县| 霍城县| 卢龙县| 呼伦贝尔市| 新余市| 太仓市| 太谷县|