国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

行人檢測(cè)模型向平躺人體檢測(cè)的遷移及其性能分析

2015-05-25 02:26:28夏道勛蘇松志李紹滋
關(guān)鍵詞:候選框平躺檢測(cè)器

夏道勛,蘇松志,李紹滋*

(1.貴州師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,貴州貴陽(yáng)550001;2.廈門大學(xué)信息科學(xué)與技術(shù)學(xué)院,福建廈門361005)

行人檢測(cè)模型向平躺人體檢測(cè)的遷移及其性能分析

夏道勛1,2,蘇松志2,李紹滋2*

(1.貴州師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,貴州貴陽(yáng)550001;2.廈門大學(xué)信息科學(xué)與技術(shù)學(xué)院,福建廈門361005)

人體檢測(cè)是計(jì)算機(jī)視覺(jué)研究中的難點(diǎn)和熱點(diǎn),具有很好的理論意義和應(yīng)用價(jià)值,它可分為行人檢測(cè)和平躺人體檢測(cè).平躺人體檢測(cè)的研究正處于起步階段,存在視角變化大、姿態(tài)多樣、背景復(fù)雜等尚未解決的問(wèn)題.為此本文借鑒行人檢測(cè)研究成果,將梯度方向直方圖和支持向量機(jī)模型(HOG+SVM)、形變部位模型(DPM)和聚合通道特征(ACF)三大主流行人檢測(cè)模型遷移到平躺人體檢測(cè)中,驗(yàn)證它們的檢測(cè)效果和分析檢測(cè)性能.總結(jié)行人檢測(cè)和平躺人體檢測(cè)的異同,找出平躺人體檢測(cè)存在的關(guān)鍵問(wèn)題,為建立適應(yīng)平躺人體檢測(cè)建模提供了理論依據(jù)和實(shí)踐經(jīng)驗(yàn),最后給出平躺人體檢測(cè)模型的一些研究建議.

行人檢測(cè);平躺人體檢測(cè);梯度方向直方圖;支持向量機(jī)模型;形變部位模型;聚合通道特征

人體檢測(cè)是在輸入單張圖片或者視頻幀中,判斷其是否包含人體,如果存在,則給出人體的位置信息,它可分為行人檢測(cè)和平躺人體檢測(cè).人體兼具剛性和柔性物體的特性,易受穿著、尺度、遮擋、姿態(tài)和視角等影響,逐漸受到研究人員的高度重視,使得人體檢測(cè)成為計(jì)算機(jī)視覺(jué)的研究難點(diǎn)與熱點(diǎn).國(guó)內(nèi)外研究機(jī)構(gòu)在該領(lǐng)域做了許多研究工作[1-9].例如,Dollar等[]于2012年實(shí)現(xiàn)了100幀/s的檢測(cè)速度;Ouyang等[]將深度學(xué)習(xí)引入行人檢測(cè)中來(lái),使檢測(cè)效率得到顯著提高.行人檢測(cè)研究中,最具代表性的三大主流行人檢測(cè)模型分別是梯度方向直方圖和支持向量機(jī)模型(histogram of oriented gradients(HOG)and support vector machines(SVM),HOG+SVM)[13]、形變部位模型(deformable parts model,DPM)[14]和聚合通道特征(aggregated channel features,ACF)[15].

然而,比較行人檢測(cè),平躺人體檢測(cè)在姿態(tài)、視角、透射形變和樣本分布等更具挑戰(zhàn)性,是計(jì)算機(jī)視覺(jué)和模式識(shí)別應(yīng)用如視頻監(jiān)控、災(zāi)害救助、生物特征識(shí)別、醫(yī)療護(hù)理和公共服務(wù)機(jī)器人等研究領(lǐng)域的關(guān)鍵問(wèn)題.主要研究方法有時(shí)空法、形狀不變性、姿態(tài)估計(jì)法、3D頭部位置分析、VAU技術(shù)和RGB-D等.研究者提出了一些獨(dú)特的平躺人體檢測(cè)算法[16-20].近年來(lái),基于RGB-D目標(biāo)檢測(cè)的研究受到廣泛的關(guān)注.Mastorakis等[21]提出一種新的基于Kinect傳感器檢測(cè)平躺人體方法.Kepski等[]設(shè)計(jì)一種頂置式三維深度相機(jī)實(shí)現(xiàn)平躺人體檢測(cè),對(duì)超過(guò)45 000張深度圖像進(jìn)行測(cè)試,獲得0.0%的錯(cuò)誤率.在受害者檢測(cè)中,近年來(lái)研究者們提出了基于無(wú)人機(jī)(uninhabited aerial vehicle,UAV)的搜救方法[23-24].

根據(jù)平躺人體檢測(cè)研究的現(xiàn)狀,較行人檢測(cè)起步晚,并且不具備理論化、系統(tǒng)化.因此,本文試圖將行人檢測(cè)的三大主流模型向平躺人體檢測(cè)進(jìn)行遷移,驗(yàn)證它們的檢測(cè)效果和分析檢測(cè)性能,總結(jié)行人檢測(cè)和平躺人體檢測(cè)的異同,找出平躺人體檢測(cè)存在的關(guān)鍵問(wèn)題,為建立適應(yīng)平躺人體檢測(cè)建模提供了理論依據(jù)和實(shí)踐經(jīng)驗(yàn),最后給出平躺人體檢測(cè)的一些研究建議.

1 模型遷移

本文只涉及行人檢測(cè)的三大主流模型HOG+ SVM、DPM和ACF,并將其遷移到平躺人體檢測(cè)中,對(duì)模型遷移過(guò)程中存在的關(guān)鍵點(diǎn)和難點(diǎn)提出解決方案,主要包括數(shù)據(jù)集的重新標(biāo)注、檢測(cè)器的重新設(shè)計(jì)和非極大值抑制的算法設(shè)計(jì).

1.1 數(shù)據(jù)集的標(biāo)注

人體檢測(cè)訓(xùn)練階段和檢測(cè)階段輸入的數(shù)據(jù)都是帶有人體的圖像數(shù)據(jù)集.數(shù)據(jù)集由測(cè)試集和訓(xùn)練集組成,它們都需要事先進(jìn)行標(biāo)注,獲取人體在圖像中的具體位置,平躺人體數(shù)據(jù)集也不例外.但是直到現(xiàn)在,較為完整、系統(tǒng)的平躺人體數(shù)據(jù)集應(yīng)是廈門大學(xué)平躺人體數(shù)據(jù)集(XMULP),它的詳細(xì)內(nèi)容將在2.1中列出.

行人都是直立行走的,它的標(biāo)注信息圖示化是正立的矩形框.如圖1的(a)所示,行人的標(biāo)注信息是由正立矩形最左上角頂點(diǎn)A(x,y)、矩形框的寬w和高h(yuǎn)決定·一個(gè)行人的標(biāo)注信息可形式化描述為:{xi,yi,wi,hi},(xi,yi)是矩形框左上角頂點(diǎn)坐標(biāo),wi、hi分別是矩形框的寬和高·然而,平躺人體的檢測(cè)不單受限于行人檢測(cè)的諸多因素,并且還受人體軀干的主方向和姿態(tài)等更顯著性變化的限制,用行人檢測(cè)的標(biāo)注方法已經(jīng)不再適應(yīng)平躺人體檢測(cè),需要有適應(yīng)于平躺人體檢測(cè)的一套標(biāo)注方案.本文提出“人體15關(guān)節(jié)點(diǎn)標(biāo)注法”,如圖1的(b)所示,圖中的15個(gè)點(diǎn)分別代表人體15個(gè)關(guān)節(jié)點(diǎn).該方法只要確定頭部和腹部關(guān)節(jié)點(diǎn)的坐標(biāo)位置,標(biāo)注軟件會(huì)自動(dòng)擬合其他13個(gè)關(guān)節(jié)點(diǎn)的位置,擬合完畢后,可人為調(diào)整各個(gè)關(guān)節(jié)點(diǎn)的具體位置,使各個(gè)關(guān)節(jié)點(diǎn)的位置更加準(zhǔn)確.當(dāng)15個(gè)關(guān)節(jié)點(diǎn)位置確定后,以頸部和腹部關(guān)節(jié)點(diǎn)連線AB作為主方向,在主方向左側(cè)和右側(cè)、上方和下方最遠(yuǎn)的點(diǎn)C和D、E和F,結(jié)合主方向的方向角度θ即可找到平躺人體的標(biāo)注信息,形式化描述為{xi1,yi1,xi2,yi2,xi3,yi3,xi4,yi4},腳標(biāo)1~4分別代表矩形的4個(gè)頂點(diǎn)序號(hào).平躺人體標(biāo)注信息是非正立的矩形框,不同的數(shù)據(jù)樣本可能存在不同的平躺方向,要使數(shù)據(jù)集樣本具備多樣性,其平躺人體主方向方向夾角應(yīng)該在(0°,360°]區(qū)間服從均勻分布.因此,平躺人體數(shù)據(jù)集樣本在送入HOG+SVM、DPM和ACF模型中進(jìn)行訓(xùn)練時(shí),必須涉及到訓(xùn)練圖片的旋轉(zhuǎn),將矩形框主方向旋轉(zhuǎn)到正立的方向.

1.2 檢測(cè)器的重新設(shè)計(jì)

經(jīng)過(guò)前期的模型訓(xùn)練,HOG+SVM、DPM和ACF模型已經(jīng)具備檢測(cè)平躺人體的主方向是正立的情況,非正立的平躺人體是檢測(cè)不到的.要提升檢測(cè)器的檢測(cè)性能,必須將3個(gè)模型的檢測(cè)器重新設(shè)計(jì),主要涉及檢測(cè)圖片的視角變化、尺度縮放、非極大值抑制和結(jié)果處理等.新設(shè)計(jì)的檢測(cè)器如圖2所示.

圖1 行人標(biāo)注和平躺人體標(biāo)注的異同F(xiàn)ig.1 The differences between pedestrian annotation and lying-pose annotation

圖2 平躺人體檢測(cè)過(guò)程示意圖Fig.2 Sketch map of the lying-pose detection process

1)檢測(cè)圖片的視角變化和尺度縮放.平躺人體的表觀受透視變換的影響較大,需要通過(guò)透視變換采樣來(lái)模擬多視角下人體的變形,以增加平躺人體樣本的多樣性,提高檢測(cè)器的效率.Morel等[25]在研究圖像配準(zhǔn)的過(guò)程中提出一種仿射變換矩陣(2×2的矩陣)分解方法,受該方法的啟示,我們提出了透視變換矩陣的分解方法,在圖像采樣過(guò)程中,以參考圖像的中心點(diǎn)作為三維世界坐標(biāo)系的原點(diǎn),S為模擬相機(jī)方位.根據(jù)透視變換成像原理,參考圖像上的點(diǎn)(x,y,0)T和采樣圖像平面上的點(diǎn)(x′,y′)T之間的關(guān)系可以通過(guò)共線方程描述:

其中f表示相機(jī)焦距,(r sin?sinκ, ̄r sin?cosκ,r cos ?)為相機(jī)的世界坐標(biāo),r表示投影中心和原點(diǎn)之間的距離·因此,圖像之間的單應(yīng)矩陣可以表示為:

最終的透視變換矩陣與旋轉(zhuǎn)角?、κ和r、f這4個(gè)參數(shù)相關(guān),r和f的值與目標(biāo)的尺度相關(guān)·在測(cè)試過(guò)程中,需要對(duì)滑動(dòng)窗口進(jìn)行歸一化,因此可以把這兩個(gè)參數(shù)的值設(shè)置為常數(shù)·擴(kuò)充后測(cè)試集的數(shù)量與參數(shù)?和κ的采樣間隔有關(guān),設(shè)這兩個(gè)參數(shù)的采樣點(diǎn)數(shù)為M和N,則擴(kuò)充后測(cè)試集數(shù)量是原始數(shù)據(jù)集數(shù)量的MN倍·但在測(cè)試過(guò)程中,如果同時(shí)兼顧檢測(cè)精度和檢測(cè)速度,需要對(duì)測(cè)試集的透視變換進(jìn)行優(yōu)化和精簡(jiǎn)·

2)檢測(cè)候選框的非極大值抑制.對(duì)原始測(cè)試集的單張圖像進(jìn)行檢測(cè)時(shí),通過(guò)上一步的透視變換,產(chǎn)生不同視角、不同尺度的待檢測(cè)實(shí)例,經(jīng)過(guò)滑動(dòng)窗口切割的樣本送入模型進(jìn)行分類,得到平躺人體檢測(cè)候選框,候選框附帶有(x1,y1,x2,y2,x3,y3,x4,y4,scale,angle,score)參數(shù)值,前面8個(gè)參數(shù)是候選框在尺度scale和角度angle下的矩形框的4個(gè)頂點(diǎn)坐標(biāo)值,score是分類器對(duì)候選框的判分值.這些候選框相對(duì)于原始圖像有著不同的旋轉(zhuǎn)角度和縮放尺度,必須對(duì)這些候選框坐標(biāo)值做反向處理,將所有候選框坐標(biāo)反向變化到原始單張圖像下,帶有不同的尺度大小、不同主方向和不同分類器判分值的眾多候選框形成形如金字塔模型.利用Mean-Shift算法進(jìn)行非極大值抑制,得出最終的檢測(cè)結(jié)果.

1.3 非極大值抑制的改進(jìn)

本節(jié)重點(diǎn)闡述金字塔Mean-Shift算法.Mean-Shift最早由Fukunaga等[26]提出關(guān)于概率密度梯度函數(shù)的估計(jì),是偏移的均值向量.后來(lái),Cheng[27]對(duì)Mean Shift算法在族核函數(shù)和權(quán)重系數(shù)2個(gè)方面做了推廣,使得不同樣本點(diǎn)的重要性不一樣,這極大地延伸了Mean-Shift的適用范圍,它在聚類、圖像平滑、圖像分割和跟蹤方面得到廣泛的應(yīng)用.

在數(shù)據(jù)集合的分析過(guò)程中,如果需要知道數(shù)據(jù)分布密度最大的位置,即可對(duì)標(biāo)準(zhǔn)密度梯度進(jìn)行估計(jì).利用核函數(shù)的可微性,其密度梯度估計(jì)定義為恒等于核密度估計(jì)的梯度·其梯度為:

令g(x)= ̄k′(x),假設(shè)除了有限個(gè)點(diǎn),輪廓函數(shù)k(.x)的梯度對(duì)所有x∈[0,∞)均存在·將g(x)作為輪廓函數(shù),核函數(shù)G(x)定義為G(x)=cg,dg(‖x‖2),這里cg,d是標(biāo)準(zhǔn)化常量,核函數(shù)K(x)稱為核函數(shù)G(x)的陰影函數(shù)(shadow)·將g(x)代入上式有:

上式中的第1項(xiàng)是在x點(diǎn)處基于核函數(shù)G(x)的無(wú)參密度估計(jì),第2項(xiàng)(第2個(gè)中括號(hào)內(nèi))是Mean-Shift向量,令為mh,G(x).為了更好地理解這個(gè)式子的物理意義,我們假設(shè)上式中的g(x)=1,這時(shí)mh,G(x)可以寫成.

Mean-Shift向量mh,G(x)應(yīng)該轉(zhuǎn)移到樣本點(diǎn)相對(duì)于點(diǎn)x變化最多(最大)的地方,其方向也就是密度梯度的方向·但是,式(5)中的所有樣本點(diǎn)xi對(duì)m(x)的貢獻(xiàn)是一樣的·一般而言,離x越近的采樣點(diǎn)估計(jì)x周圍的統(tǒng)計(jì)特征越重要,因此引入了核函數(shù)的概念·就是對(duì)每個(gè)采樣點(diǎn)的權(quán)值,所以式(4)是在核函數(shù)g(x)加權(quán)下的Mean-Shift向量.

金字塔Mean-Shift算法是在它的基礎(chǔ)上,將不同尺度、不同角度以及不同分類權(quán)重等的所有數(shù)據(jù)集,融合在相同參考值下,做統(tǒng)一的非極大值抑制.為了較為直觀地展示算法的實(shí)現(xiàn)過(guò)程,我們將問(wèn)題做簡(jiǎn)化.在二維平面下,生成服從高斯分布的有限個(gè)隨機(jī)點(diǎn),隨機(jī)點(diǎn)附帶有與檢測(cè)候選框相同的參數(shù)值,如圖3(a)所示.經(jīng)過(guò)金字塔Mean-Shift算法非極大值抑制后,得出如圖3(b)所示的6個(gè)中心點(diǎn),中心點(diǎn)即為我們所需要的坐標(biāo)位置.

圖3 金字塔Mean-Shift算法示意圖Fig.3 Sketch map of the pyramid Mean-Shift algorithm

2 實(shí)驗(yàn)及性能分析

2.1 數(shù)據(jù)集

人體檢測(cè)的訓(xùn)練階段和檢測(cè)階段輸入的數(shù)據(jù)是人體數(shù)據(jù)集.本文的平躺人體數(shù)據(jù)集采用XMULP.見(jiàn)圖4.

該數(shù)據(jù)集由訓(xùn)練集和測(cè)試集組成,訓(xùn)練集正樣本有1 003張圖像共1 487個(gè)平躺人體,負(fù)樣本有3 764張圖像.測(cè)試集有313張圖像共532個(gè)平躺人體.它們是從廈門大學(xué)校園內(nèi)以及周邊不同場(chǎng)景下采集而得,有多于30個(gè)自愿者參與.圖4顯示,平躺人體軀體的朝向在(0°,360°]服從均勻分布,標(biāo)注的平躺人體矩形框的寬高比服從高斯分布,證明了數(shù)據(jù)集的可靠性.

圖4 數(shù)據(jù)集平躺人體角度(a)和寬高比(b)的分布Fig.4 The aspect ratio(a)and lying-pose angular(b)distribution of the dataset

2.2 性能評(píng)價(jià)指標(biāo)

在目標(biāo)檢測(cè)領(lǐng)域中常用的性能評(píng)價(jià)指標(biāo)有兩個(gè):FPPW(false positive per window)和FPPI(false positive per image).基于滑動(dòng)窗口的目標(biāo)檢測(cè)框架中,窗口融合算法的選擇會(huì)影響到檢測(cè)器的性能,F(xiàn)PPI需要對(duì)檢測(cè)窗口進(jìn)行合并,能有效評(píng)估不同檢測(cè)器的檢測(cè)能力,因此本文采用FPPI評(píng)估行人檢測(cè)模型遷移性能,它是通過(guò)逐漸遞增檢測(cè)器閡值而得.在某張檢測(cè)圖像中,如果檢測(cè)器檢測(cè)窗口BBdt能顯著地覆蓋人體真實(shí)窗口BBgt的大部分面積,則視為檢測(cè)窗口是正確地檢測(cè)到人體.

在實(shí)驗(yàn)中,檢測(cè)器的輸出值都?xì)w一化到[0,1],我們?nèi)hr=0.5.

2.3 實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)中,測(cè)試集圖像的大小為560×455.HOG+ SVM模型的樣本窗口大小為64×128,HOG描述子的參數(shù)設(shè)置為默認(rèn),單個(gè)樣本維度是3 780,利用線性SVM作為分類器.DPM模型沒(méi)有使用HOG特征默認(rèn)的4×9=36維向量,而是對(duì)每個(gè)8×8的cell提取18+9+4=31維特征向量,再依據(jù)主成份分析(PCA)結(jié)果選9+4維特征,達(dá)到與HOG特征相等的維度.分類器采用Latent-SVM模型(LSVM),整個(gè)訓(xùn)練分3個(gè)階段,它們分別是:1)傳統(tǒng)的SVM訓(xùn)練;2)LSVM訓(xùn)練;3)優(yōu)化LSVM模型.ACF模型是利用顏色空間(LUV)顏色特征、梯度方向特征以及6個(gè)方向特征構(gòu)成特征組,由AdaBoost訓(xùn)練分類器模型,可使行人檢測(cè)達(dá)到實(shí)時(shí).

本文采用FPPI-Missrate作為評(píng)價(jià)指標(biāo).FPPIMissrate二維曲線的橫坐標(biāo)FPPI=FP窗口數(shù)/圖片數(shù);Miss rate=漏檢窗口數(shù)/目標(biāo)總數(shù).模型的檢測(cè)性能曲線圖和檢測(cè)結(jié)果分別由圖5和圖6所示.從圖5曲線顯示,DPM模型和ACF模型的檢測(cè)性能明顯優(yōu)于HOG+SVM模型,在FPPI為10 ̄1時(shí),ACF和DPM模型的漏檢率比HOG+SVM模型下降了13.1%,ACF和DPM模型基本相等,但從曲線的整體趨勢(shì)來(lái)看,ACF模型性能略高于DPM模型.從圖6來(lái)看,DPM模型和ACF模型矩形框所圍的平躺人體效果沒(méi)有HOG+SVM模型的好.

圖5 HOG+SVM、DPM v5和ACF的FPPI-Missrate曲線圖Fig.5 The FPPI-Missrate curve diagram of HOG+SVM,DPM v5 and ACF

3 結(jié) 論

平躺人體檢測(cè)受姿態(tài)多樣性、視角變化大、透射形變和樣本不服從統(tǒng)一分布等難題,挑戰(zhàn)性極大.經(jīng)過(guò)行人檢測(cè)3個(gè)主流模型向平躺人體檢測(cè)遷移實(shí)驗(yàn)以及對(duì)檢測(cè)性能的分析,平躺人體檢測(cè)應(yīng)在以下幾點(diǎn)做更深入的研究.1)平躺人體涉及平面內(nèi)旋轉(zhuǎn)和平面外旋轉(zhuǎn),需要設(shè)計(jì)快速的透視變換算法;2)為了增加樣本的多樣性,可考慮做樣本的幾何空間擴(kuò)充和特征空間擴(kuò)充;3)根據(jù)人體關(guān)節(jié)點(diǎn)標(biāo)注信息,可以對(duì)人體姿態(tài)進(jìn)行聚類,建立不同姿態(tài)模型,以增強(qiáng)模型的檢測(cè)性能.4)需要進(jìn)一步在檢測(cè)速度上做深入的研究.

圖6 HOG+SVM、DPM v5和ACF的檢測(cè)結(jié)果Fig.6 The detection result of HOG+SVM,DPM v5 and ACF

[1] Dollar P,Wojek C,Schiele B,et al.Pedestrian detection:an evaluation of the state of the art[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(4):743-761.

[2] Andriluka M,Schnitzspan P,Meyer J,et al.Vision based victim detection from unmanned aerial vehicles[C]∥IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS).Taipei:IEEE,2010:1740-1747.

[3] Geronimo D,Lopez A M,Sappa A D,et al.Survey of pedestrian detection for advanced driver assistance systems[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(7):1239-1258.

[4] Duan Genquan,Ai Haizhou,Lao Shihong.A structural filter approach to human detection[J].Lecture Notes in Computer Science,2010,6316:238-251.

[5] Cao Song,Duan Genquan,Ai Haizhou.Fast human detection using node-combined part detector[C]∥Proc of ICIP.Brussels:IEEE,2011:3589-3592.

[6] 許言午.面向行人檢測(cè)的組合分類計(jì)算模型與應(yīng)用研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2009:1-123.

[7] 蘇松志.行人檢測(cè)若干關(guān)鍵技術(shù)研究[D].廈門:廈門大學(xué),2011:1-113.

[8] 謝堯芳.靜態(tài)圖像的行人檢測(cè)技術(shù)研究[D].廈門:廈門大學(xué),2010:1-77.

[9] 蘇松志,李紹滋,陳淑媛,等.行人檢測(cè)技術(shù)綜述[J].電子學(xué)報(bào),2012,40(4):814-820.

[10] Doll′ar P,Wojek C,Schiele B,et al.Pedestrian detection:an evaluation of the state of the art[J].IEEE Trans Pattern A-nal Machine Intell,2012,34(4):743-761.

[11] Ouyang W L,Wang X G.Joint deep learning for pedestrian detection[C]∥IEEE International Conference on Computer Vision.Sydney,VIC:IEEE,2013:2056-2063.

[12] Luo P,Tian Y L,Wang X G,et al.Switchable deep network for pedestrian detection[C]∥Computer Vision and Pattern Recognition(CVPR).2014 IEEE Conference on.Columbus,OH:IEEE,2014:899-906.

[13] Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]∥Proc IEEE Conf Computer Vision Pattern Recognition.[S.l.]:IEEE,2005:886-893.

[14] Felzenszwalb P F,Girshick R,Mc Allester D,et al.Object detection with discriminatively trained part based models[J].IEEE Trans Pattern Anal Machine Intell,2010,32(9):1627-1645.

[15] Doll′ar P,Appelv R,Belongie S,et al.Fast feature pyramids for object detection[J].IEEE Trans Pattern Analy-sis and Machine Intelligence,2014,36(8):1532-1545.

[16] Foroughi H,Naseri A,Saberi A,et al.An eigenspacebased approach for human fall detection using integrated time motion image and neural network[C]∥Signal Processing,2008.ICSP 2008.9th International Conference on.Beijing:IEEE,2008:1499-1503.

[17] Nait-Charif H,McKenna S J.Activity summarisation and fall detection in a supportive home environment[J]. Proceedings of the Pattern Recognition,17th International Conference on(ICPR′04),2004,4:323-326.

[18] Vinay V,Mandal C,Sural S.Automatic detection of human fall in video[J].Pattern Recognition and Machine Intelligence,2007,4815:616-623.

[19] Khandoker A H,Lai D T H,Begg R K,et al.Wavelet-based feature extraction for support vector machines for screening balance impairments in the elderly[J].Neural Systems and Ehabilitation Engineering,2007,15(4):587-597.

[20] Durrant-Whyte H,Roy N,Abbeel P.Lying pose recognition for elderly fall detection[C]∥Robotics:Science and Systems VII.[S.l.]:MIT Press,2012:345-353.

[21] Mastorakis G,Makris D.Fall detection system using kinect′s infrared sensor[J].Journal of Real-Time Image Processing,2014,9(4):635-646.

[22] Kepski M,Kwolek B.Fall detection using ceiling-mounted 3d depth camera[C]∥VISAPP.Chicago,IL,USA:IEEE,2014:1-8.

[23] Morse B S,Engh C H,Goodrich M A.Uav video coverage quality maps and prioritized indexing for wilderness search and rescue[C]∥Proceedings of the 5th ACM/ IEEE International Conference on Human-robot Interaction.Piscataway,NJ,USA:ACM/IEEE,2010:227-234.

[24] Naidoo Y,Stopforth V,Bright G.Development of an uav for search amp;rescue applications[C]∥AFRICON. Livingstone,Zambia:IEEE,2011:1-6.

[25] Morel J M,YU G S.ASIFT:a new framework for fully affine invariant image comparison[J].SIAM Journal on Imaging Sciences,2009,2(2):438-469.

[26] Fukunaga K,Hostetler L.The estimation of the gradient of a density function[J].IEEE Transactions on Information Theory,1975,21(1):32-40.

[27] Cheng Y Z.Mean shift,mode seeking,and clustering[J].Pattern Analysis and Machine Intelligence,1995,17(8):790-799.

The Migration Research of Pedestrian Detection Model to Lying-pose Detection and Performance Analysis

XIA Dao-xun1,2,SU Song-zhi2,LI Shao-zi2*
(1.School of Mathematics and Computer Science,Guizhou Normal University,Guiyang 550001,China;2.School of Information Science and Engineering,Xiamen University,Xiamen 361005,China)

The human body detection constitutes a difficult task and a hotspot in computer vision research.Bearing theoretical significance and application values,it can be divided into the pedestrian detection and the lying-pose detection.The research of lying-pose detection is in its infancy.View change,posture diversity,and complex background face several problems that need to be solved timely.This paper attempts to migrate from HOG+SVM,DPM,and ACF three mainstream pedestrian detection models to lying-pose detection on the basis of the research results of pedestrian detection.Its aim is to validate detection effects and analyze detection performances.Here we summarize similarities and differences between the pedestrian detection and lying-pose detection,and find key problems of the lying-pose detection.To establish adapt lying-pose detection model provides the theoretical foundation and practical experience.Finally,some research suggestions are given for lying-pose detection models.

pedestrian detection;lying-pose detection;histogram of oriented gradients(HOG);support vector machines(SVM);deformable parts model(DPM);aggregated channel features(ACF)

TP 391

A

0438-0479(2015)04-0540-06

10.6043/j.issn.0438-0479.2015.04.018

2014-12-02 錄用日期:2015-01-23

國(guó)家自然科學(xué)基金(61202143);貴州省自然科學(xué)基金(黔科合J字LKS[2013]24號(hào))

*通信作者:szlig@xmu.edu.cn

夏道勛,蘇松志,李紹滋.行人檢測(cè)模型向平躺人體檢測(cè)的遷移及其性能分析[J].廈門大學(xué)學(xué)報(bào):自然科學(xué)版,2015,

54(4):540-545.

:Xia Daoxun,Su Songzhi,Li Shaozi.The migration research of pedestrian detection model to lying-pose detection and

performance analysis[J].Journal of Xiamen University:Natural Science,2015,54(4):540-545.(in Chinese)

猜你喜歡
候選框平躺檢測(cè)器
重定位非極大值抑制算法
面向自然場(chǎng)景文本檢測(cè)的改進(jìn)NMS算法
病毒還在我的身體里沒(méi)走
基于Soft-NMS的候選框去冗余加速器設(shè)計(jì)*
平躺,一個(gè)錯(cuò)誤的哺乳姿勢(shì)
一種針對(duì)特定目標(biāo)的提議算法
車道微波車輛檢測(cè)器的應(yīng)用
“夜是流動(dòng)的一切”
青春(2017年5期)2017-05-22 11:53:08
閃腰后平躺熱敷是首選
一種霧霾檢測(cè)器的研究與設(shè)計(jì)
南康市| 关岭| 龙游县| 辽源市| 那曲县| 凤凰县| 泽州县| 双牌县| 开原市| 丰都县| 德兴市| 盐亭县| 武强县| 慈利县| 大竹县| 聂拉木县| 沁水县| 邯郸县| 广昌县| 哈尔滨市| 东丰县| 花莲县| 肇源县| 阿尔山市| 五大连池市| 虹口区| 城步| 民丰县| 额敏县| 全州县| 赣州市| 九寨沟县| 汨罗市| 巢湖市| 万山特区| 东海县| 北碚区| 海门市| 宁安市| 岢岚县| 伊金霍洛旗|