基于改進(jìn)FCOS 的擁擠行人檢測(cè)算法

2021-09-11 03:13:58齊鵬宇王洪元張繼朱繁徐志晨

智能系統(tǒng)學(xué)報(bào) 2021年4期

齊鵬宇，王洪元，張繼，朱繁，徐志晨

（常州大學(xué) 信息科學(xué)與工程學(xué)院，江蘇常州 213164）

行人檢測(cè)屬于計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)重要的基礎(chǔ)研究課題，對(duì)于行人重識(shí)別、自動(dòng)駕駛、視頻監(jiān)控、機(jī)器人等領(lǐng)域有重要的意義[1-3]。而行人檢測(cè)領(lǐng)域在實(shí)際場(chǎng)景下面臨著行人交疊、遮擋等問(wèn)題，此類問(wèn)題依然困擾很多研究者，也是目前行人檢測(cè)面臨的巨大挑戰(zhàn)。

在現(xiàn)有的目標(biāo)檢測(cè)算法[4]中，兩階段目標(biāo)檢測(cè)器(如Faster R-CNN[5]、R-FCN[6]、Mask RCNN[7]、RetinaNet[8]、Cascade R-CNN[9])精度高但速度稍慢，單階段目標(biāo)檢測(cè)器(如YOLOv2[10]、SSD[11])速度快但精度稍低。Zhi 等[12]認(rèn)為錨框(anchor)的縱橫比和數(shù)量對(duì)檢測(cè)性能影響較大，在需要預(yù)設(shè)候選框的檢測(cè)算法中，這些anchor 相關(guān)參數(shù)需要進(jìn)行精準(zhǔn)的調(diào)整。而在多數(shù)的兩階段算法中，由于anchor 的縱橫比不變，模型檢測(cè)anchor 變化較大的候選目標(biāo)時(shí)會(huì)遇到麻煩，特別是對(duì)于小目標(biāo)的物體。多數(shù)檢測(cè)模型需要在不同的檢測(cè)任務(wù)場(chǎng)景下重新定義不同的目標(biāo)尺寸的anchor，這是因?yàn)槟Ｐ皖A(yù)定義的anchor 對(duì)模型性能影響較大。在訓(xùn)練過(guò)程中，大多數(shù)的anchor 被標(biāo)記為負(fù)樣本，而負(fù)樣本的數(shù)量過(guò)多會(huì)加劇訓(xùn)練中正樣本與負(fù)樣本之間的不平衡?；跓o(wú)預(yù)設(shè)候選框(anchor-free)的檢測(cè)算法容易造成極大的正負(fù)樣本之間不平衡，檢測(cè)的精度也不如anchor-base算法。而近年來(lái)的全卷積網(wǎng)絡(luò)(fully convolutional network，F(xiàn)CN[13])在眾多計(jì)算機(jī)視覺(jué)的密集預(yù)測(cè)任務(wù)中取得了好的效果，例如語(yǔ)義分割、深度估計(jì)[14]、關(guān)鍵點(diǎn)檢測(cè)[15]和人群計(jì)數(shù)[16]等。由于預(yù)設(shè)候選框的使用，兩階段檢測(cè)算法取得了好的效果，這也間接導(dǎo)致了檢測(cè)任務(wù)中沒(méi)有采用全卷積逐像素預(yù)測(cè)的算法框架。而FCOS[12]首次證明，基于FCN的檢測(cè)算法的檢測(cè)性能比基于預(yù)設(shè)候選框的檢測(cè)算法更好。FCOS 結(jié)合two-stage 和one-stage 算法的一些特點(diǎn)逐像素檢測(cè)目標(biāo)，實(shí)現(xiàn)了在提高檢測(cè)精度的同時(shí)，加快了檢測(cè)速度。

由于擁擠場(chǎng)景下行人目標(biāo)會(huì)出現(xiàn)交疊、遮擋和行人目標(biāo)偏小等問(wèn)題，本文提出新的特征提取網(wǎng)絡(luò)提取更具判別性行人特征。對(duì)于FCOS 檢測(cè)算法，行人檢測(cè)中行人尺度問(wèn)題對(duì)模型性能的影響較大，針對(duì)該問(wèn)題，本文改進(jìn)多尺度預(yù)測(cè)用于檢測(cè)小目標(biāo)行人，有效地解決了行人目標(biāo)偏小、擁擠等場(chǎng)景下行人檢測(cè)精度不高的問(wèn)題。

1 相關(guān)工作

1.1 FCOS 框架

FCOS 首先以逐像素預(yù)測(cè)的方式對(duì)目標(biāo)進(jìn)行檢測(cè)，無(wú)需設(shè)置anchor 的縱橫比，然后利用多級(jí)預(yù)測(cè)來(lái)提高召回率并解決訓(xùn)練中重疊預(yù)測(cè)框?qū)е碌钠缌x，這種方法可以有效提高擁擠場(chǎng)景下行人檢測(cè)精度，緩解行人擁擠而導(dǎo)致的檢測(cè)困難的問(wèn)題。實(shí)際上，諸如Unitbox[17]之類基于DenseBox[18]的anchor-free 檢測(cè)算法，難以處理重疊的預(yù)測(cè)框而導(dǎo)致召回率低的問(wèn)題，該系列的檢測(cè)算法不適合用于一般物體檢測(cè)，F(xiàn)COS 的出現(xiàn)打破這一局面。FCOS 表明，使用多級(jí)特征金字塔網(wǎng)絡(luò)(feature pyramid networks,FPN[19])預(yù)測(cè)可以提高召回率，提高檢測(cè)精度。

FCOS 在訓(xùn)練中損失定義如下：

式中：x、y表示特征圖上的某一位置；px,y表示預(yù)測(cè)分類分?jǐn)?shù)表示真實(shí)分類標(biāo)簽；tx,y表示回歸預(yù)測(cè)目標(biāo)位置表示真實(shí)目標(biāo)位置，Lcls是Focal Loss 分類損失，Lreg是IOU Loss 回歸損失，并且在預(yù)先的實(shí)驗(yàn)中發(fā)現(xiàn)，擁擠行人檢測(cè)任務(wù)中，I OU Loss效果要稍優(yōu)于GIOULoss[20]。Npos表示正樣本的個(gè)數(shù)，表示激活函數(shù)，當(dāng)時(shí)為1，否則為0。

此外，F(xiàn)COS 還具有獨(dú)特的中心度分支預(yù)測(cè)，可以抑制低質(zhì)量框的比例。由于逐像素預(yù)測(cè)，很多像素點(diǎn)雖然處于真值框內(nèi)，但是越接近真值框中心的像素點(diǎn)預(yù)測(cè)出高質(zhì)量預(yù)測(cè)框的概率也越大，因此提出預(yù)測(cè)中心度損失函數(shù)，如式(2)所示：

式中：l?、 r?、t?、b?分別表示當(dāng)前像素點(diǎn)到真值框邊界的距離，這里使用開(kāi)方來(lái)減緩中心損失的衰減。中心損失值在范圍[0,1]，因此使用二值交叉熵(BCE)損失進(jìn)行訓(xùn)練，將中心度損失加到訓(xùn)練損失函數(shù)式(1) 中。當(dāng)回歸中心在樣本中心時(shí)，中心度損失會(huì)盡可能的接近1，而當(dāng)偏離時(shí)，中心度損失會(huì)降低。測(cè)試時(shí)，通過(guò)將預(yù)測(cè)框的中心損失與相應(yīng)的分類分?jǐn)?shù)相乘來(lái)計(jì)算最終分?jǐn)?shù)，且該分?jǐn)?shù)用于對(duì)檢測(cè)到的預(yù)測(cè)框質(zhì)量進(jìn)行排序。因此，中心度可以降低遠(yuǎn)離目標(biāo)中心的預(yù)測(cè)框的分?jǐn)?shù)，再通過(guò)最終的非極大值抑制(non-maximum suppression,NMS)過(guò)程可以過(guò)濾掉這些低質(zhì)量的預(yù)測(cè)框，從而顯著提高行人檢測(cè)性能。相比基于預(yù)設(shè)候選框的一類檢測(cè)算法，F(xiàn)COS 算法實(shí)現(xiàn)更好的檢測(cè)性能。

1.2 原始FCOS 特征提取網(wǎng)絡(luò)

如圖1 所示，F(xiàn)COS 算法的特征提取網(wǎng)絡(luò)采用主干網(wǎng)絡(luò)(Backbone) 加上FPN，Backbone 選用ResNet[21]提取特征，在FPN 中，P3、P4、P5分別由C3、C4、C5橫向連接產(chǎn)生，P6、P7由P5、P6通過(guò)步長(zhǎng)為2 的卷積產(chǎn)生。每層檢測(cè)不同尺度大小的目標(biāo)，Pi層檢測(cè)當(dāng)前像素點(diǎn)處滿足條件的目標(biāo)，目標(biāo)公式定義如下：

圖1 FCOS 特征提取網(wǎng)絡(luò)Fig.1 FCOS feature extraction network

式中：l?、r?、t?、b?分別表示當(dāng)前像素點(diǎn)到真值框邊界的距離；[mi?1,mi]表示Pi層回歸目標(biāo)范圍，m2、m3、m4、m5、m6和m7分別設(shè)置為0、64、128、256、512 和 ∞，其中 ∞ 表示無(wú)窮大。這是一個(gè)非常有創(chuàng)造性的想法，這樣的設(shè)計(jì)使得FCOS 檢測(cè)算法是一個(gè)多尺度的FPN 檢測(cè)算法。

2 基于FCOS 的行人檢測(cè)

2.1 主干網(wǎng)絡(luò)VoVNet

深度學(xué)習(xí)中，特征提取網(wǎng)絡(luò)對(duì)于模型有著非常大的影響，針對(duì)不同的數(shù)據(jù)集可以直接影響其檢測(cè)性能。針對(duì)ResNet 不足，本文運(yùn)用VoVNet作為行人特征的提取網(wǎng)絡(luò)。

DenseNet[22]在目標(biāo)檢測(cè)任務(wù)上展示出了較好的效果，特別是基于anchor-free 的目標(biāo)檢測(cè)模型，這是因?yàn)橄啾扔赗esNet，DenseNet 通過(guò)特征不斷疊加達(dá)到好的效果，其缺點(diǎn)是在后續(xù)特征疊加時(shí)，通道數(shù)線性增加，參數(shù)也越來(lái)越多，模型花費(fèi)時(shí)間增加，影響模型速度。

VoVNet 認(rèn)為在特征提取方面，中間層的聚集強(qiáng)度與最終層的聚集強(qiáng)度之間存在負(fù)相關(guān)，并且密集連接是冗余的，即靠前層的特征表示能力越強(qiáng)，靠后層的特征表示能力則會(huì)被弱化。VoVNet[23]針對(duì)DenseNet 做出改進(jìn)，提出一種新的模塊，即一次性聚合(one-shot aggregation,OSA) 模塊。OSA 模塊將當(dāng)前層的特征聚合至最后一層，每一卷積層有兩種連接方式，一種方式是連接至下一層，用于產(chǎn)生更大感受野的特征，另一種方式是連接一次至最終輸出的特征圖上，與DenseNet 不同，每一層的輸出不會(huì)連接至后續(xù)的中間層，這樣的設(shè)計(jì)使得中間層的通道數(shù)保持不變。VoVNet采用更加優(yōu)化的特征連接方式，通過(guò)增強(qiáng)特征的表示能力，提高特征的提取能力，進(jìn)而提高模型的檢測(cè)性能。

2.2 SE 模塊

本文為了更好地契合復(fù)雜的行人特征，在VoVNet上使用SE 模塊[24]加強(qiáng)特征表示能力，并且在特征圖上使用SE 模塊進(jìn)行權(quán)重分配，使得深度特征更加多樣化。

SE 模塊首先依照空間維度來(lái)進(jìn)行特征壓縮，將每個(gè)二維的特征通道變成一個(gè)實(shí)數(shù)，輸出一個(gè)二維空間，它的維度與特征通道數(shù)相等，即二維空間表示對(duì)應(yīng)特征通道上的分布結(jié)果。之后生成一個(gè)具有權(quán)重的二維空間，表示特征通道間的相關(guān)性。最后將對(duì)應(yīng)的特征圖乘上權(quán)重特征，實(shí)現(xiàn)一個(gè)特征的權(quán)重分配，突出重要的特征，完成在通道維度上對(duì)原始特征通道上重要性的重標(biāo)定。

SE 模塊類似于注意力機(jī)制，本文將其使用在VoVNet 上，如圖2 所示，在每層特征下采樣時(shí)，將特征進(jìn)行SE 權(quán)重分配。根據(jù)VoVNet 的特征連接方式添加SE 模塊權(quán)重機(jī)制，本文方法可以提供更加多元化的特征，使得行人特征更好地表達(dá)，提高行人檢測(cè)的精度。并且SE 模塊可以在幾乎不增加模型時(shí)間復(fù)雜度的情況下提升模型的檢測(cè)性能。

圖2 修改后框架Fig.2 Update framework

2.3 多尺度檢測(cè)

原始模型FPN 采用5 層不同尺度回歸目標(biāo)，這5 層尺度回歸的目標(biāo)大小分別為[0,6 4]、[64,128]、[128,256]、[256,512]和[512,∞]，分別對(duì)應(yīng)FPN 中的P3、P4、P5、P6和P7。針對(duì)行人目標(biāo)的特點(diǎn)，本文發(fā)現(xiàn)，不論是在常用的行人數(shù)據(jù)集中，還是在真實(shí)檢測(cè)場(chǎng)景中，行人檢測(cè)的難點(diǎn)在于擁擠行人和小目標(biāo)行人的檢測(cè)。對(duì)于FCOS 模型，每層每個(gè)像素點(diǎn)都會(huì)回歸固定尺度大小范圍內(nèi)的目標(biāo)。相對(duì)地，如果目標(biāo)行人擁擠在某個(gè)尺度范圍內(nèi)，將會(huì)使得檢測(cè)層的任務(wù)過(guò)重，導(dǎo)致檢測(cè)效果降低，此問(wèn)題也是影響模型性能效果的原因之一，在多目標(biāo)檢測(cè)場(chǎng)景中會(huì)導(dǎo)致FCOS 模型的檢測(cè)性能稍有降低，同時(shí)也說(shuō)明，當(dāng)檢測(cè)任務(wù)復(fù)雜，檢測(cè)目標(biāo)數(shù)量較多時(shí)，本文提出的多尺度檢測(cè)會(huì)使FCOS 檢測(cè)性能提高。

如圖2 所示，減小P3層的回歸尺度，設(shè)置P3層回歸尺度為[32,64]，減少P3層的檢測(cè)任務(wù)量；增加P2層，P2層由C2層橫向連接和P3層向下連接組成，P2層回歸尺度為[0,32]的目標(biāo)，這樣的網(wǎng)絡(luò)設(shè)計(jì)既能減少P3層的回歸目標(biāo)數(shù)，也能更好地利用特征檢測(cè)小目標(biāo)行人，提高行人檢測(cè)精度。在最終的FPN 上，本文的方法在FPN 上擁有6 層特征圖以檢測(cè)6 個(gè)不同尺度范圍的目標(biāo)。

總體網(wǎng)絡(luò)框架如圖3 所示，相較于未改進(jìn)FCOS 算法，預(yù)測(cè)特征圖由5 個(gè)增加到6 個(gè)，而后對(duì)特征圖上每個(gè)點(diǎn)進(jìn)行逐像素預(yù)測(cè)，每個(gè)點(diǎn)均需預(yù)測(cè)目標(biāo)回歸框、目標(biāo)類別、目標(biāo)中心度，以上3 種預(yù)測(cè)結(jié)果對(duì)應(yīng)圖3 中3 個(gè)預(yù)測(cè)分支，假設(shè)當(dāng)前特征圖大小為W×H，則有W×H像素點(diǎn)需要進(jìn)行預(yù)測(cè)。

圖3 總體框架Fig.3 Final framework

3 數(shù)據(jù)集和評(píng)估

本文實(shí)驗(yàn)主要使用CrowdHuman[25]和Caltech 行人數(shù)據(jù)集。行人數(shù)量多、場(chǎng)景擁擠是行人檢測(cè)中一個(gè)巨大的挑戰(zhàn)，針對(duì)這一問(wèn)題，曠視發(fā)布CrowdHuman 數(shù)據(jù)集，用于驗(yàn)證檢測(cè)算法在密集人群行人檢測(cè)任務(wù)中的性能。CrowdHuman 數(shù)據(jù)集中15 000、4 370 和5 000 個(gè)圖片，分別用于訓(xùn)練、驗(yàn)證和測(cè)試。針對(duì)CrowdHuman 數(shù)據(jù)集，本文只使用全身區(qū)域標(biāo)注用于訓(xùn)練和評(píng)估，由于還未公布測(cè)試集，參考相關(guān)文獻(xiàn)[25-26]后，實(shí)驗(yàn)結(jié)果在驗(yàn)證集上進(jìn)行測(cè)試。Caltech 行人數(shù)據(jù)集時(shí)長(zhǎng)約為10 h 城市道路環(huán)境拍攝視頻，數(shù)據(jù)集中隨機(jī)分配訓(xùn)練集、測(cè)試集、驗(yàn)證集，其對(duì)應(yīng)比例為0.75∶0.2∶0.05，3 個(gè)集相互獨(dú)立，測(cè)試集圖片約為24 438 張。

本文采用MR?2(miss rate)和AP 的評(píng)估準(zhǔn)則，MR?2表示在9 個(gè)FPPI(false positive per image)值下(在值域[0.01,1.0]以對(duì)數(shù)空間均勻間隔)的平均丟失率值，F(xiàn)PPI 定義如下：

式中：N表示圖片的數(shù)量；FP 表示未擊中任意一個(gè)真值框的預(yù)測(cè)框數(shù)量。MR?2是目前衡量行人檢測(cè)一個(gè)非常重要的指標(biāo)，也是本文主要采用的評(píng)價(jià)指標(biāo)。其數(shù)值越低說(shuō)明行人檢測(cè)模型性能越好。

AP 表示平均精度，PR(Precision-Recall)曲線所圍成的面積即為AP 值大小，AP 值越大檢測(cè)精度越高，其中AP、Recall、Precision 計(jì)算公式如下：

式中：TP 是檢測(cè)出正樣本的概率；FN 是正樣本檢測(cè)出錯(cuò)誤樣本的概率；FP 是負(fù)樣本檢測(cè)出正樣本的概率。

4 實(shí)驗(yàn)

本文實(shí)驗(yàn)環(huán)境為Ubuntu18.04、Cuda10 和Cudnn7.6，使用4 塊2080Ti 的GPU，每個(gè)GPU 有11G 內(nèi)存，由于FCOS 算法要求較高，存在內(nèi)存不夠的問(wèn)題，實(shí)驗(yàn)通過(guò)線性策略[27]調(diào)整了batch_size 大小和IMS_PER_BATCH 的數(shù)量。其余參數(shù)沿用FCOS 在COCO 數(shù)據(jù)集上基礎(chǔ)參數(shù)配置，算法基于detectron 框架。

4.1 CrowdHuman 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

如表1 消融實(shí)驗(yàn)所示，其中6stage 表示多尺度檢測(cè)方法，SE 表示SE 模塊。在FCOS 上采用VoVNet 作為Backbone 起到了極大的提升作用，相較于主干網(wǎng)絡(luò)為ResNet，AP50提升11.2%。在FPN 中多添加一個(gè)尺度的回歸層，對(duì)于行人檢測(cè)的效果有極大的提升，這是因?yàn)槊芗男腥藱z測(cè)受尺度變化影響較大。相較于原始FCOS 方法，本文方法在指標(biāo)AP50上提升了15.0%。針對(duì)于不同主干網(wǎng)絡(luò)，S E 模塊在指標(biāo)A P50上有0.2%～0.3%的提升，說(shuō)明SE 模塊能增強(qiáng)行人特征提取能力。模型由5 個(gè)尺度增加到6 個(gè)尺度，指標(biāo)AP50提升3.5%，并且對(duì)于模型檢測(cè)小目標(biāo)行人有著極大的提升，可以看到指標(biāo)APS提升8.5%，實(shí)驗(yàn)結(jié)果也印證多尺度改進(jìn)能有效地提升模型檢測(cè)小目標(biāo)行人的性能。

表1 CrowdHuman 數(shù)據(jù)集APTable 1 AP on CrowdHuman

CrowdHuman[25]數(shù)據(jù)集中采用指標(biāo)MR?2，本文采用相同指標(biāo)并對(duì)比了CrowdHuman[25]中部分實(shí)驗(yàn)，表2 可以看到，在CrowdHuman 數(shù)據(jù)集上，通過(guò)消融實(shí)驗(yàn)表明：采用VoVNet 相較于采用ResNet，指標(biāo)MR?2降低26.91%。擁有SE 模塊的檢測(cè)模型相較于沒(méi)有SE 模塊的檢測(cè)模型，指標(biāo)MR?2降低0.9%。改進(jìn)多尺度回歸后的檢測(cè)模型相較于未改進(jìn)的檢測(cè)模型，指標(biāo) MR?2降低6%。本文提出的方法相較于原始方法，指標(biāo)MR?2降低了33.62%。實(shí)驗(yàn)結(jié)果證明，本文的方法在擁擠場(chǎng)景下的行人檢測(cè)效果提升較為明顯。

表2 CrowdHuman數(shù)據(jù)集MR?2Table 2 MR?2onCrowdHuman

如表3 所示，針對(duì)CrowdHuman 數(shù)據(jù)集，NMS 的IOU 閾值設(shè)定也是不同的，原始FCOS 算法在COCO 數(shù)據(jù)集上IOU 閾值設(shè)置為0.7，而針對(duì)擁擠行人場(chǎng)景，本文發(fā)現(xiàn)IOU 閾值設(shè)置為0.5 時(shí)，模型整體性能較好。圖4(a)表示PR 曲線圖，圖4(b)表示MR-FPPI 曲線，可以清晰地看到本文方法總體上提升較大。在采用了VoVNet后，對(duì)模型性能有了極大的提升，說(shuō)明VoVNet 更加適合于FCOS 在擁擠場(chǎng)景下提取行人特征。多尺度檢測(cè)方法在擁擠場(chǎng)景下的行人檢測(cè)也是有效的，提升效果明顯。

圖4 CrowdHuman 曲線圖Fig.4 CrowdHuman curves

表3 CrowdHuman 數(shù)據(jù)集IOU 閾值Table 3 IOU threshold on CrowdHuma

4.2 Caltech 數(shù)據(jù)集結(jié)果

如表4 所示，在車載攝像頭的行人數(shù)據(jù)集Caltech 上本文提出的方法也有一定提升，相較于原始YOLOv2 方法，AP 實(shí)現(xiàn)了2% 的提升。在Caltech 數(shù)據(jù)集上的提升，說(shuō)明本文模型的魯棒性較好。

表4 Caltech 行人數(shù)據(jù)集Table 4 Caltech pedestrian datasets

4.3 實(shí)際場(chǎng)景檢測(cè)結(jié)果

本文的模型使用CrowdHuman 訓(xùn)練集進(jìn)行訓(xùn)練，在實(shí)際場(chǎng)景下的檢測(cè)也有不錯(cuò)的效果，本文挑選出實(shí)際場(chǎng)景下一張室內(nèi)行人和一張室外行人進(jìn)行檢測(cè)。因?yàn)楸疚乃惴o(wú)需設(shè)置anchor 的尺寸和縱橫比，所以在實(shí)際場(chǎng)景中的行人檢測(cè)魯棒性較好。如圖5 所示，圖5(a)、(c)表示原始FCOS 方法在擁擠行人中的效果，圖5(b)、圖5(d)表示本文方法的最終效果，可以看到，原始FCOS可以較好地檢測(cè)出圖片中的行人，漏檢率較低，但是仍存在偽正例，相比于圖5(b)，可以看到圖5(a)右上角小目標(biāo)行人未檢測(cè)出來(lái)，遠(yuǎn)處的行人檢測(cè)效果也不如圖5(b)的檢測(cè)效果,而相比于圖5(d)，可以看到圖5(b) 右邊出現(xiàn)置信度為0.64 的錯(cuò)誤預(yù)測(cè)框。本文提出的方法可以較好地檢測(cè)行人，減少FP 出現(xiàn)的情況，在實(shí)際擁擠場(chǎng)景下能較好地檢測(cè)目標(biāo)行人。但當(dāng)行人目標(biāo)交疊時(shí)，或者對(duì)于有遮擋的行人，檢測(cè)的效果大部分僅能檢測(cè)出可視的部分，無(wú)法將全身區(qū)域標(biāo)注出來(lái)，導(dǎo)致與真值框交并比的值較低，被視為負(fù)類。這也是目前本文方法面臨的主要問(wèn)題之一。

圖5 實(shí)際場(chǎng)景檢測(cè)效果Fig.5 Actual scene detection effect

5 結(jié)束語(yǔ)

針對(duì)行人目標(biāo)檢測(cè)中行人擁擠、目標(biāo)偏小等問(wèn)題，本文提出一種基于FCOS 框架的行人檢測(cè)算法。通過(guò)融入新的 Backbone 并且在 FPN 中添加一層P2層，實(shí)現(xiàn)行人目標(biāo)的多尺度檢測(cè)。通過(guò)融入SE 模塊進(jìn)行特征的權(quán)重分配，更好地提取行人特征，提高行人檢測(cè)精度。本模型方法無(wú)需設(shè)置anchor 縱橫比等參數(shù)，參數(shù)設(shè)置少。相較于目前先進(jìn)方法，可以達(dá)到有較強(qiáng)競(jìng)爭(zhēng)力的檢測(cè)效果。在實(shí)驗(yàn)中也發(fā)現(xiàn)，本文提出的方法受行人深度特征影響較大，如何在擁擠遮擋等實(shí)際場(chǎng)景下進(jìn)行更高精度行人檢測(cè)是我們進(jìn)一步要研究的內(nèi)容。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡