国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于空洞卷積金字塔的目標檢測算法

2021-12-02 06:41:40候少麒殷康寧劉學(xué)婷殷光強
電子科技大學(xué)學(xué)報 2021年6期
關(guān)鍵詞:金字塔空洞尺度

候少麒,梁 杰,殷康寧,劉學(xué)婷,殷光強

(1. 電子科技大學(xué)信息與通信工程學(xué)院 成都 611731;2. 電子科技大學(xué)信息與軟件工程學(xué)院 成都 610054)

目標檢測是現(xiàn)實生活中最廣泛的應(yīng)用之一,其任務(wù)在于關(guān)注圖片中的特定目標。一般來說,通用性目標檢測包含兩個子任務(wù):一是判定特定目標的類別概率,二是給出該目標的具體位置。目標檢測在實際應(yīng)用中有著非常重要的作用,可以運用于人臉識別、行人重識別、工業(yè)檢測、車牌號識別、醫(yī)學(xué)影像等具體場景,涉及安防領(lǐng)域、工業(yè)領(lǐng)域、軍事領(lǐng)域、交通領(lǐng)域、醫(yī)療領(lǐng)域和生活領(lǐng)域等。隨著機器學(xué)習(xí)的蓬勃發(fā)展,普通場景下目標檢測的精度已經(jīng)很高,但針對復(fù)雜環(huán)境下目標數(shù)量眾多、目標尺度多變、目標遮擋嚴重等問題,仍是國內(nèi)外科研人員的研究重點[1]。

傳統(tǒng)的基于手工特征構(gòu)建的目標檢測算法過程復(fù)雜、計算量大,但為目標檢測的發(fā)展奠定了理論基礎(chǔ)。作為傳統(tǒng)領(lǐng)域最經(jīng)典的算法,文獻[2]的目標檢測器通過多尺度滑動窗口來生成可能存在的具有不同寬高比的目標區(qū)域,再利用模板進行目標匹配。另外一個與之相似的傳統(tǒng)方法是利用梯度直方圖(histogram of oriented gradient, HOG)[3]特征和支持向量機(support vector machine, SVM)[4]來進行目標分類。

隨著計算機視覺技術(shù)的長足發(fā)展,基于深度學(xué)習(xí)的目標檢測開始成為研究熱門。在2012 年ImageNet競賽上取得冠軍的AlexNet[5],是首個在大規(guī)模圖像識別問題取得突破性進展的深度神經(jīng)網(wǎng)絡(luò),并由此開啟了深度神經(jīng)網(wǎng)絡(luò)在計算機視覺領(lǐng)域的廣泛應(yīng)用。基于深度神經(jīng)網(wǎng)絡(luò)的目標檢測算法按照處理分類和回歸的方法差異,又可劃分為單階段(one stage)和兩階段(two stage)兩大派系。

兩階段算法中,以RCNN[6]為代表的目標檢測算法,其核心是采用區(qū)域提議方法,對輸入圖像進行選擇性搜索并生成區(qū)域建議框,然后對每一個區(qū)域建議框使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)提取特征,再使用分類器進行分類。該類方法最大的短板是冗余框的重復(fù)計算,導(dǎo)致最快的算法[7]在GPU 上也只有7 幀/s 的推理速度。另一類單階段目標檢測算法是以YOLO[8-10]和SSD[11]為代表的基于直接回歸的算法。這類算法將單個神經(jīng)網(wǎng)絡(luò)應(yīng)用于整幅圖像,并在最終的特征圖上劃分網(wǎng)格區(qū)域,同時預(yù)測每個區(qū)域的邊界框和目標概率,在犧牲一定精度的同時大大減少了重復(fù)計算。

經(jīng)過一系列的變種,這兩類方法的共同點逐漸演變?yōu)樵跈z測過程中都需要預(yù)先生成大量錨框(anchor),這些算法統(tǒng)稱為基于錨框(anchor based)的目標檢測算法。錨框是在訓(xùn)練之前,在訓(xùn)練集上利用聚類算法得出的一組矩形框,代表數(shù)據(jù)集中目標主要分布的長寬尺寸。在推理時先在特征圖上由這些錨框提取n個候選矩形框,再對這些矩形框做進一步的分類和回歸。相對Two Stage 算法來說,對候選框的處理依然經(jīng)過前背景粗分類和多類別細分類兩步。

單階段目標檢測算法由于缺少了兩階段算法的精細處理,在面對目標多尺度、遮擋等問題時表現(xiàn)不佳。另外,Anchor Based 算法雖然在一定程度上緩解了選擇性搜索帶來的候選框計算量爆炸的問題,但每個網(wǎng)格中大量不同尺寸錨框的生成仍然造成了計算冗余,最重要的是錨框的生成依賴于大量的超參設(shè)置,手動調(diào)參會嚴重影響目標的定位精度和分類效果。

針對以上問題,本文提出了一種基于空洞卷積金字塔的目標檢測算法(atrous convolution embedded feature pyramid network, ACFPN),能夠有效地解決因尺度和遮擋引起的漏檢、錯檢問題,主要創(chuàng)新點如下:

1)設(shè)計多尺寸的空洞卷積構(gòu)成的混合感受野模塊(hybrid receptive field module, HRFM),結(jié)合特征金字塔多尺度輸出特性,在控制模型參數(shù)量的條件下,增大感受野獲取更多全局特征細節(jié)信息,以解決目標的遮擋問題;

2)改進特征金字塔網(wǎng)絡(luò)的結(jié)構(gòu),提出了低層嵌入特征金字塔模塊(lower embedding feature pyramid module, LEFPM),解決目標檢測在處理多尺度變化上不足,融合淺層特征信息和高層特征信息,并在融合后的輸出增加歸一化處理和激活函數(shù),優(yōu)化模型訓(xùn)練;

3)引入Anchor Free 機制,結(jié)合上述兩點設(shè)計,減少冗余候選框帶來的無效計算,提高了定位精度,有效解決漏檢等問題。

1 相關(guān)工作

1.1 特征金字塔

很多傳統(tǒng)目標檢測方法都會使用圖像金字塔來解決目標的多尺度問題。圖像金字塔首先將不同尺寸的圖片分別輸入網(wǎng)絡(luò)中得到對應(yīng)尺寸的特征圖,然后對這些不同尺寸的特征圖進行預(yù)測。這種方法雖然可以在一定程度上應(yīng)對尺寸變化,但是帶來了成倍的計算量。進入深度學(xué)習(xí)時代后,目標檢測器在精度方面取得了顯著提高,文獻[12]提出了SPPNet,該算法使用空間金字塔池化策略,對輸入任意尺寸圖像都能夠產(chǎn)生固定大小的特征圖。早期基于深度模型的檢測器只在網(wǎng)絡(luò)的頂層進行檢測,特征單一且適應(yīng)性差。文獻[13]基于Faster RCNN[7]提出了特征金字塔網(wǎng)絡(luò)(feature pyramid network, FPN),F(xiàn)PN具有橫向連接的自頂向下體系結(jié)構(gòu)。本文改進特征金字塔網(wǎng)絡(luò)結(jié)構(gòu),提出了LEFPM 模塊。兩者結(jié)構(gòu)對比如圖1 所示。用于在所有級別特征中構(gòu)建高級語義信息,由于在檢測多尺度目標時效果顯著,F(xiàn)PN 已經(jīng)成為眾多深度檢測器的標準配置。

圖1 兩種特征金字塔的結(jié)構(gòu)對比

1.2 空洞卷積

在空洞卷積出現(xiàn)之前,研究人員普遍通過降采樣方式來間接增大感受野,降采樣方式會丟失大量有用信息,還易造成特征圖分辨率的急劇下降。2016 年,文獻[14]在圖像分割領(lǐng)域提出了空洞卷積模型,有效解決了這一難題。

空洞卷積是通過在標準卷積中進行零填充的方式,擴大卷積核的尺寸,使其能夠更好地捕獲特征圖的上下文信息??斩淳矸e的尺寸通過調(diào)整空洞率(atrous rate, ar)來實現(xiàn),空洞率即為在卷積核相鄰參數(shù)中填充(ar-1)個0。同樣的,標準卷積可以看做空洞卷積在ar 為1 時的特殊形式。

空洞卷積的輸出定義為:

式中,H、W分別表示輸入圖像(或前一層特征圖)的長和寬;x(i,j)表示該輸入圖像上(i,j)位置的像素值(特征值);ar 表示空洞率;y(i,j)表示該輸入圖像經(jīng)過空洞卷積后的輸出。

空洞卷積可以在不損失特征圖分辨率的情況下,有效聚合圖像全局特征信息,從而增加其感受野,解決目標的遮擋問題。同時因為其填充值為0,所以不會增加額外的計算開銷。

1.3 Anchor Free 機制

由于密集的錨框可有效提高待測目標的召回率,加之操作簡單,現(xiàn)階段基于Anchor Based 的目標檢測算法依然占據(jù)著深度目標檢測算法的主流,包括最經(jīng)典的Fast R-CNN[15]、SSD[11]、YOLOv2[9]、YOLOv3[10]等目標檢測算法。

然而在基于Anchor Based 的檢測機制中,相關(guān)超參的設(shè)置嚴重依賴較強的先驗知識。同時,根據(jù)預(yù)設(shè)產(chǎn)生的冗余框非常多,使得正負樣本嚴重不平衡。因此,Anchor Free 方法被越來越多的研究者探索。YOLOv1[8]在目標中心附近的點處預(yù)測邊界框?qū)崿F(xiàn)了Anchor Free,遺憾的是,其后續(xù)版本為了追求高召回率,依然采用了Anchor Based 路線。在Anchor Free 算法中,基于關(guān)鍵點的方法(如CornerNett[16]和CenterNet[17])本質(zhì)上都是密集預(yù)測的手段,龐大的解空間使得簡單的Anchor Free方法容易得到過多的誤檢,而獲得高召回率、低精確率的檢測結(jié)果。

FCOS[18]方法從像素點入手,一方面通過重新賦予權(quán)重來提高檢測質(zhì)量,另一方面通過加入FPN 在一定程度上緩解了高度重合帶來的影響。

2 基于空洞卷積金字塔的目標檢測算法

2.1 整體框架

本文的ACFPN 算法以一階段全卷積目標檢測算法FCOS 為基準(Baseline),并引入了FCOS 特有的Achor Free 機制。ACFPN 主要由4 部分組成:主干網(wǎng)絡(luò)、LEFPM、HRFM、檢測模塊,如圖2 所示。其中,LEFPM 和HRFM 兩個模塊都作用于主干網(wǎng)絡(luò)所產(chǎn)生的特征圖,并在整個架構(gòu)中執(zhí)行不同的功能。

圖2 本文ACFPN 的整體結(jié)構(gòu)

正如圖2 的結(jié)構(gòu)所示:首先,主干網(wǎng)絡(luò)對待檢測圖片進行卷積處理,生成具有不同高、低級特征信息的特征圖;其次,頂層特征圖C5 經(jīng)過HRFM進一步處理,并和其他特征圖一起送入LEFPM中;然后,LEFPM 通過一系列細節(jié)操作,將特征圖的高、低層信息進行充分融合,并將融合后的特征圖輸入到最后的檢測模塊中;最后,檢測模塊借助不同尺度子網(wǎng)絡(luò)的組合設(shè)計,對不同尺度的待檢測目標分別進行分類和定位。

特別地,本文主干網(wǎng)絡(luò)采用新的多尺度結(jié)構(gòu)Res2Net50[19]替換原FCOS 的ResNet50。相比于ResNet50,Res2Net50 在給定冗余塊中使用了分層級聯(lián)特征組取代了通常的單個3×3 卷積層,如圖3所示,該特征組在網(wǎng)絡(luò)寬度、深度和分辨率等方面有更多的優(yōu)化。

圖3 ResNet 和Res2Net 主干網(wǎng)絡(luò)對比

2.2 混合感受野模塊(HRFM)設(shè)計

眾多研究表明,使用單一尺寸的空洞卷積會引起網(wǎng)格效應(yīng)[20],即空洞率過大時,卷積會因為插入0 值而導(dǎo)致過于稀疏,難以捕獲關(guān)鍵信息,不利于小目標檢測。

為充分利用密集矩陣的高計算性能,文獻[21]率先提出用密集成分來近似或者代替最優(yōu)的局部稀疏結(jié)構(gòu)。2017 年是空洞卷積和多尺度密集結(jié)構(gòu)快速發(fā)展的一年:為減少信息損失,文獻[22]提出使用不同尺寸的卷積層特征圖融合成具有全局信息的特征表示方法;文獻[23]模擬人類視覺的感受野,通過在InceptionNet[21]中引入空洞卷積,加強網(wǎng)絡(luò)的特征提取能力;文獻[24]在人臉檢測中也將多尺度密集連接引入上下文信息模塊,以解決人臉的遮擋問題。

受以上思想的啟發(fā),本文設(shè)計了HRFM 通過將不同空洞率的空洞卷積層并行獲取的特征圖拼接在一起,提高網(wǎng)絡(luò)對全局特征的獲取能力,彌補單一空洞卷積引起的網(wǎng)格效應(yīng)。不同于InceptionNet和RFBNet,本文的HRFM 全部使用空洞卷積層。

經(jīng)過大量實驗,發(fā)現(xiàn)空洞卷積對頂層特征圖的感受野影響最大,為了充分發(fā)揮HRFM 的性能,特別將HRFM 嵌入在C5 和P5 之間。

由圖4 所示,HRFM 由4 個分支組成,一個1×1 的卷積層分支,3 個空洞率分別為ar=1, 2, 4的3×3 卷積層分支。ar=4 的3×3 空洞卷積層能夠獲取更多全局性的上下文特征細節(jié),增強推理能力,解決目標遮擋問題;不同空洞率的卷積層使用,提高了模型對不同尺度目標的適應(yīng)性;特別地,在拼接后的特征圖后,采用1×1 的卷積層進行特征信息融合,并將通道維度降低至指定數(shù)量,提高了HRFM 模塊的靈活性。

圖4 HRFM 的結(jié)構(gòu)

1×1 的卷積層可以在不改變特征圖尺寸的情況下,盡可能地保留圖像的細節(jié)信息,同時可以控制特征圖的通道數(shù),減少后續(xù)的計算量;3×3 的卷積層具有較小的參數(shù),既可以對特征信息進行加工,又進一步減少了網(wǎng)絡(luò)的計算;空洞卷積能夠獲取更多全局特征細節(jié)信息,增強推理能力,對遮擋目標有很好的識別能力,不同空洞率的設(shè)置在消除網(wǎng)格效應(yīng)的同時,也提高了模型對多尺度目標的適應(yīng)能力。

2.3 低層嵌入式特征金字塔模塊(LEFPM)設(shè)計

研究發(fā)現(xiàn),單階段目標檢測算法無法用單一維度特征圖同時有效地表征各個尺度的物體,這類的目標檢測算法通常只采用頂層特征做預(yù)測。FPN 結(jié)構(gòu)提出具有橫向連接的自頂向下架構(gòu),雖然將較高層的語義信息引入到當前層特征圖,但組合后的復(fù)合特征圖仍然存在兩個問題:

1) FPN 構(gòu)建用于檢測的特征圖時,并未考慮來自較低層的特征信息。較高層特征圖雖然包含更強的語義信息,但由于被多次下采樣和上采樣,包含的位置信息大量缺失。而較低層特征含有更精細的信息,這對于定位和檢測小尺度物體很有幫助;

2) FPN 產(chǎn)生的復(fù)合特征圖既作為高層語義信息向下傳遞,同時又用于檢測,這樣使用復(fù)合特征圖并不合理,因為復(fù)合特征圖承擔了過多的任務(wù)。

本文提出的LEFPM 在FPN 的基礎(chǔ)上,通過低層嵌入的方式,進一步充分融合低層細節(jié)信息,以實現(xiàn)對多尺度目標檢測效果和定位精度的雙提升。

如圖5 所示,其中C5′是C5 經(jīng)過HRFM 處理后的特征圖,復(fù)合卷積層由3×3 卷積層、BN 層和LeakyReLU 激活層級聯(lián)而成,目的是加工融合后的特征、優(yōu)化模型訓(xùn)練,并提高特征的非線性表達能力。

圖5 本文LEFPM 結(jié)構(gòu)圖

LEFPM 的設(shè)計思想是,首先將當前層特征圖與經(jīng)過通道壓縮和上采樣后的高層特征圖相融合(逐元素逐通道相加),形成復(fù)合特征圖,完成高層語義信息的嵌入;其次,復(fù)合特征圖和經(jīng)過下采樣的低層特征圖相融合,形成混合特征圖,完成低層細節(jié)信息的嵌入;最后,各混合特征圖經(jīng)過設(shè)計的復(fù)合卷積層后,生成最終的待檢測特征圖并進入下一模塊。以圖5 中各符號為例,具體的操作步驟為:

結(jié)構(gòu):LEFPM

輸入:C3, C4, P5′

1) P4′經(jīng)過1×1 卷積下采樣后與P5′融合生成x,x經(jīng)過復(fù)合卷積層后生成P5;

2)x經(jīng)過插值上采樣后與C4 融合,融合后的特征圖與C3(先經(jīng)過1×1 卷積層下采樣)相加生成y,y經(jīng)過復(fù)合卷積層后生成P4;

3)y經(jīng)過插值上采樣后與C3 融合生成z,z經(jīng)過復(fù)合卷積層后生成P3。

輸出:P3, P4, P5

3 實驗與分析

3.1 數(shù)據(jù)集和評價指標

3.1.1 數(shù)據(jù)集

PASCAL VOC 挑戰(zhàn)賽[25]是一個世界級的計算機視覺比賽,包含目標分類、目標檢測、目標分割動作分類等多個子任務(wù)。VOC2007 和VOC2012 是目標檢測子任務(wù)的兩個基準數(shù)據(jù)集,共包含人、貓、汽車等20 個類別,每個版本的數(shù)據(jù)集都采用統(tǒng)一的制作方式,并按照1:1:2 的比例分別劃分為訓(xùn)練集、驗證集和測試集,具體的圖片和目標數(shù)量見表1。

表1 VOC 數(shù)據(jù)集信息

3.1.2 評價指標mAP

IoU(intersection-over-union)為目標預(yù)測框和真實框的交集和并集的比值:

若設(shè)定IoU 的閾值為A,當一個預(yù)測框與一個真實框的IoU 值大于該閾值時,判定為真正例(true positive, TP),反之則判定為假正例(false positive,FP)。

精確率(precision)是指預(yù)測為正樣本的數(shù)據(jù)中,真正例所占的比重。召回率(recall)是指在實際為正樣本的數(shù)據(jù)中,判定為真正例的比重。二者分別作為縱、橫坐標組成P-R 曲線,曲線下的面積稱為平均精確率(average precision, AP),是對不同召回率點上精確率的積分和。AP 的值越大,說明模型的平均精確率越高:

一般的,數(shù)據(jù)集中會包含多種類別,按照類別進行算術(shù)平均后的精確率被稱為平均精確率均值(mean average precision, mAP):

3.2 損失函數(shù)

本文定義訓(xùn)練損失函數(shù)如下:

3.3 參數(shù)設(shè)置

在本實驗中,輸入到模型的圖像大小設(shè)為512×800,在將圖像輸入到網(wǎng)絡(luò)之前,對圖像數(shù)據(jù)進行歸一化增強處理;為加快收斂,訓(xùn)練時Res2Net50 加載官方給出的預(yù)訓(xùn)練模型;訓(xùn)練優(yōu)化器采用隨機梯度下降策略(stochastic gradient descent,SGD)[28]更新網(wǎng)絡(luò)參數(shù),其中動量(momentum)和權(quán)值衰減(weight decay)參數(shù)分別設(shè)為0.9 和0.000 1;學(xué)習(xí)率(learning rate)的變化采用預(yù)熱(warm up)策略[29],減緩模型在訓(xùn)練初期對小批量(mini-batch)樣本的過擬合現(xiàn)象,也有助于保持模型深層的穩(wěn)定性,初始學(xué)習(xí)率為0.01,結(jié)束學(xué)習(xí)率為0.000 01;后處理NMS-IoU 的閾值設(shè)置為0.6;在Qurdro RTX 8000上單卡(內(nèi)存48 G)訓(xùn)練30 個周期(Epochs)后結(jié)束。

3.4 消融實驗

本 文 以FCOS 為Baseline, 在VOC2007 和VOC2012 的訓(xùn)練+驗證集上進行訓(xùn)練,在VOC2007的測試集上進行驗證,分別驗證提出模塊的有效性。

如表2 所示,本文通過3 組遞進實驗,逐一驗證各模塊的有效性。首先,只將預(yù)訓(xùn)練的Res2Net50替換原Baseline 中的ResNet50,由第一組實驗可知,替換后的模型有0.7%的精度提升,而參數(shù)量只有很微小的增加,證明了Res2Net50 在特征提取上的有效性;其次,在第一組實驗的基礎(chǔ)上,加入本文提出的HRFM,由第二組實驗可知,加入HRFM 后的模型精度提升明顯,由79.4%提升到84.4%,充分證明增強頂層特征圖的感受野可以有效解決目標遮擋問題,同時對大尺度目標具有較強的適應(yīng)性;最后一組實驗中,本文將改進后的LEFPM 取代Baseline 中的FPN。改進后的模型精度比第二組實驗提高了2%,相比原Baseline 在mAP 上高出7.6%(如圖6 所示,在各個類別上相較于Baseline 也有顯著提升),表明低層特征信息對小尺度目標檢測非常重要,也為多尺度融合方式提供了參考。另一方面,在引入“Res2Net50”“LEFPM”“HRFM”3 個模塊后,本文ACFPN算法的參數(shù)量僅僅比原Baseline 增加了0.7 Mb,從側(cè)面反應(yīng)出引入的特征增強模塊并沒有增加模型整體的復(fù)雜程度和計算量。

圖6 各類別檢測精度對比圖

表2 本文提出模塊的性能對比

接下來,本文通過對Loss 進行畫圖分析,進一步比較所提出方法較原Baseline 方法的優(yōu)越性。

由圖7 可以看出,本文的ACFPN 與原Baseline相比,Loss 下降迅速,在經(jīng)過約80 次迭代之后,Loss趨于穩(wěn)定水平。充分證明主干網(wǎng)絡(luò)Res2Net50 的引入,有效提高了模型的收斂速度和收斂性。

圖7 Loss 曲線圖

綜合表2 和圖7 可知,提出的HRFM 和改進的LEFPM,得益于對卷積核尺寸和通道數(shù)約束的有效設(shè)計,在對模型精度提升的同時,并未產(chǎn)生較多的參數(shù)量。Res2Net 中分層級聯(lián)的設(shè)計模式,使得在保持提取特征有效性的同時,加快了梯度的反向傳播。

3.5 算法對比

為了證明ACFPN 的整體有效性,本文選取了一系列頂會論文中具有代表性的算法進行對比,結(jié)果如表3 所示,其中NAS Yolo 是PASCAL VOC Challenge 榜單上的Top 1 解決方案[30]。

選取表3 中對比算法的原則如下:

表3 各算法精度對比

1) 2018 年以后文獻中出現(xiàn)的優(yōu)秀檢測算法;

2)在權(quán)威VOC 測試集上進行過測試。

由表3 所示,本文列出了近3 年間頂會論文中,各方法在VOC 數(shù)據(jù)集上的測試結(jié)果。可以看出,本文提出的ACFPN 在精度上超越了各論文方法,比最好的論文方法PFPNet 在mAP 上高出2.3%,距離非論文方法NAS Yolo(榜單Top1)相差僅僅0.1%,充分證明了本文ACFPN 方法的有效性和優(yōu)越性。

3.6 算法效果展示

由檢測效果圖8 所示,本文的ACFPN 方法對比原Baseline (FCOS)方法,具有以下明顯優(yōu)勢:

圖8 檢測效果對比圖

1)定位框的位置更加精準;

2)召回率更高;

3)多尺度目標檢測、遮擋目標檢測效果顯著。

4 結(jié) 束 語

針對目標檢測領(lǐng)域普遍存在的遮擋和多尺度問題,本文提出了一種基于空洞卷積特征金字塔的目標檢測算法。利用空洞卷積可以有效增大感受野的優(yōu)點,設(shè)計了混合感受野模塊HRFM,采用多種不同尺寸的空洞卷積層密集連接,有效規(guī)避了單一空洞卷積造成的網(wǎng)格效應(yīng);在現(xiàn)有FPN 的基礎(chǔ)上重新構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),將低層特征圖包含的細節(jié)信息嵌入到高層語義信息中,彌補算法對小目標物體的漏檢缺陷,進一步提高目標定位的準確率。特別地,在主干部分,ACFPN 將Res2Net50 代替了常用的ResNet50,在增強特征表征能力的同時加快了模型收斂速度。Anchor Free 機制可以有效降低候選框的冗余,從而提高定位精度,本文將FCOS 的這一機制保留。通過在VOC 數(shù)據(jù)集上進行測試,本文的ACFPN 可以達到86.4%的mAP。本文方法為接下來行人重識別任務(wù)的開展提供了部分解決思路。

猜你喜歡
金字塔空洞尺度
“金字塔”
A Study of the Pit-Aided Construction of Egyptian Pyramids
財產(chǎn)的五大尺度和五重應(yīng)對
海上有座“金字塔”
神秘金字塔
童話世界(2017年11期)2017-05-17 05:28:25
空洞的眼神
宇宙的尺度
太空探索(2016年5期)2016-07-12 15:17:55
用事實說話勝過空洞的說教——以教育類報道為例
新聞傳播(2015年20期)2015-07-18 11:06:46
9
臭氧層空洞也是幫兇
荥经县| 泰来县| 开阳县| 株洲县| 民县| 达拉特旗| 永善县| 鄂州市| 奎屯市| 抚远县| 古田县| 沙坪坝区| 旅游| 界首市| 桑日县| 定襄县| 临江市| 娱乐| 盱眙县| 锡林浩特市| 分宜县| 永和县| 临江市| 攀枝花市| 长葛市| 吉木乃县| 永寿县| 金溪县| 甘肃省| 绥化市| 遂川县| 青铜峡市| 湘潭市| 什邡市| 平遥县| 利津县| 望城县| 江北区| 上犹县| 隆尧县| 治多县|