語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)

2019-03-11 07:29鄔亞男，李君君，張彬彬

智能計(jì)算機(jī)與應(yīng)用 2019年6期

關(guān)鍵詞：目標(biāo)檢測(cè)卷積神經(jīng)網(wǎng)絡(luò)

鄔亞男，李君君，張彬彬

摘要：目標(biāo)檢測(cè)問題一直是計(jì)算機(jī)視覺以及機(jī)器學(xué)習(xí)領(lǐng)域非常重要的研究課題，并且在交通監(jiān)控、醫(yī)學(xué)影像、輔助駕駛等方面有著廣泛的應(yīng)用。由于現(xiàn)實(shí)任務(wù)對(duì)于檢測(cè)速度和精度的要求，目標(biāo)檢測(cè)一直是計(jì)算機(jī)視覺領(lǐng)域具有挑戰(zhàn)性的任務(wù)。語(yǔ)境信息可以作為推理的關(guān)鍵證據(jù)應(yīng)用于多目標(biāo)識(shí)別領(lǐng)域。由此，提出語(yǔ)境信息約束下的直接預(yù)測(cè)目標(biāo)類別和目標(biāo)位置的多目標(biāo)檢測(cè)網(wǎng)絡(luò)。該網(wǎng)絡(luò)采取端對(duì)端的訓(xùn)練方式，分層提取特征，并利用語(yǔ)境信息微調(diào)網(wǎng)絡(luò)的輸出結(jié)果以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。在PASCAL VOC 2007數(shù)據(jù)集上的定性及定量實(shí)驗(yàn)結(jié)果，證明了深度語(yǔ)境網(wǎng)絡(luò)下的目標(biāo)檢測(cè)模型具有顯著的目標(biāo)檢測(cè)性能，優(yōu)于當(dāng)前先進(jìn)的方法。實(shí)驗(yàn)證明，利用語(yǔ)境信息可以為目標(biāo)檢測(cè)提供有效的判定依據(jù)，提高檢測(cè)的準(zhǔn)確率。

關(guān)鍵詞：目標(biāo)檢測(cè);語(yǔ)境信息;實(shí)時(shí)檢測(cè);卷積神經(jīng)網(wǎng)絡(luò)

0引言

目標(biāo)檢測(cè)的任務(wù)是集目標(biāo)分類、目標(biāo)定位兩者之所長(zhǎng)，檢測(cè)輸入圖像中所有感興趣的目標(biāo)的類別屬性和位置屬性，輸出相對(duì)應(yīng)的概率標(biāo)簽，表明將目標(biāo)分類為該類別的概率，明確輸入圖像中感興趣物體的位置和范圍，以矩形框表示物體的所在。目標(biāo)檢測(cè)問題一直是計(jì)算機(jī)視覺以及機(jī)器學(xué)習(xí)領(lǐng)域非常重要的研究課題，并且在視頻監(jiān)控、行人檢測(cè)、行為識(shí)別、場(chǎng)景理解等方面有著廣泛的應(yīng)用。

傳統(tǒng)目標(biāo)檢測(cè)模型主要由人工設(shè)計(jì)特征以及分類決策構(gòu)成。通過人工設(shè)計(jì)特征表達(dá)，然后設(shè)計(jì)相應(yīng)的分類器對(duì)目標(biāo)進(jìn)行檢測(cè)。雖然這些手工制作的方法取得了令人矚目的成功，但其在實(shí)踐中不能靈活捕獲圖片信息，這可能會(huì)阻礙性能進(jìn)一步提高。隨著機(jī)器學(xué)習(xí)理論逐步完善以及深度學(xué)習(xí)技術(shù)的日益發(fā)展，深度網(wǎng)絡(luò)模型不斷發(fā)展壯大，對(duì)于特征的表達(dá)能力日益增強(qiáng)，檢測(cè)精度也得以提升。目標(biāo)檢測(cè)任務(wù)從傳統(tǒng)模型逐漸向基于深度學(xué)習(xí)的模型研究，涌現(xiàn)了一大批深度網(wǎng)絡(luò)下的目標(biāo)檢測(cè)模型。盡管如此，由于現(xiàn)實(shí)任務(wù)高精度、高速度的目標(biāo)檢測(cè)需求，當(dāng)前的目標(biāo)檢測(cè)結(jié)果仍然差強(qiáng)人意。因此，深度檢測(cè)模型設(shè)計(jì)仍然面臨著巨大的壓力，仍然是亟待優(yōu)化和解決的具有挑戰(zhàn)性的研究課題。

語(yǔ)境線索在搜索和檢測(cè)物體中有著重要作用，并且在計(jì)算機(jī)視覺和認(rèn)知神經(jīng)科學(xué)等方面有著重要的應(yīng)用。語(yǔ)境有助于圖像理解，符合現(xiàn)實(shí)世界的客觀規(guī)律，語(yǔ)境信息對(duì)于人類識(shí)別物體也至關(guān)重要，計(jì)算機(jī)視覺的許多研究證明，通過適當(dāng)?shù)恼Z(yǔ)境建模能夠有效改進(jìn)識(shí)別算法。由于視覺對(duì)象在其外觀、動(dòng)作等方面變化很大，通常難以僅使用局部線索來學(xué)習(xí)魯棒模型。同時(shí)，由于物體幾乎不是孤立地發(fā)生的，其語(yǔ)境信息，可以用來評(píng)估目標(biāo)檢測(cè)模型的輸出并提高檢測(cè)性能。本文的主要貢獻(xiàn)如下：

（1）在SSD模型基礎(chǔ)上，提出語(yǔ)境信息約束下的直接預(yù)測(cè)目標(biāo)類別和目標(biāo)位置的多目標(biāo)檢測(cè)網(wǎng)絡(luò)，該網(wǎng)絡(luò)采取端對(duì)端的訓(xùn)練方式，分層提取特征并進(jìn)行實(shí)時(shí)的目標(biāo)檢測(cè)。

（2）采用語(yǔ)境信息作為約束條件，預(yù)測(cè)目標(biāo)類別和目標(biāo)位置，利用語(yǔ)境信息微調(diào)網(wǎng)絡(luò)的輸出結(jié)果，以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。

（3）在PASCAL VOC 2007數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果，證明了本文方法在公開數(shù)據(jù)集測(cè)試中具有顯著的目標(biāo)檢測(cè)性能，優(yōu)于當(dāng)前先進(jìn)的方法。

1相關(guān)工作

針對(duì)圖像目標(biāo)檢測(cè)問題，通常有兩種常見的目標(biāo)檢測(cè)模型，一種為基于滑動(dòng)窗口的目標(biāo)檢測(cè)模型，另一種為基于區(qū)域提議的目標(biāo)檢測(cè)模型。在卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前，DPM和選擇性搜索受到了許多的關(guān)注。在R-CNN結(jié)合選擇性搜索、區(qū)域提議以及卷積神經(jīng)網(wǎng)絡(luò)帶來顯著改進(jìn)后，基于區(qū)域提議的目標(biāo)檢測(cè)方法變得流行。

SPPnet顯著加快了原有的R-CNN方法，其引入了一個(gè)空間金字塔池化層，對(duì)區(qū)域大小和尺度更加魯棒，并允許分類層重用多個(gè)圖像分辨率下生成的特征映射上計(jì)算的特征。Fast R-CNN擴(kuò)展了SPPnet.使得其可以通過最小化置信度和邊界框回歸的損失，來對(duì)所有層進(jìn)行端到端的微調(diào)，并初次利用MuhiBox學(xué)習(xí)目標(biāo)信息。然而，F(xiàn)ast R-CNN仍然選擇使用選擇性搜索進(jìn)行區(qū)域提議，浪費(fèi)了太多的檢測(cè)時(shí)間。據(jù)此，F(xiàn)aster R-CNN提出區(qū)域提議網(wǎng)絡(luò)進(jìn)行區(qū)域提議，并引入了一種方法，通過微調(diào)共享卷積層和預(yù)測(cè)層將區(qū)域提議網(wǎng)絡(luò)和Fast R-CNN結(jié)合在一起，使用區(qū)域提議網(wǎng)絡(luò)池化中級(jí)特征，提升了檢測(cè)速度。

基于滑動(dòng)窗口的目標(biāo)檢測(cè)模型完全跳過提出步驟，直接預(yù)測(cè)多個(gè)類別的邊界框和置信度。OverFeat是首先利用滑動(dòng)窗口進(jìn)行目標(biāo)檢測(cè)的方法，在知道了底層目標(biāo)類別的置信度之后，直接從最頂層的特征映射的每個(gè)位置預(yù)測(cè)邊界框。之前常見的檢測(cè)方法都將檢測(cè)轉(zhuǎn)換為分類問題，而YOLO另辟蹊徑，僅僅經(jīng)過一個(gè)神經(jīng)網(wǎng)絡(luò)，將檢測(cè)轉(zhuǎn)換為回歸問題，從而實(shí)現(xiàn)端對(duì)端優(yōu)化。YOLO使用整個(gè)最頂層的特征映射來預(yù)測(cè)多個(gè)類別和邊界框（這些類別共享）的置信度。YOLO經(jīng)過不斷更新多次優(yōu)化升級(jí)得到目前的YOLOv3.并在設(shè)計(jì)上進(jìn)行了一定的改進(jìn)：首先融合先前的Darknet-19網(wǎng)絡(luò)以及殘差網(wǎng)絡(luò)，設(shè)計(jì)出DarkNet-53網(wǎng)絡(luò)進(jìn)行特征提取，功能更加強(qiáng)大。此外，YOLOv3還能夠進(jìn)行跨尺度預(yù)測(cè)，利用金字塔網(wǎng)絡(luò)的概念預(yù)測(cè)出三個(gè)不同的尺度上邊界框。

語(yǔ)境信息可以作為推理的關(guān)鍵證據(jù)應(yīng)用于多目標(biāo)識(shí)別領(lǐng)域。然而，上述研究忽略了語(yǔ)境信息的重要作用，僅僅利用設(shè)計(jì)的目標(biāo)檢測(cè)器檢測(cè)對(duì)象類別及位置，結(jié)果可能會(huì)違反現(xiàn)實(shí)世界中的規(guī)律。在考慮語(yǔ)境信息之后，準(zhǔn)確性得到了很大改善。在傳統(tǒng)模型中，檢測(cè)算法由人工設(shè)計(jì)特征及淺層分類器構(gòu)成。語(yǔ)境信息可作為正則化約束條件，調(diào)整檢測(cè)結(jié)果以提高性能，也可以約束深度學(xué)習(xí)模型，利用這種豐富的且有區(qū)別的語(yǔ)境信息有助于機(jī)器獲取行為發(fā)生時(shí)相應(yīng)的場(chǎng)景信息，獲得圖像內(nèi)容的理解，提高檢測(cè)的準(zhǔn)確度。例如，Bell等人也分別對(duì)語(yǔ)境和外部場(chǎng)景進(jìn)行了建模。利用空間循環(huán)神經(jīng)網(wǎng)絡(luò)分別對(duì)感興趣區(qū)域的外部環(huán)境整合了多尺度語(yǔ)境，有助于特定的小目標(biāo)檢測(cè)。Zhe等人通過可學(xué)習(xí)的直方圖層在端到端訓(xùn)練中學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)中的統(tǒng)計(jì)語(yǔ)境特征，將可學(xué)習(xí)的直方圖層集成到深層網(wǎng)絡(luò)中，探索了語(yǔ)義分割和目標(biāo)檢測(cè)兩個(gè)視覺問題。Heilbron等人提出語(yǔ)境級(jí)聯(lián)模型，通過采用與人類活動(dòng)相關(guān)的語(yǔ)義先驗(yàn)，語(yǔ)境級(jí)聯(lián)模型產(chǎn)生高質(zhì)量的特定類別的行動(dòng)提議，并通過級(jí)聯(lián)的方式抑制無關(guān)的活動(dòng)提議。

2語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)

利用語(yǔ)境信息作為約束條件，能夠準(zhǔn)確且有效地捕捉圖片中除了目標(biāo)物本身之外的所有信息（包括其它目標(biāo)信息和背景信息）。語(yǔ)境信息作為目標(biāo)檢測(cè)推理過程的關(guān)鍵證據(jù)，具有重要的作用及意義。以此作為切入點(diǎn)，構(gòu)建語(yǔ)境信息約束下實(shí)時(shí)的多目標(biāo)檢測(cè)網(wǎng)絡(luò)，如圖l所示。該網(wǎng)絡(luò)分層提取特征并依次進(jìn)行邊框回歸和分類，從而得到圖像中所有感興趣的目標(biāo)類別屬性和位置屬性。

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)的主要貢獻(xiàn)如下：

（1）在SSD模型基礎(chǔ)上進(jìn)行改進(jìn)，提出語(yǔ)境信息約束下能夠端對(duì)端訓(xùn)練的多目標(biāo)檢測(cè)網(wǎng)絡(luò)，并依次進(jìn)行邊框回歸和分類。

（2）采用語(yǔ)境信息約束網(wǎng)絡(luò)輸出結(jié)果，微調(diào)網(wǎng)絡(luò)的輸出結(jié)果以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。

2.1語(yǔ)境約束

多目標(biāo)檢測(cè)網(wǎng)絡(luò)經(jīng)過初步訓(xùn)練，將得到訓(xùn)練集圖像所有候選框中目標(biāo)的語(yǔ)義類別、標(biāo)簽以及所有候選框的位置坐標(biāo)。由此，可以計(jì)算出候選框中心位置點(diǎn)的坐標(biāo)。已知語(yǔ)義類別集合，可得候選目標(biāo)O的位置屬性v.以及候選目標(biāo)的語(yǔ)義屬性a。定義語(yǔ)義存在矩陣，統(tǒng)計(jì)每一幅圖像中出現(xiàn)的類別，語(yǔ)義存在矩陣，統(tǒng)計(jì)所有訓(xùn)練集圖像中同時(shí)出現(xiàn)的類別，對(duì)即可得語(yǔ)義類別共現(xiàn)頻率矩陣，統(tǒng)計(jì)訓(xùn)練集圖像中同時(shí)出現(xiàn)的類別頻率。由候選目標(biāo)的語(yǔ)義屬性以及語(yǔ)義類別共現(xiàn)頻率矩陣作為語(yǔ)義信息獲取目標(biāo)類別關(guān)系。目標(biāo)類別之間語(yǔ)義約束置信度獲取方法如下：

其中，I表示訓(xùn)練集圖像I^（n）∈I_train;a表示語(yǔ)義類別集合a_m，a_n∈a;v表示候選框v_i，v_j∈ v;o候選框中目標(biāo)的語(yǔ)義類別標(biāo)簽;I表示計(jì)數(shù)函數(shù)。

由目標(biāo)對(duì)的位置信息可計(jì)算類別間的相對(duì)位置信息。該信息是一個(gè)向量，包含兩個(gè)類別間的距離和角度信息，由目標(biāo)對(duì)的相對(duì)位置信息可計(jì)算類別間相對(duì)位置，分別作為位置信息獲取目標(biāo)類別關(guān)系。目標(biāo)類別之間位置約束置信度獲取方法如下：

其中，[x_i，y_i]表示候選框的中心位置坐標(biāo);[△x_ij，△y_ij]表示屬于兩個(gè)類別a_m，a_n之間的候選框v_i，v_j相對(duì)位置;v為目標(biāo)對(duì)的相對(duì)位置均值;σ²為目標(biāo)對(duì)的相對(duì)位置方差;f為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。

根據(jù)捕獲的目標(biāo)類別關(guān)系，微調(diào)候選目標(biāo)框的類別得分。通過語(yǔ)境約束C_semantic以及C_location判斷后，對(duì)于每張圖片的每個(gè)目標(biāo)，考慮所有與之相關(guān)的候選框類別，得到最終類別置信度c。

2.2網(wǎng)絡(luò)模型

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)與Faster R-CNN中的區(qū)域提議網(wǎng)絡(luò)非常相似，也使用了一組固定的邊界框進(jìn)行預(yù)測(cè)，類似于RPN中的錨邊界框。但并不是使用這些來池化特征并評(píng)估另一個(gè)分類器，而是為每個(gè)目標(biāo)類別在每個(gè)邊界框中同時(shí)生成一個(gè)分?jǐn)?shù)。因此，本文的方法避免了將區(qū)域提議網(wǎng)絡(luò)與Fast R-CNN合并的復(fù)雜性，并且更容易訓(xùn)練，更快且更直接地集成到其它任務(wù)中。語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)使用默認(rèn)邊界框，方法比現(xiàn)有方法更靈活，可以在不同尺度的多個(gè)特征映射的每個(gè)特征位置上使用不同長(zhǎng)寬比的默認(rèn)邊界框。如果只從最頂層的特征映射的每個(gè)位置使用一個(gè)默認(rèn)框，語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)將具有與OverFeat相似的架構(gòu)，若使用整個(gè)最頂層的特征映射，并添加一個(gè)全連接層進(jìn)行預(yù)測(cè)來代替卷積預(yù)測(cè)器，并且沒有明確地考慮多個(gè)長(zhǎng)寬比，將近似地再現(xiàn)YOLO。

利用在ILSVRC CLS-LOC數(shù)據(jù)集上已經(jīng)預(yù)先訓(xùn)練好的VGG16網(wǎng)絡(luò)，作為基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。通過多層卷積分層提取特征，直接檢測(cè)圖像中的目標(biāo)，最終獲得固定尺度的邊界框以及對(duì)象的類別。將多個(gè)卷積層添加到VGG16第五個(gè)卷積層之后，VGG第六、七層原本為全連接層，將其替換為卷積層，從其中重采樣參數(shù)。然后繼續(xù)增加4個(gè)卷積層，所以總共含有6種尺度的卷積層，尺寸逐漸減小，每種尺度的卷積層都能學(xué)習(xí)到一個(gè)特征圖，將6種尺度卷積層學(xué)習(xí)的多個(gè)特征圖預(yù)測(cè)組合在一起，以便于針對(duì)不同尺度的目標(biāo)檢測(cè)問題。SSD模型訓(xùn)練一開始，需要將真實(shí)信息分配給固定的檢測(cè)器，輸出集合中的特定輸出，一旦確定了這個(gè)分配，損失函數(shù)和反向傳播就可以應(yīng)用端到端了。通過計(jì)算交疊面積，保證唯一的默認(rèn)框與真實(shí)標(biāo)簽一一對(duì)應(yīng)，之后只要交疊面積大于設(shè)定的閾值就將默認(rèn)框與真實(shí)標(biāo)簽進(jìn)行隨機(jī)匹配，使網(wǎng)絡(luò)可以預(yù)測(cè)同個(gè)位置的多個(gè)框。測(cè)試時(shí)，根據(jù)訓(xùn)練好的模型得到每個(gè)候選框中的目標(biāo)類別的預(yù)測(cè)分?jǐn)?shù)，同時(shí)對(duì)候選框進(jìn)行調(diào)整以便于更好地匹配目標(biāo)形狀。使用隨機(jī)梯度下降，對(duì)得到的語(yǔ)境信息約束下的實(shí)時(shí)多目標(biāo)檢測(cè)網(wǎng)絡(luò)模型進(jìn)行微調(diào)，初始學(xué)習(xí)率為10^-3，動(dòng)量為0.9.權(quán)重衰減為0.0005.批處理數(shù)據(jù)大小為32。針對(duì)每個(gè)數(shù)據(jù)集的學(xué)習(xí)速率衰減策略略有不同，本文使用Caffe框架，實(shí)驗(yàn)環(huán)境硬件平臺(tái)配置為CoreX i7-6800k 6核、3.4GHz CPU、2塊NIVDIA GTX10808GB顯卡。整個(gè)語(yǔ)境信息約束下的實(shí)時(shí)多目標(biāo)檢測(cè)網(wǎng)絡(luò)訓(xùn)練過程的損失函數(shù)為：

其中，x為網(wǎng)絡(luò)輸入;c為類別置信度;l和g分別為預(yù)測(cè)框和真實(shí)標(biāo)簽;L_conf代表置信損失，置信度損失是在多類別置信度上的softmax損失;L_loc代表定位損失，定位損失是預(yù)測(cè)框與真實(shí)框參數(shù)之間的Smooth L1損失，

3實(shí)驗(yàn)結(jié)果與分析

3.1數(shù)據(jù)集與評(píng)價(jià)標(biāo)準(zhǔn)

由于PASCAL VOC 2007數(shù)據(jù)集是一個(gè)有著明顯層級(jí)結(jié)構(gòu)的多類別、多目標(biāo)類型的數(shù)據(jù)集，類別、目標(biāo)之間具有明顯的共生關(guān)系。所以本文選擇在PASCAL VOC 2007數(shù)據(jù)集上評(píng)估DCN方法。該數(shù)據(jù)集包括20個(gè)對(duì)象類別，9963張高質(zhì)量圖片。其中5011張訓(xùn)練和驗(yàn)證集圖像，4952張測(cè)試圖像，包含24640個(gè)已標(biāo)注的目標(biāo)，該數(shù)據(jù)集為圖像分割、目標(biāo)識(shí)別和目標(biāo)檢測(cè)提供標(biāo)準(zhǔn)。為了證明DCN方法的檢測(cè)精度，本文采用類別平均精準(zhǔn)度（Ap.Average Precision）值和平均AP（mean AP）值進(jìn)行評(píng)測(cè)。

其中，N（TruePositives）_{c_i}為正確預(yù)測(cè)的數(shù)量;N（TotalObjects）_{c_i}該圖像中給定類別c_i的實(shí)際目標(biāo)的數(shù)量;Precision_{c_i}為類c_i的精度。平均AP值即為所有類別的平均精度求和除以所有類別。

實(shí)驗(yàn)方法中，如果預(yù)測(cè)窗口與數(shù)據(jù)集標(biāo)定的ground-truth窗口面積IoU重疊大于50%（mAP@IoU=0.5），則認(rèn)為此提議窗口的檢測(cè)是正確的，否則是錯(cuò)誤的，

3.2實(shí)驗(yàn)結(jié)果分析

本文在PASCAL VOC 2007數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證，并與當(dāng)前先進(jìn)檢測(cè)方法R-CNN、Fast R-CNN、Faster R-CNN、G-CNN、OHEM、SSD進(jìn)行對(duì)比，以驗(yàn)證語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)方法的目標(biāo)檢測(cè)效果。

表1給出了不同線索下語(yǔ)境信息約束下，多目標(biāo)檢測(cè)網(wǎng)絡(luò)在PASCAL VOC 2007數(shù)據(jù)集上得到平均準(zhǔn)確率值，以證明不同線索對(duì)檢測(cè)結(jié)果的影響。其中semantic代表語(yǔ)義約束，location代表位置約束。由表1可得，語(yǔ)境信息約束分別作用以及共同作用下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)對(duì)于檢測(cè)精度的提升效果。

表2給出了語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)與對(duì)比方法，分別在PASCAL VOC 2007數(shù)據(jù)集上的平均AP值以及20個(gè)類別條件下得到平均準(zhǔn)確率值。由表2可得，在PASCAL VOC 2007數(shù)據(jù)集下以及20個(gè)類別條件下得到的平均準(zhǔn)確率，總體優(yōu)于當(dāng)前先進(jìn)方法。

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)能夠在一定程度上處理漏檢（chair、bird）、誤檢（potted plant、sofa）等問題，針對(duì)檢測(cè)錯(cuò)誤以及不準(zhǔn)確等問題進(jìn)行修正，提升檢測(cè)的精準(zhǔn)度，具有更好的檢測(cè)效果，如圖2所示。

圖3給出了PASCAL VOC 2007數(shù)據(jù)集上6個(gè)示例類別的平均精準(zhǔn)度柱狀圖結(jié)果，驗(yàn)證了利用語(yǔ)境信息約束能夠提升多目標(biāo)檢測(cè)網(wǎng)絡(luò)的檢測(cè)效果，語(yǔ)義約束和位置約束對(duì)于目標(biāo)檢測(cè)有著重要的作用。

4結(jié)束語(yǔ)

本文介紹了語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)，是一種快速的單次多類別目標(biāo)檢測(cè)器，模型的關(guān)鍵特性是使用網(wǎng)絡(luò)頂部多個(gè)特征映射的多尺度卷積邊界框輸出，這種表示能夠高效地建模可能的邊界框形狀空間。語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)在準(zhǔn)確性和速度方面與其對(duì)應(yīng)的最先進(jìn)的目標(biāo)檢測(cè)器相比毫不遜色。在PASCAL VOC 2007數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了本文方法在公開數(shù)據(jù)集測(cè)試中具有顯著的目標(biāo)檢測(cè)性能，提高了檢測(cè)精度，優(yōu)于當(dāng)前先進(jìn)的方法，在此基礎(chǔ)上仍然存在許多可以深入研究的方向，其中有前景的未來方向是探索其作為系統(tǒng)的一部分，使該模型作為目標(biāo)檢測(cè)組件的大型系統(tǒng)有用的構(gòu)建模塊，同時(shí)檢測(cè)和跟蹤視頻中的目標(biāo)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)