国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種可變錨框候選區(qū)域網(wǎng)絡(luò)的目標(biāo)檢測方法

2020-09-10 03:58:14李承昊茹樂何林遠(yuǎn)遲文升
關(guān)鍵詞:錨框置信度閾值

李承昊,茹樂,何林遠(yuǎn),遲文升

(1.空軍工程大學(xué) 航空工程學(xué)院,西安710038; 2.空軍工程大學(xué) 裝備管理與無人機(jī)工程學(xué)院,西安710038;3.西安電子科技大學(xué) 機(jī)電工程學(xué)院,西安710126)

隨著計(jì)算機(jī)科學(xué)和認(rèn)知神經(jīng)科學(xué)的不斷發(fā)展,人們想要研發(fā)以及開發(fā)能夠模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)以及應(yīng)用系統(tǒng),自此人工智能這一技術(shù)科學(xué)誕生。模式識(shí)別、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等理論的不斷完善和發(fā)展,使得計(jì)算機(jī)視覺在社會(huì)各種領(lǐng)域應(yīng)用廣泛,例如交通、醫(yī)學(xué)、農(nóng)業(yè)等領(lǐng)域都取得了明顯的成果。隨著計(jì)算機(jī)視覺領(lǐng)域的蓬勃發(fā)展,目標(biāo)檢測作為該領(lǐng)域一個(gè)重要任務(wù),在人臉識(shí)別、行人跟蹤、車牌識(shí)別和無人駕駛等領(lǐng)域獲得廣泛應(yīng)用[1]。

在生活中,人們僅僅通過看一眼就可以在很短的時(shí)間內(nèi)知道圖像中的物體類別和位置甚至還能獲得更為復(fù)雜的信息??焖俣譁?zhǔn)確的目標(biāo)檢測方法能夠使機(jī)器扮演視覺處理的角色,從環(huán)境中發(fā)現(xiàn)目標(biāo)、定位目標(biāo)并分析目標(biāo),為計(jì)算機(jī)后續(xù)判讀、推理并決策提供可靠保證[2]。隨著深度學(xué)習(xí)的廣泛應(yīng)用,目標(biāo)檢測方法已經(jīng)從傳統(tǒng)的基于手動(dòng)設(shè)計(jì)特征算法向基于深度學(xué)習(xí)計(jì)算機(jī)自動(dòng)提取特征算法發(fā)展。目前目標(biāo)檢測方法一般被分為兩大類:一類是基于一體化卷積神經(jīng)網(wǎng)絡(luò)的一步檢測(One-stage),如YOLO[3]、SSD[4]等;另一類是以R-CNN[5]模型為基礎(chǔ)的兩步檢測(Two-stage),以模型為基礎(chǔ)對(duì)兩步檢測進(jìn)行不斷地改進(jìn),出現(xiàn)了一系列具有代表性的算法Fast R-CNN[6]、Faster RCNN[7]等。近年來,目標(biāo)檢測方法不斷追求更好的特征提取網(wǎng)絡(luò)、更高效的訓(xùn)練方法、更完善的分類方式和更有效的樣本后處理,涌現(xiàn)出許多具有更好性能的算法如Cascade R-CNN[8]、Mask RCNN[9]和FPN[10]等。

人的視覺系統(tǒng)對(duì)于通過人眼接收到的圖像是進(jìn)行選擇性處理,基于注意力機(jī)制(Attention Mechanism)的深度神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用到各個(gè)領(lǐng)域。模型可以利用注意力機(jī)制通過訓(xùn)練不斷提取更為有效的注意區(qū)域,從而提升模型的性能。文獻(xiàn)[11]中提出了一種基于注意力引導(dǎo)機(jī)制的網(wǎng)絡(luò)來克服大圖像成像像素飽和度失調(diào)的問題;文獻(xiàn)[12]提出了圖注意網(wǎng)絡(luò)利用掩蔽自注意層來提升模型的性能解決了許多理論問題;文獻(xiàn)[13]提出了一種三步注意力引導(dǎo)卷積網(wǎng)絡(luò)來對(duì)肺部醫(yī)學(xué)圖像進(jìn)行分類進(jìn)而提高了準(zhǔn)確率。

受以上方法啟發(fā),本文提出了一種基于注意力機(jī)制的候選區(qū)域網(wǎng)絡(luò)(RPN),運(yùn)用注意力引導(dǎo)(AG)模塊對(duì)Faster R-CNN[7]的RPN進(jìn)行改進(jìn),并采用局部訓(xùn)練和全局訓(xùn)練相結(jié)合,獨(dú)立地訓(xùn)練改進(jìn)的RPN和整體地訓(xùn)練整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合,通過注意力機(jī)制不斷降低分類和回歸誤差,提高了識(shí)別性能。同時(shí)本文根據(jù)改進(jìn)的RPN網(wǎng)絡(luò)引入一種置信度因子非極大值抑制(NMS)算法,雖然對(duì)于速度性能有小幅度的下降,但是對(duì)于模型的準(zhǔn)確性有著顯著的提高。本文在標(biāo)準(zhǔn)數(shù)據(jù)集MS COCO 2007[14]進(jìn)行了綜合實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果也證明該方法有著較好的準(zhǔn)確性能。

1 相關(guān)工作

本節(jié)主要對(duì)與本文工作最為相關(guān)的目標(biāo)檢測方法和深度學(xué)習(xí)算法進(jìn)行分析。目標(biāo)檢測的目的是檢測出圖像中每一個(gè)目標(biāo)的位置和類別。根據(jù)以往的經(jīng)驗(yàn),可變形組件模型及其改進(jìn)算法一直是一個(gè)很好的解決辦法。這些算法利用人工描述的特征,如HOG[15]和SIFT[16]等,來對(duì)整幅圖像進(jìn)行掃描獲取大致目標(biāo)區(qū)域。傳統(tǒng)的目標(biāo)檢測方法利用滑動(dòng)窗法來大致確定目標(biāo)位置,雖然實(shí)現(xiàn)較為簡單,但是這種幾乎遍歷的方法造成計(jì)算量較大,耗費(fèi)時(shí)間多。隨著深度學(xué)習(xí)的廣泛應(yīng)用,R-CNN[5]、Fast R-CNN[6]中的選擇性搜索(Selective Search)算法通過采用邊緣、顯著性、形狀等特征來尋找感興趣區(qū)域,雖然相比滑動(dòng)窗法有所改進(jìn)但仍然不滿足實(shí)際需求無法完成端到端的訓(xùn)練。Faster R-CNN[7]的RPN利用深度卷積神經(jīng)網(wǎng)絡(luò)提取的特征來尋找感興趣的候選區(qū)域,能夠真正地實(shí)現(xiàn)端到端的訓(xùn)練。從該系列算法的發(fā)展可以看出,改進(jìn)主要圍繞如何尋找更為有效的候選區(qū)域這一問題。

RPN是Faster R-CNN[7]中至關(guān)重要的一個(gè)環(huán)節(jié),其輸入是由深度卷積神經(jīng)網(wǎng)絡(luò)提取出的特征圖,其輸出是候選建議區(qū)域。整個(gè)網(wǎng)絡(luò)的作用是尋找目標(biāo)可能存在的區(qū)域并進(jìn)行粗檢測,同時(shí)由于RPN減小了計(jì)算冗余也大大地縮短了計(jì)算時(shí)間。網(wǎng)絡(luò)通過輸入的任意尺度圖片的特征圖,利用滑動(dòng)窗口在卷積特征圖上進(jìn)行滑動(dòng)獲取多個(gè)錨。錨(Anchor)機(jī)制是RPN中比較重要的一個(gè)方法,是以得到的每個(gè)錨點(diǎn)的中心位置為基準(zhǔn),根據(jù)本文已經(jīng)設(shè)定的9種不同的長寬比、不同的尺度對(duì)應(yīng)映射得到錨框,再通過忽略超出邊界的錨框來去掉多余重疊區(qū)域,至此本文就分別得到了感興趣的原圖區(qū)域和感興趣的特征圖區(qū)域(見圖1)。兩者正是依靠錨機(jī)制來相互聯(lián)系。接下來就是對(duì)候選區(qū)域進(jìn)行前景與背景的粗檢測,RPN在此任務(wù)上分成2層進(jìn)行處理:一層是soft-max分類層,輸出是錨點(diǎn)所對(duì)應(yīng)2個(gè)分類信息,背景的分?jǐn)?shù)(不是目標(biāo))和前景的分?jǐn)?shù)(是目標(biāo)),識(shí)別錨框內(nèi)是否含有目標(biāo);另一層是邊框回歸層,輸出是錨框的4個(gè)位置信息(中心點(diǎn)的x和y,整個(gè)框的長度和高度)來定位候選區(qū)域的位置。至此,F(xiàn)ast R-CNN[6]通過獨(dú)立的網(wǎng)絡(luò)從特征圖上獲取一幅圖像的候選區(qū)域并且已經(jīng)對(duì)該區(qū)域進(jìn)行了粗檢測。由于RPN是獨(dú)立的網(wǎng)絡(luò)所以可以實(shí)現(xiàn)端到端的訓(xùn)練,可以通過反向傳播算法對(duì)候選建議網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)優(yōu),同時(shí)增加了模型的可移植性。

NMS算法一直以來就是行之有效的后處理方式其實(shí)質(zhì)是通過抑制非極大值數(shù)據(jù)來搜索局部極大值。目前在基于深度學(xué)習(xí)的目標(biāo)檢測領(lǐng)域NMS算法被廣泛使用,它的目的是從目標(biāo)產(chǎn)生的多個(gè)候選框選擇最為合理的候選框。文獻(xiàn)[17]提出了一種基于“抑制覆蓋檢測”和“重疊判據(jù)”的改進(jìn)NMS算法在行人檢測中降低誤檢概率;文獻(xiàn)[18]提出了一種連續(xù)比例因子NMS,降低了算法對(duì)于固定閾值的依賴。

圖1 錨點(diǎn)映射Fig.1 Anchor mapping

RPN的核心作用就是在提取圖像特征的過程中來完成對(duì)于候選框的選擇操作,RPN最大的優(yōu)點(diǎn)也在此,減少了重復(fù)提取特征的過程。同時(shí),由于RPN的存在Faster R-CNN[7]真正成為了能夠?qū)崿F(xiàn)端到端的目標(biāo)檢測框架。但是,RPN也存在這一些問題,仍然無法達(dá)到實(shí)時(shí)檢測的目的,對(duì)于候選框的分類和回歸計(jì)算量仍然很大。不同錨點(diǎn)所產(chǎn)生的錨框尺寸是相同因此缺乏多樣性進(jìn)而導(dǎo)致小目標(biāo)檢測效果不是很好。傳統(tǒng)的NMS算法雖然計(jì)算速度較快,但是對(duì)于閾值依賴過大,容易造成誤檢和漏檢。本文改進(jìn)的RPN的錨框大小和尺寸不在固定并且能夠更好地包圍目標(biāo)。同時(shí)基于傳統(tǒng)NMS算法存在的問題,引入置信度因子減少了對(duì)于閾值的依賴性。通過實(shí)驗(yàn)發(fā)現(xiàn)本文提出的方法與現(xiàn)存一些先進(jìn)算法相比具有很好的準(zhǔn)確性能。

2 可變錨框的RPN網(wǎng)絡(luò)

本文的目標(biāo)檢測系統(tǒng)是在Faster R-CNN[7]上進(jìn)行改進(jìn)的,改進(jìn)的RPN網(wǎng)絡(luò)主要包括兩部分:一部分是AG模塊,該模塊運(yùn)用注意力機(jī)制引導(dǎo)RPN搜尋更有效的錨框;另一部分是NMS算法的改進(jìn),通過引入置信度因子加強(qiáng)目標(biāo)檢測系統(tǒng)對(duì)已經(jīng)獲取的錨框進(jìn)行有效的后處理。首先,對(duì)整體網(wǎng)絡(luò)框架進(jìn)行了簡要分析;其次,介紹了AG模塊的設(shè)計(jì)思想和特性;最后,對(duì)使用的基于置信度因子的NMS算法進(jìn)行分析。

2.1 網(wǎng)絡(luò)框架

本文網(wǎng)絡(luò)框架(見圖2)是在 Faster RCNN[7]基礎(chǔ)上進(jìn)行改進(jìn),輸入圖像通過特征提取網(wǎng)絡(luò)得到特征圖,AG模塊利用特征圖對(duì)目標(biāo)錨框的種類進(jìn)行預(yù)先選擇,利用AG模塊提供的信息來指導(dǎo)RPN進(jìn)行錨框的選擇,在后端去除冗余的過程中,與傳統(tǒng)的處理方式不同,引入了置信度因子的NMS(Cf-NMS)算法來去除多余錨框并保留有效錨框。其后生成候選框,后端網(wǎng)絡(luò)與傳統(tǒng)兩步檢測相同,進(jìn)行池化和全卷積得出最終檢測結(jié)果。

圖2 網(wǎng)絡(luò)框架Fig.2 Network framework

2.2 注意力引導(dǎo)模塊

錨機(jī)制是今年以來比較流行的尋找目標(biāo)位置的方法。具體來說就是將預(yù)定義的縱橫比和大小的錨放置在特征圖上,而其中錨框的尺度以及縱橫比都是根據(jù)經(jīng)驗(yàn)預(yù)先定義好的,本文的目的是為了尋找一種更高效的可學(xué)習(xí)的錨框的搜索方案。考慮到對(duì)于某個(gè)固定類別的目標(biāo)其實(shí)其形狀以及大小是類似的或者說是相關(guān)的。AG模塊的工作原理如下:目標(biāo)的形狀和大小可以用2個(gè)參數(shù)來表征(s,r),s為目標(biāo)的尺度大小,r為目標(biāo)的縱橫比。該模塊的任務(wù)可以歸結(jié)在已知圖像特征圖,來尋求目標(biāo)的尺度大小以及縱橫比,假設(shè)本文在一個(gè)給定圖像上畫出一個(gè)物體的大致區(qū)域,則可以考慮這個(gè)物體的區(qū)域其尺度大小和縱橫比,以I為條件的分布則可以寫為

式中:p(s,r|I)為輸入圖像I存在的目標(biāo)尺度為s和縱橫比為r的概率。

本文將對(duì)于目標(biāo)區(qū)域的搜尋分別注意力集中在目標(biāo)區(qū)域的大小以及縱橫比,根據(jù)式(1)設(shè)計(jì)了對(duì)于錨框選擇的AG模塊如圖3所示,同樣預(yù)先定義幾種可以選擇的錨框的種類。假定一組尺度s1,s2,…,sn和一組縱橫比r1,r2,…,rm,S和R分別對(duì)應(yīng)尺度空間和縱橫比空間,然后相互組合就會(huì)有n×m個(gè)可供選擇的錨框形狀。即AG模塊的錨框選擇空間A為

圖3 注意力引導(dǎo)模塊Fig.3 Attention guidance module

該模塊由兩部分組成,分別用于對(duì)目標(biāo)區(qū)域的大小和縱橫比進(jìn)行預(yù)測。在特征圖上錨點(diǎn)的選擇仍然采取滑動(dòng)窗口的方法,這樣的選擇能夠更完備以及不遺漏地確定目標(biāo)的中心點(diǎn)。對(duì)于錨框的選擇具體來說,依據(jù)給定的特征映射也就是從特征提取網(wǎng)絡(luò)獲取的特征圖I,該部分對(duì)于每個(gè)確定的中心點(diǎn)進(jìn)行大小和縱橫比的預(yù)測,生成對(duì)于每個(gè)錨點(diǎn)的幾組優(yōu)化組合。在本文的網(wǎng)絡(luò)結(jié)構(gòu)中,使用了2個(gè)子網(wǎng)絡(luò)分別用于對(duì)目標(biāo)區(qū)域大小和縱橫比進(jìn)行預(yù)測,利用特征圖進(jìn)行一次卷積后通過最大池化層進(jìn)行再次降維,保留最強(qiáng)特征,再經(jīng)過2次卷積后再利用反卷積,將反卷積與最大池化層相結(jié)合分別生成含有S和R單通道映射。在此,本文的結(jié)構(gòu)與原算法中相比,不像原來錨的選擇方法采用固定的窮舉法對(duì)于形狀的選擇,因?yàn)閷?duì)于目標(biāo)的每個(gè)錨來說與它的形狀是有一定的關(guān)系的。在實(shí)驗(yàn)中本文對(duì)于2種空間內(nèi)種類,相互組合也就是說有25種可供選擇的種類n,m=5,從中預(yù)測2類尺度大小和3類縱橫比也就是說最后選擇6種錨框?qū)δ繕?biāo)進(jìn)行檢測。

2.3 置信度因子的NMS算法

對(duì)于現(xiàn)階段的目標(biāo)檢測系統(tǒng),每個(gè)要識(shí)別的目標(biāo)都有多個(gè)錨框,但是目標(biāo)檢測任務(wù)要求最終的結(jié)果是每個(gè)目標(biāo)分類對(duì)應(yīng)于一個(gè)框,因此需要對(duì)冗余的錨框進(jìn)行去冗余。傳統(tǒng)的NMS是一種貪心算法,將檢測框的置信度分?jǐn)?shù)從大到小排列,將分?jǐn)?shù)最大的檢測框作為抑制框(該算法認(rèn)為分?jǐn)?shù)最大的即為目標(biāo)框),將其余的框與抑制框做交并比(Intersection over Union,IoU)運(yùn)算,移除所有IoU值大于預(yù)設(shè)閾值T,重復(fù)上述運(yùn)算再找到新的抑制框,直至沒有錨框可以抑制為止。

式中:RIoU為交并比;G為由貪心方式選擇出來的抑制框;C為待選擇的目標(biāo)框。

雖然在算法的第1步對(duì)于預(yù)選框進(jìn)行根據(jù)置信度從大到小排列,但是對(duì)于檢測框的移除并未考慮置信度,只是依據(jù)IoU與固定閾值進(jìn)行對(duì)檢測框的選擇會(huì)造成錯(cuò)誤檢測。存在這樣的2種情況:①當(dāng)檢測的2個(gè)目標(biāo)相鄰甚至有較大重疊時(shí),如果僅僅依靠IoU作為條件判定會(huì)將存在目標(biāo)的檢測框移除造成漏檢。②當(dāng)目標(biāo)的部分結(jié)構(gòu)被檢測框選中時(shí),如果僅僅以IoU作為條件判定,由于目標(biāo)部分結(jié)構(gòu)較小所以IoU較小不會(huì)將該種目標(biāo)框保留造成誤檢。

針對(duì)以上這種情況,本文在貪心NMS算法的基礎(chǔ)上提出了一種Cf-NMS算法,將判定函數(shù)進(jìn)行改進(jìn),引入置信度因子μ,改進(jìn)抑制目標(biāo)框的條件,優(yōu)化錨框后處理方式進(jìn)而提高檢測的準(zhǔn)確性。置信度因子μ是目標(biāo)框與預(yù)選框的置信度分?jǐn)?shù)之間的關(guān)系,當(dāng)兩者分?jǐn)?shù)相近時(shí),置信度因子通過降低改進(jìn)的U函數(shù)來優(yōu)化抑制條件。

式中:μi為檢測框i的置信度因子;ci為檢測框i的置信度分?jǐn)?shù);cm為抑制框的置信度分?jǐn)?shù)。

3 實(shí)驗(yàn)結(jié)果和分析

本節(jié)先介紹利用所提改進(jìn)方法對(duì)Faster RCNN[7]中的RPN進(jìn)行改進(jìn),然后用改進(jìn)的模型進(jìn)行端到端的訓(xùn)練獲得目標(biāo)檢測模型,最后對(duì)比驗(yàn)證模型的檢測效果并分析。

3.1 訓(xùn) 練

對(duì)于本文所提出的框架為了使其能夠完成端到端方式的訓(xùn)練,本文以多任務(wù)損失函數(shù)完成對(duì)其的優(yōu)化。在傳統(tǒng)的分類損失Lcls和回歸損失Lreg的基礎(chǔ)上,引入了尺度損失La和縱橫比損失Lr2種附加損失。它們共同優(yōu)化模型,損失公式為

式中:ω1和ω2為AG模型參數(shù)。

為了確定最佳錨框的選擇,首先,將錨框的真實(shí)值相匹配,接下來從尺度空間和縱橫比空間中預(yù)測最佳的參數(shù)來更好地覆蓋真實(shí)目標(biāo)。本文中錨點(diǎn)位置的選擇與經(jīng)典RPN相一致,對(duì)于與真實(shí)值的匹配不存在較大的問題,同時(shí)尺度空間和縱橫比空間本質(zhì)也是預(yù)定義的空間,所以可以直接將錨框分配給真實(shí)值的包圍框,使該錨生成的框產(chǎn)生最大的IoU值。AG模塊是對(duì)錨的選擇進(jìn)行引導(dǎo)并不是起決定性作用,對(duì)于損失函數(shù)的選擇,La和Lr均采用smooth L1損失,分類損失和回歸損失采用傳統(tǒng)的損函數(shù)。

3.2 實(shí)驗(yàn)設(shè)置

1)平臺(tái)環(huán)境為:處理器為Intel(R)i7-8750H CPU@2.20 Hz 2.20 GHz,安裝內(nèi)存為8 GB,操作系統(tǒng)為Windows 64位,顯卡為NVIDIA GeForce GTX 1050Ti 4 GB,實(shí)驗(yàn)框架為Caffe。

2)數(shù)據(jù)集:在經(jīng)典的MS COCO 2007[14]數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。

3)實(shí)驗(yàn)細(xì)節(jié):選擇廣泛使用的ImageNet[19]作為本文的主干網(wǎng)絡(luò)。對(duì)于輸入圖像,為了保持尺度和縱橫比,不對(duì)輸入圖像進(jìn)行過多的預(yù)處理。對(duì)于尺度空間和縱橫比空間分別設(shè)置為S={128,192,256,384,512}和R={0.5,0.8,1,1.2,2}。在Cf-NMS算法中,通過大量的試驗(yàn)性實(shí)驗(yàn)得到閾值選取0.6有著更好的效果,所以在模型的整體檢測過程中閾值選擇0.6。對(duì)于多任務(wù)損失函數(shù)設(shè)置AG模型參數(shù)ω1=0.5,ω2=0.1,在訓(xùn)練中總共訓(xùn)練了5 epoch,初始學(xué)習(xí)率設(shè)置為0.01。

4)評(píng)價(jià)指標(biāo):為獲得更為全面有效的錨框選擇,所以實(shí)驗(yàn)以平均查全率(AR)作為評(píng)價(jià)候選區(qū)域的好壞。在不同的RIoU(0.5~0.9)進(jìn)行平均查全率的比較。AR100、AR300和AR500分別對(duì)應(yīng)于每幅圖像100、300和500個(gè)建議的平均查全率;ARS、ARM和ARL分別對(duì)應(yīng)于小型、中型以及大型目標(biāo)選取100幅圖像計(jì)算的平均查全率。在進(jìn)行改進(jìn)的NMS算法和模型整體準(zhǔn)確性性能的比較中,本文采用平均準(zhǔn)確度(mAP)作為性能度量參數(shù)(下標(biāo)的含義與AR相同)。

3.3 實(shí)驗(yàn)結(jié)果

本文首先對(duì)改進(jìn)的RPN與原RPN以及RPN的一些變體進(jìn)行AR的比較?!癛PN+AG”為引入AG 模塊的改進(jìn)RPN,“RPN +9 anchors”和“RPN+12 anchors”分別對(duì)應(yīng)于RPN固定的9種和固定的12種錨框,其中的NMS算法仍為傳統(tǒng)貪心NMS算法,按照此方式對(duì)本文改進(jìn)的RPN進(jìn)行平均查全率的評(píng)估。接下來,本文又對(duì)Cf-NMS算法與傳統(tǒng)的貪心算法、抑制覆蓋檢測的NMS[17]和連續(xù)比例因子的NMS[18]在不同閾值下平均準(zhǔn)確度的比較。最后,對(duì)本文提出的整體的目標(biāo)檢測模型與現(xiàn)有一些先進(jìn)方法進(jìn)行比較,如Cascade RCNN[8]、Mask R-CNN[9]和FPN[10]。

如表1所示,本文方法對(duì)于候選區(qū)域的平均查全率性能明顯要優(yōu)于傳統(tǒng)RPN和固定種類的RPN。從中也可以發(fā)現(xiàn),本文方法對(duì)于小目標(biāo)會(huì)有更好的效果,分析其原因:傳統(tǒng)的方法由于固定的錨框尺度和縱橫比的限制對(duì)于小目標(biāo)不能做到很好的識(shí)別。對(duì)于不同目標(biāo),錨框的選擇不再同傳統(tǒng)方法一樣,不同目標(biāo)有著同種類型的錨框選擇,而是會(huì)生成更符合目標(biāo)的錨框種類。同時(shí)可以發(fā)現(xiàn),本文方法雖然在運(yùn)行速度上有所增加,但仍在可接受的范圍內(nèi)。

從表2中可以得出,本文的Cf-NMS算法對(duì)于目標(biāo)有著更好的準(zhǔn)確率。當(dāng)閾值等于0.6時(shí),本文方法相比其他算法精度提升了約2%。當(dāng)閾值大于0.6時(shí),本文方法仍然具有較好的性能。原本檢測框中被抑制的正樣本由于閾值的增大被保留,降低了漏檢,實(shí)現(xiàn)了較好的效果。通過實(shí)驗(yàn)本文也發(fā)現(xiàn)隨著閾值的升高,檢測準(zhǔn)確度呈現(xiàn)先增加后降低的趨勢,這是由于當(dāng)閾值很低時(shí),許多不含有目標(biāo)的錨框沒有被有效地抑制造成了準(zhǔn)確度低的情況,當(dāng)閾值很高時(shí),正負(fù)樣本的比例不均衡造成了準(zhǔn)確率的降低。

檢測結(jié)果示例和檢測性能比較如圖4和表3所示。在與上述3種先進(jìn)算法的對(duì)比中可以發(fā)現(xiàn),本文方法無論是在不同RIoU閾值下的準(zhǔn)確度還是在平均準(zhǔn)確度都有所提高。在小型、中型以及大型目標(biāo)的測試中可以發(fā)現(xiàn),雖然本文方法對(duì)于小型和中型目標(biāo)的檢測查準(zhǔn)率與先進(jìn)算法相比有著很好的提升,但是對(duì)于大型目標(biāo)本文方法與Cascade R-CNN[8]相比,性能提升并沒有達(dá)到預(yù)期的效果。

表1 候選區(qū)域的平均查全率Table 1 Average recall rate of region pr oposal

表2 不同NMS算法的mAP的實(shí)驗(yàn)結(jié)果Table 2 Experimental results of m AP by different NMS algorithms

圖4 檢測結(jié)果示例Fig.4 Sample of test results

表3 檢測性能比較Table 3 Comparison of detection performance

4 結(jié) 論

1)本文提出了一種基于注意力引導(dǎo)的可變錨框RPN,其通過AG模塊來預(yù)測目標(biāo)的尺度和縱橫比,來引導(dǎo)錨框的選擇。與傳統(tǒng)方法相比,不同目標(biāo)的錨框不再是固定的種類。在與傳統(tǒng)RPN和RPN一些變體比較實(shí)驗(yàn)中,所提方法也在平均查全率上有較好的提升。

2)所提方法在召回率方面比RPN高。針對(duì)傳統(tǒng)的后處理方式貪心NMS算法出現(xiàn)的誤檢和漏檢的問題,在抑制判別條件中引入了置信度因子,增加了算法的準(zhǔn)確度。同時(shí)所提方法在平均查全率上相比于傳統(tǒng)的RPN有所提高。

通過實(shí)驗(yàn)發(fā)現(xiàn)所提方法還是存在不足。雖然通過AG模塊以及Cf-NMS算法來對(duì)模型進(jìn)行改進(jìn),但是仍然受限于預(yù)定義的錨框選擇空間集。下一步工作希望改進(jìn)方法使RPN在尋找感興趣區(qū)域算法方面不過分依賴于參數(shù)設(shè)定。

猜你喜歡
錨框置信度閾值
基于YOLOv3錨框優(yōu)化的側(cè)掃聲吶圖像目標(biāo)檢測
錨框策略匹配的SSD飛機(jī)遙感圖像目標(biāo)檢測
基于SSD算法的輕量化儀器表盤檢測算法*
基于GA-RoI Transformer的遙感圖像任意方向目標(biāo)檢測
硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
基于自適應(yīng)閾值和連通域的隧道裂縫提取
正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
比值遙感蝕變信息提取及閾值確定(插圖)
河北遙感(2017年2期)2017-08-07 14:49:00
室內(nèi)表面平均氡析出率閾值探討
福贡县| 中西区| 临城县| 乌拉特后旗| 额敏县| 浮梁县| 新兴县| 玛沁县| 皮山县| 凤庆县| 怀远县| 台北县| 稻城县| 壶关县| 仙居县| 万山特区| 大连市| 久治县| 高平市| 应用必备| 樟树市| 嘉兴市| 兰考县| 新邵县| 澄迈县| 富民县| 阿拉善左旗| 永和县| 府谷县| 勐海县| 乃东县| 上犹县| 平湖市| 广元市| 砀山县| 措美县| 平顶山市| 阿鲁科尔沁旗| 瑞昌市| 鞍山市| 集贤县|