裴儀瑤,郭會明,張丹普,陳文博
(1.中國航天科工集團(tuán)第二研究院,北京 100039;2.北京航天長峰股份有限公司北京航天長峰科技工業(yè)集團(tuán)有限公司,北京 100039;3.中國科學(xué)院自動(dòng)化研究所,北京 100190)
3D 目標(biāo)檢測是車輛無人駕駛、機(jī)器人、增強(qiáng)現(xiàn)實(shí)、安保邊防、同時(shí)定位與地圖構(gòu)建(Simultaneous Localization And Mapping,SLAM)等應(yīng)用領(lǐng)域中的一項(xiàng)關(guān)鍵任務(wù)。在車輛無人駕駛過程中需要對周邊環(huán)境進(jìn)行實(shí)時(shí)感知,3D 目標(biāo)檢測任務(wù)可以用于識別并定位車輛周圍的物體,以此躲避障礙物[1-2];動(dòng)態(tài)環(huán)境下的SLAM 是一項(xiàng)充滿挑戰(zhàn)的任務(wù),SLAM 與基于深度神經(jīng)網(wǎng)絡(luò)的3D 目標(biāo)檢測任務(wù)可以互相促進(jìn)[3],通過3D 目標(biāo)檢測任務(wù)刪除不可靠的特征點(diǎn)(如移動(dòng)的物體),提高SLAM 的精度和魯棒性。近年來出現(xiàn)了基于點(diǎn)云投影到圖像[4-6]、基于3D 體素網(wǎng)格[7-9]和基于原始點(diǎn)云[10-12]的3D 目標(biāo)檢測方法。基于3D體素網(wǎng)格的方法用空間信息進(jìn)行顯式編碼,將點(diǎn)云數(shù)據(jù)轉(zhuǎn)化為體素格式并對體素特征進(jìn)行編碼;然后,在體素網(wǎng)格上應(yīng)用3D 卷積進(jìn)行特征提??;最后,使用候選區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN)進(jìn)行目標(biāo)預(yù)測。稀疏嵌入卷積檢測(Sparsely Embedded CONvolutional Detection,SECOND)網(wǎng)絡(luò)[9]是一個(gè)具有代表性的基于體素網(wǎng)格的3D目標(biāo)檢測網(wǎng)絡(luò),其提出的稀疏卷積方法提高了網(wǎng)絡(luò)運(yùn)算效率,加快了網(wǎng)絡(luò)推理速度。
目前大部分3D 目標(biāo)檢測方法的研究都是基于全監(jiān)督的方法[1,4,7],而全監(jiān)督的3D 目標(biāo)檢測方法需要大量的人工標(biāo)注數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)來優(yōu)化模型,由于3D 點(diǎn)云數(shù)據(jù)的特殊性,在人工標(biāo)注目標(biāo)3D邊界框的過程中不可避免地存在偏差,即目標(biāo)的標(biāo)注數(shù)據(jù)中存在噪聲,若使用這種數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)則會對模型的定位精度造成影響;另一方面,在一般的3D 目標(biāo)檢測方法中,往往輸出結(jié)果只有分類置信度以及回歸的3D邊界框[7-9],而缺少對于3D 邊界框置信度的估計(jì),因此常規(guī)的3D 目標(biāo)檢測器很難區(qū)分誤檢(False Positive,F(xiàn)P)和正確檢測結(jié)果(True Positive,TP)。誤檢在自動(dòng)駕駛下非常危險(xiǎn),可能會引起諸如意外制動(dòng)的情況,降低駕駛的穩(wěn)定性和效率,因此在考慮目標(biāo)置信度時(shí)除了分類置信度,定位的置信度也是非常重要的,可以用于表征預(yù)測3D邊界框的可靠性。本文提出了一種預(yù)測3D 邊界框不確定性的方法,在原SECOND 網(wǎng)絡(luò)基礎(chǔ)上額外輸出定位不確定性,使用高斯和拉普拉斯兩種方法對定位不確定性進(jìn)行建模,對定位損失函數(shù)進(jìn)行重新定義并對比了兩種方法的性能。在檢測過程中,聯(lián)合使用分類置信度以及定位不確定性對候選目標(biāo)進(jìn)行篩選,從而得到更準(zhǔn)確的檢測結(jié)果,同時(shí)也提高了網(wǎng)絡(luò)的魯棒性。
由于SECOND 網(wǎng)絡(luò)使用規(guī)則的體素網(wǎng)格的形式,能夠顯式地對點(diǎn)云形狀信息進(jìn)行編碼,同時(shí)采用稀疏卷積層可有效提高網(wǎng)絡(luò)運(yùn)算性能[9],因此,本文選用基于3D 體素網(wǎng)格的單階段3D目標(biāo)檢測網(wǎng)絡(luò)SECOND[9]作為3D目標(biāo)檢測基礎(chǔ)網(wǎng)絡(luò)。
SECOND 網(wǎng)絡(luò)結(jié)構(gòu),如圖1 虛線框內(nèi)所示,該網(wǎng)絡(luò)由體素特征提取器(Voxel-wise Feature Extractor,VFE)、稀疏卷積中間層(sparse convolutional middle layer)和RPN 三部分組成。首先,對點(diǎn)云進(jìn)行體素化編碼,將點(diǎn)云分割為等大小的體素網(wǎng)格并對體素內(nèi)的點(diǎn)進(jìn)行固定數(shù)量的隨機(jī)采樣。然后,使用VFE 層來提取逐體素特征,VFE 層將同一體素中的所有點(diǎn)作為輸入,使用完全連接網(wǎng)絡(luò)(Fully Connected neural Network,F(xiàn)CN)來提取逐點(diǎn)特征。之后通過最大池化層得到局部聚合特征。三維體素特征提取器由多個(gè)VFE 層和1 個(gè)FCN 層組成,輸出為所有體素的全局特征。隨后,將特征輸入稀疏卷積中間層,通過稀疏卷積解決了三維卷積特征提取造成的內(nèi)存開銷大以及計(jì)算速度慢的問題。該層由兩個(gè)階段的稀疏卷積組成,每個(gè)階段包含幾個(gè)子流形卷積層和1 個(gè)稀疏卷積層,在z軸上進(jìn)行下采樣之后,稀疏的特征圖將轉(zhuǎn)換為密集特征圖。最后,將中間層得到的密集特征圖輸入RPN 進(jìn)行候選區(qū)域預(yù)測,RPN 由3 個(gè)階段組成,其中每個(gè)階段包括下采樣層和卷積層,再將每個(gè)階段的輸出上采樣至相同的大小連接起來,最終應(yīng)用3個(gè)1×1卷積得到3D 檢測結(jié)果,包括分類置信度、3D 邊界框回歸值和方向分類預(yù)測值。
圖1 整體網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Overall network structure
目前已經(jīng)提出了很多3D目標(biāo)檢測方法,但對定位不確定性的研究較少。在2D目標(biāo)檢測任務(wù)中,文獻(xiàn)[13]介紹了兩種算法來計(jì)算多尺度單發(fā)射擊(Single Shot multibox Detector,SSD)[14]檢測網(wǎng)絡(luò)的任意不確定性:一種方法是利用異方差回歸法,另一種方法是根據(jù)錨框的所有候選框來估計(jì)不確定性。實(shí)驗(yàn)結(jié)果表明,這兩種方法都會對FP即誤檢結(jié)果預(yù)測帶來較大的不確定性值。文獻(xiàn)[15]中,在統(tǒng)一實(shí)施目標(biāo)檢測(You Only Look Once v3,YOLOv3)網(wǎng)絡(luò)[16]中同樣加入了異方差回歸用于預(yù)測邊界框的不確定性,并使用高斯參數(shù)構(gòu)建損失函數(shù),可以提高檢測器有效適應(yīng)噪聲數(shù)據(jù)的能力,并對噪聲標(biāo)注具有魯棒性[17],實(shí)驗(yàn)結(jié)果表明,2D 目標(biāo)檢測的平均精度均值(mean value of Average Precision,mAP)提升了約3 個(gè)百分點(diǎn),并且顯著降低了誤檢,提高了正確目標(biāo)的檢測能力。在3D目標(biāo)檢測任務(wù)中,文獻(xiàn)[18]和文獻(xiàn)[19]分別利用高斯參數(shù)和拉普拉斯參數(shù)構(gòu)建了3D 目標(biāo)檢測中邊界框不確定性回歸的模型,證明了邊界框不確定性回歸在3D 目標(biāo)檢測中的有效性。但這些方法都沒有通過具體的實(shí)驗(yàn)來證明模型提高了對噪聲數(shù)據(jù)的魯棒性,以及沒有說明定位不確定性在網(wǎng)絡(luò)預(yù)測后續(xù)處理中的具體應(yīng)用。
圖1 中,本文網(wǎng)絡(luò)使用SECOND 網(wǎng)絡(luò)作為主干網(wǎng)絡(luò),并使用1 個(gè)除了預(yù)測目標(biāo)分類、3D 邊界框回歸和方向分類回歸結(jié)果,另外輸出定位不確定性的新檢測頭。網(wǎng)絡(luò)輸出的有向3D邊界框編碼為包含7個(gè)維度的向量B=(x,y,z,w,h,l,θ),其中:(x,y,z)代表3D邊界框的中心在三維空間的坐標(biāo);(w,h,l)代表3D邊界框的寬度、高度和長度;θ代表3D邊界框以y軸為中心的旋轉(zhuǎn)角度。本文中的定位不確定性回歸模塊輸出結(jié)果為7維向量,即分別對應(yīng)3D邊界框編碼中每個(gè)維度的不確定性。
本文利用額外輸出的定位不確定性,構(gòu)建新的定位不確定性損失函數(shù),分別使用高斯參數(shù)和拉普拉斯參數(shù)構(gòu)造3D目標(biāo)檢測中的定位不確定性損失函數(shù)。
具體來說,對3D邊界框每一個(gè)系數(shù)的不確定性建立高斯或拉普拉斯模型,即建立了兩種均以3D邊界框回歸結(jié)果為均值、定位不確定性為方差的不確定性模型,對應(yīng)兩種定位不確定性損失函數(shù)。
高斯定位不確定性損失函數(shù)Lun_reg_Gaussian定義為:
拉普拉斯定位不確定性損失函數(shù)Lun_reg_Laplace定義為:
其中,分別對邊界框的每一個(gè)維度計(jì)算不確定性損失函數(shù),ti、μi和σi(i∈{x,y,z,w,h,l,θ})代表邊界框每個(gè)維度的回歸目標(biāo)值、預(yù)測值和不確定性預(yù)測值。在計(jì)算損失函數(shù)之前計(jì)算每個(gè)維度的回歸目標(biāo)值如下:
其中:gi和ai(i∈{x,y,z,w,h,l,θ})代表3D 邊界框的真值和定義的錨框。
總損失函數(shù)定義為:
其中:為了解決正負(fù)樣本不平衡的問題使用Focal損失函數(shù)作為分類損失函數(shù)Lcls,使用L1 損失函數(shù)定義定位損失函數(shù)Lreg,Ldir為方向分類損失函數(shù),計(jì)算方法同SECOND 原損失函數(shù);β1、β2、β3和β4是超參數(shù),分別為4個(gè)損失函數(shù)的權(quán)重系數(shù)。
在檢測過程中,網(wǎng)絡(luò)輸出若干3D候選目標(biāo)之后會進(jìn)行一系列后處理操作,篩選得到最終預(yù)測目標(biāo),包括按目標(biāo)置信度進(jìn)行篩選以及采用非極大值抑制(Non-Maximum Suppression,NMS)方法等,在原SECOND 方法中,3D 候選目標(biāo)的置信度被直接定義為分類置信度,其計(jì)算方法為:
其中:outputcls是網(wǎng)絡(luò)輸出的分類結(jié)果,用于將分類結(jié)果轉(zhuǎn)化到[0,1]區(qū)間內(nèi),得到的即為分類置信度。本文將分類置信度和定位置信度結(jié)合起來,作為目標(biāo)置信度conftotal進(jìn)行目標(biāo)篩選,計(jì)算方式如下:
取7個(gè)維度的平均不確定性作為每個(gè)預(yù)測目標(biāo)的定位不確定性,然后得到定位置信度,將定位置信度和分類置信度結(jié)合起來即為目標(biāo)置信度。在檢測后處理中首先設(shè)置置信度閾值,篩除目標(biāo)置信度較低的候選目標(biāo),然后按照置信度進(jìn)行排序,使用NMS方法篩除邊界框重疊的目標(biāo),得到最終的檢測結(jié)果。
在開源的KITTI 自動(dòng)駕駛數(shù)據(jù)集[22]中的3D 目標(biāo)檢測數(shù)據(jù)集上進(jìn)行本文網(wǎng)絡(luò)的訓(xùn)練和驗(yàn)證。該數(shù)據(jù)集包括了在市區(qū)、鄉(xiāng)村和高速公路等多種場景下采集的真實(shí)數(shù)據(jù),其中,有多種目標(biāo)類別,例如車、行人、騎車人等。場景中的目標(biāo)還有各種程度的遮擋和截?cái)唷?shù)據(jù)集中共包括7 481幀帶有3D 目標(biāo)檢測標(biāo)注的激光雷達(dá)點(diǎn)云數(shù)據(jù)。
本文僅在具有代表性的車輛類別的數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)并對比模型性能,對模型在3D 目標(biāo)檢測和鳥瞰視圖(Bird’s Eye View,BEV)檢測中的性能進(jìn)行對比評價(jià),使用交并比(Intersection over Union,IoU)閾值為0.7 的3D 平均檢測精度(Average Precision for 3D boxes,AP 3D)和鳥瞰圖平均檢測精度(Average Precision for BEV boxes,AP BEV)作為模型評價(jià)指標(biāo)。對于每一種類別,模型在不同的難度等級上進(jìn)行驗(yàn)證,難度等級分為容易、中等和困難,是按照目標(biāo)遮擋、截?cái)喑潭群臀矬w高度劃分的。
本文實(shí)驗(yàn)使用的操作系統(tǒng)為Ubuntu 16.04 操作系統(tǒng);計(jì)算機(jī)硬件配置為Intel Xeon Gold 5220處理器,內(nèi)存為256 GB,GPU 為NVIDIA GeForce RTX 2080 Ti,顯存11 GB;開發(fā)環(huán)境為python3.6、pytorch1.1.0,GPU加速庫為CUDA10.0 和CUDNN7.0。
按照數(shù)據(jù)集的官方設(shè)置,將KITTI 數(shù)據(jù)分為3 712 幀訓(xùn)練數(shù)據(jù)和3 769 幀驗(yàn)證集。由于檢測的車輛類別目標(biāo)大小較為固定,本文參照SECOND 網(wǎng)絡(luò),基于KITTI 數(shù)據(jù)集中車輛類別目標(biāo)的平均大小,使用固定大小的錨框,即寬×長×高=1.6 m×3.9 m×1.56 m,對每個(gè)錨框分配類別、邊界框大小和角度向量作為預(yù)測目標(biāo)。對于車輛類別,若檢測框與錨交并比(IoU)大于0.6,則視為正樣本;小于0.45 視為負(fù)樣本;其余樣本在訓(xùn)練過程中忽略不計(jì)。
對于損失函數(shù)中各項(xiàng)函數(shù)的權(quán)重設(shè)置,本文實(shí)驗(yàn)中參照SECOND 網(wǎng)絡(luò)設(shè)置β1=1.0、β2=2.0、β4=0.2,β3設(shè)置的對比實(shí)驗(yàn)見第4.4節(jié)。本文所有實(shí)驗(yàn)在訓(xùn)練過程中,都使用one cycle學(xué)習(xí)率,初始學(xué)習(xí)率為0.0003,最大學(xué)習(xí)率為0.003,動(dòng)量參數(shù)為[0.95,0.85],權(quán)重衰減參數(shù)為0.01。
本文實(shí)驗(yàn)中的網(wǎng)絡(luò)均訓(xùn)練了60 個(gè)epochs(30 000 個(gè)迭代),批大小為6,在單個(gè)GPU 上的一次完整訓(xùn)練時(shí)長約為7 h,平均檢測速度為每幀2.33 ms。
在實(shí)驗(yàn)過程中,為了增加樣本豐富性,分別在訓(xùn)練過程中對訓(xùn)練數(shù)據(jù)的標(biāo)注和全局點(diǎn)云數(shù)據(jù)隨機(jī)增加噪聲作為數(shù)據(jù)增強(qiáng)操作。具體來說,在數(shù)據(jù)標(biāo)注中對位置(x,y,z)維度分別進(jìn)行標(biāo)準(zhǔn)差為(1.0,1.0,0.5),均值為0 的高斯分布中采樣的隨機(jī)線性變換,對角度維度加入[-π/4,π/4]區(qū)間內(nèi)隨機(jī)采樣的角度。在全局點(diǎn)云數(shù)據(jù)上,在尺度上進(jìn)行[0.95,1.05]區(qū)間內(nèi)的隨機(jī)變換,以及在角度上加入[-π/4,π/4]區(qū)間內(nèi)隨機(jī)采樣的角度。
本文在SECOND 網(wǎng)絡(luò)基礎(chǔ)上,在輸出7 維3D 邊界框回歸結(jié)果時(shí)同時(shí)輸出7 維定位不確定性,并在此基礎(chǔ)上實(shí)現(xiàn)了兩種定位不確定性損失函數(shù)——高斯和拉普拉斯損失函數(shù)。為了對比兩種損失函數(shù)的效果,分別將其替換或疊加在原網(wǎng)絡(luò)中的L1定位損失函數(shù)上。
表1 對比了本文方法和其他方法的實(shí)驗(yàn)結(jié)果,其中:多視圖3D(Multi-View 3D,MV3D)[4]網(wǎng)絡(luò)是基于多視圖的經(jīng)典網(wǎng)絡(luò),點(diǎn)區(qū)域卷積網(wǎng)絡(luò)[20](Point Regions-Convolutional Neutral Network,PointRCNN)是基于原始點(diǎn)云的網(wǎng)絡(luò),VoxelNet[8]、SECOND[9]和結(jié)構(gòu)感知單階段檢測器[21](Structure Aware Single-Stage Detector,SA-SSD)是基于體素網(wǎng)格的網(wǎng)絡(luò)。實(shí)驗(yàn)(A)為本文復(fù)現(xiàn)的SECOND 網(wǎng)絡(luò)的性能,并將此作為實(shí)驗(yàn)對比的基線模型,實(shí)驗(yàn)(B)和(C)使用不確定性損失函數(shù)替換L1定位損失函數(shù),實(shí)驗(yàn)(D)和(E)為不確定性損失函數(shù)與原L1損失函數(shù)疊加使用。
表1 不同定位損失函數(shù)對比Tab.1 Comparison of different localization loss functions
對比(A)、(B)、(D),在中等難度上拉普拉斯定位損失函數(shù)替換和疊加L1 損失函數(shù)分別使平均檢測精度提升0.57 和0.5 個(gè)百分點(diǎn),說明拉普拉斯定位損失函數(shù)可以直接替換L1損失函數(shù)且保持性能提升。對比(A)、(C)、(E),在中等難度上用高斯損失函數(shù)替換L1 損失函數(shù)會降低平均檢測精度0.15個(gè)百分點(diǎn),但在L1基礎(chǔ)上加入高斯損失函數(shù)可以提升平均檢測精度0.54 個(gè)百分點(diǎn),并可以達(dá)到與(B)基本相同的性能。綜合對比實(shí)驗(yàn)結(jié)果(B)到(E)證明了不確定性檢測頭的有效性,高斯和拉普拉斯兩種對定位不確定性的回歸方式都可以輔助3D邊界框的回歸,但拉普拉斯定位損失函數(shù)帶來的性能提升優(yōu)于高斯,這是因?yàn)槔绽沟幕貧w方式更加接近L1損失函數(shù)。
圖2為不同網(wǎng)絡(luò)在KITTI驗(yàn)證集上進(jìn)行3D 目標(biāo)檢測的可視化效果,可以看出不確定性檢測頭相較原SECOND 網(wǎng)絡(luò)得到的檢測框更準(zhǔn),并且可以篩選部分誤檢結(jié)果,說明不確定性可以有效用于3D邊界框的篩選。
圖2 不同模型在KITTI驗(yàn)證集上的檢測效果Fig.2 Detection effects of different models on KITTI validation set
圖3 為訓(xùn)練過程中各個(gè)模型的準(zhǔn)確率變化折線,可以看出雖然原SECOND 網(wǎng)絡(luò)在訓(xùn)練初期準(zhǔn)確率上升較快,但后續(xù)有較大起伏,而增加了拉普拉斯和高斯定位損失函數(shù)的模型在整個(gè)訓(xùn)練階段準(zhǔn)確率逐步提升直至穩(wěn)定,易收斂。
圖3 不同模型在KITTI驗(yàn)證集上的準(zhǔn)確率Fig.3 Accuracies of different models on KITTI validation set
將不確定性損失函數(shù)與L1損失函數(shù)疊加時(shí),需考慮不同的權(quán)重情況,以得到最優(yōu)的疊加方式,表2 展示了使用不同權(quán)重β3對不確定性損失函數(shù)加權(quán)的結(jié)果。對于拉普拉斯損失函數(shù),其權(quán)重為0.5 時(shí)模型準(zhǔn)確率最高;對于高斯損失函數(shù),其權(quán)重為0.01時(shí)模型準(zhǔn)確率最高。
表2 定位不確定性損失函數(shù)在不同權(quán)重下的對比Tab.2 Comparison of localization uncertainty loss functions with different weights
為了驗(yàn)證定位不確定性對于噪聲標(biāo)注數(shù)據(jù)的魯棒性,本文模擬了人工標(biāo)注數(shù)據(jù)的不準(zhǔn)確性,在訓(xùn)練數(shù)據(jù)標(biāo)注中隨機(jī)加入不同尺度的噪聲擾動(dòng)。表3 中的實(shí)驗(yàn)表明,本文提出的改進(jìn)SECOND 模型對于噪聲數(shù)據(jù)更加魯棒。本文分別在物體的尺寸(長、寬、高)、位置(x、y、z維度上的坐標(biāo))以及旋轉(zhuǎn)角度上加入不同尺度的隨機(jī)數(shù)作為噪聲擾動(dòng),以模擬人工標(biāo)注數(shù)據(jù)中可能存在的噪聲數(shù)據(jù)。例如尺寸(-0.10,0.10)表示在訓(xùn)練數(shù)據(jù)的標(biāo)注中,將尺寸維度長、寬、高3 個(gè)數(shù)據(jù)上分別加入(-0.10,0.10)范圍內(nèi)的隨機(jī)數(shù),作為該物體的真實(shí)標(biāo)注值對模型進(jìn)行訓(xùn)練。表3中模型S代表SECOND原始網(wǎng)絡(luò),L代表最優(yōu)設(shè)置的SECOND-Laplace 模型,G 代表最優(yōu)設(shè)置的SECOND-Gaussian+模型。實(shí)驗(yàn)結(jié)果表明,尺寸數(shù)據(jù)中的噪聲對三個(gè)模型影響都較小,(-0.20,0.20)范圍內(nèi)的擾動(dòng)僅使三個(gè)模型在中等難度上準(zhǔn)確率下降2.3、1.7、1.7 個(gè)百分點(diǎn),位置噪聲在(-0.20,0.20)范圍內(nèi)的擾動(dòng)使三個(gè)模型在中等難度上準(zhǔn)確率下降高達(dá)7.2、4.7、5.3 個(gè)百分點(diǎn)。在噪聲數(shù)據(jù)上兩個(gè)改進(jìn)模型的魯棒性均比原始網(wǎng)絡(luò)好,尤其是在噪聲較為嚴(yán)重時(shí),改進(jìn)模型準(zhǔn)確率下降程度遠(yuǎn)小于原始模型,其中SECOND-Laplace 模型相較SECOND-Gaussian+模型基本對于每一種類型的噪聲數(shù)據(jù)都更為魯棒。
表3 不同模型用噪聲數(shù)據(jù)訓(xùn)練對比Tab.3 Comparison of different models on training data with noisy data
本文提出了一種基于定位不確定性的魯棒3D 目標(biāo)檢測方法,在一定程度上解決了訓(xùn)練數(shù)據(jù)中的3D目標(biāo)檢測框可能存在的人工標(biāo)注不準(zhǔn)確問題。在SECOND 網(wǎng)絡(luò)中加入對定位不確定性的預(yù)測,利用拉普拉斯和高斯兩種分布模型構(gòu)造定位不確定性損失函數(shù),并在檢測后處理中結(jié)合分類置信度和定位不確定性進(jìn)行候選框篩選。所提算法在KITTI 數(shù)據(jù)集中等難度的檢測準(zhǔn)確率達(dá)到78.77%,相較原始SECOND 網(wǎng)絡(luò)提高了0.5 個(gè)百分點(diǎn);在訓(xùn)練數(shù)據(jù)有噪聲的情況下,檢測準(zhǔn)確率比原始SECOND 網(wǎng)絡(luò)最多提高了3 個(gè)百分點(diǎn)。本文方法提高了對于帶噪聲訓(xùn)練數(shù)據(jù)的魯棒性,減少了誤檢并提高了定位精度,但在KITTI 驗(yàn)證集上的結(jié)果與原方法相比準(zhǔn)確度提升不多,仍有提高的空間,可以考慮對定位不確定性的建模方法進(jìn)行更深入的研究。本文提出的方法具有通用性,理論上可以應(yīng)用于其他3D目標(biāo)檢測方法網(wǎng)絡(luò)中。