魯文強(qiáng)
摘 ?要:針對(duì)自動(dòng)駕駛場(chǎng)景中的點(diǎn)云數(shù)據(jù)標(biāo)注問(wèn)題,設(shè)計(jì)了一款基于目標(biāo)跟蹤算法的標(biāo)注軟件。該軟件除了很好的完成點(diǎn)云標(biāo)注功能,還實(shí)現(xiàn)了對(duì)相應(yīng)圖片的映射標(biāo)注,使用的目標(biāo)跟蹤算法極大的提高了標(biāo)注效率。本文主要從以上三個(gè)方面介紹軟件的設(shè)計(jì)思路,最后介紹軟件的標(biāo)注流程。
關(guān)鍵詞:點(diǎn)云標(biāo)注;目標(biāo)跟蹤;軟件設(shè)計(jì)
Abstract:Aiming at the problem of point cloud data labeling in autonomous driving scenarios,a labeling software based on target tracking algorithm is designed.In addition to the good completion of the point cloud annotation function,the software also realizes the mapping annotation of the corresponding pictures.The target tracking algorithm used greatly improves the annotation efficiency.This article mainly introduces the software design ideas from the above three aspects,and finally introduces the software annotation process.
Key words:Point cloud annotation;Target tracking algorithm;Software design
隨著深度學(xué)習(xí)在物體識(shí)別領(lǐng)域的快速發(fā)展,其在自動(dòng)駕駛中發(fā)揮著越來(lái)越重要的作用。而在深度學(xué)習(xí)里,標(biāo)注的數(shù)據(jù)質(zhì)量影響著模型的訓(xùn)練效果。在自動(dòng)駕駛領(lǐng)域中,對(duì)數(shù)據(jù)標(biāo)注有了更高的要求,希望同時(shí)可以標(biāo)注點(diǎn)云和圖像,同時(shí)擁有更高的標(biāo)注效率。
本文在點(diǎn)云庫(kù)的基礎(chǔ)上,引入了目標(biāo)跟蹤算法,以此來(lái)提高標(biāo)注效率,同時(shí)還添加了點(diǎn)云到圖像的映射功能,完成標(biāo)注點(diǎn)云的同時(shí)也完成了圖片的標(biāo)注。
1 點(diǎn)云的標(biāo)注
點(diǎn)云中3維bounding box的繪制采用了PCL庫(kù)中的方法實(shí)現(xiàn),選定點(diǎn)云集合,利用沿坐標(biāo)軸包圍盒算法(AABB)計(jì)算邊界,按照邊界繪制框。由于點(diǎn)云密集分布這一特點(diǎn),有可能會(huì)無(wú)差別的將一
些誤選的點(diǎn)云也包含在集合中,增加了需要修正的次數(shù)。加入自動(dòng)修正機(jī)制,對(duì)手動(dòng)選取的點(diǎn)云集合進(jìn)行處理,去除雜點(diǎn),提高標(biāo)注的準(zhǔn)確度。
修正功能的實(shí)現(xiàn)是使用柵格法[1]對(duì)選中的點(diǎn)云集合構(gòu)建俯視圖,即投影到平面的2D網(wǎng)格,網(wǎng)格的大小由點(diǎn)云的大小決定。建立網(wǎng)格之后,可以得到一些統(tǒng)計(jì)量。例如:網(wǎng)格中的點(diǎn)云個(gè)數(shù)、點(diǎn)云高度、點(diǎn)云序號(hào)等等,基于以上的統(tǒng)計(jì)量,尋找每個(gè)格子領(lǐng)域的連通區(qū)域,連通區(qū)域可以視為是物體,從而達(dá)到去除雜點(diǎn)的效果。
2 點(diǎn)云標(biāo)注在圖像的映射
2.1 映射關(guān)系
在裝配了一臺(tái)Velodyne激光雷達(dá)掃描儀和4臺(tái)相機(jī)的實(shí)驗(yàn)車(chē)輛在采集原始數(shù)據(jù)的過(guò)程中[2],主要存在三類坐標(biāo)系,分別是相機(jī)坐標(biāo)系、Velodyne坐標(biāo)系和以車(chē)輛中心為坐標(biāo)原點(diǎn)的笛卡爾坐標(biāo)系。點(diǎn)云坐標(biāo)到圖像坐標(biāo)需要一系列的轉(zhuǎn)換操作,例如3D點(diǎn) 投影到經(jīng)過(guò)矯正的第i個(gè)相機(jī)圖像上點(diǎn) 的表示為:
由上述式子可知,各坐標(biāo)間的轉(zhuǎn)換關(guān)系是線性的,這也就大大減少我們計(jì)算的工作量,遍歷所有的點(diǎn),記錄下X、Y、Z方向的最大值和最小值,即為邊界范圍。對(duì)這六個(gè)邊界值進(jìn)行映射,得到圖像的標(biāo)注邊框。
3 目標(biāo)跟蹤算法
粒子濾波算法[3]廣泛應(yīng)用在目標(biāo)跟蹤中,主要分為四個(gè)階段。第一階段是提取跟蹤目標(biāo)特征,第二階段為搜索階段,第三階段為決策階段,第四為重采樣階段。粒子濾波的核心思想就是隨機(jī)采樣和重要性重采樣,在隨機(jī)撒粒子后,根據(jù)特征相似度計(jì)算每個(gè)粒子的重要性,然后在重要的地方多撒粒子,不重要的地方少撒粒子。如此的循環(huán)往復(fù),即完成了目標(biāo)的動(dòng)態(tài)追蹤。
傳統(tǒng)的粒子濾波算法是采用粒子隨機(jī)分布采樣,基于KLD采樣的自適應(yīng)濾波算法[4]可以根據(jù)場(chǎng)景調(diào)整粒子的數(shù)目,來(lái)降低算法的時(shí)間復(fù)雜度。KLD采樣的全稱是庫(kù)爾貝科-萊布勒距離Kullback-Lerbler Distance,它是一種計(jì)算兩個(gè)概率分布之間差異的方法。KLD采樣背后的思想就是根據(jù)基于采樣近似質(zhì)量的統(tǒng)計(jì)界限來(lái)確定粒子數(shù)量。更特殊的是,在粒子濾波器的每次迭代的過(guò)程中,KLD采樣以概率1- 來(lái)確定采樣數(shù)量,真實(shí)的后驗(yàn)概率與基于采樣的近似分布之間的差異小于 。以下是它的算法流程:
4 標(biāo)注流程
如下圖是我們軟件的UI使用界面,主要的功能標(biāo)注點(diǎn)云文件,在有圖片文件的情況下也可以根據(jù)映射算法,同步標(biāo)注圖片文件,下面是主要的流程介紹:
結(jié)語(yǔ)
點(diǎn)云標(biāo)注在自動(dòng)駕駛算法訓(xùn)練中占據(jù)這十分重要的部分,數(shù)據(jù)的質(zhì)量影響這模型的準(zhǔn)確度,一款適合模型需要的標(biāo)注工具顯得更為重要。這款工具主要標(biāo)注采集到的點(diǎn)云數(shù)據(jù),同時(shí)也可以標(biāo)注對(duì)應(yīng)的圖片文件。在標(biāo)注的過(guò)程中,使用到一些提高效率的方法,也就是基于目標(biāo)跟蹤的半自動(dòng)標(biāo)注。通過(guò)這一流程,極大提高了標(biāo)注的效率。同時(shí)目標(biāo)跟蹤也有一些局限的地方[5],比如需要前文信息加以輔助,這也是我們后續(xù)工作的研究點(diǎn)。
參考文獻(xiàn)
[1] 汪世財(cái).基于三維激光雷達(dá)的障礙物檢測(cè)與跟蹤研究[D].
[2] Geiger A,Lenz P,Stiller C,et al.Vision meets robotics:The KITTI dataset[J].International Journal of Robotics Research,2013,32(11):1231-1237..
[3] 王法勝,魯明羽,趙清杰,et al.粒子濾波算法[J].計(jì)算機(jī)學(xué)報(bào),2014,37(008):1679-1694..
[4] 作田真.多目標(biāo)檢測(cè)前跟蹤的粒子濾波算法研究[D].2019.
[5] 盧湖川,李佩霞,王棟.目標(biāo)跟蹤算法綜述[J].模式識(shí)別與人工智能,2018,31(001):61-76.