全江浩 王云成
摘要:如今人均車(chē)輛保有率逐年上升,如何快捷尋找停車(chē)場(chǎng)空位成為停車(chē)行業(yè)研究的新方向。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,使用深度學(xué)習(xí)檢測(cè)停車(chē)場(chǎng)空位,為解決停車(chē)位檢測(cè)問(wèn)題提供了新思路。文章提出了一種基于深度學(xué)習(xí)結(jié)合透視變換,Canny算子邊緣檢測(cè)和霍夫變換直線特征提取等方法的停車(chē)場(chǎng)空位檢測(cè)模型,其準(zhǔn)確率達(dá)到94.44%,在檢測(cè)停車(chē)空位方面取得較好效果﹐為停車(chē)場(chǎng)空位圖像檢測(cè)方向提供了實(shí)現(xiàn)方法和技術(shù)支撐。
關(guān)鍵詞:霍夫變換;邊緣檢測(cè);深度學(xué)習(xí);車(chē)位檢測(cè)中圖法分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A
Parking space detection model based on hough transform anddeep neural network
QUAN Jianghao,WANG Yuncheng
(College of Data Science and Application,Inner Mongolia University of Technology,Huhhot o10051,China)Abstract: Nowadays,the per capita vehicle occupancy rate is increasing year by year.How to quicklyfind parking spaces has become a new direction of parking industry research. With the development ofdeep learning,deep learning is used to detect parking spaces,which provides innovative ideas forsolving parking space detection problems. In this paper,a parking space detection model based ondeep learning combined with perspective transform,Canny operator edge detection and Houghtransform linear feature extraction is proposed. The accuracy rate reaches 94.44 %,and good resultsare achieved in the detection of parking spaces,which provides implementation methods andtechnicalsupport for parking space image detection.
Key words: houghtransform,edgedetection,deeplearning,parking detection
1? 引言
近年來(lái),國(guó)內(nèi)車(chē)輛人均保有率持續(xù)上升,提高停車(chē)位利用率成為新的研究方向。在充分利用現(xiàn)有車(chē)位的前提下,協(xié)助駕駛員更快地找到空車(chē)位,可以提高停車(chē)場(chǎng)的空位利用率。目前,大多數(shù)停車(chē)場(chǎng)基于安全考慮已實(shí)現(xiàn)視頻監(jiān)控全覆蓋,在此基礎(chǔ)上可以構(gòu)建基于分析視頻圖像監(jiān)測(cè)停車(chē)場(chǎng)的車(chē)位情況系統(tǒng)。傳統(tǒng)圖像檢測(cè)是將圖像灰度尖峰區(qū)域作為特征檢測(cè)車(chē)位的方法[1] ,對(duì)車(chē)位的選定為人工輸入,無(wú)法根據(jù)環(huán)境情況進(jìn)行更新,易受環(huán)境信息的干擾。人工智能技術(shù)發(fā)展迅速,深度學(xué)習(xí)是當(dāng)今研究和應(yīng)用的熱點(diǎn)技術(shù)。基于此,本文主要應(yīng)用深度學(xué)習(xí)網(wǎng)絡(luò)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行停車(chē)場(chǎng)空位檢測(cè),基于 Canny 算子邊緣檢測(cè)、霍夫變換直線檢測(cè)、圖像透視變換等技術(shù),處理原始停車(chē)場(chǎng)圖像數(shù)據(jù),可有效提高檢測(cè)的準(zhǔn)確率。
2? 原始數(shù)據(jù)預(yù)處理
2.1? 停車(chē)位透視變換
該模型使用逆透視變換的方法,可將車(chē)位圖像變換為俯視圖。假設(shè)停車(chē)場(chǎng)攝像機(jī)安裝的位置在世界坐標(biāo)系中的坐標(biāo)為(d,l,h),攝像機(jī)光軸 o 在 z =0 平面的投影與 y 軸的夾角為γ,光軸 o 與 z =0平面的夾角為θ,攝像機(jī)的視角為2α,攝像機(jī)在水平方向和垂直方向的分辨率分別為 Rx 和 Ry [2]。則根據(jù)坐標(biāo)變換關(guān)系,可得從圖像坐標(biāo)系 I 變換到世界坐標(biāo)系 W 的逆透視變換模型如下:
2.2? 邊緣檢測(cè)
圖像邊緣檢測(cè)是圖像處理流程中較為重要的環(huán)節(jié)。目前,主流的邊緣檢測(cè)多樣,結(jié)合車(chē)位檢測(cè)任務(wù)對(duì) log 算子、sobel算子、canny 算子等進(jìn)行評(píng)估與選擇:log 算子常產(chǎn)生雙邊界,sobel算子易形成不閉合區(qū)域,無(wú)法滿足停車(chē)位檢測(cè)的需要。而 canny 算子是相較更優(yōu)的階梯型邊緣檢測(cè)算法[3]。1986年,John Canny 首次提出了 Canny 算子,Canny 邊緣檢測(cè)算法運(yùn)用高斯函數(shù)對(duì)原始圖像進(jìn)行卷積運(yùn)算到達(dá)去噪效果,從而得到平滑圖像[4]。公式如下:
式中 G( x ,y)代表平滑因子,?代表卷積操作,I( x ,y) 代表濾波后的圖像,σ代表均方差。本文采用 canny 算子邊緣檢測(cè)技術(shù)實(shí)現(xiàn)停車(chē)場(chǎng)原始圖像數(shù)據(jù)的邊緣檢測(cè),圖1 為停車(chē)場(chǎng)原始數(shù)據(jù)檢測(cè)邊沿效果。
2.3? 直線特征提取
前文介紹的車(chē)位圖像中,車(chē)位特征信息主要為直線邊緣特征,通過(guò)對(duì)停車(chē)位直線特征的檢測(cè),可提取車(chē)位的有效位置信息。1962年,Paul Hough 根據(jù)數(shù)學(xué)對(duì)偶性原理提出了檢測(cè)圖像直線的方法,此后該方法被不斷地研究和發(fā)展,集中應(yīng)用于模式識(shí)別領(lǐng)域中對(duì)二值圖像進(jìn)行直線檢測(cè)[5]?;舴蜃儞Q通過(guò)圖像平面中的點(diǎn)計(jì)算得到參數(shù)平面中的線,通過(guò)參數(shù)平面中相應(yīng)線的交會(huì)地址計(jì)算圖像平面中的目標(biāo)直線。直線上的兩個(gè)點(diǎn)( x 1,y1) 和( x2,y2) 在參數(shù)平面分別對(duì)應(yīng)一條曲線:
式中,θ代表直線通過(guò)原點(diǎn)的垂線段與 x 軸正方向夾角,ρ代表垂線段的長(zhǎng)度。若將θ,ρ作為參數(shù),則直線在參數(shù)平面可表示為一點(diǎn)(θ,ρ)。兩曲線交點(diǎn)的坐標(biāo)(θ′,ρ′)為該直線在xy平面內(nèi)的對(duì)應(yīng)參數(shù)[6] 。將θρ平面離散化為累加單元 A ,并將其初始化為0 ,然后令θ等于每一個(gè)允許的細(xì)分值,對(duì)圖像中的每一個(gè)非背景點(diǎn)( x2,y2) 得到與之對(duì)應(yīng)的ρ。本文應(yīng)用
霍夫變換原理提取停車(chē)場(chǎng)車(chē)位的邊緣直線特征。圖2 為原始數(shù)據(jù)經(jīng)過(guò)霍夫直線檢測(cè)并處理得到目標(biāo)車(chē)位預(yù)測(cè)。
3? 自建數(shù)據(jù)集
停車(chē)場(chǎng)車(chē)位數(shù)據(jù)屬于非公開(kāi)數(shù)據(jù),所用數(shù)據(jù)大多來(lái)自網(wǎng)絡(luò),包含空位、占位、雜物占位等多種車(chē)位情況,圖像數(shù)據(jù)分辨率為300×600像素,共選取的圖像數(shù)量為1355張,根據(jù)空位和占位的不同種類(lèi)分別置于文件夾中,按照3 ∶1的比例,隨機(jī)抽取圖片分別劃分成訓(xùn)練集和測(cè)試集,每個(gè)種類(lèi)展示3 張圖片。
4? 模型分析
本文搭建的神經(jīng)網(wǎng)絡(luò)檢測(cè)模型是一種針對(duì)停車(chē)場(chǎng)空位檢測(cè)任務(wù)設(shè)計(jì)的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)。在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層的數(shù)量不同會(huì)對(duì)神經(jīng)網(wǎng)絡(luò)性能產(chǎn)生較大影響。因此,進(jìn)行對(duì)比實(shí)驗(yàn)時(shí),探討較適合停車(chē)場(chǎng)空位檢測(cè)模型的卷積層數(shù)量,經(jīng)過(guò)多輪實(shí)驗(yàn)得出結(jié)論:卷積層數(shù)量為3 的卷積神經(jīng)網(wǎng)絡(luò)在處理車(chē)位檢測(cè)任務(wù)時(shí)性能表現(xiàn)較為出色。sigmoid 是最接近生物神經(jīng)元的函數(shù),在處理二分類(lèi)問(wèn)題時(shí)表現(xiàn)出色,該函數(shù)圖像平滑,較易于求導(dǎo),具體數(shù)學(xué)功能是將實(shí)數(shù)映射到[0 ,1] 區(qū)間[7] ,契合停車(chē)場(chǎng)空位檢測(cè)二分類(lèi)任務(wù),所以自建停車(chē)場(chǎng)空位檢測(cè)模型所用分類(lèi)層由 sigmoid 函數(shù)實(shí)現(xiàn)。圖3 為該自建模型的可視化展示。
5? 訓(xùn)練模型
5.1? 數(shù)據(jù)增強(qiáng)
停車(chē)空位作為一個(gè)場(chǎng)景分類(lèi)任務(wù),其標(biāo)簽涉及光線、噪點(diǎn)以及場(chǎng)景環(huán)境等多種要素,僅從有限的數(shù)據(jù)集中訓(xùn)練出能夠較準(zhǔn)確識(shí)別停車(chē)場(chǎng)車(chē)位情況的模型是非常困難的,因此還需要通過(guò)數(shù)據(jù)增強(qiáng)方法對(duì)數(shù)據(jù)集的數(shù)量和質(zhì)量進(jìn)行提升。本文采用動(dòng)態(tài)的數(shù)據(jù)增強(qiáng)方法,在每輪訓(xùn)練開(kāi)始之前,通過(guò)透視變換理論重新隨機(jī)選擇訓(xùn)練集中的車(chē)位圖像,進(jìn)行左右翻轉(zhuǎn)或角度偏移以及在一定范圍內(nèi)隨機(jī)設(shè)置圖片亮度、對(duì)比度和飽和度,擴(kuò)大數(shù)據(jù)集的規(guī)模,提高模型的魯棒性。
5.2? 自建模型訓(xùn)練
使用訓(xùn)練集的樣本圖像訓(xùn)練自建模型,模型訓(xùn)練只使用 GPU 運(yùn)算,每一輪參與訓(xùn)練的樣本總數(shù)為 1553。每輪訓(xùn)練采用分批次的方法,一個(gè)批次訓(xùn)練所用的樣本數(shù)( Batch Size )設(shè)為32,因此每輪的迭代數(shù)(Epoch)等于50。初始學(xué)習(xí)率( Learning Rate )初始設(shè)置為0.001,應(yīng)用動(dòng)態(tài)學(xué)習(xí)率策略實(shí)時(shí)優(yōu)化模型參數(shù)。圖 4表示準(zhǔn)確率(Accuracy)和損失值(Loss )隨輪次的變化,隨著輪次數(shù)值接近40次時(shí),訓(xùn)練集損失值逐步收斂于0 ,準(zhǔn)確率逐步趨于1 ,表明模型訓(xùn)練成功。
6? 評(píng)估模型預(yù)測(cè)效果
使用驗(yàn)證集樣本圖像測(cè)試已經(jīng)完成訓(xùn)練的自建深度學(xué)習(xí)模型,驗(yàn)證集數(shù)據(jù)獨(dú)立于訓(xùn)練集外,總計(jì) 446張,經(jīng)過(guò)模型預(yù)測(cè),總體準(zhǔn)確率為94.44%,總體準(zhǔn)確率的具體定義模型預(yù)測(cè)正確的數(shù)量與測(cè)試數(shù)據(jù)總量的百分比。圖5 為使用原始數(shù)據(jù)測(cè)試模型的結(jié)果樣圖,得出原始數(shù)據(jù)中車(chē)位總數(shù)和空位分布情況。
7? 結(jié)論
本文主要研究基于視覺(jué)分析的停車(chē)場(chǎng)空位檢測(cè)算法,結(jié)合 Canny 算子檢測(cè)方法、透視變換原理和霍夫變換直線檢測(cè)理論提取停車(chē)位特征數(shù)據(jù)并加以訓(xùn)練,基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)出停車(chē)場(chǎng)空位檢測(cè)的二分類(lèi)識(shí)別方法,利用自建數(shù)據(jù)集完成在多種停車(chē)情景中的停車(chē)位檢測(cè)任務(wù)。模型訓(xùn)練開(kāi)始時(shí),首先根據(jù)原始數(shù)據(jù)固有特點(diǎn)對(duì)初始學(xué)習(xí)率、輪次、步長(zhǎng)等參數(shù)進(jìn)行合理設(shè)置,創(chuàng)新采用 Canny 算子檢測(cè)方法和透視變換原理結(jié)合的預(yù)處理流程,極大擴(kuò)增了樣本訓(xùn)練量,并在接下來(lái)的測(cè)試集預(yù)測(cè)中,總體準(zhǔn)確率達(dá)到94.44%,對(duì)多種停車(chē)情景的識(shí)別效果較好,表明使用該算法對(duì)停車(chē)場(chǎng)空位進(jìn)行檢測(cè)是切實(shí)可行的,同時(shí)也為實(shí)現(xiàn)停車(chē)場(chǎng)空位檢測(cè)的智能化提供了理論技術(shù)和實(shí)用方法。
參考文獻(xiàn):
[1 ] 王建飛.停車(chē)場(chǎng)空位檢測(cè)系統(tǒng)研究[ D].貴州:貴州民族大
[2 ] 李海華,萬(wàn)熱華,陳小玲,等.一種基于逆透視變換的車(chē)道線檢測(cè)方法[J].工業(yè)儀表與自動(dòng)化裝置,2021( 2):97?100.
[3 ] 梅永,莊建軍.基于 Canny 邊緣檢測(cè)的圖像預(yù)處理優(yōu)化算法[J].信息化建設(shè),2022,46(1 ):75?79.
[4 ]? Canny? J .A? Computational? Approach? to? Edge? Detection [ J ].IEEE? Transactions? on? Pattern? Analysis? and? Machine Intelligence ,1986,PAMI?8( 6):679?698.
[5 ] 唐佳林,王鎮(zhèn)波,張?chǎng)析?基于霍夫變換的直線檢測(cè)技術(shù)[ J ].科技信息,2011 (14):33?35.
[6 ] 李慧鵬,朱偉偉,譚朦曦,等.基于改進(jìn) Hough 變換的直線檢測(cè)算法[J].半導(dǎo)體光電,2017,38(4 ):603?608.
[7 ] 王攀杰,郭紹忠,侯明,等.激活函數(shù)的對(duì)比測(cè)試與分析[J].信息工程大學(xué)學(xué)報(bào),2021,22(5 ):551?557.
作者簡(jiǎn)介:
全江浩(2001— ),本科,研究方向:計(jì)算機(jī)視覺(jué)。
王云成(1993—) ,碩士,助教,研究方向:深度學(xué)習(xí)、智能系統(tǒng)。
計(jì)算機(jī)應(yīng)用文摘·觸控2022年9期