張智凡,于鳳芹
(江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214000)
圖像處理技術(shù)在地理信息、建筑、電子、機(jī)械等領(lǐng)域中得到了廣泛應(yīng)用,特別是對(duì)工程圖紙的理解與識(shí)別過程,更是極大地依賴于圖像處理技術(shù)[1]。而在工程圖紙理解與識(shí)別中,最主要的基礎(chǔ)圖元就是圓弧,因此對(duì)圓弧進(jìn)行準(zhǔn)確迅速的檢測是工程圖紙理解與識(shí)別領(lǐng)域的一個(gè)關(guān)鍵問題,也是工件尺寸測量領(lǐng)域的一個(gè)重要問題[2]。
圓弧檢測的基礎(chǔ)算法是霍夫變換算法。隨機(jī)霍夫變換可以克服計(jì)算量大[3]、占用內(nèi)存大、無法在線實(shí)時(shí)檢測的缺點(diǎn),但是由于隨機(jī)抽樣會(huì)產(chǎn)生很多無效點(diǎn)集,會(huì)增加搜索時(shí)間并且降低在復(fù)雜背景圖像中的檢測效率和精度[4]。概率霍夫變換可以解決前兩種算法耗時(shí)的問題,在選擇擬合點(diǎn)時(shí)采用了隨機(jī)抽取的方式,并加入了計(jì)數(shù)器,當(dāng)直線被擬合出的次數(shù)達(dá)到一定閾值時(shí)取出這條線并完成擬合,增加了檢測實(shí)時(shí)性[5]。有學(xué)者在霍夫變換算法的基礎(chǔ)上提出了一系列優(yōu)化的圓弧檢測算法,文獻(xiàn)[6]通過找出可能位于圓外邊界上與圓相切的線段,根據(jù)切線段估計(jì)圓心半徑,得到候選圓集合并進(jìn)行數(shù)據(jù)合并,對(duì)每一個(gè)候選圓進(jìn)行跟蹤檢測來判斷其為圓或弧。但該方法在匹配切線的過程中確定候選圓,易導(dǎo)致誤檢情況的發(fā)生。文獻(xiàn)[7]提出了一種利用統(tǒng)一多尺度深卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行快速目標(biāo)檢測的方法,但是該方法的檢測精度存在一定的影響范圍,難以保證整體的高準(zhǔn)確性。文獻(xiàn)[8]利用確定的橢圓中心為匹配參考點(diǎn)逐行匹配圓弧特征點(diǎn),然后利用改進(jìn)的RANSAC算法排除誤匹配對(duì),但是計(jì)算量大,匹配成功率偏低。
針對(duì)現(xiàn)有方法中存在的誤檢率較高、檢測效率低的問題,文中提出一種基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法,以提高圓弧檢測算法的計(jì)算效率與準(zhǔn)確度。首先基于多層卷積網(wǎng)絡(luò)進(jìn)行圓弧信息的聚類存儲(chǔ),并將缺損比例在三分之一以下的圓弧排除,再對(duì)其他圓弧進(jìn)行全局聚類。該過程減小了噪聲和缺損圓弧的干擾,提高了圓弧檢測效率。然后以圓弧的圓心所在區(qū)域?yàn)橐罁?jù)對(duì)圓心閾值區(qū)域進(jìn)行重構(gòu),獲取圓弧閾值區(qū)間。最后對(duì)閾值區(qū)間進(jìn)行優(yōu)化,并對(duì)圓弧進(jìn)行擬合和去偽,實(shí)現(xiàn)圓弧的快速檢測。
大量物體具有圓弧輪廓,可以通過檢測圓弧來識(shí)別物體的存在,并可利用其實(shí)現(xiàn)產(chǎn)品質(zhì)量評(píng)估、提高生產(chǎn)效率等。圓弧檢測的基本原理是在對(duì)圓弧圖像識(shí)別的基礎(chǔ)上,對(duì)圓弧特征信息進(jìn)行提取、儲(chǔ)存、分析和判斷,并優(yōu)化霍夫變換算法,實(shí)現(xiàn)對(duì)圓弧的檢測。
一般情況下,對(duì)圓弧圖像的識(shí)別需借助機(jī)器視覺技術(shù),其識(shí)別過程如圖1所示。
圖1 基于機(jī)器視覺技術(shù)的圓弧圖像識(shí)別過程
在此基礎(chǔ)上,從機(jī)器視覺的識(shí)別結(jié)果中提取圓弧的特征信息,并將其中夾雜的噪聲濾除,對(duì)目標(biāo)圖像的信息加強(qiáng),再對(duì)其進(jìn)行提取、儲(chǔ)存、分析和判斷,繼而對(duì)基礎(chǔ)的霍夫變換算法進(jìn)行優(yōu)化,完成對(duì)圓弧信息的檢測。其中,霍夫變換算法是利用圖像空間和霍夫參數(shù)空間的線-點(diǎn)對(duì)偶性,把圖像檢測過程由圖像空間轉(zhuǎn)換到參數(shù)空間中進(jìn)行。
首先利用多層卷積網(wǎng)絡(luò)實(shí)現(xiàn)圓弧信息的聚類存儲(chǔ)[9]。多層卷積網(wǎng)絡(luò)是一種可用于進(jìn)行圖像特征識(shí)別的感知器模型,其中包括卷積層、Maxout層、池化層和全連接層。其中,卷積層用于提取特征,Maxout層利用Maxout激活函數(shù)實(shí)現(xiàn)信息篩選,池化層用于選擇特征,全連接層用于分類。在多層卷積網(wǎng)絡(luò)中,在兩個(gè)及以上的卷積層后才會(huì)存在一個(gè)池化層,即卷積層串聯(lián)。這是一種優(yōu)化操作,即通過增加卷積層數(shù)來縮小卷積核的尺寸,從而減少網(wǎng)絡(luò)參數(shù),增加多層卷積層中的非線性操作,使多層卷積網(wǎng)絡(luò)對(duì)特征信息的學(xué)習(xí)能力更強(qiáng)。
利用多層卷積網(wǎng)絡(luò)對(duì)圓弧信息進(jìn)行訓(xùn)練,從中提取圓弧的特征信息,并以此為依據(jù)對(duì)圓弧信息進(jìn)行聚類存儲(chǔ)[10],具體步驟如下:
①利用卷積核掃描所輸入的圖像,逐個(gè)掃描圖像中的所有像素點(diǎn)。在掃描過程中將最先找到的特征像素點(diǎn)記錄為p,并自上而下對(duì)其進(jìn)行初始化檢測,規(guī)定其初始化值為0[11]。
②分別檢測p上方位的右、中、左三個(gè)位置,當(dāng)檢測到對(duì)應(yīng)位置的特征像素點(diǎn)后將其記錄為q1,并在數(shù)組中儲(chǔ)存q1的坐標(biāo)位置,將其像素值初始化為0。對(duì)p左、右兩方位的像素點(diǎn)進(jìn)行檢測,檢測到像素點(diǎn)后對(duì)其進(jìn)行標(biāo)記并儲(chǔ)存坐標(biāo)點(diǎn)位置,檢測不到像素點(diǎn)時(shí)則退出聚類[12]。
③分別檢測p下方位的右、中、左三個(gè)位置,當(dāng)檢測到對(duì)應(yīng)位置的像素點(diǎn)后將其記錄為q2,并在數(shù)組中儲(chǔ)存q2的坐標(biāo)位置,將其像素值初始化為0。按照步驟②中的方法對(duì)q2的左、右兩方位的像素點(diǎn)進(jìn)行檢測。
④分別對(duì)p左、右兩個(gè)方位的像素點(diǎn)進(jìn)行檢測,將檢測到的像素點(diǎn)分別記錄為q3、q4,并在數(shù)組中存儲(chǔ)q3、q4的坐標(biāo)位置,將其像素值初始化為0。按照步驟②中的方法對(duì)q3、q4的8個(gè)方位的像素點(diǎn)進(jìn)行檢測。
⑤以方位標(biāo)記為依據(jù),當(dāng)方位標(biāo)記是上方位時(shí),進(jìn)行步驟②的操作,當(dāng)方位標(biāo)記是下方位時(shí)進(jìn)行步驟③的操作,當(dāng)方位標(biāo)記是左右方位時(shí)進(jìn)行步驟④的操作[13]。
不斷重復(fù)上述步驟即可在卷積層中得到圓弧圖像的特征信息,經(jīng)過Maxout激活函數(shù)篩選得到特征圖,然后在池化層池化這些特征。池化操作是為了進(jìn)一步減少網(wǎng)絡(luò)參數(shù),防止多層卷積神經(jīng)網(wǎng)絡(luò)過擬合。然后在全連接層輸出標(biāo)記特征結(jié)果,如下所示:
(1)
根據(jù)上述特征輸出結(jié)果進(jìn)行聚類及存儲(chǔ),其過程如下:
·隨機(jī)選取k個(gè)特征像素點(diǎn)作為初始中心點(diǎn),即共有k個(gè)類;
·計(jì)算其余特征像素點(diǎn)到這k個(gè)中心點(diǎn)的距離,從中選擇距離最小的中心點(diǎn);
·重新計(jì)算k類的質(zhì)心作為新的中心點(diǎn);
·迭代步驟2和3,直到達(dá)到最大的迭代次數(shù),輸出聚類中心集并在數(shù)組中存儲(chǔ)。這樣,通過聚類方向自帶的慣性作用即可加速圓弧的檢測,并且能夠?qū)?shù)目較少的孤立像素點(diǎn)當(dāng)做噪聲信息直接過濾[14]。
完成圓弧信息的聚類存儲(chǔ)后,對(duì)圓弧進(jìn)行全局聚類,即把不相接的、一個(gè)橢圓中的圓弧劃分至一處。將缺損比例在三分之一以下的圓弧排除,對(duì)其他圓弧進(jìn)行全局聚類,聚類依據(jù)為包含像素點(diǎn)的具體數(shù)量。如圖2所示,圓弧a1為待聚類的對(duì)象,首先對(duì)a1的搜索區(qū)域進(jìn)行定義,對(duì)圓弧a1與搜索區(qū)域中的圓弧進(jìn)行全局聚類。該搜索區(qū)域的定義為圓弧a1的弦J3、J4,切線τ1、τ2以及圖像邊界所構(gòu)成的區(qū)域。接下來對(duì)搜索區(qū)域內(nèi)能夠與圓弧a1進(jìn)行全局聚類的其他圓弧進(jìn)行搜索:過圓弧a1的末端點(diǎn)與首端點(diǎn)作與J3、J4平行的直線,當(dāng)該直線與切線τ1、τ2相交時(shí)可獲得兩個(gè)交點(diǎn),當(dāng)其他圓弧的首端點(diǎn)與末端點(diǎn)都位于搜索區(qū)域之內(nèi),即說明該圓弧位于圓弧a1的搜索區(qū)域內(nèi)[15]。
圖2 圓弧搜索區(qū)域定義
利用弧中心、弦中心距離條件對(duì)圓弧是否屬于同一橢圓進(jìn)行確定:
(2)
‖Pm/2,1Pn/2,2‖>‖C2Pm/2,1‖
(3)
如圖3所示,C1、C2、C3分別代表弦b1、b2、b3的中點(diǎn);Pm/2,1、Pn/2,2、Ps/2,3分別代表圓弧a1、a2、a3的中點(diǎn);m、n、s分別代表圓弧a1、a2、a3的點(diǎn)數(shù),當(dāng)下標(biāo)不能整除時(shí)可進(jìn)行四舍五入。通過式(2)、式(3)可排除搜索區(qū)域內(nèi)不屬于一個(gè)橢圓的圓弧。
圖3 去除圓弧a2
完成圓弧全局聚類后,對(duì)其進(jìn)行閾值區(qū)間獲取[16]。以圓弧的圓心所在區(qū)域?yàn)橐罁?jù)對(duì)圓心閾值區(qū)域進(jìn)行重構(gòu):在數(shù)組中利用三弦比例對(duì)圓弧上最短的采樣點(diǎn)間隔長度進(jìn)行確定,并按照順序獲得n組采樣點(diǎn)以對(duì)圓心分布區(qū)域進(jìn)行計(jì)算,其中分布如圖4所示。在計(jì)算時(shí),每次都需要在參數(shù)空間中對(duì)對(duì)應(yīng)的格子累加器進(jìn)行加一操作。對(duì)參數(shù)空間中持有最大累加值的格子位置進(jìn)行統(tǒng)計(jì)即可獲得圓弧的圓心所在區(qū)域。對(duì)該區(qū)域的縱坐標(biāo)與橫坐標(biāo)進(jìn)行分布范圍記錄,以計(jì)算圓心區(qū)域的構(gòu)筑邊長,計(jì)算公式如下:
(4)
其中,L表示圓心區(qū)域的構(gòu)筑邊長;H表示橫坐標(biāo)分布范圍的差值;V表示縱坐標(biāo)分布范圍的差值;Hu、Hb表示橫坐分布范圍的橫縱坐標(biāo);Vu、Vb表示縱坐標(biāo)。構(gòu)筑以圓心為中心,邊長為L的正方形區(qū)域即為圓弧的閾值區(qū)間。
圖4 閾值區(qū)間示意圖
完成圓弧閾值區(qū)間獲取后,需要對(duì)其閾值區(qū)間進(jìn)行優(yōu)化,并對(duì)圓弧進(jìn)行擬合和去偽,以實(shí)現(xiàn)圓弧的快速檢測[17]。其中閾值區(qū)間的優(yōu)化策略如表1所示。
表1 閾值區(qū)間優(yōu)化策略
而圓弧的擬合和去偽需要對(duì)候選弧對(duì)與圓弧的有向邊界列進(jìn)行提取,并利用最小二乘法對(duì)候選圓的參數(shù)(p,q,r1,r2,θ)進(jìn)行計(jì)算。并對(duì)候選圓上是否存在邊界像素進(jìn)行判斷:
(5)
當(dāng)di的值不屬于圓弧的閾值區(qū)間時(shí),將候選圓排除。直到各個(gè)圓弧都找到對(duì)應(yīng)的圓,完成圓弧的擬合和去偽,實(shí)現(xiàn)圓弧的快速檢測。
基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法的檢測過程如圖5所示。
圖5 基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測過程示意圖
根據(jù)圖5可知,所設(shè)計(jì)的基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法首先是借助于多層卷積網(wǎng)絡(luò)實(shí)現(xiàn)了圓弧信息的聚類存儲(chǔ),然后利用圓弧聚類方向自帶的慣性作用將數(shù)目較少的孤立像素點(diǎn)過濾掉,并對(duì)其他圓弧進(jìn)行全局聚類。在此基礎(chǔ)上重構(gòu)圓心閾值區(qū)域,獲取圓弧閾值區(qū)間,并對(duì)閾值區(qū)間進(jìn)行優(yōu)化,對(duì)圓弧進(jìn)行擬合和去偽,完成對(duì)圓弧的快速檢測。
為了檢測提出的基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法的有效性,設(shè)計(jì)如下實(shí)驗(yàn),將該方法與文獻(xiàn)[6]中的基于切線段匹配的快速圓弧檢測算法、文獻(xiàn)[10]中的基于邊界聚類的圓弧檢測算法進(jìn)行對(duì)比。
算法運(yùn)行的環(huán)境為MATLAB 8.0的程序開發(fā)環(huán)境、Windows 7的操作系統(tǒng)、3G DDRII的內(nèi)存、2G雙核處理器、Technology AMD Turion 的CPU。
在GREC2013測試集中對(duì)工件的擬合圖片進(jìn)行選取,圖片尺寸為512×512,共6張,利用基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法、基于切線段匹配的快速圓弧檢測算法和基于邊界聚類的圓弧檢測算法對(duì)其中的圓弧進(jìn)行檢測,觀察不同算法的誤檢情況和檢測耗時(shí),比較其性能的優(yōu)劣。
(1)誤檢率對(duì)比。
利用基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法、基于切線段匹配的快速圓弧檢測算法和基于邊界聚類的圓弧檢測算法進(jìn)行圓弧檢測的識(shí)別結(jié)果如圖6所示。
圖6 不同算法的檢測識(shí)別結(jié)果
分析圖6可知,文中所提算法的檢測結(jié)果明顯要優(yōu)于另外兩種算法,檢測結(jié)果與樣圖相符,且噪聲較小、清晰度更高。
為進(jìn)一步驗(yàn)證所提算法的準(zhǔn)確性,對(duì)比不同圓弧檢測算法的誤檢率,對(duì)比結(jié)果如表2所示。
表2 誤檢率對(duì)比結(jié)果
根據(jù)表2中數(shù)據(jù)可知,基于切線段匹配的快速圓弧檢測算法的誤檢率為16.8%,基于邊界聚類的圓弧檢測算法的誤檢率為13.2%,基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法的誤檢率為4.8%。通過比較可知,所提圓弧檢測算法的誤檢率在三種算法中最低,能夠?qū)崿F(xiàn)對(duì)圓弧的準(zhǔn)確檢測。
(2)檢測精度對(duì)比。
在一個(gè)目標(biāo)檢測過程中,檢測結(jié)果的質(zhì)量可從召回率和精度兩方面進(jìn)行評(píng)價(jià)。召回率和精度成反比例關(guān)系,召回率越高則檢測精度越低。因此為驗(yàn)證所提圓弧檢測算法檢測結(jié)果的精度,測試不同算法的召回率,得到對(duì)比結(jié)果如表3所示。
表3 不同圓弧檢測算法的召回率對(duì)比 %
分析表3可知,隨著迭代次數(shù)的增加,不同算法檢測結(jié)果的采集召回率也在不斷發(fā)生變化。基于邊界聚類的圓弧檢測算法召回率的變化幅度在三種算法中最大,但是召回率比基于切線段匹配的快速圓弧檢測算法略小。所提算法的召回率在三種算法中始終最低,證明該算法的檢測精度最高。
(3)檢測效率對(duì)比。
為檢驗(yàn)所提圓弧檢測算法的檢測效率,測試相同實(shí)驗(yàn)次數(shù)下不同算法的檢測耗時(shí),結(jié)果如圖7所示。
圖7 不同圓弧檢測算法檢測耗時(shí)對(duì)比
分析圖7可知,隨著實(shí)驗(yàn)次數(shù)的不斷增加,不同圓弧檢測算法的檢測耗時(shí)也相應(yīng)發(fā)生變化?;谶吔缇垲惖膱A弧檢測算法的檢測耗時(shí)僅在最初時(shí)少于所提的基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法,而基于切線段匹配的快速圓弧檢測算法的檢測耗時(shí)始終大于文中算法。對(duì)比結(jié)果表明,文中算法所用的檢測時(shí)間最少。通過上述實(shí)驗(yàn)可知,所提圓弧檢測算法的檢測精度最高,因此可證明所提算法具有較高的檢測效率。
基于多層卷積網(wǎng)絡(luò)的圓弧快速檢測算法通過圓弧信息聚類存儲(chǔ)、圓弧全局聚類與獲取圓弧閾值區(qū)間實(shí)現(xiàn)了圓弧快速檢測,其檢測速度高于傳統(tǒng)圓弧檢測算法,并且誤檢率遠(yuǎn)低于傳統(tǒng)圓弧檢測算法,實(shí)現(xiàn)了圓弧檢測領(lǐng)域速度與效率的提升,對(duì)圓弧檢測領(lǐng)域具有重大的意義。