趙麗
關(guān)鍵詞:水平投影;垂直投影;自適應(yīng)投影法;數(shù)字分割
0引言
目前工業(yè)生產(chǎn)中各類儀表數(shù)據(jù)主要采用人工讀取。人工讀取存在很多缺點(diǎn):儀表位置隱蔽,人工不易讀??;人工無(wú)法實(shí)時(shí)監(jiān)控同一個(gè)儀表;人工讀取速度較慢,并且可能泄露信息;不同的工作人員由于受到主觀因素的干擾,在讀取數(shù)據(jù)時(shí),結(jié)果會(huì)有一定的誤差。因此,采用智能的讀取方法具有必然性。智能的儀表讀取方法既能減少人為因素的干擾,又能實(shí)現(xiàn)高效地讀取。相關(guān)算法包括模板匹配、機(jī)器學(xué)習(xí)訓(xùn)練、骨骼提取等。但是上述算法針對(duì)不同情況的準(zhǔn)確率不同,不具備普適性。
本文提出了一種自適應(yīng)投影法,可以對(duì)工業(yè)現(xiàn)場(chǎng)各種儀表數(shù)字進(jìn)行識(shí)別,同時(shí)采用一系列的預(yù)處理操作,并通過實(shí)驗(yàn)確定了分割和預(yù)處理的順序,達(dá)到了最佳的分割效果。
1圖像分割
數(shù)字分割是將數(shù)字圖片中的數(shù)字分割出來(lái),便于之后的特征提取和分類器訓(xùn)練。本文采用投影法對(duì)數(shù)字表盤進(jìn)行切分。
1.1投影數(shù)字分割算法
投影法可分為水平投影和垂直投影。水平投影主要是指二維圖像在y軸上的投影,即統(tǒng)計(jì)每一行像素的數(shù)量,表明圖像在水平方向上的特征。垂直投影主要是指二維圖像在x軸上的投影,即統(tǒng)計(jì)每一列像素的數(shù)量,表明圖像在垂直方向上的特征。
運(yùn)用投影法進(jìn)行數(shù)字分割,步驟如下。
步驟1:數(shù)字圖片列掃描。對(duì)數(shù)字圖像從左到右逐列掃描,記錄每列像素點(diǎn)個(gè)數(shù),并將其投影到水平面上,得到垂直投影圖。人為設(shè)定一個(gè)閾值,在垂直投影圖上逐列掃描獲得每列的像素和,達(dá)到閾值則進(jìn)行分割,直至將所有數(shù)字在垂直方向上都分割出來(lái)。如果該數(shù)字圖片中有3個(gè)數(shù)字,那么垂直投影結(jié)束后應(yīng)該分割出來(lái)3個(gè)圖片,且3個(gè)圖片的左右邊緣均是數(shù)字本身的邊緣,但是圖片上下仍存在多余部分。
步驟2:數(shù)字圖片行掃描。對(duì)數(shù)字圖像從上到下逐行掃描,記錄每行像素點(diǎn)個(gè)數(shù),并將其投影到垂直面上,得到水平投影圖。設(shè)定一個(gè)閾值將所有數(shù)字在水平方向上分割出來(lái)。由步驟1可知,垂直投影后的圖片上下存在多余部分,經(jīng)過了水平投影后,可得到只含有數(shù)字區(qū)域的部分,上下多余的部分將被分割掉,從而得到精確的數(shù)字區(qū)域。投影數(shù)字分割算法流程如圖1所示。
1.2投影數(shù)字分割算法的改進(jìn)
雖然上述投影數(shù)字分割算法可以得到精確的數(shù)字,但仍存在一些問題,本文對(duì)其做出以下改進(jìn)。
圖像的分割閾值是人為規(guī)定的,不具有魯棒性,不同的圖片分割效果差別很大?;诖?,本文選擇遍歷垂直和水平投影中的像素點(diǎn),統(tǒng)計(jì)像素點(diǎn)個(gè)數(shù)和,選擇所有像素點(diǎn)個(gè)數(shù)的平均值作為閾值。針對(duì)不同情況的數(shù)字圖片,這種改進(jìn)方式均可以選擇一個(gè)合適的閾值進(jìn)行分割,效果較好。
此外,即使選擇了自適應(yīng)閾值,如果圖片中存在獨(dú)立、細(xì)小的雜質(zhì)或者干擾物,那么它們也有可能被分割出來(lái)。針對(duì)這種情況,本文選擇設(shè)定像素閾值為1000個(gè),如果像素和小于該值就證明該圖片為干擾圖片,將其刪去;如果像素和大于該值就證明該圖片為正常數(shù)字圖片,即可進(jìn)行后續(xù)的分類器預(yù)測(cè)。
2圖像預(yù)處理
圖像預(yù)處理是數(shù)字分割中較關(guān)鍵的一步,預(yù)處理效果與后續(xù)數(shù)字分割精確性有直接關(guān)系。現(xiàn)場(chǎng)圖片因光照、溫度、霧霾等影響,采集照片的清晰度并不能得到有效保障,因此,需要經(jīng)過一系列的預(yù)處理過程。
本文對(duì)圖像進(jìn)行了一系列的預(yù)處理操作,依次為二值化、腐蝕和去除小面積干擾。通過上述操作對(duì)圖像中出現(xiàn)的各種噪聲信息進(jìn)行處理,可以最大化地利用有效信息,為后續(xù)操作提供便利條件。
3實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證本文算法的有效性,本文收集了各個(gè)工業(yè)現(xiàn)場(chǎng)變電站現(xiàn)場(chǎng)的圖片,其中包括各種復(fù)雜的環(huán)境。圖2為現(xiàn)場(chǎng)采集數(shù)字儀表圖片的分割效果。
本文算法對(duì)于有粘連的數(shù)字處理效果更好,由于受到外界光線以及拍攝角度的干擾,拍攝出來(lái)的數(shù)字上方可能會(huì)有粘連。如果直接對(duì)其進(jìn)行特征提取和訓(xùn)練,圖片分割結(jié)果可能有誤,如圖片中本有3個(gè)數(shù)字,但在單獨(dú)進(jìn)行數(shù)字分割時(shí),有可臺(tái)旨分割成2個(gè)數(shù)字甚至1個(gè)數(shù)字。而采用本文的算法后,可以將所有的數(shù)字完整分割出來(lái),粘連圖片投影分割效果如圖3所示。
即使數(shù)字之間存在粘連,本文算法仍然可以將數(shù)字區(qū)域準(zhǔn)確分割出來(lái),并且分割之后的數(shù)字較清晰。只要分割出來(lái)的數(shù)字保持一個(gè)正常的清晰度,后續(xù)就可以準(zhǔn)確識(shí)別該數(shù)字。
確定了算法的流程順序后,本文選擇了3組數(shù)字圖片進(jìn)行測(cè)試(圖4),發(fā)現(xiàn)分割效果均較好,從而驗(yàn)證了本文算法的有效性。
觀察3組分割效果圖可以發(fā)現(xiàn),本文算法具有較好的普適性。針對(duì)3個(gè)數(shù)字的圖片、2個(gè)數(shù)字的圖片和中間有干擾顏色區(qū)域的圖片,本文算法均可以準(zhǔn)確分割。
4結(jié)語(yǔ)
本文對(duì)戶外復(fù)雜環(huán)境下的表盤數(shù)字分割算法進(jìn)行優(yōu)化。采用水平投影與垂直投影相結(jié)合的方法對(duì)數(shù)字進(jìn)行分割,得到每個(gè)數(shù)字的精確邊緣,再分別對(duì)其進(jìn)行預(yù)處理,從而精確地進(jìn)行數(shù)字分割。通過改變算法的流程,可以發(fā)現(xiàn)本文設(shè)定的算法流程可以精確識(shí)別出數(shù)字,具有較高的識(shí)別準(zhǔn)確率。與其他方法相比,本文算法適用性強(qiáng),可應(yīng)用于各種形式圖片的數(shù)字識(shí)別,準(zhǔn)確性高,具有較高的推廣價(jià)值。