張忍
摘要:字符識(shí)別技術(shù)作為自動(dòng)化領(lǐng)域的熱門話題,在很多行業(yè)都發(fā)揮著重要的作用。OCR技術(shù)的一般由圖像預(yù)處理,字符分割,識(shí)別三個(gè)主要部分組成。然而,此技術(shù)在金屬閥門表面的字符識(shí)別的應(yīng)用還很少。對(duì)于金屬閥門而言,表面字符的作用是用來(lái)標(biāo)識(shí)閥門型號(hào),序列號(hào)等重要信息;在生產(chǎn)過(guò)程中,對(duì)表面字符的檢測(cè)構(gòu)成其生產(chǎn)制造的重要環(huán)節(jié)。本文中使用圖像處理和OCR技術(shù)相結(jié)合的方法,實(shí)現(xiàn)了金屬閥門表面的字符識(shí)別。首先使用工業(yè)相機(jī)和光源搭建光學(xué)系統(tǒng)來(lái)拍攝閥門原圖像。之后對(duì)獲取的圖像進(jìn)行預(yù)處理,剔除有字符缺陷的閥門。最后基于卷積神經(jīng)網(wǎng)絡(luò)完成字符識(shí)別算法。實(shí)驗(yàn)結(jié)果表明,用CNN可以實(shí)現(xiàn)字符的高識(shí)別率。
關(guān)鍵詞:字符識(shí)別;光學(xué)系統(tǒng);圖像預(yù)處理;CNN
1.光學(xué)系統(tǒng)設(shè)計(jì)
1.1光源設(shè)計(jì)
輔助光源是機(jī)器視覺(jué)系統(tǒng)關(guān)鍵組成部分之一[7],直接從源頭上影響到輸入圖像的質(zhì)量。圖像的過(guò)暗或過(guò)亮都會(huì)給處 理及識(shí)別帶來(lái)很大影響,雖然可以通過(guò)圖像增強(qiáng)等方式對(duì)其進(jìn)行改善,但有時(shí)原圖的曝光不當(dāng)會(huì)直接導(dǎo)致原始信息的缺失,以及圖像局部過(guò)亮或過(guò)暗的情況,都很難在圖像處理過(guò)程中得以校正。由于金屬表面的反光特性,通常所成的圖像都會(huì)存在明暗不均的問(wèn)題,因此選擇合適的輔助光源是至關(guān)重要的一步。輔助光源的作用主要在于使物體表面均勻曝光,從而提升原始圖像的質(zhì)量。根據(jù)光源照射形式的不同,主要可以分為面陣光源、條形光源以及環(huán)形光源等,如圖2-1所示。
1.1.1打光效果分析
在進(jìn)行光學(xué)實(shí)驗(yàn)時(shí)要考慮金屬閥門自身的特點(diǎn):
(1)圓柱形物體,字符信息分布在曲面上。
(2)金屬表面反光。
兩種打光方式拍攝的圖像如圖 2-1-1所示。圖中A為條光打光效果;B為平行面光源打光效果。
圖A是條形光在側(cè)面打光的方式。因?yàn)樽址谇嫔希圆旁斐闪斯饩€反射到相機(jī)的強(qiáng)度不一致,在圖像上則呈現(xiàn)出明暗不均。這會(huì)對(duì)字符識(shí)別造成干擾。圖B是采用面光源從閥門的正上方進(jìn)行打光,光線是以一種平行于物體表面的方式打亮閥門工件的表面。可以看出圖像不會(huì)出現(xiàn)明暗不均的問(wèn)題,并且一個(gè)面光源就可以覆蓋整個(gè)曲面。實(shí)驗(yàn)結(jié)果表明,采用一個(gè)面光源從閥門正上方進(jìn)行打光的方式可以拍攝到均勻性較好的圖像。
1.2光學(xué)系統(tǒng)
經(jīng)觀察閥門表面有12個(gè)字符信息,經(jīng)過(guò)分析論證,決定采用3個(gè)面陣相機(jī)進(jìn)行圖像的采集。通過(guò)對(duì)各種打光方式的對(duì)比,最終選用一個(gè)面光源由上至下進(jìn)行垂直打光。
2字符識(shí)別算法
2.1圖像預(yù)處理
通過(guò)實(shí)驗(yàn),發(fā)現(xiàn)使用尺寸為3×3的中值濾波器可以有效地去除背景噪聲。不同類型的字符圖像及濾波結(jié)果如圖2-1所示。圖1(a)-(c)顯示了:表面劃痕,局部凹坑,表面鋼印,3種字符圖像。在每種情況下,A為原始圖像,B為濾波后的圖像,C為提取到的字符信息。
2.2字符分割
將圖像預(yù)處理階段提取到的字符信息先進(jìn)行二值化等處理,之后通過(guò)垂直投影法進(jìn)行分割。
本文中主要通過(guò)改變訓(xùn)練集的字符數(shù)量,測(cè)試對(duì)識(shí)別結(jié)果的影響。實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)如表1:
實(shí)驗(yàn)結(jié)果表明,改進(jìn)的LeNet-5卷積神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識(shí)別模型,在訓(xùn)練集數(shù)據(jù)足夠多的情況下,進(jìn)行金屬閥門表面的字符識(shí)別時(shí)可以達(dá)到99%的識(shí)別率。
參考文獻(xiàn):
[1]郝輝,哈力木拉提·買買提,喬薩礎(chǔ)拉,等.字符識(shí)別研究現(xiàn)狀和發(fā)展趨勢(shì)計(jì)量分析[J].現(xiàn)代電子技術(shù),2018,41(22):154-158.
[2]王文華.淺談 OCR 技術(shù)的發(fā)展和應(yīng)用[J].福建電腦,2012,28(6):56+92.
[3]陳利.基于深度學(xué)習(xí)的車牌識(shí)別系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2018,28(6):85-89.
[4]王志瑜.基于 OCR 成績(jī)單錄入系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].吉林大學(xué),2015.
[5]索玉秀.基于 OCR 技術(shù)的名片識(shí)別方法研究[D].哈爾濱理工大學(xué),2015.