王蕊
摘 要:針對(duì)傳統(tǒng)板材噴碼人工記錄的問(wèn)題,提出一種基于圖像處理的噴碼圖像識(shí)別方法。在該方法中,首先采用加權(quán)平均法對(duì)圖像進(jìn)行灰度化處理,然后采用背景差分法和Otsu對(duì)圖像進(jìn)行定位和分割;利用旋轉(zhuǎn)投影法和最小二乘擬合法對(duì)噴碼圖像進(jìn)行校正;通過(guò)PCA融合方法完成對(duì)一維投影特征、外輪廓特征和網(wǎng)格特征的提取;最后通過(guò)二叉樹(shù)的SVM進(jìn)行識(shí)別分類(lèi)。通過(guò)試驗(yàn)驗(yàn)證表明,本文采用的方法可有效識(shí)別不同格式的英文字符,且識(shí)別正確數(shù)明顯高于傳統(tǒng)的SVM方法,具有一定的優(yōu)勢(shì)。
關(guān)鍵詞:噴碼圖像;英文字符;圖像識(shí)別;SVM分類(lèi)
中圖分類(lèi)號(hào):TP391.43 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-5922(2021)05-0076-04
Research on English Character Recognition of Chemical Products Based on Image Processing
Wang Rui
(Xi an Siyuan University,Xi an 710038,China)
Abstract:Aiming at the problem of manual record of traditional plate spray code, an image recognition method based on image processing is proposed. In this method, firstly, the weighted average method is used to gray the image, then the background difference method and Otsu are used to locate and segment the image; the rotation projection method and the least square fitting method are used to correct the spray code image; the PCA fusion method is used to extract the one-dimensional projection features, the contour features and the grid features; finally, recognition and classification are carried out through the SVM of the binary tree. The experimental results show that the proposed method can effectively recognize English characters of different formats, and the correct number of recognition is significantly higher than that of the traditional SVM method , which has certain advantages.
Key words:inkjet image; English characters; image recognition; SVM classification
為區(qū)別鋼鐵板材信息,部分廠(chǎng)家會(huì)在生產(chǎn)的板材表面會(huì)通過(guò)噴涂的形式噴印上板材的信息,如鋼板號(hào)、鋼種、尺寸、制造商、生產(chǎn)批次等,且每一個(gè)板材產(chǎn)品對(duì)應(yīng)于唯一的鋼板號(hào)。在這其中,包含著大量的英文字符信息。而板材成品從入庫(kù)導(dǎo)裝車(chē)發(fā)貨過(guò)程中,管理員往往會(huì)通過(guò)手工記錄的方式來(lái)記錄本批次板材的噴碼信息,以此區(qū)別不同類(lèi)別的板材。但這種傳統(tǒng)的人工記錄難免會(huì)出錯(cuò),進(jìn)而給板材的管理帶來(lái)不便。而伴隨著現(xiàn)代圖像識(shí)別技術(shù)的發(fā)展,以及圖像識(shí)別在物流等領(lǐng)域的應(yīng)用,給板材噴碼識(shí)別提供了新的借鑒思路。而在當(dāng)前的圖像識(shí)別中,對(duì)圖像進(jìn)行特征提取,然后采用神經(jīng)網(wǎng)絡(luò)、SVM等算法對(duì)圖像進(jìn)行識(shí)別,是常用的思路。而本文則結(jié)合以往研究的思路,嘗試將識(shí)別方法應(yīng)用到板材的噴涂信息識(shí)別中,特別是數(shù)字字符和英文字符識(shí)別,以此為圖像識(shí)別在板材管理的運(yùn)用提供新思路。
1 識(shí)別整體思路
參照一般性的字符識(shí)別流程,結(jié)合板材表面噴印字符、噴碼信息的特點(diǎn),本文確定了板材表面噴碼字符識(shí)別的技術(shù)路線(xiàn),展示如圖1所示。
2 圖像預(yù)處理與字符區(qū)域定位
基于色彩空間變換原理對(duì)獲取到的噴涂信息圖像進(jìn)行灰度轉(zhuǎn)換,然后利用背景差分法來(lái)定位板材噴涂圖像,最后利用Otsu法對(duì)噴涂圖像的字符區(qū)域進(jìn)行分割。
2.1 圖像灰度化
灰度化處理采用加權(quán)平均法。該方法的基本思路為:首先RGB三分量不同的權(quán)值,然后通過(guò)求解加權(quán)平均來(lái)確定灰度值。本研究則采用如下公式進(jìn)行灰度化計(jì)算:
其中,? ?為彩色圖像的三分量,指的是灰度圖像對(duì)應(yīng)點(diǎn)亮度。
2.2 圖像定位
圖像定位采用背景差分法。具體流程為:首先獲取噴碼背景圖像,然后將之與抓拍圖像進(jìn)行差分運(yùn)算,由此得到寬厚板表面噴碼圖像。差分運(yùn)算公式為:
其中,依次是目標(biāo)圖像、背景圖像,M界定了圖像尺度。
在本噴碼圖像的定位中,由于外部環(huán)境中的光照變化會(huì)對(duì)背景差分造成擾動(dòng),因此采用對(duì)背景圖像進(jìn)行實(shí)時(shí)更新,以盡量消除光照條件的干擾作用。
2.3 圖像分割
圖像分割采用Otsu法。具體步驟為:首先通過(guò)Otsu法確定最佳閥值,保持目標(biāo)像素不變,并設(shè)置背景像素為0,在此基礎(chǔ)上,通過(guò)Otsu法再次確定最佳閥值。如此重復(fù)迭代,直到滿(mǎn)足迭代停止條件,即在一次迭代過(guò)程中,分割前與分割后整體圖像的像素變化率小于類(lèi)內(nèi)方差變化率。將所有的Otsu閥值列入閾值數(shù)組,利用閥值數(shù)組逆序驗(yàn)證二值化效果。根據(jù)閾值二值化圖像后,采取水平垂直法計(jì)算出字符區(qū)域的寬高比,如果寬高比符合先驗(yàn)條件,隨即輸出正確結(jié)果;如果寬高比不符先驗(yàn)條件,則需要提取前一個(gè)閾值并據(jù)此進(jìn)行復(fù)判;如果提取了所有閾值都不符先驗(yàn)條件,則根據(jù)先驗(yàn)知識(shí)提取閾值,并利用此閾值二值化圖像。流程如圖2所示。
2.4 圖像校正
實(shí)踐發(fā)現(xiàn),板材表面噴印的英文字符缺少直線(xiàn)邊框,因此需要對(duì)圖像進(jìn)行校正。傳統(tǒng)的校正方法中,旋轉(zhuǎn)投影法的校正容易受旋轉(zhuǎn)角度的影響,雖控制較小的旋轉(zhuǎn)角度能夠提高旋轉(zhuǎn)投影法的精度,但運(yùn)算較大;最小二乘擬合法的校正精度取決于關(guān)鍵點(diǎn)提取量,如果提取出的關(guān)鍵點(diǎn)數(shù)較少,則無(wú)法保證最小二乘擬合法的精度。因此融合以上兩種方法的優(yōu)勢(shì)進(jìn)行校正,具體步驟為:
(1)根據(jù)底層坐標(biāo)點(diǎn)數(shù)求解出傾斜角度。首先獲得字符區(qū)域底層目標(biāo)像素點(diǎn)的坐標(biāo),然后將坐標(biāo)點(diǎn)列入直角坐標(biāo)系中,通過(guò)最小二乘擬合求解出整體圖像的傾斜角度。最小二乘擬合法的基本思路是,針對(duì)一組已知的有序數(shù)據(jù),采取一條光滑曲線(xiàn)進(jìn)行擬合,確保目標(biāo)函數(shù)最小化,殘差算式是。建立直線(xiàn)方程,對(duì)直線(xiàn)方程中的參量、b求偏導(dǎo),最終計(jì)算出直線(xiàn)斜率的值,如下:
在計(jì)算出直線(xiàn)斜率以后,即可根據(jù)關(guān)系式求解出傾斜角度。
(2)設(shè)定閾值t,據(jù)此對(duì)最小二乘擬合法所用的關(guān)鍵點(diǎn)數(shù)n進(jìn)行檢驗(yàn)。若n
(3)利用基于最小二乘擬合法確定的傾斜角度進(jìn)行投影校正。若,則向X軸上方旋轉(zhuǎn);若,則向X軸下方旋轉(zhuǎn)。
(4)基于旋轉(zhuǎn)投影法對(duì)傾斜角度進(jìn)行驗(yàn)證。
(5)根據(jù)驗(yàn)證后的傾斜角度,對(duì)整體圖像執(zhí)行傾斜校正。
2.5 特征提取
在本文中,主要對(duì)噴碼圖像的一維投影特征、網(wǎng)格特征和外輪廓特征進(jìn)行提取。
(1)一維特征提取。對(duì)于像素m×n的二值圖,將原點(diǎn)選定在二值圖像的左下角,然后確定該圖像在x軸上的垂直投影以及在y軸上的水平投影,從而提取出圖像的一維投影特征,即:
由垂直投影提取的一維圖像:
由水平投影提取的一維圖像:
(2)網(wǎng)格特征。將字符區(qū)域劃分為多個(gè)子區(qū)域,并且計(jì)算出不同子區(qū)域內(nèi)的目標(biāo)像素點(diǎn)數(shù),這一信息構(gòu)造了圖像的網(wǎng)格特征。
(3)外輪廓特征。以圖像邊緣為基礎(chǔ),計(jì)算出圖像邊緣與第一個(gè)目標(biāo)像素點(diǎn)之間的像素點(diǎn)數(shù),從而獲悉了字符結(jié)構(gòu)的外輪廓信息,或者稱(chēng)之為圖像的外輪廓特征。
2.6 基于PCA的特征融合
為更好的獲得完整的噴碼圖像特征,本研究采用PCA的融合方式對(duì)主成分特征進(jìn)行提取,這樣在減少圖像特征維度的同時(shí),降低計(jì)算量。
PCA的特征融合是以實(shí)現(xiàn)轉(zhuǎn)換前后的均方誤差最小化作為目標(biāo)的,具體實(shí)現(xiàn)步驟為:
(1)建立噴碼圖像原始特征的協(xié)方差矩陣。初始向量x的均值向量是,協(xié)方差矩陣是,相關(guān)矩陣是。
(2)計(jì)算的特征值、特征向量,并且確定特征值序列以及相應(yīng)的特征向量序列。代入式Y(jié)=UX中,即可求解出D個(gè)新特征的方差。
(3)界定第i個(gè)主成分的“方差貢獻(xiàn)率”和前d個(gè)主成分的“累計(jì)方差貢獻(xiàn)率”,如果已經(jīng)足夠大,則提取前d個(gè)主成分做好新的特征,即:
在獲得新的特征以后,隨即摒棄后面D-d個(gè)特征,由此實(shí)現(xiàn)了降維效果。
3 基于二叉樹(shù)的SVM多模板識(shí)別
SVM主要適用于兩分類(lèi)問(wèn)題,但在實(shí)際應(yīng)用中卻存在多類(lèi)分類(lèi)問(wèn)題。因此,本文提出采用基于二叉樹(shù)的SVM多模板識(shí)別方法。具體步驟為:首先針對(duì)板材表面噴印字符格式不同問(wèn)題,先判定圖像中英文字符、數(shù)字字符的格式,然后識(shí)別具體字符。具體可分為2個(gè)步驟:①利用決策樹(shù)模式識(shí)別噴印字符的不同格式,從而對(duì)字符的模板類(lèi)型進(jìn)行分類(lèi);②在確定字符模板類(lèi)型以后,基于多分類(lèi)SVM進(jìn)行字符識(shí)別,最終確定字符內(nèi)容。
4 試驗(yàn)驗(yàn)證
4.1 噴印格式的識(shí)別
基于決策樹(shù)進(jìn)行板材噴印格式的識(shí)別,首先明確各類(lèi)噴印格式的特點(diǎn),然后提取關(guān)鍵特征,包括字符行數(shù)、字符區(qū)域的寬高比、校正后的水平投影等。在對(duì)板材噴碼圖像進(jìn)行字符區(qū)域定位和傾斜校正以后,首先進(jìn)行y方向的水平投影,并獲取波峰數(shù)量m,然后利用先驗(yàn)知識(shí)確定字符行數(shù),由此計(jì)算出字符區(qū)域的寬高比。考慮到噴印格式不會(huì)輕易發(fā)生變化,所以,首先構(gòu)造不同類(lèi)型、不同功能的判別函數(shù),然后據(jù)此完成分類(lèi)工作。具體來(lái)說(shuō),利用寬高比特征建立人工噴印模板的分類(lèi)函數(shù);利用字符行數(shù)n、波峰數(shù)量m等信息構(gòu)建根判別函數(shù);利用y向水平投影特征信息建立機(jī)器噴印格式的分類(lèi)函數(shù)。在實(shí)操中,首先在根節(jié)點(diǎn)上利用判別函數(shù)進(jìn)行樣本判決,判定噴印樣本屬于右節(jié)點(diǎn)(即機(jī)器噴印格式)或者左節(jié)點(diǎn)(即人工噴印格式)。
4.2 英文字符識(shí)別結(jié)果
以“B”字符識(shí)別為例,通過(guò)采集不同噴碼圖像中的“B”字符樣本集720組,訓(xùn)練樣本80組,在經(jīng)過(guò)以上二叉樹(shù)的SVM模式識(shí)別訓(xùn)練后,得到表1所示的識(shí)別結(jié)果。同時(shí)為比較識(shí)別效果,將該測(cè)試樣本與傳統(tǒng)的SVM算法進(jìn)行比較。
5 結(jié)語(yǔ)
根據(jù)上述的識(shí)別結(jié)果看出,在對(duì)板材的噴碼進(jìn)行識(shí)別過(guò)程中,最為關(guān)鍵的是要結(jié)合圖像識(shí)別思路對(duì)圖像一步步進(jìn)行處理。而在本研究中,采用圖像灰度化處理、圖像定位與分割,以及采用基于PCA的特征融合和二叉樹(shù)的SVM識(shí)別方法,得到更高準(zhǔn)確率的英文字符識(shí)別率,由此說(shuō)明該方法的可行性。
參考文獻(xiàn)
[1]莊家俊,冼文鋒,王前.結(jié)合形態(tài)結(jié)構(gòu)和BP神經(jīng)網(wǎng)絡(luò)的盲文字符識(shí)別[J].現(xiàn)代計(jì)算機(jī),2020(21):50-53+76.
[2]傅漢東.光學(xué)字符識(shí)別技術(shù)在高校會(huì)計(jì)核算中的實(shí)踐和應(yīng)用[J].現(xiàn)代經(jīng)濟(jì)信息,2020(12):64-65+67.
[3]張秀玲,魏其珺,周凱旋,等.基于改進(jìn)LeNet-5網(wǎng)絡(luò)的車(chē)牌字符識(shí)別[J].沈陽(yáng)大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,32(04):312-317.
[4]侯嘉璐.模式識(shí)別及其在圖像處理中的應(yīng)用研究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(10):42+139.
[5]李亞楠,王海暉,劉黎志.基于PBL模式的數(shù)字圖像處理課程教學(xué)優(yōu)化探討[J].教育教學(xué)論壇,2020(36):251-253.
[6]曹林根,宓超.集裝箱箱號(hào)字符識(shí)別算法研究[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-11[2020-09-16].
[7]徐亮.復(fù)雜光照條件下含拖影儀表字符識(shí)別方法[D].武漢:湖北工業(yè)大學(xué),2020.
[8]李朋飛,王熙,丁國(guó)超,等.精準(zhǔn)播種機(jī)粒距檢測(cè)系統(tǒng)信號(hào)與圖像處理的研究[J].農(nóng)機(jī)化研究,2021,43(06):20-25.
[9]王正玉.基于數(shù)字圖像處理的機(jī)房網(wǎng)絡(luò)設(shè)備安全監(jiān)控技術(shù)研究[J].計(jì)算機(jī)時(shí)代,2020(08):37-41.
[10]陳建國(guó),康海靜,蘭英.基于CPLD芯片控制的視頻圖像處理系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2020,28(08):217-222.