郁 巖
(江蘇安全技術(shù)職業(yè)學(xué)院 機(jī)械工程學(xué)院,江蘇 徐州 221000)
輪胎、軸承、鋼材、模具等工業(yè)產(chǎn)品出廠前被印制了一些產(chǎn)品字符,其內(nèi)容記錄著產(chǎn)品的重要信息,所以準(zhǔn)確、高效地識(shí)別壓紋字符是企業(yè)智能化制造必須滿(mǎn)足的基本要求[1]。因此,如何快速識(shí)別產(chǎn)品上的字符信息已成為企業(yè)向信息化發(fā)展的掣肘。
壓紋字符相較于其他印刷字符而言更加立體,且字符與其背景之間無(wú)色差[2]。因此用于識(shí)別壓紋字符的算法與識(shí)別其他光學(xué)字符的算法相比存在明顯區(qū)別。本文重點(diǎn)探究光學(xué)字符識(shí)別(OCR)中對(duì)圖像單個(gè)字符分割和分割后的訓(xùn)練集學(xué)習(xí)識(shí)別任務(wù)[3]。
本次實(shí)驗(yàn)平臺(tái)由相機(jī)支架、大恒MER500黑白相機(jī)、日本COMPUTAR 25 mm焦距鏡頭、OPT同軸光源、LINGD2001-T型光源控制器和PC機(jī)組成[4],待識(shí)別字符是在環(huán)形鑄件表面用模具直接沖壓形成的字符,如圖1所示。相機(jī)固定在被測(cè)物的正上方,光源由固定支架夾持,保證通過(guò)同軸光源半透半返的光線(xiàn)垂直且均勻的照射在零件表面。被測(cè)零件置于實(shí)驗(yàn)平臺(tái)下方,通過(guò)VisionPro軟件采集圖像。
圖1 待測(cè)零件上表面
壓紋字符是利用模具直接在零件表面沖壓形成的字符,所以字符周?chē)念伾捅尘皡^(qū)域的顏色無(wú)差別,因此實(shí)驗(yàn)采用15°環(huán)形角度光源采集圖像[5]。
金屬壓紋字符呈圓周狀分布在環(huán)形區(qū)域內(nèi),不利于后期的字符識(shí)別。為了使環(huán)形區(qū)域內(nèi)的壓紋字符呈水平方向排列,需對(duì)圖像進(jìn)行校正,如圖2所示。
圖2 極坐標(biāo)轉(zhuǎn)換
圖2(a)為環(huán)形區(qū)域,圖2(b)為轉(zhuǎn)換后的矩形區(qū)域。環(huán)形區(qū)域的頂點(diǎn)A、B、C、D分別對(duì)應(yīng)轉(zhuǎn)換后矩形區(qū)域的頂點(diǎn)A、B、C、D。設(shè)P點(diǎn)為環(huán)形區(qū)域中的像素點(diǎn),空間坐標(biāo)為(x, y),矩形區(qū)域與其對(duì)應(yīng)的點(diǎn)是P',空間坐標(biāo)為(x', y'),變換中心為點(diǎn)O(xO, yO)。
環(huán)形區(qū)域內(nèi)P點(diǎn)在極坐標(biāo)系中的角度值β3計(jì)算如下:
ROP的長(zhǎng)度計(jì)算公式為:
P'空間坐標(biāo)(x',y')由極坐標(biāo)變換得到:
因點(diǎn)P'的空間坐標(biāo)(x',y')一般為實(shí)數(shù),所以只能插值獲得點(diǎn)P'的灰度值。圖3(a)表示輸出圖像中某一像素已被變換回輸入圖像中,但經(jīng)轉(zhuǎn)換后該像素的中心點(diǎn)處于與之相鄰的4個(gè)像素的中心點(diǎn)之間,且為非整數(shù)位置。算法采用最近鄰域插值法,首先對(duì)變換后的像素中心的數(shù)據(jù)取整處理,從而確定在4個(gè)相鄰像素點(diǎn)中心位置和該坐標(biāo)最近的一個(gè),接著把該像素的灰度值當(dāng)作輸出圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值,如圖3(b)所示。
圖3 插值法計(jì)算
為減少圖像處理時(shí)的數(shù)據(jù)量,對(duì)極坐標(biāo)變換后的圖像進(jìn)行二值化處理,即利用IPOneImage工具中的量化算法進(jìn)行處理[6],如圖4(a)所示。此算法減少了圖像背景的數(shù)據(jù),使得目標(biāo)輪廓更加突出,大大提高了識(shí)別效率[7]。但圖像二值化處理后灰度級(jí)分布不均勻,所以還需對(duì)二值化圖像進(jìn)行均衡化處理,如圖4(b)所示。
圖4 字符圖像優(yōu)化處理
建立一個(gè)字符訓(xùn)練數(shù)據(jù)集,如圖5所示。本訓(xùn)練集由一些特征向量的范例和已知字符種類(lèi)組成,訓(xùn)練集的字符包含油污、缺角、壓紋較淺、表面銹斑等工況,還包含實(shí)際工況采集圖像時(shí),出現(xiàn)噪聲、圖像強(qiáng)度不均勻等現(xiàn)象[8-9]。通常情況下獲得變化的訓(xùn)練集比較困難,所以在圖像處理時(shí)采取一些措施對(duì)已收集的字符范例進(jìn)行拓展訓(xùn)練,本訓(xùn)練集也經(jīng)過(guò)了人為處理。
圖5 部分訓(xùn)練集樣本
圖6列舉了被測(cè)零件的部分壓紋字符在4種工況下利用OCR和訓(xùn)練集集合算法分割字符,圖6(c)被潤(rùn)滑油侵蝕過(guò),圖像質(zhì)量最差,只有微小的邊緣信息,此時(shí)人為將預(yù)先定義的良品壓紋字符加入訓(xùn)練集中,圖中可以看出,SSE字符被準(zhǔn)確分割出來(lái),且藍(lán)色的矩形緊貼字符邊緣。
圖6 被測(cè)零件部分壓紋字符
從實(shí)驗(yàn)運(yùn)行結(jié)果來(lái)看,OCR和訓(xùn)練集集合算法可以在復(fù)雜的工況下分割壓紋字符,此算法不僅可以對(duì)較淺的壓紋進(jìn)行識(shí)別,還能適應(yīng)多油、銹斑等復(fù)雜條件下的檢測(cè),大大提高了傳統(tǒng)OCR字符識(shí)別的準(zhǔn)確率,且算法響應(yīng)速度更快。