張付祥 郭旺 黃永建 王春梅 黃風山
摘 要:為實現(xiàn)特鋼棒材生產(chǎn)信息的全流程可追溯,分析特鋼棒材生產(chǎn)環(huán)境及形狀特點,采用基于雙標志點的標記方案進行標記并利用機器視覺技術(shù)實現(xiàn)成捆特鋼端面字符的識別。首先,采用Hough變換將成捆特鋼棒材端面圖像分割成單根;其次,采用基于小波變換的圖像增強算法完成單根特鋼棒材端面圖像的增強;再次,將MSER算法和邊緣檢測算法相結(jié)合完成單根特鋼棒材字符區(qū)域的檢測,并基于投影法完成字符的分割;最后,通過創(chuàng)建和訓練SVM分類器完成每一根特鋼棒材端面字符識別,并將成捆特鋼棒材端面字符識別結(jié)果輸出保存。結(jié)果表明,新算法可以滿足成捆特鋼棒材生產(chǎn)過程中字符識別要求,字符識別準確率可達到97.35%。新算法將Hough變換、基于小波變換的圖像增強算法、MSER算法、邊緣檢測算法、投影法及SVM分類器等算法融合到特鋼棒材端面字符識別過程中,為特鋼棒材生產(chǎn)過程中的信息獲取、信息傳遞及信息追溯的技術(shù)實現(xiàn)提供了參考。
關(guān)鍵詞:計算機圖像處理;特鋼棒材;信息標記;圖像增強;字符分割;字符識別
中圖分類號:TP391.43?? 文獻標識碼:A
doi:10.7535/hbkd.2021yx05005
收稿日期:2021-06-17;修回日期:2021-09-05;責任編輯:馮 民
基金項目:國家重點研發(fā)計劃項目(2018YFB1308700);河北省重大成果轉(zhuǎn)化項目(19011826Z);石家莊市科技計劃項目(216010017A)
第一作者簡介:張付祥(1973—),男,河北青縣人,教授,博士,主要從事機電控制與機器人方面的研究。
E-mail:zhangfx@hebust.edu.cn
Study on character recognition algorithm for end face of bundled special steel bars
ZHANG Fuxiang1,GUO Wang1,HUANG Yongjian2,WANG Chunmei3,HUANG Fengshan1
(1.School of Mechanical Engineering,Hbebei University of Science and Technology,Shijiazhuang,Hebei 050018,China;2.Shijiazhuang Iron & Steel Company Limited,Shijiazhuang,Hebei 050031;3.School of Electrical Engineering,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China)
Abstract:In order to realize the traceability of the whole process of special steel bar production information,the production environment and shape characteristics of special steel bar were analyzed.The marking scheme based on double mark points was adopted,and the machine vision technology was used to realize the character recognition of the end face of the bundled special steel bars.First,Hough transform was used to segment the end face image of the bundle of special steel bars into single ones.Secondly,an image enhancement algorithm based on wavelet transform was used to enhance the end face image of a single special steel bar.Then,the MSER algorithm and the edge detection algorithm were combined to complete the detection of the character area of a single special steel bar,and the character segmentation was completed based on the projection method.Finally,the end face character recognition of each special steel bar was completed by creating and training an SVM classifier,and the end face character recognition results of the bundle of special steel bars were output and saved.The results show that the new algorithm can meet the requirements of character identification in the production process of bundles,and the accuracy of character recognition can reach 97.35%.With combination of the Hough transform,the wavelet transform image enhancement algorithm,MSER algorithm,edge detection algorithm,projection method,and SVM classifier and other algorithms to character identification of special steel bar end face,the new algorithm provides reference for information acquisition,information transfer and information traceability of special steel bar production.
Keywords:
computer image processing;special steel bar;information marking;image enhancement;character segmentation;character recognition
特鋼是建筑、機械、汽車等行業(yè)不可或缺的材料,其強度、硬度更大,可塑性好,中國作為鋼鐵產(chǎn)量第一大國,特鋼棒材年產(chǎn)量在1 500萬t以上。為了加強特鋼棒材產(chǎn)品的監(jiān)管,引入機器視覺技術(shù)實現(xiàn)棒材生產(chǎn)信息全流程可追溯是重大戰(zhàn)略需求[1-2]。信息追溯技術(shù)在多個領(lǐng)域已經(jīng)有了成熟的應(yīng)用,但針對特鋼棒材產(chǎn)品的應(yīng)用研究較少。在實現(xiàn)特鋼棒材全流程可追溯研究的過程中,結(jié)合特鋼棒材端面的特點,采用了基于豎直雙標志點的標記方案并通過噴印的方式將信息碼標記在特鋼棒材端面[3],該方案與其他標記方式相比有著更強的抗干擾能力。利用機器視覺技術(shù)依次完成特鋼棒材端面圖像增強、字符檢測與分割、字符識別等工作,可實現(xiàn)特鋼棒材生產(chǎn)信息全流程追溯。針對圖像增強,研究人員提出了基于直方圖均衡化圖像增強算法、基于Retinex算法圖像增強算法、基于小波變換圖像增強算法等多種研究方法;針對字符檢測與分割,研究人員提出了基于顏色信息字符檢測算法、基于邊緣檢測字符檢測算法等方法以及基于投影法的字符分割方法等;針對字符識別,為了提高模板匹配等傳統(tǒng)字符識別方法的效率及準確率,目前研究人員結(jié)合神經(jīng)網(wǎng)絡(luò)技術(shù)提出了多種字符識別算法。
1 圖像采集系統(tǒng)及字符識別算法流程
1.1 成捆特鋼棒材端面字符圖像采集系統(tǒng)
圖像采集系統(tǒng)用于采集并保存特鋼棒材端面的圖像,由工業(yè)相機、鏡頭、光源及工控機組成,如圖1所示。
特鋼棒材精整線中存在多個工序,且各工序之間節(jié)拍配合尤為重要,對視覺檢測系統(tǒng)有著較高的實時性要求。選用MER-500-14GM/C大恒千兆網(wǎng)相機,與相機配套的鏡頭型號為M0814-MP2,焦距f=8 mm,且該鏡頭的光圈與焦距可進行手動旋轉(zhuǎn)調(diào)整。光源采用CST-RS12090-B藍色環(huán)形光源,同時選取型號為CST-DPS24120C-4TD的網(wǎng)口數(shù)字控制器與光源配套使用。工控機是整個圖像采集系統(tǒng)的控制單元,通過網(wǎng)口分別與光源和相機進行通訊,實現(xiàn)特鋼棒材圖像的實時采集??紤]到特鋼棒材生產(chǎn)環(huán)境比較差,工控機擔負著繁重的計算任務(wù),選用研華工控機。該工控機采用CORE I5-6500(65 W)處理器、AIMB-505G2工控主板、256 G 2.5"SATA固態(tài)硬盤以及8 G DDR4內(nèi)存。
圖2 算法流程圖
Fig.2 Flow chart of the algorithm
1.2 成捆特鋼棒材端面字符識別算法流程
為完成成捆特鋼棒材端面字符識別工作,首先,將采集到的特鋼棒材端面圖像分割成單根并計數(shù),與生產(chǎn)信息數(shù)據(jù)庫中根數(shù)進行比較;其次,針對單根特鋼棒材端面圖像采用基于小波變換的圖像增強算法完成圖像增強;再次,基于MSER算法和邊緣檢測完成字符區(qū)域檢測,并基于投影法完成字符分割;最后,通過設(shè)計和訓練SVM分類器完成字符識別工作。算法流程圖如圖2所示。
2 成捆特鋼棒材端面圖像分割
成捆特鋼棒材端面圖像分割采用的方法是將補光后圖像與補光前圖像做減法得到每一根特鋼棒材端面區(qū)域。在對補光后圖像進行區(qū)域選取時,由于特鋼棒材端面為圓形區(qū)域,采用Hough變換來完成單根特鋼棒材端面區(qū)域的選取[4-5]。圖3 a)為未補光的成捆特鋼棒材,圖3 b)為補光成捆特鋼棒材,圖3 c)為特鋼棒材端面區(qū)域最終選取結(jié)果。
將得到的單根特鋼棒材區(qū)域與未補光圖像進行減法運算即可得到單根特鋼棒材端面,圖4為部分分割完成的單根棒材端面(為使圖片有更佳的顯示效果,對圖像進行灰度拉伸以增強亮度)。
3 單根棒材字符圖像處理
3.1 棒材端面圖像增強
特鋼棒材的生產(chǎn)車間光照條件較為復雜,導致圖像采集系統(tǒng)得到的特鋼棒材端面圖像對比度較低,所以必須對采集到的圖像進行增強。圖像增強是為了將圖像中相關(guān)區(qū)域進行增強顯示,而非相關(guān)區(qū)域則需要弱化甚至去除。常用的圖像增強算法包括灰度變換法、同態(tài)濾波法、Retinex增強方法等[6-8]。
經(jīng)過對特鋼棒材端面圖像分析可知,在字符識別過程中字符與背景之間難以區(qū)分且存在噪聲干擾。采用的基于小波變換的圖像增強算法首先將特鋼棒材端面圖像進行一次二維小波分解,分別得到圖像的低頻信息、水平邊緣信息、垂直邊緣信息以及對角方向的高頻信息;然后將得到的圖像的低頻信息進行Gamma校正,以提高字符區(qū)域與背景之間的對比度,其余信息分量通過中值濾波去除噪聲;最后將處理后的各分量進行重構(gòu)得到新的特鋼棒材圖像并對圖像進行二次中值濾波,完成特鋼棒材端面圖像的增強。
3.1.1 圖像小波分解
二維圖像的小波變換是通過小波基函數(shù)將圖像重新表示,小波有多種基函數(shù),選擇不同的基函數(shù)圖像分解的效果也會有很大的不同[9-10]。經(jīng)過對多種小波基函數(shù)的分析,采用Harr小波對特鋼棒材端面圖像進行分解。將特鋼棒材端面圖像進行一次小波分解,其結(jié)果如圖5所示(為有更好的顯示效果,將未分解的圖像以及分解后的各分量進行灰度拉伸以增強亮度)。
從圖5可以看出,特鋼棒材端面圖像經(jīng)過小波分解后,其低頻信息包含了圖像的大部分信息,其余部分中包含的為噪聲區(qū)域。但是由于字符以外區(qū)域亮度過大,仍然會對字符的檢測與分割造成影響,因此需要將圖像字符以外區(qū)域的亮度進行調(diào)整,并將高頻信息分量中的噪聲去除。
3.1.2 Gamma校正
Gamma校正是通過非線性灰度變換來實現(xiàn)圖像對比度的調(diào)整[11-13],其表達式為
Oij=max(Iij)(Iijmax(Iij))γ,i<M,j<N,(1)
式中:Iij為輸入圖像第i行j列處的灰度值;Oij為輸出圖像第i行j列處的灰度值;M為圖像的行數(shù);N為圖像的列數(shù);γ為校正系數(shù)。γ<1時,會使圖像的亮度整體提高,這有助于提升較暗區(qū)域的亮度;當γ>1時,會使圖像的整體亮度降低,這有助于調(diào)整亮度過強的區(qū)域。采用Gamma校正算法進行圖像低頻信息分量處理時γ選擇尤為重要,為取得較好的效果,γ取3.5。特鋼棒材端面圖像低頻分量信息處理結(jié)果如圖6所示,從圖6可以看出,經(jīng)過Gamma校正的特鋼棒材端面圖像中非字符區(qū)域的亮度得到了抑制,字符區(qū)域與非字符區(qū)域之間的對比度得到了進一步增強。
3.1.3 中值濾波
由于特鋼棒材在生產(chǎn)過程中需要對其切割,其端面比較粗糙,加之生產(chǎn)環(huán)境光照復雜,導致采集到的特鋼棒材端面圖像會受到大量的噪聲影響。經(jīng)過對圖像的小波分解可以發(fā)現(xiàn),高頻信息分量中存在大量噪聲且大多為孤立的噪聲點。對于孤立噪聲點的去除,中值濾波有著很大的優(yōu)勢,該方法能夠在消除噪聲的同時不會使邊緣模糊[14]。分別將水平邊緣信息、垂直邊緣信息和對角信息進行中值濾波,結(jié)果如圖7所示。
從圖7可以看出,各分量經(jīng)過上述處理以后,絕大部分孤立的噪聲得到了去除,只存在部分面積較大的區(qū)域,而這些區(qū)域則是字符區(qū)域在不同分量中的體現(xiàn)。
3.1.4 圖像重構(gòu)與二次中值濾波
圖像重構(gòu)是指將處理后的各分量信息通過逆小波變換重新組合成一個新圖片的過程。將處理后得到的各分量信息進行逆小波變換得到的結(jié)果如圖8所示。從圖8可以看出,字符區(qū)域的對比度得到了增強,但是重構(gòu)后的圖像中仍然存在部分噪聲。因此,將重構(gòu)完成的圖像進行二次中值濾波得到最終完成增強的特鋼棒材端面圖像,如圖9所示。將圖8與圖9比較可以發(fā)現(xiàn),圖9中字符區(qū)域的邊界更加光滑且圖像更加清晰。
3.1.5 圖像增強結(jié)果評價
對采集到的多組特鋼棒材端面圖像進行試驗,隨機選取1組特鋼棒材端面圖像進行分析。將本文算法與Retinex算法、同態(tài)濾波算法、直方圖均衡化算法的處理結(jié)果進行比較,并從主觀評價和客觀評價2方面對實驗結(jié)果進行分析。
1)主觀評價
主觀評價是指觀察圖像增強以后其亮度、對比度、細節(jié)信息是否得到了明顯的改善,該方法可以比較直觀地對圖像做出評價,但是容易受到觀察者主觀意識的影響。圖10分別為原始圖像、Retinex算法處理結(jié)果、同態(tài)濾波算法處理結(jié)果、直方圖均衡化處理結(jié)果及本文圖像增強算法處理結(jié)果。從圖10可以看出,本文算法能夠更好地完成特鋼棒材端面圖像的增強。
2)客觀評價
本文分別計算了各處理后圖像的信息熵、峰值信噪比及平均梯度,結(jié)果如表1所示。從表1可以看出,本文圖像增強算法的圖像增強效果明顯,能夠滿足后續(xù)工作的要求。
3.2 棒材端面字符檢測與分割
字符檢測是將字符區(qū)域從圖像中分離出來,字符分割則主要是將字符區(qū)域分割為單個字符。由于棒材自身形狀的原因,采集到的端面圖像字符會呈現(xiàn)任意角度,這也給字符的分割帶來了難度,因此,在進行字符分割時需要將圖像旋正后再進行分割。
3.2.1 基于MSER算法的字符檢測
MSER的原理是根據(jù)給定的一個閾值范圍對圖像進行二值化處理[15-17]。該方法類似于分水嶺算法,不斷向區(qū)域內(nèi)注水,隨著水平面的上升低洼的盆地區(qū)域會被水面淹沒,從上往下看,則只存在水域和陸地2部分。在最終得到的圖像中幾乎不變的區(qū)域為最大穩(wěn)定極值區(qū)域。針對增強后的特鋼棒材端面圖像,結(jié)合MSER算法進行字符檢測可按以下步驟進行。
1)字符區(qū)域初次檢測 字符區(qū)域的初次篩選是采用基于MSER的方法完成圖像中類似字符區(qū)域的篩選,初次檢測時會出現(xiàn)圖11所示幾種情況,針對不同情況需要進行不同的處理。
首先,針對檢測到的各區(qū)域進行開運算,將干擾區(qū)域去除,剩下疑似字符區(qū)域;然后,根據(jù)疑似字符區(qū)域的數(shù)目及面積來區(qū)分上述3種情況;最后,針對3種情況再進行不同處理,完成字符區(qū)域的初次篩選。針對圖11 a)中所示情況,首先通過開運算將字符區(qū)域周圍較小的干擾區(qū)域去除,然后通過閉運算將字符區(qū)域進行一定程度的膨脹,得到新的字符區(qū)域,如圖12 a)所示;針對圖11 b)中所示情況,大面積干擾區(qū)域與字符區(qū)域相連,在進行字符區(qū)域篩選時,首先通過開運算將字符區(qū)域與干擾區(qū)域分離,然后通過閉運算對字符區(qū)域的腐蝕進行補償,得到新的字符區(qū)域,如圖12 b)所示;針對圖11 c)中所示情況,字符區(qū)域被分割成單獨的連通域,因此可以通過閉運算對單獨的連通域進行膨脹操作,得到新的字符區(qū)域,結(jié)果如圖12 c)所示。
2)字符區(qū)域二次篩選 字符區(qū)域的二次篩選是根據(jù)字符區(qū)域的長寬比rz、面積占比pz、連通域中心坐標(xz,yz)等特征,從初次篩選的區(qū)域中最終完成區(qū)域的篩選,需滿足式(2)。
0.3<rz<3,pz>0.6,|x0-xz|<Δ,|y0-yz|<Δ。(2)
其中(x0,y0)為篩選區(qū)域邊框的中心坐標,Δ為連通域中心點與篩選區(qū)域邊框中心點的允許偏差。按照上述要求最終篩選結(jié)果如圖13所示。
3)字符區(qū)域獲取 將篩選出的字符區(qū)域與圖像相減即可得到字符區(qū)域,如圖14所示。
3.2.2 基于投影法字符分割
在將字符區(qū)域分割成單個字符時,字符區(qū)域角度隨機,需要通過雙標志點將其矯正,即字符區(qū)域處于水平位置。首先,通過邊緣檢測找到圖像中字符及標志點的邊緣;然后,通過閉運算將未形成閉合區(qū)域的標志點邊緣進行調(diào)整并將檢測到的閉合區(qū)域進行填充;最后,通過連通域分析找到雙標志點。
1)邊緣檢測 常用的邊緣檢測算子包括Robert算子、Sobel算子、Prewitt算子、LOG算子和Canny算子。將圖14 b)所示字符圖像采用幾種邊緣檢測算子進行處理,結(jié)果如圖15所示。
由圖15可以看出,Robert算子、Sobel算子和Prewitt算子檢測到的邊緣信息斷點太多,不利于提取標志點的邊緣信息;LOG算子雖然檢測到的邊緣信息斷點少,但是不能將字符的邊緣信息完全檢測到;Canny算子能夠檢測比較完整的邊緣信息,便于標志點的提取。因此,選取Canny算子進行字符邊緣的檢測。
2)閉合區(qū)域填充及標志點選取 經(jīng)過邊緣檢測得到的標志點區(qū)域會存在不閉合的情況,因此,先通過形態(tài)學運算將標志點邊緣閉合,再將圖像中的區(qū)域進行填充,填充結(jié)果如圖16所示。
由圖16可以看出,通過雙標志點連通域的面積s和距離d可以完成雙標志點的選擇,需滿足式(3),其中dij為任意2個連通域中心坐標之間的距離,經(jīng)過對大量雙標志點面積統(tǒng)計發(fā)現(xiàn)其面積為20~80。
d=max(dij),20<s<80。(3)
3)圖像校正 由所采用的噴碼方案可知,字符左側(cè)為方形標志點,右側(cè)為圓形標志點,且二者面積不同,前者大于后者。因此,可以根據(jù)面積的大小確定標志點的類型,從而保證矯正后的字符為從左到右依次水平排列。首先,以方形標志點為起點、圓形標志點為終點構(gòu)建一向量A;其次,過2個標志點連線的中點構(gòu)造水平向量B,方向從左到右;再次,計算向量A與向量B的夾角θ;最后,將字符圖像旋轉(zhuǎn)θ,得到校正后的圖像,結(jié)果如圖17所示。
基于投影的字符分割是指基于圖像灰度值分布直方圖進行分析,找到字符之間的分割點,以此為界限進行字符分割[18]。以圖17 a)為例,基于投影法的字符分割步驟如下。
1)計算水平和豎直投影 分別對圖像每行像素灰度值、每列像素灰度值求和,計算結(jié)果如圖18所示。
2)字符水平分割 由于字符灰度值比背景灰度值要大,因而在進行字符分割時選擇投影圖中的波谷為分割點。從圖18 a)可以看出存在多個波谷,可根據(jù)相鄰波谷之間的灰度差Δ水平進行波谷的篩選,在此基礎(chǔ)上分別找到第1個和最后1個波谷,以此作為字符水平分割的邊界,波谷篩選結(jié)果如圖18 a)中圓點所示。
3)字符豎直分割 從圖18 b)可以看出,同樣需要從多個波谷中篩選出標志點及字符的分割點。經(jīng)過對多幅圖像豎直投影圖分析發(fā)現(xiàn),標志點的寬度W標范圍為[6,10],字符“1”的寬度范圍W1為[9,11],字符“0”“2”“3”“4”“5”“6”“7”“8”“9”的寬度W其他范圍為[17,23]。根據(jù)3個范圍篩選出標志點及字符的分割點,如圖18 b)中圓點所示。
字符分割的最終結(jié)果如圖19 a)所示。將圖17 b)和圖17 c)根據(jù)上述步驟進行分割,也可順利完成,結(jié)果如圖19 b)、圖19 c)所示。
3.3 棒材端面字符識別
3.3.1 SVM理論
SVM理論,即支持向量機理論,是一種基于統(tǒng)計學理論和結(jié)構(gòu)風險最小原理通過最大化分類間隔來獲得最佳分類的方法[19-20]。SVM函數(shù)形式上和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似,輸出為中間層各節(jié)點的線性組合,每個中間層節(jié)點均和一個支持向量y相對應(yīng),其結(jié)構(gòu)可以用式(4)表示。
y=sgn(∑ni=1αiyiK(xi,x)+b),(4)
式中:n為輸入向量個數(shù);x=(x1,x2,…,xn)為輸入向量;αiyi為權(quán)重;K(xi,x)為基于n個向量x1,x2,…,xn的非線性變換。
3.3.2 SVM分類器的創(chuàng)建和訓練
SVM分類器的創(chuàng)建和訓練具體步驟如下。
1)準備字符訓練集圖像,首先采集特鋼棒材端面圖像,并采用圖像增強算法和字符分割算法對其進行處理以得到單個字符的圖像,然后對圖像進行歸一化處理并分類存放在不同文件夾中。
2)創(chuàng)建SVM字符分類器,首先遍歷每個文件夾中的字符圖像,創(chuàng)建訓練文件,然后根據(jù)遍歷文件夾的順序設(shè)置字符分類為“0”“1”“2”“3”“4”“5”“6”“7”“8”“9”。
3)訓練SVM字符分類器,選擇RBF核函數(shù),結(jié)合設(shè)置的字符分類和讀取的訓練文件進行分類器的訓練。進行訓練時所選擇的特征為具有灰度值最大縮放的字符圖像的灰度值、圖像的寬高比。
4)保存SVM字符分類器,將訓練完成的相關(guān)數(shù)據(jù)保存,以便用于后續(xù)的字符識別工作。
3.3.3 SVM分類器參數(shù)選擇
選用RBF核函數(shù),RBF核函數(shù)中的參數(shù)δ=0.02。SVM分類器的正則化常數(shù)η的取值對SVM分類器字符識別的準確率的影響也比較大,因此令η取不同的數(shù)值進行分析,從中找到最優(yōu)的取值。采用500張單根特鋼棒材端面圖像進行SVM分類器的訓練,100張單根特鋼棒材端面圖像進行測試。表2為η取不同值時的準確率。
由表2可以看出,識別準確率在η取0.000 1時最高,可達到98.58%,因此最終選擇η的取值為0.000 1。
3.3.4 試驗結(jié)果與評價
采用基于SVM分類器的字符識別方法,對100張成捆特鋼棒材端面圖像進行處理,
準確率為97.35%,圖20為某捆特鋼棒材端面字符識別結(jié)果。成捆特鋼棒材字符識別準確率略低于單根特鋼棒材,經(jīng)過分析發(fā)現(xiàn)其原因在于:成捆特鋼棒材存放時端面不平齊,存在遮擋,使棒材端面光線發(fā)生變化,導致圖像質(zhì)量降低,字符識別成功率也隨之降低。
4 結(jié) 語
通過分析復雜光照條件下特鋼棒材端面圖像的特點,提出了一種成捆特鋼棒材端面字符識別算法。該算法采用基于小波變換的圖像增強算法完成了成捆特鋼棒材端面圖像增強,基于MSER和邊緣檢測算法完成了圖像中字符的檢測,基于投影法將字符圖像分割為單個字符圖像,基于SVM分類器最終完成棒材端面字符識別,字符識別準確率可達到97.35%。將機器視覺技術(shù)融入到特鋼棒材生產(chǎn)過程中,可使特鋼棒材的生產(chǎn)信息實現(xiàn)一一對應(yīng),有助于特鋼棒材生產(chǎn)信息全流程可追溯目標的實現(xiàn),減少由于特鋼棒材生產(chǎn)信息無法查詢而造成的損失。
本文算法的字符識別準確率還存在提升空間,未來研究將把深度學習的相關(guān)理論與方法應(yīng)用于特鋼棒材端面字符圖像的增強和字符識別,進一步提高字符識別準確率,更好地滿足實際生產(chǎn)的需要。
參考文獻/References:
[1] 張付祥,蔡立強,李偉峰,等.成捆圓鋼端面自動貼標系統(tǒng)設(shè)計[J].河北科技大學學報,2016,37(6):601-608.
ZHANG Fuxiang,CAI Liqiang,LI Weifeng,et al.Design of automatic labeling system on the end surfaces of bundles of round steels[J].Journal of Hebei University of Science and Technology,2016,37(6):601-608.
[2] 葛宵燁,郭英軍,孫梓鈞,等.冷軋帶鋼表面缺陷圖像預處理研究[J].河北科技大學學報,2016,37(3):262-267.
GE Xiaoye,GUO Yingjun,SUN Zijun,et al.Study on preprocessing of surface defect images of cold steel strip[J].Journal of Hebei University of Science and Technology,2016,37(3):262-267.
[3] 張付祥,趙陽,黃永建,等.特鋼棒材標記方案設(shè)計與信息碼識別[J].中國冶金,2020,30(3):28-34.
ZHANG Fuxiang,ZHAO Yang,HUANG Yongjian,et al.Marking scheme design and information code recognition of special steel bars[J].China Metallurgy,2020,30(3):28-34.
[4] 王春梅,黃風山,任玉松,等.成排連鑄坯端面中心坐標視覺自動提取方法[J].河北科技大學學報,2018,39(3):268-274.
WANG Chunmei,HUANG Fengshan,REN Yusong,et al.Center-point coordinate vision automatic extraction method for row billet end face[J].Journal of Hebei University of Science and Technology,2018,39(3):268-274.
[5] 杜靜,魏鴻磊,樊雙蛟,等.基于HOUGH變換的指針式壓力表自動識別算法[J].機床與液壓,2020,48(11):70-75.
DU Jing,WEI Honglei,F(xiàn)AN Shuangjiao,et al.Automatic recognition algorithm of pointer pressure gauge based on HOUGH transform[J].Machine Tool & Hydraulics,2020,48(11):70-75.
[6] FENG S,BO L.Low-light color image enhancement based on Retinex[C]//2020 5th International Conference on Automation,Control and Robotics Engineering(CACRE).Dalian:IEEE,2020:570-574.
[7] 蔡秀梅,馬今璐,吳成茂,等.基于模糊同態(tài)濾波的彩色圖像增強算法[J].計算機仿真,2020,37(6):342-346.
CAI Xiumei,MA Jinlu,WU Chengmao,et al.Color image enhancement algorithm based on fuzzy homomorphic filtering[J].Computer Simulation,2020,37(6):342-346.
[8] 徐小來,彭暉,鄔書躍.基于直覺模糊集和直方圖均衡的圖像增強方法[J].電光與控制,2021,28(4):70-72.
XU Xiaolai,PENG Hui,WU Shuyue.Image enhancement based on intuitionistic fuzzy sets and histogram equalization[J].Electronics Optics & Control,2021,28(4):70-72.
[9] QIN Y Y,CUI W,LI Q,et al.Traffic sign image enhancement in low light environment[J].Procedia Computer Science,2019,154:596-602.
[10]MITTAL N,RAJ A,GOYAL H.Enhancement and removal of noise from medical images by wavelet transform method[C]//2019 3rd International Conference on Electronics,Communication and Aerospace Technology (ICECA).Coimbatore:IEEE,2019:1126-1130.
[11]陸濤.基于統(tǒng)計特征分類耦合自適應(yīng)Gamma校正的圖像增強算法[J].電子測量與儀器學報,2020,34(6):154-162.
LU Tao.Image enhancement based on image classification coupled adaptive gamma correction[J].Journal of Electronic Measurement and Instrumentation,2020,34(6):154-162.
[12]JEONG I,LEE C.An optimization-based approach to gamma correction parameter estimation for low-light image enhancement[J].Multimedia Tools and Applications,2021,80(12):18027-18042.
[13]SHARMA A,PANDEY A K,KHICHI D,et al.Methylene diphosphonate bone scan scintigraphic image enhancement using gamma correction and optimizing the value of gamma[J].Indian Journal of Nuclear Medicine,2020,35(1):21-27.
[14]董林鷺,向洋,林國軍,等.一種基于椒鹽噪聲密度的濾波算法[J].四川師范大學學報(自然科學版),2021,44(2):277-284.
DONG Linlu,XIANG Yang,LIN Guojun,et al.A filtering algorithm based on salt and pepper noise density[J].Journal of Sichuan Normal University(Natural Science),2021,44(2):277-284.
[15]KHAYEAT A R H,ABDULMUNEM A A,Al-SHAMMARI R F N,et al.Traffic sign detection and classification based on combination of MSER features and multi-language OCR[J].Webology,2020,17(2):394-403.
[16]王大千,崔榮一,金璟璇.基于視覺關(guān)注模型與多尺度MSER的自然場景文本檢測[J].應(yīng)用科學學報,2020,38(3):496-506.
WANG Daqian,CUI Rongyi,JIN Jingxuan.Text detection in natural scene based on visual attention model and multi-scale MSER[J].Journal of Applied Sciences,2020,38(3):496-506.
[17]AGRAHARI A,GHOSH R.Multi-oriented text detection in natural scene images based on the intersection of MSER with the locally binarized image[J].Procedia Computer Science,2020,171:322-330.
[18]方徐偉,付曉薇.基于投影法和Caffe框架的身份證分割算法[J].計算機工程與應(yīng)用,2017,53(23):113-117.
FANG Xuwei,F(xiàn)U Xiaowei.ID card segmentation based on projection method and Caffe framework[J].Computer Engineering and Applications,2017,53(23):113-117.
[19]祝磊,韓自營,阮宇靜,等.基于機器視覺的輪胎胎面檢測系統(tǒng)設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2018,39(6):1782-1787.
ZHU Lei,HAN Ziying,RUAN Yujing,et al.Design and implementation of tire tread detection system based on machine vision[J].Computer Engineering and Design,2018,39(6):1782-1787.
[20]劉昶,徐超遠,張鑫,等.液晶字符識別的CNN和SVM組合分類器[J].圖學學報,2021,42(1):15-22.
LIU Chang,XU Chaoyuan,ZHANG Xin,et al.A combined classifier based on CNN and SVM for LCD character recognition[J].Journal of Graphics,2021,42(1):15-22.