国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)LeNet-5的壓印字符識(shí)別

2022-03-15 10:33:22汪志成何堅(jiān)強(qiáng)翁嘉鑫
計(jì)算機(jī)仿真 2022年2期
關(guān)鍵詞:壓印池化字符

汪志成,何堅(jiān)強(qiáng),翁嘉鑫,苗 榮

(1.江蘇大學(xué)電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212000;2.鹽城工學(xué)院電氣工程學(xué)院,江蘇 鹽城 224000;3.江蘇怡通控制系統(tǒng)有限公司,江蘇 鹽城 224000)

1 引言

在工業(yè)生產(chǎn)中,產(chǎn)品上壓印字符的內(nèi)容承載著產(chǎn)品的重要信息[1]。對(duì)壓印字符采用自動(dòng)化圖像識(shí)別替代人工識(shí)別有助于提高生產(chǎn)線的生產(chǎn)效率、減少人工成本。壓印字符具有立體感,而且器件表面很多場(chǎng)景下并不平整,因此采集的數(shù)據(jù)質(zhì)量與采集的平面字符數(shù)據(jù)質(zhì)量相比有差距,所以識(shí)別難度較大[2]。

對(duì)于二維字符的識(shí)別,研究學(xué)者提出了許多方法[3-4],但是這些方法應(yīng)用到壓印字符識(shí)別領(lǐng)域時(shí),并不滿足預(yù)期,因此在二維字符識(shí)別方法的基礎(chǔ)上需要進(jìn)行一些改進(jìn)。常見的壓印字符識(shí)別方法主要包括基于支持向量機(jī)的方法[5]、基于Gabor濾波器的方法[6]、基于BP神經(jīng)網(wǎng)絡(luò)的方法[7]、基于圓周投影和矢量和的方法[8]。上述方法雖然在壓印字符識(shí)別領(lǐng)域取得了一些進(jìn)展,但是仍存在識(shí)別精度不夠高,實(shí)際應(yīng)用困難等問題。

自2012年卷積神經(jīng)網(wǎng)絡(luò)在ImageNet(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)大賽中取得壓倒性勝利以來,國(guó)內(nèi)外眾多專家學(xué)者對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了研究,因此卷積神經(jīng)網(wǎng)絡(luò)飛速發(fā)展。其中LeNet-5是一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)[9],它被成功地應(yīng)用在手寫數(shù)字識(shí)別領(lǐng)域,自LeNet-5被提出以來,已有多種變形版本被開發(fā)用以解決車牌識(shí)別[10]、交通標(biāo)志識(shí)別[11-12]、人臉識(shí)別[13]、圖像分類[14-16]等任務(wù)。鑒于LeNet-5的強(qiáng)大圖像識(shí)別功能,本文采用LeNet-5對(duì)壓印字符進(jìn)行識(shí)別。為滿足壓印字符識(shí)別對(duì)準(zhǔn)確性、快速性的高要求,對(duì)LeNet-5進(jìn)行了進(jìn)一步的改進(jìn)。

2 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)核心有兩點(diǎn):卷積和池化。

1)卷積層通過卷積核的卷積操作來提取圖像的特征,公式如式(1)所示

(1)

以及Relu函數(shù)的變式。

2)池化層通過池化操作對(duì)特征圖降維。應(yīng)用最廣的池化方式有兩種:平均池化與最大池化。

平均池化公式如式(2)所示

(2)

最大池化公式如式(3)所示

(3)

式(2),(3)中,aavg、amax分別代表平均、最大池化值,K代表池化區(qū)域,avg(·)、max(·)分別代表平均池化函數(shù)和最大池化函數(shù),xij代表池化區(qū)域的第i行、第j列的參數(shù)值。

3 改進(jìn)LeNet-5模型

3.1 傳統(tǒng)LeNet-5模型

LeNet-5網(wǎng)絡(luò)作為卷積神經(jīng)經(jīng)典之一,包含七層結(jié)構(gòu)(主要包括卷積層、池化層、全連接層),被成功的應(yīng)用在支票編碼識(shí)別,對(duì)卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展具有指導(dǎo)作用,現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)中仍然沿用著它的一些構(gòu)想。LeNet-5結(jié)構(gòu)如圖1所示。但是,壓印字符與手寫數(shù)字相比,識(shí)別難度更大,傳統(tǒng)網(wǎng)絡(luò)的輕型結(jié)構(gòu)已經(jīng)不能滿足壓印字符識(shí)別的高要求。

圖1 LeNet-5網(wǎng)絡(luò)基本結(jié)構(gòu)

3.2 改進(jìn)LeNet-5模型

本文提出了改進(jìn)型LeNet-5網(wǎng)絡(luò),其主要包括:

1)采用小卷積核。Szegedy等人[17]在文獻(xiàn)[17]中提出了小卷積核的構(gòu)想,并通過實(shí)驗(yàn)證明其有效性。小卷積核能夠在不影響特征提取的前提下,減少網(wǎng)絡(luò)模型的參數(shù)。

更少的參數(shù)可以帶來更快的訓(xùn)練速度,并且可以提取更多特征,而卷積過程是不斷循環(huán)的,這意味著小卷積核方案在多次運(yùn)算中,可以節(jié)省大量的時(shí)間。表1是兩種卷積核方案的對(duì)比。

表1 卷積核比較

2)嵌入Inception-v2卷積模塊。Christian Szegedy在2014年提出了被稱為Inception的全新卷積結(jié)構(gòu)[19]。本文的方法是使用改進(jìn)型的Inception-v2模塊代替LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)中的第五層C5,加深網(wǎng)絡(luò)寬度,提取更多特征。

1)采用全局平均池化。全連接層能夠?qū)矸e、池化后的特征進(jìn)行“投票”分類,但是它的參數(shù)量巨大,占整個(gè)網(wǎng)絡(luò)模型的十分之八。而2014年Min Lin提出了全局平均池化的概念[18],實(shí)踐證明全局平均池化能夠精簡(jiǎn)網(wǎng)絡(luò)、有效對(duì)整個(gè)網(wǎng)絡(luò)做正則化防止過擬合,因此本文采用全局平均池化代替F6全連接層。

3)采用Relu函數(shù)作為激活函數(shù)。本文采用Relu函數(shù)作為主要激活函數(shù)。Relu函數(shù)的數(shù)學(xué)公式如式(4)所示

(4)

根據(jù)Relu函數(shù)特性可知,Relu函數(shù)在x<0時(shí)硬飽和;當(dāng)x>0時(shí)導(dǎo)數(shù)為1,梯度不衰減。這種特性使Relu函數(shù)具有單側(cè)抑制性,并且使網(wǎng)絡(luò)中的神經(jīng)元具備了稀疏激活性,因此Relu函數(shù)能夠克服Sigmoid函數(shù)的缺點(diǎn),緩解梯度消失問題,加快模型收斂、提高識(shí)別精度。

模型結(jié)構(gòu)如圖2所示,模型參數(shù)如表2所示。

圖2 改進(jìn)LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)圖

表2 改進(jìn)LeNet-5網(wǎng)絡(luò)參數(shù)

4 實(shí)驗(yàn)結(jié)果與分析

4.1 數(shù)據(jù)集預(yù)處理

本文使用的數(shù)據(jù)集是采用大恒工業(yè)相機(jī),在實(shí)驗(yàn)室中采集而來,相機(jī)型號(hào)為MER-500-14GM。因?yàn)閷?shí)驗(yàn)樣品有限,采集的壓印字符圖片樣本不足,為了提高本文網(wǎng)絡(luò)模型的識(shí)別精度,本文采用數(shù)據(jù)增強(qiáng)的方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充。擴(kuò)充后的訓(xùn)練集樣本數(shù)達(dá)到5000張,測(cè)試集樣本數(shù)達(dá)到1000張。數(shù)據(jù)集包含7個(gè)字符,分別是0、1、2、5、7、A、M。

壓印字符表面并不平滑,存在光散射,并且字符與背景顏色相近,因此需要對(duì)原始圖像進(jìn)行預(yù)處理才能得到可靠的數(shù)據(jù)樣本。預(yù)處理的過程包括:灰度增強(qiáng)、二值化、字符分割等。采集的原始?jí)河∽址麍D像如圖3所示。

圖3 原始圖像

4.1.1 灰度增強(qiáng)

因?yàn)榻饘俦砻娲嬖诠馍⑸涞膯栴},因此采集的原始圖像質(zhì)量受到影響,灰度增強(qiáng)的目的是增強(qiáng)圖像的對(duì)比度,突出字符的細(xì)節(jié),提高識(shí)別的成功率。圖4是原始圖像的灰度直方圖。

圖4 灰度分布直方圖

從圖中可以看出圖像的灰度值,并沒有均勻分布,0-75灰度值幾乎為0;75-125存在峰值,灰度值主要集中在這個(gè)區(qū)間;125-250區(qū)間內(nèi)灰度值少量分布,這就造成了壓印字符圖像的模糊,給識(shí)別帶來難度。因此本文將75-255之間的灰度值均勻分布在0-255之間,以此增強(qiáng)原始圖像的質(zhì)量?;叶戎灯骄蟮膱D像如圖5所示。從圖5可以看出,灰度值平均化后,干擾區(qū)域灰度值增加,與字符區(qū)域差異化增大。與原始圖像相比,字符特征變得更加明顯,有利于接下來的處理。

圖5 灰度增強(qiáng)圖片

4.1.2 二值化

在經(jīng)過灰度變換增強(qiáng)后,接下來需要對(duì)圖像二值化,利用字符與干擾區(qū)域的灰度值差異,提取字符特征。本文采用具有自適應(yīng)性的迭代式閾值分割法,對(duì)壓印字符圖片進(jìn)行二值化,得到壓印字符圖像。如圖6所示。

圖6 二值化圖像

4.1.3 字符分割

在得到二值化圖像后,只需要對(duì)圖像進(jìn)行分割便可得到本文的數(shù)據(jù)集,本文采用的是連通域分割法,通過掃描圖中白色區(qū)域確定字符位置。

最終得到的數(shù)據(jù)集部分樣本如圖7所示。

圖7 可視化數(shù)據(jù)集

4.2 實(shí)驗(yàn)環(huán)境與過程

實(shí)驗(yàn)在MATLAB2016a環(huán)境下實(shí)現(xiàn),計(jì)算機(jī)處理器型號(hào)為I5-9600KF,主頻3.7GHz,內(nèi)存為16GB,顯卡為Nvidia1060。

實(shí)驗(yàn)開始之前,統(tǒng)一將圖片的大小轉(zhuǎn)換為32*32,初始學(xué)習(xí)率設(shè)置為0.008,批訓(xùn)練樣本數(shù)batch設(shè)置為100,迭代次數(shù)epoch設(shè)置為500,記錄每次迭代的識(shí)別率并繪制曲線圖。識(shí)別流程如下所示:

1)經(jīng)過預(yù)處理的壓印字符圖片,由Iuput layer輸入,圖片尺寸為32*32。

2)圖片輸入后,進(jìn)入1st layer,該層為卷積層。該層的作用是提取壓印字符的特征。小尺寸卷積核卷積操作后得到6幅特征圖,特征圖尺寸為28*28,再經(jīng)過激活函數(shù)添加非線性特征后輸出。

3)上一層卷積操作得到的特征圖,進(jìn)入2nd Layer。該層是池化層,作用對(duì)輸入特征圖進(jìn)行降維,減少參數(shù)、降低在識(shí)別壓印字符時(shí)發(fā)生過擬合的概率。該層會(huì)輸出6張?zhí)卣鲌D,尺寸為14*14。

4)上一層池化操作得到特征圖,進(jìn)入3rd layer。該層是卷積層,作用與1st layer相似,進(jìn)一步提取壓印字符的特征,從此層開始,壓印字符圖像更加抽象化,如圖8所示,人眼已無法分辨圖像。該層輸出16幅特征圖,尺寸為10*10。

5)上一層得到高度抽象化的16幅特征圖進(jìn)入4th layer。該層也是池化層,作用與2nd laye相同,對(duì)降維圖像降維,最后輸出16幅特征圖,尺寸為5*5。

6)5th layer是Inception-v2模塊層。不同于1st layer和3rd layer的單層卷積結(jié)構(gòu)。Inception-v2層由1*1卷積模塊、3*3池化模塊、3*3卷積模塊、級(jí)聯(lián)3*3卷積模塊組成。Inception-v2各模塊的通道數(shù)分別為24、32、24、64。各模塊操作完成后會(huì)進(jìn)行聚合過程,最終輸出128張?zhí)卣鲌D,尺寸為5*5。

7)經(jīng)過Inception-v2卷積聚合后得到的128幅特征圖,輸入6th layer,該層是池化層。不同于2nd layer和4th layer,該層池化操作是針對(duì)整幅特征圖。池化方式是將5*5特征圖內(nèi)的25個(gè)參數(shù)值求平均值,然后輸出。因此特征圖尺寸降維為1*1,最后輸出128幅1*1的特征圖。

8)網(wǎng)絡(luò)模型的最后一層為Output layer,采用softmax分類器。

部分特征圖可視化如圖8所示。

圖8 部分可視化特征圖

4.3 實(shí)驗(yàn)結(jié)果對(duì)比

4.3.1 改進(jìn)LeNet-5網(wǎng)絡(luò)性能對(duì)比

傳統(tǒng)LeNet-5網(wǎng)絡(luò)模型識(shí)別率曲線如圖9所示。迭代500次,在前50次迭代中,曲線波動(dòng)明顯,識(shí)別率僅達(dá)到約60%,在迭代到100次時(shí)曲線趨于平穩(wěn),識(shí)別率達(dá)到94.2%。

圖9 傳統(tǒng)LeNet-5識(shí)別率曲線圖

將本文的LeNet-5網(wǎng)絡(luò)模型,在同一數(shù)據(jù)集中進(jìn)行訓(xùn)練,迭代500次,識(shí)別率曲線如圖10所示。從圖中可以看出,在前50次迭代中,識(shí)別率快速上升,短時(shí)間內(nèi)達(dá)到約96%。在150次迭代后,識(shí)別率曲線趨于平穩(wěn),達(dá)到98.57%。對(duì)比圖9,10可以看出,相比較于傳統(tǒng)LeNet-5網(wǎng)絡(luò),改進(jìn)后的LeNet-5網(wǎng)絡(luò)的識(shí)別率與收斂速度都有了大幅的提高,證明了本文改進(jìn)LeNet-5網(wǎng)絡(luò)的優(yōu)越性。

圖10 改進(jìn)LeNet-5識(shí)別率曲線

4.3.2 不同學(xué)習(xí)率對(duì)比

表3記錄了不同學(xué)習(xí)率下改進(jìn)LeNet-5網(wǎng)絡(luò)的識(shí)別精度。從表中可以看出,在其它參數(shù)條件不變的情況下,學(xué)習(xí)率對(duì)識(shí)別精度也具有較大影響。本文共實(shí)驗(yàn)了四種學(xué)習(xí)率,可以發(fā)現(xiàn)從0.001開始,識(shí)別精度逐漸提高,但是在0.009時(shí)識(shí)別精度呈現(xiàn)出下降趨勢(shì),因此綜合考慮后本文將網(wǎng)絡(luò)模型的初始學(xué)習(xí)率設(shè)置為0.008。

表3 不同學(xué)習(xí)率對(duì)比

4.3.3 不同算法識(shí)別結(jié)果

表4為3種算法在同一數(shù)據(jù)集下的識(shí)別率對(duì)比。從表中可以看出改進(jìn)的LeNet-5網(wǎng)絡(luò)的識(shí)別率達(dá)到98.57%,與傳統(tǒng)LeNet-5、BP神經(jīng)網(wǎng)絡(luò)相比,識(shí)別率分別獲得了4.37%和3.47%的提升。這證明了本文改進(jìn)方法的有效性,使網(wǎng)絡(luò)具備了更好的識(shí)別、分類能力。

表4 不同方法識(shí)別率對(duì)比

5 結(jié)論

本文針對(duì)傳統(tǒng)網(wǎng)絡(luò)識(shí)別精度不夠的問題,改進(jìn)了LeNet-5網(wǎng)絡(luò),得到了本文網(wǎng)絡(luò)的模型結(jié)構(gòu)以及模型參數(shù)參數(shù)。在本文數(shù)據(jù)集上進(jìn)行多次實(shí)驗(yàn),證明了本文改進(jìn)網(wǎng)絡(luò)的有效性,識(shí)別率達(dá)到98.57%;在不同的學(xué)習(xí)率下進(jìn)行實(shí)驗(yàn),證實(shí)了學(xué)習(xí)率能夠影響網(wǎng)絡(luò)的識(shí)別精度,并找到了適合本文網(wǎng)絡(luò)的學(xué)習(xí)率;與傳統(tǒng)LeNet-5網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)對(duì)比,在參數(shù)減少的情況下,識(shí)別率提高了3到4個(gè)百分點(diǎn),驗(yàn)證了本文網(wǎng)絡(luò)的優(yōu)越性。

猜你喜歡
壓印池化字符
基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識(shí)別方法研究
無線電工程(2024年8期)2024-09-16 00:00:00
基于Sobel算子的池化算法設(shè)計(jì)
尋找更強(qiáng)的字符映射管理器
卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
字符代表幾
一種USB接口字符液晶控制器設(shè)計(jì)
電子制作(2019年19期)2019-11-23 08:41:50
基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識(shí)別研究
消失的殖民村莊和神秘字符
用于寬光譜減反射膜的熱壓印圖形轉(zhuǎn)移的研究
納米壓印光刻技術(shù)
永寿县| 江津市| 敦煌市| 金坛市| 肥乡县| 泗水县| 乌拉特后旗| 全椒县| 噶尔县| 祁门县| 扶绥县| 博湖县| 嵊州市| 临颍县| 望谟县| 洛南县| 金湖县| 封丘县| 肇庆市| 小金县| 镇雄县| 观塘区| 吉木萨尔县| 澎湖县| 红河县| 龙门县| 武义县| 永胜县| 济宁市| 宁明县| 蒙城县| 景谷| 乌拉特中旗| 梁河县| 陈巴尔虎旗| 西乡县| 池州市| 蒙阴县| 蓝山县| 陇川县| 堆龙德庆县|