国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于二次網(wǎng)格的字符圖像特征提取方法

2015-03-06 01:31:56方玉玲
電子科技 2015年10期
關(guān)鍵詞:字符識別散度二值

方玉玲,魏 赟

(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)

車牌識別技術(shù)是智能交通系統(tǒng)中的關(guān)鍵技術(shù)之一,廣泛應(yīng)用于交通管制、監(jiān)控系統(tǒng)、停車場管理處、軍事要塞等場所。完整的車牌識別系統(tǒng)技術(shù)核心主要有3 部分:車牌定位、字符分割、字符識別[1-2]。其中,字符識別是整個識別系統(tǒng)的關(guān)鍵部分,直接影響識別系統(tǒng)的好壞。目前,主流的車牌字符識別方法有3 類:(1)模板匹配字符識別算法[3]。該方法實(shí)現(xiàn)方式是通過對樣本與模版進(jìn)行匹配,取相似性最大的樣本為輸入模式所屬類別。但由于所采集的樣本形態(tài)各異,實(shí)際應(yīng)用中經(jīng)常會由于模版的概括能力有限而導(dǎo)致識別錯誤。(2)神經(jīng)網(wǎng)絡(luò)字符識別算法[4-5]。該方法是先對待識別字符進(jìn)行特征提取,然后用所獲得的特征向量來訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類器,通過訓(xùn)練好的分類器將字符識別出來。影響該方法的因素較多,如車牌定位、訓(xùn)練分類器樣本數(shù)量、訓(xùn)練次數(shù)等,都會制約識別速率與準(zhǔn)確率。同時,由于該算法計(jì)算復(fù)雜度較高,難以達(dá)到實(shí)時識別的應(yīng)用目的。(3)多特征字符識別法[6]。該方法先提取出字符相關(guān)結(jié)構(gòu),再經(jīng)分類器進(jìn)行多次分類達(dá)到字符識別的目的。該方法對易混字符有較好的區(qū)分能力,但對相似字符要進(jìn)行多次降維和分類才能達(dá)到準(zhǔn)確區(qū)分的目的,算法復(fù)雜性高,計(jì)算量大。

本文針對不同類型的字符識別問題,充分利用字符關(guān)鍵特征,在二次網(wǎng)格化基礎(chǔ)上依次提取出字符圖像的曲率、占空比、質(zhì)心、散度共4 種特征向量。然后利用C_SVC 類型的SVM 模型,設(shè)置核函數(shù)為線性核,SVM 模型訓(xùn)練之后,即可在高維特征空間中將不同類別的漢字、字母及數(shù)字所映射成的特征向量很好的區(qū)分開,訓(xùn)練生成的分類器在車牌識別過程中有較高的識別準(zhǔn)確率。同時,由于模型的核函數(shù)為線性,分類器識別過程計(jì)算量小,復(fù)雜度低,算法效率更高。通過對大量樣本的實(shí)驗(yàn),該算法在保證快速識別的情況下,相比其他算法,識別的準(zhǔn)確率也有所提高。

1 車牌字符特征提取綜述

字符特征的提取是指從經(jīng)過尺寸歸一化處理的字符二值圖像中提取出字符的關(guān)鍵特征,同時要滿足特征向量的維數(shù)盡可能少,正確分類的精度盡可能高,系統(tǒng)有較高的穩(wěn)定性和魯棒性的要求[7]。一般來說,字符主要有結(jié)構(gòu)特征和統(tǒng)計(jì)特征。結(jié)構(gòu)特征對于筆畫結(jié)構(gòu)上相近的字符易于區(qū)分,缺點(diǎn)是該類特征難于提取,而且實(shí)現(xiàn)起來的魯棒性和抗干擾能力較差;統(tǒng)計(jì)特征是對字符筆畫像素的一種累加。因此,在對一些相似字符的識別能力上不如結(jié)構(gòu)特征,但是其優(yōu)點(diǎn)是抗干擾能力強(qiáng)且足夠穩(wěn)定。

1.1 傳統(tǒng)字符特征提取算法思路分析

(1)基于投影歸一化的字符特征提取方法。該方法實(shí)現(xiàn)的基本思想[2]是先將字符二值圖像轉(zhuǎn)化為一個二維的0-1 矩陣,其中0 代表背景像素點(diǎn),1 代表字符筆畫像素點(diǎn),然后分別對矩陣的行和列進(jìn)行投影生成行投影向量和列投影向量,再對行、列投影向量進(jìn)行維數(shù)歸一化和密度歸一化生成雙投影歸一化特征向量。

外輪廓分布特征,有些字符僅從外部輪廓結(jié)構(gòu)就可區(qū)分出來,如“S”和“I”。以字符“S”為例,如圖1(a)示,按從上到下、從右向左的順序進(jìn)行掃描,每次掃描可獲得一組特征向量;筆畫的斜率特征,把所得斜率值分為正、負(fù)、零值3 類,如圖1(b)示。分別對正、負(fù)斜率值進(jìn)行累加,否則累加零斜率點(diǎn)的數(shù)目。此特征可以較好地表征字符筆畫長短和筆畫形態(tài);拐點(diǎn)幅度特征,在字符識別中,筆畫拐點(diǎn)的數(shù)量和位置與字符識別密切相關(guān)。此處將相鄰斜率值不相等的點(diǎn)定義為拐點(diǎn)并計(jì)算其幅度,如圖1(c)示。此特征是對斜率特征無法完全體現(xiàn)字符筆畫結(jié)構(gòu)特征的補(bǔ)充。

內(nèi)部像素統(tǒng)計(jì)特征,只對字符外圍結(jié)構(gòu)或輪廓特征進(jìn)行提取,容易混淆外部特征相近而內(nèi)部差異大的字符,如“B”和“D”,對于這樣的字符,還要依靠字符內(nèi)部的像素特征來加以區(qū)分,如圖1(d)示,分別統(tǒng)計(jì)字符內(nèi)部不同區(qū)域內(nèi)目標(biāo)像素的個數(shù),得到特征向量。

圖1 組合特征示意圖

該方法在識別相似字符時效果較好。但提取組合特征之前需對字符圖像進(jìn)行細(xì)化處理,由圖2 和圖3可知,經(jīng)細(xì)化后字符圖像與原圖像相比發(fā)生了較大變化,尤其對于相近字符“0”和“D”,經(jīng)細(xì)化后嚴(yán)重影響了識別準(zhǔn)確率。

圖2 原字符“0”和“D”

圖3 細(xì)化字符“0”和“D”的比較

1.2 字符特征提取算法流程

本文提出一種將兩種特征相結(jié)合的特征提取方法,其主要思想是對網(wǎng)格化后的字符圖像按網(wǎng)格順序提取字符筆畫的曲率、使用率、質(zhì)心和散度[8]共4 種組合特征,然后通過建立SVM 模型,設(shè)定SVM 類型與核函數(shù)類型,將要識別的不同字符作為不同的類別,并設(shè)定不同類別的標(biāo)簽,利用對應(yīng)樣本圖像提取出的特征向量進(jìn)行訓(xùn)練,得到的分類器即可用來進(jìn)行字符識別。具體算法流程如圖4 所示。

圖4 本文算法流程圖

1.3 字符圖像預(yù)處理

為了提高字符識別的準(zhǔn)確率和整個車牌識別系統(tǒng)的性能,在提取字符特征之前,還需要將經(jīng)字符分割后的不同分辨率的單個字符進(jìn)行預(yù)處理,得到具有歸一化分辨率的字符圖像。本文中的所有字符均經(jīng)過圖像尺寸歸一化為20×40,即圖像寬為20 個像素,高為40個像素。歸一化處理后的部分字符如表1 所示。

表1 部分經(jīng)尺寸歸一化后字符圖像結(jié)果

1.4 字符圖像網(wǎng)格化

網(wǎng)格化是指將預(yù)處理后的具有統(tǒng)一分辨率的字符二值圖像均勻的劃分為多個子網(wǎng)格區(qū)域,對每一個子區(qū)域進(jìn)行關(guān)鍵特征的提取。提取出的子網(wǎng)格特征體現(xiàn)出了字符筆畫相對于整體的一種分布情況。本文將對字符二值圖像進(jìn)行兩次網(wǎng)格化,分別提取出關(guān)鍵字符特征。

(1)將預(yù)處理后的字符二值圖像均勻的劃分為2×2=4 個子網(wǎng)格,如圖5 所示。

由于實(shí)證分析的被解釋變量是“支付方式”這一虛擬變量,所以本文運(yùn)用Logistic 回歸模型進(jìn)行實(shí)證研究。本文選取的解釋變量(Yi)表示“收購方選擇現(xiàn)金支付方式”。

圖5 歸一化及初次網(wǎng)格化后的字符二值圖像

對初次網(wǎng)格化后的字符二值圖像提取字符筆畫外輪廓的曲率特征。

(2)將預(yù)處理后的字符二值圖像均勻的劃分為8×4=32 個子網(wǎng)格,如圖6 所示。

圖6 歸一化及二次網(wǎng)格化后的字符二值圖像

對二次網(wǎng)格化后的字符二值圖像提取占空比、質(zhì)心、散度共3 組特征向量。以上的關(guān)鍵特征中,曲率和散度反映了字符筆畫的輪廓結(jié)構(gòu),屬于結(jié)構(gòu)特征;占空比和質(zhì)心體現(xiàn)了字符筆畫像素的累計(jì)情況,屬于統(tǒng)計(jì)特征。本文依次對網(wǎng)格化后的二值圖像提取出以上4種特征。這樣每幅字符二值圖像可提取到2×2×1+8×4×3=100 維特征向量。

2 字符特征提取

2.1 曲率

曲線的曲率是針對曲線上某個點(diǎn)的切線方向角對弧長的轉(zhuǎn)動率,表明曲線偏離直線的程度。類似的,斜率在數(shù)學(xué)定義中也是對直線傾斜程度的度量,通過代數(shù)和幾何,可計(jì)算出直線的斜率。

在網(wǎng)格化字符二值圖像中,文中采用斜率的計(jì)算方式來表征曲率,即字符筆畫彎曲情況。根據(jù)前文介紹的斜率提取方法,設(shè)當(dāng)前統(tǒng)計(jì)點(diǎn)為pi+1(xi+1,yi+1),前一統(tǒng)計(jì)點(diǎn)為pi(xi,yi)。則該點(diǎn)處斜率計(jì)算公式為

若所得相鄰統(tǒng)計(jì)點(diǎn)的斜率相等,即ki+1=ki(ki=ki-1),且ki可為任何數(shù)值,則累加具有相同斜率值的像素點(diǎn)的數(shù)目,當(dāng)該累加值超過所在網(wǎng)格中目標(biāo)像素點(diǎn)的一半時,定義該網(wǎng)格內(nèi)特征向量為零向量,表示該網(wǎng)格中字符筆畫為直線,否則定義該網(wǎng)格內(nèi)特征向量為單位向量,表示此網(wǎng)格中字符筆畫為曲線。該特征對于字符筆畫相近的“0”和“D”,“2”和“Z”,“5”和“S”,“8”和“B”等有較好的區(qū)分效果。

2.2 占空比

在網(wǎng)格化字符二值圖像中,占空比是指子網(wǎng)格區(qū)域Bj(j=1,…,32)內(nèi)的目標(biāo)像素的總個數(shù)占該區(qū)域像素總個數(shù)的比率。字符子網(wǎng)格區(qū)域Bj的面積為

該區(qū)域內(nèi)字符像素占空比為

其中,S 為子網(wǎng)格區(qū)域的面積;g(x,y)為點(diǎn)(x,y)處的像素的灰度值,設(shè)目標(biāo)像素的值為1,背景像素的值為0,y1、y2、x1、x2分別為區(qū)域Bj上下左右的邊界值。

2.3 質(zhì)心

質(zhì)心即質(zhì)量的中心,指物質(zhì)系統(tǒng)中被認(rèn)為質(zhì)量集中于此的一個假想點(diǎn)。質(zhì)心的坐標(biāo)可用組成該物質(zhì)的質(zhì)點(diǎn)坐標(biāo)的加權(quán)平均值來表示。設(shè)i 表示物質(zhì)系統(tǒng)中的某一點(diǎn),mi為質(zhì)點(diǎn)i 的質(zhì)量,xi為質(zhì)點(diǎn)i 的坐標(biāo)向量。則質(zhì)心Xm的計(jì)算公式為

在網(wǎng)格化字符二值圖像中,質(zhì)心的位置可用來表示該子網(wǎng)格區(qū)域Bj中字符筆畫整體的偏向位置。在具體的實(shí)現(xiàn)中,將目標(biāo)像素點(diǎn)對應(yīng)的灰度值作為該質(zhì)點(diǎn)的質(zhì)量。設(shè)定目標(biāo)像素的灰度值為1,背景像素的灰度值為0。此處對質(zhì)心的計(jì)算包括豎直方向和水平方向兩種,公式如下。

豎直方向質(zhì)心

水平方向質(zhì)心

區(qū)域Bj的整體質(zhì)心坐標(biāo)

其中,y1、y2、x1、x2分別為子區(qū)域Bj上下左右的邊界值;g(x,y)為坐標(biāo)(x,y)處的像素點(diǎn)的灰度值。

2.4 散度

散度的大小用于表征空間某一點(diǎn)的微小體元內(nèi)的矢量場向外發(fā)散的強(qiáng)弱程度。散度值越大,代表發(fā)散的程度越大,散度值越小,則代表發(fā)散的程度越小。矢量場F 中的某一點(diǎn)P(x,y,z)處的散度是指在一個包含該點(diǎn)的微小體元內(nèi)的通量除以該體元所包含的體積V 得到的結(jié)果在體積V 趨于0 時的極值,散度的計(jì)算公式為

其中,n 為微小體元內(nèi)點(diǎn)P 處的單位法矢量;dS 是積分的面積元。由散度的定義可知,divF 表示在某點(diǎn)處的單位體積內(nèi)散發(fā)出來的矢量場F 的通量,所以divF描述了通量源的密度。從定義中還可以看出,散度是向量場的一種強(qiáng)度性質(zhì),就如同密度、濃度、溫度一致。

在網(wǎng)格化字符二值圖像中,散度值代表各子網(wǎng)格Bj內(nèi)字符筆畫所包含的像素點(diǎn)相對于該區(qū)域中心的發(fā)散程度,即字符筆畫的發(fā)散程度。本文中需計(jì)算豎直和水平方向兩種散度值,公式如下:豎直散度

水平散度

區(qū)域Bj的總體散度值

其中,(X,Y)為子區(qū)域內(nèi)字符筆畫像素點(diǎn)的坐標(biāo)集;y1、y2、x1、x2分別為子區(qū)域Bj在整幅圖像中上下左右的邊界值;yc、xc則為子區(qū)域豎直方向和水平方向的中心值。

3 實(shí)驗(yàn)結(jié)果與分析

將本文算法移植到安卓智能機(jī)上,通過智能機(jī)的攝像頭采集相應(yīng)的圖像,然后用本文算法進(jìn)行識別,結(jié)果如圖7 所示。同時將本文算法與綜述中的算法進(jìn)行對比,使用不同類型的漢字、字母、數(shù)字各1 500 個字符測試集,利用Visual Studio2010+OpenCV 進(jìn)行測試,得到統(tǒng)計(jì)結(jié)果如表2 所示,具體實(shí)驗(yàn)結(jié)果和實(shí)驗(yàn)分析如下。

圖7 本文算法車牌識別示意圖

表2 本文方法與其它方法識別準(zhǔn)確率結(jié)果對比

圖7 中選取6 張具有代表性的識別結(jié)果,便于對比將原始圖像與識別結(jié)果整合到一起,各圖片中上半部分為原始車牌,下半部分為本文方法識別結(jié)果。圖7涵蓋了0 ~9 的所有數(shù)字和一些易混字符,如“8”和“B”、“5”和“S”、“4”和“A”等,很明顯,本文算法所提取的特征向量,在各個類別之間具有很好的區(qū)分能力。

表2 是用本文方法與前文中介紹的其它兩種方法在使用相同SVM 分類器情況下對3 類字符各1 500 副測試樣本進(jìn)行測試的結(jié)果。其中,a 為基于投影歸一化的字符特征提取方法;b 為基于多特征組合的字符特征提取方法;c 為代表本文方法。

結(jié)果表明,本文方法應(yīng)用到字符識別系統(tǒng)中在整體平均識別率上都優(yōu)于其它兩種常用的方法。表2中,方法一對字母和數(shù)字識別率高,但沒有充分考慮漢字的字符結(jié)構(gòu)和筆畫的復(fù)雜性,因而對漢字的識別率降低,僅為78.5%,難以滿足實(shí)際應(yīng)用的需要;方法二能較好地提取出字符的關(guān)鍵特征,但在特征提取前需對字符進(jìn)行細(xì)化處理,易對相似字符造成誤判,嚴(yán)重影響了識別的準(zhǔn)確率。本文算法在常用算法的基礎(chǔ)上,采用互補(bǔ)性強(qiáng)的粗網(wǎng)格化思想對單個字符進(jìn)行分塊,再分別提取子網(wǎng)格區(qū)域的關(guān)鍵特征,最終對字母和數(shù)字的識別準(zhǔn)確率均達(dá)到了97%以上,對漢字的識別率也高于其它兩種方法,能滿足車牌識別的使用需求。

4 結(jié)束語

車牌字符圖像特征提取的方法會直接影響車牌識別系統(tǒng)的整體性能。本文介紹目前常用的字符特征提取方法,為克服常用算法的缺點(diǎn),提高字符識別率,提出一種基于二次網(wǎng)格化的字符特征提取方法,對尺寸歸一化后的字符二值圖像分兩次提取出網(wǎng)格內(nèi)字符筆畫輪廓的曲率特征向量和目標(biāo)像素點(diǎn)的占空比、質(zhì)心和散度共4 種特征向量。該方法兼具統(tǒng)計(jì)特征與結(jié)構(gòu)特征的優(yōu)點(diǎn),具有較強(qiáng)的抗干擾能力且足夠穩(wěn)定。實(shí)驗(yàn)結(jié)果表明,本文方法不僅對字母和數(shù)字具有較高的識別準(zhǔn)確率,同時,對漢字的識別準(zhǔn)確率也高于其它兩種方法,較好地提高了車牌識別系統(tǒng)的性能。

[1] 李宇成,楊光明,王目樹.車牌識別系統(tǒng)中關(guān)鍵技術(shù)的研究[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(27):180-184.

[2] 周治緊,李玉鑑.基于投影歸一化的字符特征提取方法[J].計(jì)算機(jī)工程,2006,32(2):197-199.

[3] Zhu Youqing,Li Cuihua.A recognition method of car license plate characters based on template matching using modified hausdorff distance[C].Changchun:Conference on Control and Electronic Engineering,2010.

[4] 湯茂斌,謝渝平,李就好.基于神經(jīng)網(wǎng)絡(luò)算法的字符識別方法研究[J].微電子學(xué)與計(jì)算機(jī),2009(8):91-97.

[5] Ning Chen,Li Xing.Research of license plate recognition based on improved BP neural network[J].Computer Application and System Modeling,2010(11):482-485.

[6] 羅輝武,唐遠(yuǎn)炎,王翊,等.基于結(jié)構(gòu)特征和灰度特征的車牌字符識別方法[J].計(jì)算機(jī)科學(xué),2011,38(11):267-270.

[7] 何兆成,佘錫偉,余文進(jìn),等.字符多特征提取方法及其在車牌識別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(23):228-231.

[8] 呂文強(qiáng).基于Adaboost 和SVM 的車牌識別方法研究[D].南京:南京理工大學(xué),2013.

猜你喜歡
字符識別散度二值
帶勢加權(quán)散度形式的Grushin型退化橢圓算子的Dirichlet特征值的上下界
混沌偽隨機(jī)二值序列的性能分析方法研究綜述
支持CNN與LSTM的二值權(quán)重神經(jīng)網(wǎng)絡(luò)芯片
具有部分BMO系數(shù)的非散度型拋物方程的Lorentz估計(jì)
基于二值形態(tài)學(xué)算子的軌道圖像分割新算法
H型群上一類散度形算子的特征值估計(jì)
一種改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識別
基于曲率局部二值模式的深度圖像手勢特征提取
H?rmander 向量場上散度型拋物方程弱解的Orlicz估計(jì)
儀表字符識別中的圖像處理算法研究
饶河县| 那曲县| 海安县| 海门市| 林芝县| 平昌县| 乌兰浩特市| 屏东市| 许昌县| 万全县| 东乡县| 屯门区| 乌兰浩特市| 崇州市| 阿合奇县| 定陶县| 荔波县| 唐海县| 柏乡县| 吐鲁番市| 维西| 昭通市| 商洛市| 临沭县| 山阴县| 区。| 太和县| 车险| 嵩明县| 姜堰市| 卓尼县| 合川市| 木兰县| 萨迦县| 海盐县| 自贡市| 白河县| 城固县| 合山市| 光山县| 新民市|