国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺議車(chē)牌識(shí)別中字符的特征提取方法

2009-11-04 08:04
科技傳播 2009年18期
關(guān)鍵詞:車(chē)牌識(shí)別提取字符

陳 輝

摘要 本文對(duì)車(chē)牌識(shí)別中的字符的結(jié)構(gòu)特征提取方法和統(tǒng)計(jì)特征提取方法做了概述,并對(duì)二者進(jìn)行了比較,分析其二者各自的利弊。

關(guān)鍵詞 車(chē)牌識(shí)別;字符;提取

中圖分類號(hào) U491文獻(xiàn)標(biāo)識(shí)碼 A文章編號(hào) 1674-6708(2009)05-0035-02

0引言

字符識(shí)別的特征提取主要有結(jié)構(gòu)特征提取方法和統(tǒng)計(jì)特征提取方法兩種方法。車(chē)牌字符,包括漢字、英文和數(shù)字,有其特殊的結(jié)構(gòu)特征,如筆畫(huà)、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)等等,這些結(jié)構(gòu)特征可區(qū)別性強(qiáng)、穩(wěn)定性好,可以作為特征用來(lái)進(jìn)行分類。這種以字符圖像的自身結(jié)構(gòu)作為提取特征,與設(shè)定好的模板進(jìn)行相關(guān)計(jì)算,得到與字符相似度最大的模板,從而判斷其所屬的類別,稱為結(jié)構(gòu)特征提取方法。另外一種方法是統(tǒng)計(jì)特征提取方法,這種方法,需要對(duì)整個(gè)字符圖像進(jìn)行變換,在大量訓(xùn)練集樣本中估計(jì)統(tǒng)計(jì)特征的分類情況、設(shè)定分類器,然后根據(jù)識(shí)別器的分類曲面進(jìn)行分類判別。

1字符的結(jié)構(gòu)特征提取方法

結(jié)構(gòu)特征提取方法的基本思想是把字符圖像分割簡(jiǎn)化為若干基元,如筆畫(huà)、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)等,與模板對(duì)比,觀察必要的基元是否存在,不可以有的基元是否出現(xiàn),從而判斷所屬的類別。在字符識(shí)別的早期,這種方法得到了廣泛的應(yīng)用,如何得到以基元表示的結(jié)構(gòu)信息是結(jié)構(gòu)特征提取方法的重點(diǎn)。目前為止,主要有根據(jù)骨架、輪廓和筆畫(huà)得到結(jié)構(gòu)基元的方法。在這里面,最常使用的是將字符細(xì)化得到骨架作為結(jié)構(gòu)基元。

中軸變換(medial axis transform,MAT)是一種用來(lái)確定物體骨架的細(xì)化技術(shù),中軸變換具有邊界B的區(qū)域R的MAT是這樣確定的。對(duì)每個(gè)R中的點(diǎn)P,我們?cè)贐中搜尋與它最近的點(diǎn),如果對(duì)P能找到多于一個(gè)這樣的點(diǎn)(即有2個(gè)或以上的B中的點(diǎn)與P同時(shí)最近),就可認(rèn)為P屬于R的中線或骨架,或者說(shuō)P是1個(gè)骨架點(diǎn)。理論上講,每個(gè)骨架點(diǎn)保持了其與邊界距離最小的性質(zhì),所以如果用以每個(gè)骨架點(diǎn)為中心的圓的集合,就可以恢復(fù)出原始的區(qū)域來(lái)。具體就是以每個(gè)骨架點(diǎn)為圓心,以前述最小距離為半徑作圓周。它們的包絡(luò)就構(gòu)成了區(qū)域的邊界,填充圓周就得到區(qū)域?;蛘咭悦總€(gè)骨架點(diǎn)為圓心,以所有小于和等于最小距離的長(zhǎng)度為半徑作圓,這些圓的并集就覆蓋了整個(gè)區(qū)域。

圖1是一些區(qū)域和它們的用歐氏距離算出的骨架。由圖(a)和圖(b)可知,對(duì)較細(xì)長(zhǎng)的物體其骨架常能提供較多的形狀信息,而對(duì)較粗短的物體則骨架提供的信息較少。注意,有時(shí)用骨架表示區(qū)域受噪聲的影響較大,例如比較圖(c)和圖(d),其中圖(d)中的區(qū)域與圖(c)中區(qū)域只有一點(diǎn)兒差別(可認(rèn)為由噪聲產(chǎn)生),但兩者的骨架相差很大。

基于骨架的結(jié)構(gòu)特征提取方法,在保持字符特征的基礎(chǔ)上,大大簡(jiǎn)化了字符的表達(dá),減少了字符的信息量,但它也有自身的缺點(diǎn),它過(guò)多的依賴于圖像的細(xì)化質(zhì)量。當(dāng)圖像中有墨點(diǎn)或粘連的框線時(shí)細(xì)化常常會(huì)產(chǎn)生拓?fù)浣Y(jié)構(gòu)上的變化。

輪廓可以反映字符圖像的結(jié)構(gòu),提取方法簡(jiǎn)單,結(jié)果確定,是一種較好的數(shù)據(jù)信息源。輪廓提取的方法,是在提取字符骨架的基礎(chǔ)上掏空內(nèi)部點(diǎn),我們首先按從上往下,從左往右的順序找到其第一個(gè)黑點(diǎn),也就是0點(diǎn),然后找其點(diǎn)的各方位的點(diǎn),每個(gè)點(diǎn)都與0點(diǎn)相比較,如果所有值都相等,那么這個(gè)點(diǎn)就為此圖的內(nèi)部點(diǎn),就去掉此點(diǎn)信息,將此點(diǎn)的值設(shè)為1,然后重新尋找新的內(nèi)部點(diǎn),如果不是所有的都相等,那么直接尋找下一個(gè)點(diǎn)信息。輪廓相對(duì)于骨架,帶入了更精確的位置,也節(jié)省了細(xì)化的運(yùn)算量,但它易受到筆畫(huà)寬度和斷線的影響。并且預(yù)先設(shè)定的規(guī)則中有很多涉及位置參數(shù),適于質(zhì)量較好的圖像。

另外,字符的局部筆畫(huà)特征是很重要的標(biāo)志性特征??捎糜趨^(qū)分“由”與“田”,“于” 和“干”的局部差異。

結(jié)構(gòu)特征提取方法的缺點(diǎn)在于難以擺脫字體變形及噪聲的影響。字體變形對(duì)結(jié)構(gòu)的影響幾乎無(wú)規(guī)律可循,因而容易造成規(guī)則庫(kù)的片面性。即使能夠得到較為全面的規(guī)則庫(kù),也存在規(guī)則的靈活應(yīng)用問(wèn)題,這些問(wèn)題嚴(yán)重影響系統(tǒng)性能。因此,僅靠模板的機(jī)械性匹配句法和規(guī)則的推理方法是遠(yuǎn)遠(yuǎn)不夠的。

2字符的統(tǒng)計(jì)特征提取方法

統(tǒng)計(jì)特征提取方法是通過(guò)選取同一類字符中相對(duì)穩(wěn)定的分類性能好的共有統(tǒng)計(jì)特征作為特征向量,包括字符的位置特征、筆畫(huà)特征、水平投影直方圖和垂直方向投影直方圖特征、矩特征等等。字符經(jīng)過(guò)頻域變換或其它變換后得到統(tǒng)計(jì)特征,然后在大量訓(xùn)練集樣本中估計(jì)統(tǒng)計(jì)特征的分類情況,設(shè)定分類器,最后根據(jù)識(shí)別器的分類曲面進(jìn)行分類判別。大量字符的統(tǒng)計(jì)特征經(jīng)過(guò)提取和分類后形成關(guān)于字符原型知識(shí),構(gòu)成識(shí)別字符的模板信息,存儲(chǔ)在識(shí)別系統(tǒng)中。在識(shí)別時(shí)首先提取相同的統(tǒng)計(jì)特征,然后與識(shí)別系統(tǒng)存儲(chǔ)的字符原型知識(shí)匹配比較,根據(jù)比較結(jié)果確定字符的最終分類。

統(tǒng)計(jì)特征包括全局特征和局部特征。全局特征包括字符歐拉數(shù)特征、外圍輪廓特征、方向鏈碼、周邊面積等,局部特征包括網(wǎng)格特征、線段梯度、線段方向長(zhǎng)度、筆畫(huà)密度等。全局特征對(duì)平移和旋轉(zhuǎn)具有不變性,對(duì)局部變化不敏感,抗干擾能力強(qiáng),但容易忽視某些重要的局部信息無(wú)法正確區(qū)分相似字,計(jì)算代價(jià)也較大;局部特征區(qū)分相似字的能力較強(qiáng),但是無(wú)法適應(yīng)不同的書(shū)寫(xiě)風(fēng)格。

3結(jié)構(gòu)方法和統(tǒng)計(jì)方法的比較

結(jié)構(gòu)方法和統(tǒng)計(jì)方法各有利弊,結(jié)構(gòu)方法的優(yōu)點(diǎn)是對(duì)細(xì)節(jié)的變化比較敏感,能夠較好的分辨出結(jié)構(gòu)上的細(xì)微的差別,在區(qū)分字形相近,結(jié)構(gòu)上有細(xì)微差別的字符時(shí),通常會(huì)比較有效。缺點(diǎn)是魯棒性較差,對(duì)噪聲比較敏感,容易受到干擾,而且由于對(duì)字符結(jié)構(gòu)特征的描述要占用大量的存儲(chǔ)資源,因此,算法在實(shí)現(xiàn)上相對(duì)復(fù)雜、識(shí)別速度也比較慢。統(tǒng)計(jì)方法的優(yōu)點(diǎn)是對(duì)噪聲不敏感,有較好的魯棒性和穩(wěn)定性,缺點(diǎn)是對(duì)細(xì)節(jié)上的細(xì)微差別反映不靈敏,不能很好地區(qū)分字與字之間的一些細(xì)節(jié)上的差異,無(wú)法對(duì)字符進(jìn)行細(xì)分類。在實(shí)際的應(yīng)用中,我們應(yīng)該結(jié)合結(jié)構(gòu)方法和特征方法的優(yōu)點(diǎn),特征提取在保證系統(tǒng)識(shí)別的穩(wěn)定性和準(zhǔn)確率的同時(shí),也要兼顧好系統(tǒng)的識(shí)別速度和處理時(shí)間,處理好速度和識(shí)別率之間矛盾。

猜你喜歡
車(chē)牌識(shí)別提取字符
尋找更強(qiáng)的字符映射管理器
字符代表幾
一種USB接口字符液晶控制器設(shè)計(jì)
消失的殖民村莊和神秘字符
土壤樣品中農(nóng)藥殘留前處理方法的研究進(jìn)展
中學(xué)生開(kāi)展DNA“細(xì)”提取的實(shí)踐初探
基于支持向量機(jī)的車(chē)牌字符識(shí)別方法
淺析城市老街巷景觀本土設(shè)計(jì)元素的提取與置換
車(chē)牌識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
蝦蛄殼中甲殼素的提取工藝探究