国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

家用水表字符的識別算法研究

2018-09-12 07:30陳英李磊汪文源徐嘉伯楊豐玉
現(xiàn)代電子技術(shù) 2018年18期
關(guān)鍵詞:自動識別

陳英 李磊 汪文源 徐嘉伯 楊豐玉

摘 要: 針對基于水表圖像的自動抄表,提出滿足實時性要求的水表字符自動識別算法。首先,將真彩色圖像灰度化和標(biāo)準(zhǔn)化處理;然后,通過字符分割得到獨立的單個字符;接著,采用自適應(yīng)閾值的二值化方法將灰度圖像轉(zhuǎn)換為二值圖像,再對圖像進行去噪和兩次位置調(diào)整操作,將字符圖像裁剪為模板大小并將字符提取到圖像中央;最后,對圖像進行細化、特征提取和字符識別。基于三類圖像樣本的實驗結(jié)果表明,該算法整體的字符分割率可達97.33%,整體識別率達到94.00%,平均每幅圖像的處理時間為0.15 s,能滿足實時性要求。

關(guān)鍵詞: 水表字符識別; 字符分割; 自適應(yīng)二值化; 位置調(diào)整; 自動抄表; 自動識別

中圖分類號: TN911?34; TP391.41 文獻標(biāo)識碼: A 文章編號: 1004?373X(2018)18?0099?05

Research on character recognition algorithm for domestic water meter

CHEN Ying, LI Lei, WANG Wenyuan, XU Jiabo, YANG Fengyu

(School of Software, Nanchang Hangkong University, Nanchang 330063, China)

Abstract: A water meter character automatic recognition algorithm that can meet the real?time requirement is proposed for automatic meter reading based on the water meter image. The true color image is grayed and normalized, and then the independent single character is obtained by means of character segmentation. The binarization method based on the adaptive threshold is adopted to convert the gray image into the binary image. Denoising and two times of position adjustment operations are performed for images. Character images are cut into the template size, and characters are extracted into the center of images. Image detailing, feature extraction, and character recognition are conducted. The results of the experiment based on three types of image samples show that the algorithm has an overall character segmentation rate of 97.33%, an overall recognition rate of 94.00%, and an average processing time of 0.15 s for each image, which can meet the real?time requirement.

Keywords: water meter character recognition; character segmentation; adaptive binarization; position adjustment; automatic meter reading; automatic recognition

0 引 言

我國水表查表方式經(jīng)歷了單元總表查表、進戶查表、戶外查表和智能查表[1?2]。隨著移動互聯(lián)網(wǎng)及移動設(shè)備的發(fā)展,尤其是智能手機普及率的增加,利用智能手機對水表拍照及對水表字符進行自動識別的抄表技術(shù)將極大提高工作效率[3?4]。但是家用水表多安裝在光線不好的狹小場景中,所以水表字符的自動識別仍然存在一定的難點。文獻[5]采用基于神經(jīng)網(wǎng)絡(luò)的水表字符識別系統(tǒng),該方法具有較強的分類能力,但識別系統(tǒng)的運行時間較長,同時對先驗知識過分依賴。文獻[6]實現(xiàn)了水表指針表盤圖像的提取、定位及示值的確定。文獻[7]實現(xiàn)了效果比較好的儀表字符分割算法,但魯棒性不夠。文獻[8]只針對特定的一種表型,不具有水表讀數(shù)識別的多樣性,且識別速度不高。文獻[9]在識別半字的過程中提出了滑動模板匹配的方法,解決了半字模板不唯一的問題,但整體算法的運行效率有待提高。徐平等提出了改進的雙半字識別算法[10],從完整雙字符模板中截取雙半字符模板,利用改進的Hausdorff距離模板匹配進行匹配識別,最后通過比較上下半字符的比例確定字符讀數(shù)。林陽等首先利用霍夫變換和放射變換定位水表的字符區(qū)域,然后用投票策略對字符進行分割,最后使用改進的Tesseract OCR識別引擎對字符進行識別[11]。

針對上述文獻存在圖像迭代次數(shù)過多,整體效率不太理想的情況,本文提出時間復(fù)雜度較低,整體運行效率較高,能符合實時性要求的識別算法。

1 水表圖像的預(yù)處理

1.1 字符區(qū)域定位

本文獲取的圖像為24位真彩色圖像,如圖1a)所示,通過預(yù)處理之前,將圖像進行灰度化操作變換為8位的灰度圖像。同時,因為數(shù)字區(qū)域有比較銳利的邊緣,這些邊緣有水平的,也有垂直的,使用Sobel函數(shù)進行水平方向的投影,再進行自適應(yīng)的閾值化,得到水平投影后的效果如圖1b)所示。如圖1c)所示,數(shù)字區(qū)域被投影,但整個表盤也被投影,所以會出現(xiàn)一些干擾,如:表盤的邊緣,這些弧形的輪廓非常大,本文通過第一輪篩選去除這些較大的輪廓,根據(jù)輪廓的外界矩形的面積進行篩選,將面積大于500和小于10的篩選掉,得到結(jié)果如圖1d)所示。

此時,圖像上的白色區(qū)域比較分散,要定位出數(shù)字區(qū)域,需要得到的一整塊的區(qū)域。本文對圖像進行一次膨脹,膨脹的核選用8×3的矩形核。這種核是一種比較扁的核,可以更好地使橫向的線條連接起來,為了不使干擾區(qū)域與數(shù)字區(qū)域連接起來,再用一個較小的3×3的核進行一次腐蝕,得到的效果如圖2a)所示。此時數(shù)字區(qū)域已經(jīng)完全連通在一起,但是圖像上仍然有很多的干擾,需要根據(jù)輪廓的外界矩形的面積以及長寬比來進行第二輪篩選。映射到原始圖像的區(qū)域,即得到待定位的數(shù)字區(qū)域,要識別的數(shù)字字符位于綠色線框所在的水表框內(nèi),其效果如圖2b)所示。

1.2 單個字符分割

在對圖像進行大小標(biāo)準(zhǔn)化后,采用基于固定規(guī)則的靜態(tài)邊界法對字符區(qū)域進行分割,即根據(jù)字符寬度和高度、相鄰字符之間的分布距離等先驗知識對字符區(qū)域進行分割。該算法需要準(zhǔn)確指定字符的起始位置,對于水表這樣固定字體的字符來說是可行的。為了防止分割出的字符圖像的字符不完整,分割時區(qū)域應(yīng)較大些,再通過位置調(diào)整,將字符從背景中提取出來。單個字符分割的效果圖如圖3所示。

1.3 自適應(yīng)二值化

對于圖像的二值化,關(guān)鍵問題是閾值的選擇,本文對每個分割后的單字符采用自適應(yīng)二值化操作。通過觀察發(fā)現(xiàn)大多數(shù)單字符圖像對應(yīng)的灰度直方圖都呈現(xiàn)2~3個波峰,當(dāng)閾值選取第一個波峰后面的波谷時效果最好。步驟如下:

1) 定義一個長度為256的數(shù)組gray,并初始化所有數(shù)組元素為0,記錄圖像中每一個灰度級對應(yīng)的像素點個數(shù)。

2) 讀取一幅灰度圖像,掃描每一個像素點,在每一個像素點的灰度級對應(yīng)的數(shù)組元素位置加1。

3) 遍歷整個gray數(shù)組,通過滑動窗口找出最大值。

4) 找到第一個波峰值后,找其后面的最小值即為最佳閾值。在找到每個分割字符的自適應(yīng)閾值后,自適應(yīng)二值化的結(jié)果如圖4所示。

1.4 第一次位置調(diào)整

1.4.1 左右位置調(diào)整

對整幅圖像進行掃描,記錄圖像白點的列數(shù),當(dāng)列數(shù)達到指定寬度,則認為是目標(biāo)字符。具體可以分為三種情況進行處理:

1) 字符“0~9”:選取以上9個字符的最小寬度20作為閾值。橫向掃描圖像字符的寬度,當(dāng)寬度大于這個閾值且小于新圖像寬度時,認為是以上字符中的一個。如圖5所示,圖5a)中字符“3”,圖5b)為掃描方式效果圖。依次從左向右掃描每一列,掃描到第一條紅線位置時,該列有白色像素點,計數(shù)器開始記錄出現(xiàn)白色像素點的列數(shù),直到掃描到第二條紅線位置時,該列不再出現(xiàn)白色像素點,計數(shù)器和指定的寬度進行比較,此時計數(shù)器大于指定的寬度,認為兩條紅線內(nèi)為字符,將兩條紅線中間的內(nèi)容提取出來得到圖5c)。

2) 字符“1”:其寬度比其他字符要小很多,因此當(dāng)檢測到字符的寬度小于閾值時視為檢測到的字符為“1”。此時,只將圖像兩邊裁剪相同大小,保證裁剪后的寬度與模板寬度一致。如圖5所示,圖5d)中字符“1”,圖5e)為掃描方式效果圖,從左向右每一列進行掃描,記錄連續(xù)出現(xiàn)白色像素點的列數(shù),最大的為圖5e)中兩條紅線對應(yīng)的兩列之間的內(nèi)容,右側(cè)也不再有白色像素點的列,此時計數(shù)器的計數(shù)小于指定的寬度,認為是字符“1”,于是將兩條紅線對應(yīng)的列之間的內(nèi)容居中提取到新的圖像中得到圖5f)。

3) 字符寬度大于新圖像寬度:右位置調(diào)整時還會因為噪聲點的影響,掃描到的寬度大于新圖像寬度,如圖5所示,圖5g)為原圖,圖5h)為當(dāng)掃描到的寬度大于新圖像寬度時會出現(xiàn)覆蓋現(xiàn)象。圖5j)為圖5g)的掃描示意圖,左側(cè)圖為右圖的放大后的圖像,從左向右掃描連續(xù)出現(xiàn)白色像素點的列數(shù)。掃描到第二列時,從上到下掃描該列,出現(xiàn)第一個白色像素點P,則橫向掃描當(dāng)前行,如紅色橫線所示,該行的白色像素點個數(shù)大于新圖像寬度,則認為點P為干擾點,不記錄在當(dāng)前列內(nèi)。依次掃描圖像上剩余點,最后得到左右位置調(diào)整后的圖像見圖5i)。

1.4.2 上下位置調(diào)整

上下位置調(diào)整操作,首先對整幅圖像進行掃描,記錄圖像有白點的行數(shù),當(dāng)行數(shù)達到指定寬度,則認為是目標(biāo)字符,將字符居中保存在新的文件中。針對三種情況的處理過程為:

1) 如圖6a)和圖6b)所示,數(shù)字處于正中央時,將數(shù)字上下兩部分刪去,數(shù)字居中顯示。

2) 如圖6c)和圖6d)所示,數(shù)字偏下時,掃描整幅圖像,選取下方完整數(shù)字,居中保存在新文件中。

3) 如圖6e)和圖6f)所示,數(shù)字偏上時,掃描整幅圖像,選取上方完整數(shù)字,居中保存在新文件中。

1.5 第二次位置調(diào)整

本文使用八鄰域?qū)Χ祷膱D像進行細化處理。字符圖像在經(jīng)過細化后,字符不一定在圖像中央,需再一次執(zhí)行位置調(diào)整操作,將字符區(qū)域提取到圖像中央部分。如圖7所示,圖7a)中字符位于圖像中央,細化后生成圖7b)時字符在整幅圖像中偏下,需要將位置調(diào)整到圖像中央,調(diào)整結(jié)果如圖7c)所示;圖7d)中明顯左上角有一個噪聲點影響,在第一次調(diào)整時無法去除噪聲點,細化后如圖7e)所示,噪聲點范圍明顯縮小,而字符偏右下,因此再次位置調(diào)整,提取出字符置于新圖像中央位置如圖7f)所示。

2 字符特征的提取與識別

經(jīng)過上述方法處理后,得到的字符模板如圖8所示。

采用粗網(wǎng)格特征和穿越次數(shù)特征相結(jié)合作為特征。將字符圖像平均分為25等份,把網(wǎng)格內(nèi)白像素的個數(shù)作為特征,穿越次數(shù)特征是指用水平線或垂直線對字符圖像進行掃描。提取的特征共33維,標(biāo)記為[v={WG1,…,WG25,CYH1,…,CYH4,CYV1,…,CYV4}]。其中:WG為粗網(wǎng)格特征,共25個;CYH為水平方向穿越次數(shù)特征,共4個;CYV為垂直方向穿越次數(shù)特征,共4個。通過特征向量的歐氏距進行識別。

3 實驗結(jié)果及分析

3.1 實驗樣本描述

實驗樣本為不同時間段采集的RGB真彩色圖像,共90幅。本文把圖像分為3類,分別為:

1) 較為理想的圖像(第1類):光照均勻,字符清晰,沒有半字的圖像;

2) 有噪聲的圖像(第2類):光照不均導(dǎo)致存在不同程度噪聲的圖像;

3) 存在半字的圖像(第3類):定義水表讀數(shù)轉(zhuǎn)盤出現(xiàn)進位不完全情況時的圖像。

為了保持實驗樣本的均衡,每類圖像均為30幅,下文中直接用第1類、第2類和第3類表示。硬件環(huán)境為Intel Core i5?3320M CPU @2.60 GHz,內(nèi)存2 GB;軟件為Windows XP(虛擬機)和VC 6.0。

3.2 字符分割率

字符是否被完整分割將直接影響字符識別率,總共為450個字符,而每一類圖像中包含了150個字符。分割率如圖9所示。其中,第1類圖像的分割率最高,達到了100%;第2類圖像的分割率居中,達到了97.33%,這是因為在預(yù)處理階段本文的算法能夠有效地去噪和進行位置調(diào)整;第3類圖像的分割率最低,這是因為在進行橫向掃描時,半字的情況存在一些干擾,但本文在分割該類圖像字符時,字符分割率也達到了94%;整體字符分割率為97.33%。相對于其他兩個算法的對比結(jié)果表明,本文的算法能夠很好地滿足水表字符分割的要求。

3.3 字符識別率

識別率如圖10所示。其中,第1類圖像的識別率達到了99.33%;第2類圖像的識別率達到了94.67%;第3類圖像的識別率為88.00%,為3類圖像識別率最低;整體識別率達到了94.00%。對比圖10結(jié)果表明,雖然本文的識別率相對其他文獻沒有明顯的優(yōu)勢,但是,對比圖11的結(jié)果可以發(fā)現(xiàn),在識別率相當(dāng)?shù)那闆r下,本文算法的識別時間平均要快很多,平均處理一幅水表圖像的時間為0.15 s,符合實時性要求。

4 結(jié) 語

本文從圖像識別技術(shù)方面入手,進行水表字符識別的研究,所做的工作包括:

1) 采集到的圖像。通過加權(quán)平均值法對圖像進行灰度化處理,通過線性縮放將圖像大小歸一化并分割出字符,采用自適應(yīng)算法對圖像進行二值化處理,利用去噪、位置調(diào)整、細化等操作對字符進行提取。

2) 預(yù)處理的圖像。通過粗網(wǎng)格特征和穿越次數(shù)特征相結(jié)合提取特征,再利用模板匹配進行圖像識別。由實驗結(jié)果可以看出,本文的算法能夠滿足水表字符自動識別和實時性的要求。

需要改進和下一步的研究方向包括:進一步提高“半字”現(xiàn)象的識別精度;對于拍攝角度不正的圖像的研究和處理。

參考文獻

[1] 李云棟,孫長慶.基于BP神經(jīng)網(wǎng)絡(luò)的實時水表自動識別系統(tǒng)的研究[J].計算機測量與控制,2013,21(5):1330?1332.

LI Yundong, SUN Changqing. Research on real?time water meter recognition system based on BP neural network [J]. Computer measurement & control, 2013, 21(5): 1330?1332.

[2] 馬婷.基于圖像處理技術(shù)的遠程抄表系統(tǒng)的設(shè)計[D].南京:南京理工大學(xué),2013.

MA Ting. Design of remote meter reading system based on image processing technology [D]. Nanjing: Nanjing University of Science and Technology, 2013.

[3] SAFAEI A, TANG H L, SANEL S, et al. Real?time search?free multiple license plate recognition via likelihood estimation of saliency [J]. Computers & electrical engineering, 2016, 56: 15?29.

[4] ASIF M R, QI C, HUSSAIN S, et al. Multinational vehicle license plate detection in complex backgrounds [J]. Journal of visual communication & image representation, 2017, 46: 176?186.

[5] 林文婭. 基于神經(jīng)網(wǎng)絡(luò)的水表字符識別[D].南京:南京理工大學(xué),2007.

LIN Wenya. Character recognition of water meter based on neural network [D]. Nanjing: Nanjing University of Science and Technology, 2007.

[6] 高元元.圖像處理技術(shù)在自動水表校驗裝置中的應(yīng)用研究[D].南京:南京航空航天大學(xué),2010.

GAO Yuanyuan. Application of image processing technology on automatic water meter calibration device [D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2010.

[7] 劉金清,喻麗春,劉引.儀表字符識別中的圖像處理算法研究[J].湖南城市學(xué)院學(xué)報(自然科學(xué)版),2016(2):91?93.

LIU Jinqing, YU Lichun, LIU Yin. The image processing algorithms of the instrument character recognition [J]. Journal of Human City University (Natural science), 2016(2): 91?93.

[8] 張秋月.基于ANDROID平臺的水表字符識別算法研究[D].杭州:杭州電子科技大學(xué),2014.

ZHANG Qiuyue. Research on recognition algorithm of meter character based on Android platform [D]. Hangzhou: Hangzhou Dianzi University, 2014.

[9] 吳夢麟.圖像式水表讀數(shù)識別方法研究[D].南京:南京理工大學(xué),2006.

WU Menglin. Research on image water meter reading recognition method [D]. Nanjing: Nanjing University of Science and Technology, 2006.

[10] 徐平,許彬,常英杰.雙半字識別算法在水表字符識別系統(tǒng)中的應(yīng)用[J].杭州電子科技大學(xué)學(xué)報(自然科學(xué)版),2016,36(1):80?85.

XU Ping, XU Bin, CHANG Yingjie. Application of improved double half?word recognition method in water character recognition system [J]. Journal of Hangzhou Dianzi University (Natural sciences), 2016, 36(1): 80?85.

[11] 林陽,郭丙軒,肖雄武,等.利用多種投票策略的水表讀數(shù)字符分割與識別[J].科學(xué)技術(shù)與工程,2017,17(10):50?57.

LIN Yang, GUO Bingxuan, XIAO Xiongwu, et al. Water?meter character segmentation and recognition method by using several voting strategies [J]. Science technology and engineering, 2017, 17(10): 50?57.

猜你喜歡
自動識別
中國自動識別技術(shù)協(xié)會
船舶模擬駕駛系統(tǒng)障礙物自動識別方法
基于數(shù)據(jù)挖掘的船舶航跡自動識別系統(tǒng)
太陽黑子自動識別與特征參量自動提取
基于衛(wèi)星遙感圖像的收費站位置自動識別與校核
船舶自動識別系統(tǒng)對船舶救助的影響
基于改進Canny算法的道路標(biāo)線自動識別及定位
自動識別系統(tǒng)
金屬垃圾自動識別回收箱
基于IEC61850的配網(wǎng)終端自動識別技術(shù)