OCR文字識(shí)別系統(tǒng)的應(yīng)用

2019-09-10 04:52王學(xué)梅

現(xiàn)代信息科技 2019年18期

摘 ?要：OCR全稱為Optical Character Recognition，是一種用于識(shí)別圖像和圖形中字符的識(shí)別技術(shù)。其實(shí)現(xiàn)原理是通過如掃描儀或數(shù)碼相機(jī)等電子設(shè)備輸入圖形圖像信息，將圖像信息中的印刷體文字通過相應(yīng)的轉(zhuǎn)換形成一定的字符，并與字符數(shù)據(jù)庫進(jìn)行比對(duì)，最終將標(biāo)準(zhǔn)的文本信息輸出。本文從OCR識(shí)別技術(shù)的發(fā)展和原理入手，結(jié)合EasyPR提供的識(shí)別功能，在移動(dòng)端完成車輛識(shí)別的案例，將圖片中的車牌信息轉(zhuǎn)換成對(duì)應(yīng)的文字以供編輯。

關(guān)鍵詞：OCR文字識(shí)別系統(tǒng);移動(dòng)端;Android

中圖分類號(hào)：TP391.4 ? ? 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：2096-4706（2019）18-0066-03

Abstract：The full name of OCR is Optical Character Recognition，and it is a character recognition technology used to recognize characters in image graphics. Its realization principle is to input graphic and image information through electronic devices such as scanners or digital cameras，convert words in image information into certain characters through corresponding conversion，and compare with character database，and finally output standard text information. This paper starts with the development and principle of OCR recognition technology，combines with the recognition function provided by EasyPR，completes the case of vehicle recognition at the mobile end，and converts the license plate information in the picture into corresponding text for editing.

Keywords：OCR text recognition system;mobile;Android

0 ?引 ?言

隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展，OCR技術(shù)應(yīng)用越來越廣泛，有效地節(jié)省了人力、物力，提高了數(shù)據(jù)的有效性和準(zhǔn)確性，為我們的生活提供了便利，例如高速公路ETC自助通道的車牌自動(dòng)識(shí)別等等。本文從OCR識(shí)別技術(shù)的發(fā)展和原理入手，通過結(jié)合EasyPR提供的識(shí)別功能，在移動(dòng)端完成OCR車輛識(shí)別，將圖片中的車牌信息轉(zhuǎn)換成對(duì)應(yīng)的文字以供編輯的案例，解析了移動(dòng)端文字識(shí)別的過程及原理。

1 ?OCR技術(shù)在我國的發(fā)展

OCR是1929年由德國的科學(xué)家首先提出的概念，研究的初期，多以文字的識(shí)別方法研究為主，且可識(shí)別的文字僅為0至9的數(shù)字。我國在70年代開始進(jìn)行OCR技術(shù)的研究，最終實(shí)現(xiàn)了由數(shù)字、英文字母及符號(hào)的識(shí)別研究到漢字識(shí)別技術(shù)的研究，并通過計(jì)算機(jī)實(shí)現(xiàn)了識(shí)別的功能要求。

20世紀(jì)70年代我國開始對(duì)數(shù)字、英文字母及符號(hào)的識(shí)別進(jìn)行研究，70年代末開始進(jìn)行漢字識(shí)別的研究，到1986年，我國提出了863國家高技術(shù)研究發(fā)展計(jì)劃，使得漢字識(shí)別的研究進(jìn)入一個(gè)實(shí)質(zhì)性的階段，相繼推出了中文OCR產(chǎn)品。由于識(shí)別率及產(chǎn)品化等多方面的因素，早期的OCR軟件未能達(dá)到實(shí)際要求，同時(shí)因硬件設(shè)備成本高，運(yùn)行速度慢，大部分的OCR技術(shù)沒有得到廣泛的應(yīng)用。進(jìn)入20世紀(jì)90年代以后，平臺(tái)式掃描儀的廣泛應(yīng)用，以及我國信息自動(dòng)化和辦公自動(dòng)化的普及，大大推動(dòng)了OCR技術(shù)的進(jìn)一步發(fā)展，使OCR的識(shí)別正確率、識(shí)別速度滿足了廣大用戶的要求。隨著OCR技術(shù)的發(fā)展，各種應(yīng)用系統(tǒng)也相繼出現(xiàn)，比如名片識(shí)別系統(tǒng)、身份證銀行卡識(shí)別系統(tǒng)、車牌識(shí)別系統(tǒng)、銀行票據(jù)識(shí)別系統(tǒng)、增值稅發(fā)票識(shí)別認(rèn)證系統(tǒng)等等。而衡量一個(gè)OCR系統(tǒng)性能好壞的主要指標(biāo)包含拒識(shí)率、誤識(shí)率、識(shí)別速度、用戶界面的友好性以及產(chǎn)品的穩(wěn)定性、易用性及可行性等幾個(gè)方面，目前識(shí)別速度也是一個(gè)OCR性能的一個(gè)重要評(píng)判標(biāo)準(zhǔn)，同時(shí)利用移動(dòng)客戶端進(jìn)行識(shí)別的要求也越來越高。

2 ?OCR技術(shù)的實(shí)現(xiàn)原理

OCR識(shí)別技術(shù)的實(shí)現(xiàn)過程非常復(fù)雜，主要分為圖像輸入、圖像處理、字符切割、特征提取、字符識(shí)別等幾個(gè)流程完成。通過對(duì)OCR技術(shù)的研究分析，將其基本的識(shí)別實(shí)現(xiàn)步驟總結(jié)如下。

2.1 ?獲取圖像

通過電子設(shè)備獲取要識(shí)別的圖像信息，可以是包含印刷體文字的任何圖像，如身份證、銀行卡、駕照、文檔等相關(guān)的內(nèi)容，并將圖像傳輸給要識(shí)別的主體。這里是利用CCD（電荷耦合器件）將文稿的光信號(hào)轉(zhuǎn)換為電信號(hào)，經(jīng)過模擬數(shù)字轉(zhuǎn)換器轉(zhuǎn)化為數(shù)字信號(hào)傳輸給計(jì)算機(jī)。

2.2 ?圖像預(yù)處理

該過程指進(jìn)行文字識(shí)別之前的準(zhǔn)備工作，包括二值化處理、去噪處理以及字符的分割校正等操作。因?yàn)樵谟?jì)算機(jī)中RGB彩色圖像的每個(gè)像素、每種顏色占一個(gè)字節(jié)，占用的內(nèi)存較大，會(huì)影響處理速度，所以首先將圖像進(jìn)行灰度化處理，即將圖像設(shè)置為只有黑色和白色的二值化圖，其中一個(gè)顏色表示圖像背景，一個(gè)顏色表示要識(shí)別的文字。完成了二值化，就可以對(duì)圖像進(jìn)行去噪處理了。在對(duì)圖像進(jìn)行存儲(chǔ)和傳輸?shù)倪^程中會(huì)因?yàn)楦鞣N噪聲的干擾和影響而降低圖像的品質(zhì)，為了獲取高質(zhì)量的數(shù)字圖像，需要對(duì)圖像進(jìn)行降噪處理，即去除數(shù)字圖像中的無用信息，但要保留原始信息的完整性。圖像去噪處理是數(shù)字圖像處理中的重要環(huán)節(jié)和步驟，去噪算法的好壞直接關(guān)系到后續(xù)圖像分割和邊緣檢測處理的效果，一直是圖像處理和計(jì)算機(jī)視覺研究的熱點(diǎn)。在預(yù)處理階段同時(shí)要完成文字的校正工作和文本分割，如對(duì)因拍照產(chǎn)生的文檔圖片傾斜而進(jìn)行的校正，同時(shí)將文檔中的所有文字塊分撿出來，區(qū)分出文本段落及排版順序，以及圖像和表格的區(qū)域，確定各文字塊的區(qū)域，用于識(shí)別。

2.3 ?特征提取與數(shù)據(jù)庫比對(duì)

在完成了圖像的預(yù)處理后，要想計(jì)算機(jī)能夠識(shí)別文字，首先需要將文字的特征信息存儲(chǔ)到計(jì)算機(jī)。特征提取是識(shí)別文字關(guān)鍵的一步，每個(gè)文字通過特征提取來進(jìn)行區(qū)分。對(duì)于數(shù)字和字母類型的字符來說，特征的提取相對(duì)容易，因?yàn)閿?shù)字和字母個(gè)數(shù)有限，屬于小字符集。而漢字的提取相對(duì)比較復(fù)雜，不僅個(gè)數(shù)多，而且漢字的結(jié)構(gòu)復(fù)雜、形近字多。關(guān)于特征提取的研究體現(xiàn)在兩個(gè)方面，一為統(tǒng)計(jì)的特征，如文本區(qū)域內(nèi)的黑色和白色點(diǎn)數(shù)比對(duì)聯(lián)合，形成空間的數(shù)值向量和數(shù)學(xué)模型，用于識(shí)別算法的實(shí)現(xiàn)。二為結(jié)構(gòu)的特征，根據(jù)文字的筆畫特征點(diǎn)及投影信息點(diǎn)的區(qū)域分布進(jìn)行分析，利用相應(yīng)的比對(duì)方法進(jìn)行比對(duì)。目前，大部分的識(shí)別軟件以第二種方法為主。在完成了文本的特征提取后，需要將其與字符的特征數(shù)據(jù)庫中的標(biāo)準(zhǔn)字符進(jìn)行匹配，找出最相近的字符，確定比對(duì)后的文本信息。

3 ?移動(dòng)端OCR系統(tǒng)的設(shè)計(jì)思路

移動(dòng)端OCR識(shí)別技術(shù)簡單來說是通過手機(jī)APP利用計(jì)算機(jī)視覺、圖像處理與模式識(shí)別等方法從圖像中提取相應(yīng)的字符信息。Android平臺(tái)車牌識(shí)別實(shí)現(xiàn)的過程可以簡單為以下幾個(gè)部分：

圖像采集：通過智能手機(jī)攝像頭拍攝車牌圖像。

預(yù)處理：對(duì)圖像進(jìn)行灰度化、二值化、邊緣增強(qiáng)、噪聲過濾、自動(dòng)白平衡、自動(dòng)曝光以及伽馬校正、對(duì)比度調(diào)整等處理。

車牌定位：在經(jīng)過圖像預(yù)處理之后的灰度圖像上進(jìn)行行列掃描，確定車牌區(qū)域，車牌切斜校正。

字符分割：將定位在車牌區(qū)域中的圖像文字分割成單個(gè)字符，精確定位字符的邊界，確定文本區(qū)域。

字符識(shí)別：字符分割完畢后，對(duì)字符進(jìn)行特征提取，將存儲(chǔ)的文字特征信息與特征數(shù)據(jù)庫中的標(biāo)準(zhǔn)字符進(jìn)行比對(duì)，找出最相近的字符。

結(jié)果輸出：將車牌識(shí)別的結(jié)果以文本格式輸出。

本文介紹了以Android Studio為開發(fā)平臺(tái)，基于開源的EasyPR_Android識(shí)別源碼，完成車輛信息識(shí)別的文字識(shí)別系統(tǒng)。其中，EasyPR是基于OpenCV這個(gè)開源庫產(chǎn)生的車輛識(shí)別系統(tǒng)，能夠識(shí)別中文，識(shí)別率較高，目前情況下，字符識(shí)別已經(jīng)可以達(dá)到90%以上的精度。

4 ?移動(dòng)端車輛識(shí)別系統(tǒng)的實(shí)現(xiàn)

4.1 ?系統(tǒng)界面設(shè)計(jì)

在車輛識(shí)別系統(tǒng)的界面中，首先包含3個(gè)組件，分別為：EasyPRPreView（位于com.fosung.libeasypr.view包）、Button和TextView。其中一個(gè)TextView組件用于顯示輸入車牌的信息提示，另一個(gè)TextView組件用于提取顯示車牌的文字信息。APP在運(yùn)行時(shí)，有車牌限定框，在框的范圍內(nèi)進(jìn)行圖像裁剪，人為縮小了識(shí)別范圍，提高了識(shí)別度。其界面效果如圖1所示。

其中部分代碼如下：

<com.fosung.libeasypr.view.EasyPRPreView

android：id="@+id/preView"

android：layout_width="fill_parent"

android：layout_height="match_parent"/>

<Button

android：id="@+id/btnShutter"

android：layout_width="wrap_content"

android：layout_height="wrap_content"

android：layout_alignParentBottom="true"

android：layout_centerHorizontal="true"

android：text="車輛識(shí)別"

android：textSize="16sp"

android：textColor="#FFFFFF"

android：background="@color/colorAccent"/>

<TextView

android：id="@+id/title"

android：layout_width="fill_parent"

android：layout_height="wrap_content"

android：layout_marginTop="20dp"

android：gravity="center"

android：textColor="#FFFFFF"

android：textSize="16dp"

android：text="請(qǐng)將車牌放入框內(nèi)"/>

<TextView

android：id="@+id/infotext"

android：layout_width="fill_parent"

android：layout_height="wrap_content"

android：layout_marginTop="5dp"

android：gravity="center"

android：textColor="#FFFFFF"

android：textSize="18dp"

android：layout_below="@+id/title"/>

設(shè)置完界面后在manifest加入攝像機(jī)權(quán)限

<uses-permission android：name="android.permission.CAMERA" /> 。

4.2 ?車牌識(shí)別功能實(shí)現(xiàn)

在進(jìn)入了識(shí)別的界面后，首先在Activity的onStart（）方法中添加EasyPRPreView的判定并進(jìn)入其onStart（），同時(shí)在Activity的onStop（）方法中添加EasyPRPreView的onStop（），在Activity進(jìn)行銷毀時(shí)，實(shí)現(xiàn)EasyPRPreView的onDestroy（）。部分代碼如：

publicvoidonStart（） {

if（easyPRPreView ！= null） {

easyPRPreView.onStart（）;

}

@Override

publicvoidonDestroy（） {

if（easyPRPreView ！= null） {

easyPRPreView.onDestroy（）;

}

當(dāng)單擊“車輛識(shí)別”按鈕時(shí)，開始識(shí)別，在按鈕的監(jiān)聽事件中添加EasyPRPreView的recognize（）的方法。如：

recBtn.setOnClickListener（new View.OnClickListener （） {

@Override

publicvoidonClick（View view） {

easyPRPreView.recognize（）;//開始識(shí)別

}

}）;

可以根據(jù)識(shí)別過程中的問題及時(shí)進(jìn)行提示，如當(dāng)識(shí)別成功后，可以顯示“識(shí)別成功！”。

5 ?結(jié) ?論

本文從OCR的發(fā)展、實(shí)現(xiàn)原理出發(fā)，簡單介紹了OCR技術(shù)在實(shí)際中的應(yīng)用，同時(shí)以移動(dòng)端車輛識(shí)別系統(tǒng)為例，講解了關(guān)于EasyPR開源系統(tǒng)在Android中的實(shí)現(xiàn)方式，解析了移動(dòng)端文字識(shí)別的過程及原理。

參考文獻(xiàn)：

[1] 郝輝，哈力木拉提·買買提，喬薩礎(chǔ)拉，等.字符識(shí)別研究現(xiàn)狀和發(fā)展趨勢計(jì)量分析 [J].現(xiàn)代電子技術(shù)，2018，41（22）：154-158.

[2] Bradski G，Kaehler A.學(xué)習(xí)OpenCV（中文版） [M].于仕琪，劉瑞禎，譯.北京：清華大學(xué)出版社，2009.

[3] 楊明，李晶.一種新的椒鹽噪聲去除方法 [J].科技視界，2014（25）：111.

[4] 劉明英.檔案數(shù)字化過程中OCR技術(shù)的應(yīng)用分析 [J].中國高新技術(shù)企業(yè)，2017（5）：55-56.

[5] 梁連高.淺析紙質(zhì)文書檔案數(shù)字副本OCR識(shí)別方法 [J].科技與創(chuàng)新，2018（4）：129-130.

[6] OCR識(shí)別移動(dòng)端的實(shí)現(xiàn)與應(yīng)用 [EB/OL].（2018-06-15）.https：//blog.csdn.net/zl18231137982/article/details/80701738.

作者簡介：王學(xué)梅（1979.08-），女，漢族，山東德州人，教師，講師，碩士，研究方向：數(shù)據(jù)庫應(yīng)用、軟件開發(fā)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

OCR文字識(shí)別系統(tǒng)的應(yīng)用