苗智耀 賈翠萍 孫杭雨 李志剛 馮家瑤 梁建賓 張?jiān)娝C
(河北北方學(xué)院信息科學(xué)與工程學(xué)院 河北·張家口 075000)
校園卡實(shí)現(xiàn)了對學(xué)校師生和學(xué)校員工日?;顒?dòng)的集中管理,它是一種包括門禁卡、消費(fèi)卡、多媒體借閱卡等各種功能的卡片。校園卡的使用和普及能給師生帶來很多方便,但是也存在容易丟失、丟失后不易找回的問題,造成了成本的浪費(fèi)。目前的校園卡丟失招領(lǐng)過程存在系統(tǒng)管理困難、人手動(dòng)參與環(huán)節(jié)較多等問題。本文通過MATLAB軟件,實(shí)現(xiàn)了一種基于OCR算法的校園卡卡號識別方法,主要目標(biāo)是自動(dòng)識別卡片中的有效身份信息,并生成文字輸出,以便于實(shí)際信息進(jìn)行對比和驗(yàn)證。
二十世紀(jì)六十年代初期,美國Murray Eden率先提出了一種用于數(shù)字字符識別的識別算法。該算法通過描述由零至九這十個(gè)數(shù)字體現(xiàn)的基本特征出發(fā),為此后數(shù)字以及其他字符的識別研究,奠定了十分堅(jiān)實(shí)的基礎(chǔ)。到二十世紀(jì)七十年代,Parks等多位研究者提出了一種新的多級結(jié)構(gòu)鏈接識別方法以及對拓?fù)浣Y(jié)構(gòu)進(jìn)行特征抽取的辦法,這一方法的提出,在很大程度上提高了數(shù)字字符識別的識別效率和精確率。在我國,專門針對數(shù)字字符識別的研究工作最早開始于20世紀(jì)70年代初。最初把十個(gè)數(shù)字字符識別的算法應(yīng)用到郵政信函分揀系統(tǒng)之中。在此之后的研究中,來自復(fù)旦大學(xué)的研究者們開發(fā)了中國第一臺數(shù)字字符識別的機(jī)器,這臺機(jī)器能做到十分精確地把標(biāo)準(zhǔn)印刷體數(shù)字字符識別出來。與此同時(shí),中國科學(xué)院成功研制出一臺郵政編碼識別樣機(jī),并把樣機(jī)應(yīng)用于信件郵政編碼的識別。經(jīng)過多年的研究與成果的積累,目前我國數(shù)字識別領(lǐng)域已經(jīng)取得了很多突破,并在不斷深入中。
本文通過MATLAB強(qiáng)大的圖像數(shù)字處理功能,采用基于OCR技術(shù)的識別算法,在MATLAB強(qiáng)大的計(jì)算能力基礎(chǔ)上,通過使用MATLAB提供的數(shù)字圖像處理工具箱,完成了校園卡數(shù)字字符信息的提取和識別過程。
在計(jì)算機(jī)中,可以將一幅二維圖像定義為一個(gè)與之對應(yīng)的二維函數(shù),表示為f(x,y),其中(x,y)是平面坐標(biāo)系坐標(biāo),在任意坐標(biāo)(x,y)處的幅度,則被定義為該幅圖像在此坐標(biāo)位置處的對應(yīng)亮度值。由該二維函數(shù)f(x,y)可知,圖像的坐標(biāo)值和亮度變化之間的關(guān)系表示為f。本文的圖像處理方法是基于數(shù)字圖像的方法,因此,首先要把一幅待處理的字符圖像進(jìn)行數(shù)字化處理。對模擬圖像進(jìn)行數(shù)字化處理時(shí),需要將其坐標(biāo)和幅度均進(jìn)行數(shù)字化分析。分析和處理的過程中,把坐標(biāo)值數(shù)字化的過程被稱之為“取樣”,把幅度值數(shù)字化的過程稱之為“量化”。當(dāng)表示圖像的x、y兩個(gè)分量值及幅度值都是有限且離散的量時(shí),稱圖像為數(shù)字圖像。
以下為一種數(shù)字圖像的數(shù)學(xué)表達(dá)方式。坐標(biāo)位置(x,y)=(0,0)被定義為圖像坐標(biāo)原點(diǎn),圖像中沿Y的下一坐標(biāo)位置被記為(x,y)=(0,1),因此(x,y)=(0,1),表示為沿Y軸的第2個(gè)取樣點(diǎn)。圖1表示為圖像數(shù)字化坐標(biāo)表達(dá)方式。
圖1:圖像數(shù)字化坐標(biāo)表達(dá)方式
根據(jù)圖1表示的坐標(biāo)系,可以得到數(shù)字圖像的數(shù)學(xué)表達(dá)方式,如以下公式所示:
光學(xué)字符識別技術(shù),即OCR(Optical Character Recognition)技術(shù),始于1929年,由德國科學(xué)家Tausheck提出的。到20世紀(jì)70年代,我國的研究者開始進(jìn)行漢字字符識別研究工作,直到1986年“863”高新科技研究計(jì)劃的提出把我國的漢字識別研究推向一個(gè)更高的領(lǐng)域,經(jīng)過潛心研究,清華大學(xué)的丁曉青教授和中科院的研究者們陸續(xù)推出了相關(guān)的中文光學(xué)字符識別產(chǎn)品。20世紀(jì)90年代,平臺式掃描儀地進(jìn)入大眾的視野,并被不斷應(yīng)用的生活和生產(chǎn)工作中,使得辦公自動(dòng)化、高效化、智能化過程不斷提升的同時(shí),也大力推動(dòng)了光學(xué)字符識別技術(shù)地進(jìn)一步發(fā)展。使OCR的識別正確率、識別速度滿足了廣大用戶的要求。
從工作流程來看,OCR識別技術(shù)的基本過程如圖2所示:
圖2:OCR技術(shù)路線圖
圖像預(yù)處理,在本文中是指對輸入的字符圖像自身成像問題進(jìn)行預(yù)處理。常見的預(yù)處理過程包括:圖像數(shù)字化、直方圖變換、畸變校正、圖像的幾何變換、圖像增強(qiáng)等。
文字檢測,文字檢測過程即檢測文本內(nèi)容(本文中指數(shù)字字符內(nèi)容)在原始圖像中的布局,以及其所占位置、比例大小等,主要解決要識別的文字在哪里,范圍有多大等問題。
文本識別,即在上一步驟文本檢測的基礎(chǔ)上,對數(shù)字字符內(nèi)容進(jìn)行進(jìn)一步分析,這一步驟中,圖像中的文本信息被識別并輸出為最終所需要的文本信息。文字識別主要解決的是每個(gè)文字代表什么含義的問題。
2.2.1 圖像預(yù)處理
在圖像預(yù)處理過程中,首先讀取原始卡片圖像并顯示原圖,判斷原始圖像是否為RGB圖像,如果是RGB圖像,將其轉(zhuǎn)換為灰度圖并進(jìn)行歸一化處理。加入高斯噪聲后,利用graythresh函數(shù)獲取一個(gè)閾值,將圖像二值化,以便更清晰的凸顯目標(biāo)數(shù)字的輪廓。原始卡片圖像如圖3所示。
圖3:卡片身份數(shù)字信息
圖像處理結(jié)果如圖4所示。包括圖像灰度化、加噪、二值化和去噪結(jié)果。
圖4:圖像處理結(jié)果
2.2.2 卡號識別
校園卡卡號識別過程是通過字符分割函數(shù),將卡片上字符進(jìn)行分割,通過與創(chuàng)建的字符模板進(jìn)行匹配,獲得匹配的數(shù)字字符,最后將各個(gè)匹配結(jié)果進(jìn)行連接,并輸出為文本。
識別過程如圖5所示。
文本輸出結(jié)果如圖6所示。可準(zhǔn)確識別出卡面上的卡號數(shù)字信息和學(xué)號數(shù)字信息,為后續(xù)身份識別提供可靠依據(jù)。
圖5:算法流程圖
圖6:文本輸出結(jié)果
通過基于OCR字符識別技術(shù),將校園卡上的身份信息數(shù)字進(jìn)行分割和識別后再連接,可以得到有效的校園卡身份識別結(jié)果。該方法為進(jìn)一步實(shí)現(xiàn)校園卡的信息管理、丟失找回過等程提供了基礎(chǔ),使得校園卡的使用過程更加方便、安全。