劉洋++黃欣
摘 要
在網(wǎng)上閱卷系統(tǒng)中,需要將紙質(zhì)的試卷和答題卡掃描成數(shù)字化圖像數(shù)據(jù),以此提取考生答題及其個人的信息特征。本文針對掃描后的數(shù)字化圖像數(shù)據(jù),運用Hough變換,提出一種新的圖像傾斜角檢測算法,以此為基礎(chǔ),對網(wǎng)上閱卷系統(tǒng)進行重新設(shè)計,將系統(tǒng)核心功能分為答題卡圖像信息預(yù)處理和答題卡信息識別兩大模塊。該系統(tǒng)的設(shè)計,能夠有效地降低評卷誤差,提高系統(tǒng)的檢測率,促進了評卷的科學(xué)化和規(guī)范化。
【關(guān)鍵詞】圖像識別 網(wǎng)上閱卷系統(tǒng) 圖像處理技術(shù) Hough變換
1 引言
網(wǎng)上閱卷是借助計算機網(wǎng)絡(luò)技術(shù),將紙質(zhì)的試卷和答題卡通過電子掃描技術(shù)和圖像處理技術(shù)轉(zhuǎn)化為數(shù)字化的形式,呈現(xiàn)給特定的教師進行評閱,已經(jīng)成為高效、準(zhǔn)確、公平的現(xiàn)代化閱卷方式。較之傳統(tǒng)閱卷方式,網(wǎng)上閱卷具有很多優(yōu)點,比如成績“多評制”、全程計算機管理、實時高效監(jiān)控和管理閱卷的質(zhì)量和進度、實現(xiàn)了考試信息的數(shù)字化和閱卷工作的科學(xué)化管理。本文針對掃描后的數(shù)字化圖像數(shù)據(jù),提出了一個新的基于圖像邊緣檢測的傾斜角檢測算法,以此為基礎(chǔ)對網(wǎng)上閱卷系統(tǒng)進行設(shè)計,構(gòu)建了基于圖像識別的網(wǎng)上閱卷系統(tǒng)。
2 相關(guān)技術(shù)
2.1 網(wǎng)上閱卷的核心分析
網(wǎng)上閱卷的流程與傳統(tǒng)閱卷非常相似,有所不同的是需要對圖像化的試卷進行切割處理,以便實現(xiàn)任務(wù)的分發(fā)和指配。其核心流程如圖1所示。
下面對這些核心步驟進行說明:
2.1.1 圖像數(shù)字化
在網(wǎng)上閱卷中,通過網(wǎng)絡(luò)傳輸?shù)氖菙?shù)字化的圖像信息,所以,首先需要借助掃描設(shè)備對紙質(zhì)的考生試卷和答題卡進行掃描,生成數(shù)字化的圖像信息。
2.1.2 圖像預(yù)處理
為了后續(xù)的處理,需要對圖像進行預(yù)處理,包括消除圖像中無關(guān)的信息、增強圖像信息的可檢測性等。
2.1.3 獲取圖像信息
通過對圖像進行分析處理,以確定不同圖像信息代表不同的考試信息數(shù)據(jù)。
2.1.4 信息處理
在上述工作的基礎(chǔ)上,對圖像信息進行加工、匹配、整理,完成圖像信息的處理。
2.1.5 特征提取
通過閱卷系統(tǒng)建立的標(biāo)識信息,從而正確地獲取試卷信息和答題卡信息等之間的對應(yīng),實現(xiàn)圖像信息的特征提取。
2.2 數(shù)字圖像處理
數(shù)字圖像處理是計算機研究領(lǐng)域一個非常重要的內(nèi)容,主要是對圖像進行去噪、增強、復(fù)原等操作所涉及到的具體技術(shù)和方法,其主要目的是提高圖像的視感質(zhì)量、獲取圖像的特殊信息以及圖像的編碼壓縮。在實際應(yīng)用中,數(shù)字圖像處理常用的方法有:圖像編碼壓縮、圖像增強和旋轉(zhuǎn)、圖像分割、和圖像識別等。
3 圖像邊緣檢測算法的設(shè)計
將答題卡通過掃描生成數(shù)字圖像后,數(shù)字圖像或多或少會產(chǎn)生一定角度的傾斜,為了確保后續(xù)工作的正確性,需要對數(shù)字圖像進行傾斜角度檢測和圖像矯正處理。目前,在圖像傾斜角檢測上,應(yīng)用較多的是以Hough變換為基礎(chǔ)的系列優(yōu)化算法,在功能和性能上都有不錯的表現(xiàn)效果。為了最大程度的保證邊緣點的平滑,本節(jié)提出基于圖像邊緣檢測的傾斜檢測算法,以達到優(yōu)化圖像矯正流程的目的,能夠滿足實際應(yīng)用的要求。
3.1 基于圖像邊緣檢測的傾斜檢測研究
本節(jié)在基于垂直邊緣提取的Hough優(yōu)化算法和基于鄰域統(tǒng)計分析的Hough優(yōu)化算法的基礎(chǔ)上,結(jié)合兩種算法的優(yōu)點,實現(xiàn)圖像邊緣的傾斜檢測。
3.1.1 圖像的邊緣檢測
邊緣檢測主要目的是利用導(dǎo)數(shù)及微分的性質(zhì),確定圖像上的一組曲線,即圖像的邊緣,該邊緣是圖像上那些在亮度上急劇變化、中間有間斷的像素點所形成的集合,通過此邊緣可以提取圖像的一些關(guān)鍵信息,比如圖像表面方向的不連續(xù)等,在一定程度上簡化了圖像的處理過程。以答題卡定位區(qū)域為例,如圖2所示。
通過對該區(qū)域的分析就可以判定考生個人信息和其答題區(qū)域。通過對圖像的邊緣進行檢測,可以大大降低計算量,有效彌補基于鄰域統(tǒng)計分析的Hough優(yōu)化算法計算量大的缺點。
3.1.2 圖像的邊緣檢測方法
圖像邊緣檢測的步驟一般包含濾波、增強、檢測、定位。從目前的檢測方法來看,大部分基于圖像亮度之上的導(dǎo)數(shù)計算,以此來判定圖像中的邊緣位置。該方法對于圖像邊緣的檢測跟設(shè)定的閥值有關(guān)系,閥值大小會影響到判定結(jié)果。事實上,邊緣檢測是通過算法來提取圖像中對象和背景間的交界線,通過圖像灰度分布的梯度來獲得邊緣檢測算子。以下是幾種常見的圖像邊緣檢測算子:
(1)Roberts算子:Roberts 算子是一種最簡單的算子,適用于邊緣明顯且噪聲較少的圖像分割,對具有陡峭的低噪聲的圖像效果最好,但處理后結(jié)果邊緣不是很平滑。
(2)Prewitt算子:利用像素點上下、左右鄰點的灰度差,在邊緣處達到極值檢測邊緣,去掉部分偽邊緣,對噪聲具有平滑作用。該算子對噪聲有抑制作用,但對邊緣的定位仍不夠理想。
(3)Sobel算子:是一個離散的一階差分算子,對靠近中心的點加權(quán)以突出邊緣點。該算子通過梯度與差分原理實現(xiàn),用來運算圖像亮度函數(shù)的梯度的近似值。當(dāng)精度要求很高時,該算子提取的圖像輪廓仍然不甚理想。
(4)Canny算子:是一個多階段的優(yōu)化算子,在濾波、增強和檢測方面要優(yōu)于其他的算子,是一種既能抗噪又能保持弱邊緣的算子,但實現(xiàn)起來較為麻煩。
3.2 基于圖像邊緣檢測的傾斜檢測算法
3.2.1 矩形連通域檢測
在檢測圖像的傾斜角度時,需要提取一個典型的定位塊,以此定位塊來分析整個答題卡的傾斜角度。這里采用鄰域跟蹤法識別出一個完整的矩形連通區(qū)域,其工作過程如下:
(1)以從上到下和從左到右的順序以此掃描二值化圖像,這里令起始邊界點為W(x0,y0),以此點為基礎(chǔ)跟蹤下一個邊界點。為了下面描述的方面,這里假定首次跟蹤?quán)徲蚍较驗閐=0。
(2)在W的鄰域內(nèi)判斷是否有跟W同像素的點(這里假定W為黑色像素),如果沒有,調(diào)整跟蹤方向d=(d+1) mod 8,如果有,則該點為下一個邊界點。在跟蹤方向的選定上,如果(d mod 2)==0,則調(diào)整方向d=(d + 6) mod 8;否則,d=(d + 7)mod 8。
(3)重復(fù)步驟(2),直到找到四個矩形邊界點為止,那么該矩形塊就是一個完好的定位塊。
3.3 矩形邊緣Hough檢測
利用Hough變換,能快速實現(xiàn)傾斜角的檢測和圖像矯正。其思想是把圖像平面上的點對應(yīng)到參數(shù)平面上的線,對原始圖像子抽樣處理和邊緣線提取,最后通過統(tǒng)計特性來解決問題。
3.4 圖像傾斜矯正
通過Hough變換找到圖像傾斜角度θ后,就可以進行坐標(biāo)的變換,實現(xiàn)圖像傾斜的矯正。其變換公式為:
4 基于圖像掃描識別的網(wǎng)上閱卷系統(tǒng)的處理流程設(shè)計
作為網(wǎng)上閱卷系統(tǒng)而言,要在短時間內(nèi)實現(xiàn)大批量的閱卷,這對系統(tǒng)要求很高,需要具備準(zhǔn)確性、穩(wěn)定性、可靠性、易用性、實時性和安全性等特征。在功能上,要求對掃描后的數(shù)字化圖像文件進行存儲、切割,以便實現(xiàn)試卷的評閱。本文側(cè)重網(wǎng)上閱卷系統(tǒng)的基礎(chǔ)數(shù)據(jù)收集部分,主要是通過圖像識別完成對掃描后的數(shù)字化圖像數(shù)據(jù)的加工處理,這也是網(wǎng)上閱卷系統(tǒng)的核心。因此,可以將系統(tǒng)分為兩大核心模塊,分別是答題卡圖像信息預(yù)處理和答題卡信息識別,二者在業(yè)務(wù)流程上是相互關(guān)聯(lián)的。在圖像存入緩存后,流程會轉(zhuǎn)向答題卡圖像預(yù)處理,預(yù)處理完成之后才轉(zhuǎn)向答題卡信息識別模塊處理,需要說明的是,二者處理完后都需要進行異常的檢測。
其中,答題卡圖像預(yù)處理包括一系列的過程,比如圖像的灰度化處理、二值化處理、去噪處理和圖像矯正,以增強答題卡圖像特征信息可分辨能力和可提取能力,預(yù)處理的結(jié)果最終得到一幅經(jīng)過Hough變換后的二值化圖像;而答題卡信息識別主要是利用圖像定位技術(shù),根據(jù)答題卡模板中的設(shè)置對答題卡圖像進行區(qū)域分割,以便完成考生基本信息識別、客觀題識別、主觀題識別等操作。
5 結(jié)束語
本文對基于圖像識別的網(wǎng)上閱卷系統(tǒng)進行了設(shè)計,包括算法和系統(tǒng)兩個方面的設(shè)計。通過圖像識別和圖像處理技術(shù),可以準(zhǔn)確地對掃描后的數(shù)字化圖像數(shù)據(jù)進行切割,高效完成答題卡及試卷上不同信息的識別。由于網(wǎng)上閱卷系統(tǒng)主要是對數(shù)字化圖像數(shù)據(jù)進行處理,所以本文運用Hough變換,提出了一種基于圖像邊緣檢測的傾斜角檢測算法,以此為基礎(chǔ)設(shè)計系統(tǒng)的業(yè)務(wù)處理流程。該系統(tǒng)的設(shè)計,使得閱卷工作更加規(guī)范化、制度化、科學(xué)化、現(xiàn)代化,有效提高閱卷的效率和準(zhǔn)確性。
參考文獻
[1]滕今朝,邱杰.利用Hough變換實現(xiàn)直線的快速精確檢測[J].中國圖象圖形學(xué)報,2008(02).
[2]李清.基于圖像識別的網(wǎng)上閱卷系統(tǒng)的設(shè)計實現(xiàn)與優(yōu)化[D].長春:東北師范大學(xué),2013.
[3]張站,劉政怡,吳建國等.基于圖像識別的閱卷系統(tǒng)的設(shè)計與實現(xiàn)[J].微型機與應(yīng)用,2011(04).
[4]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術(shù)[J].山東科技大學(xué)學(xué)報(自然科學(xué)版),2009(03).
作者單位
1.長春工業(yè)大學(xué)信息化建設(shè)工作辦公室 吉林省長春市 130012
2.中國移動通信集團吉林有限公司長春分公司 吉林省長春市 130000