国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多模版匹配的特殊符號(hào)識(shí)別定位算法研究

2021-03-16 13:29曹長(zhǎng)玉鄭佳春黃一琦
關(guān)鍵詞:方塊圓圈括號(hào)

曹長(zhǎng)玉 鄭佳春 黃一琦

(集美大學(xué)廈門市海洋智能終端研發(fā)及應(yīng)用重點(diǎn)實(shí)驗(yàn)室 福建 廈門 361021)

0 引 言

傳統(tǒng)基于人工的試卷批改方式需花費(fèi)教師大量的時(shí)間與精力,大大增加了教學(xué)負(fù)擔(dān)。為節(jié)約教師時(shí)間使其全身心投入到教學(xué)任務(wù)中,機(jī)器自動(dòng)閱卷成為一個(gè)值得研究的課題。然而,手寫答案的精準(zhǔn)定位是成功自動(dòng)閱卷極其重要的關(guān)鍵技術(shù),查閱大量文獻(xiàn)未見(jiàn)有相關(guān)報(bào)道,為此本文展開(kāi)技術(shù)研究。

深度學(xué)習(xí)不但在檢測(cè)與高精度識(shí)別方面得到廣泛應(yīng)用,而且在OCR領(lǐng)域中也占據(jù)主導(dǎo)地位。文獻(xiàn)[1]提出Faster R-CNN網(wǎng)絡(luò)模型,使用RPN(Region Proposal Networks)網(wǎng)絡(luò)生成目標(biāo)候選框,替代了選擇搜索算法[2],由分類定位網(wǎng)絡(luò)對(duì)候選框做分類與定位處理,取得較高的定位精度。文獻(xiàn)[2]提出R-FCN模型,采用卷積層替換Faster R-CNN網(wǎng)絡(luò)中的全連接層,構(gòu)建位置敏感分布得分圖估計(jì)目標(biāo)類別概率,解決了目標(biāo)分類平移不變性與檢測(cè)平移變化的矛盾。文獻(xiàn)[3]提出基于回歸思想的單階段SSD(Single Shot MultiBox Detector)算法,引入SPPNet[4]特征金字塔檢測(cè)定位,實(shí)現(xiàn)不同尺寸目標(biāo)的精準(zhǔn)定位。文獻(xiàn)[5]提出基于回歸思想的YOLO算法,將圖像劃分為S×S個(gè)網(wǎng)格,每個(gè)網(wǎng)格負(fù)責(zé)檢測(cè)目標(biāo)中心落入該網(wǎng)格內(nèi)目標(biāo)的位置及類別,定位速度快。文獻(xiàn)[6]提出CTPN(Connectionist Text Proposal Network)模型,檢測(cè)文本行中的單個(gè)字符,通過(guò)雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)連接單個(gè)字符得到文本行信息。文獻(xiàn)[7]提出RRPN ( Rotation Region Proposal Networks)模型,在Faster R-CNN基礎(chǔ)上通過(guò)旋轉(zhuǎn)anchor框,實(shí)現(xiàn)傾斜字符的檢測(cè)。文獻(xiàn)[8]改進(jìn)SSD算法得到TextBoxes模型,為匹配文本行呈長(zhǎng)方形的特點(diǎn),使用長(zhǎng)方形的卷積核替換傳統(tǒng)正方形的卷積核;為降低網(wǎng)絡(luò)回歸的難度,使用長(zhǎng)寬比較大的錨框,而后使用非極大值抑制算法過(guò)濾冗余的邊界框。文獻(xiàn)[9]提出SegLink模型,將文字檢測(cè)分為兩部分,一部分檢測(cè)文本行中的文字片段,另一部分預(yù)測(cè)文字片段之間的連接關(guān)系,最后通過(guò)深度優(yōu)先搜索結(jié)合算法,把文字片段連接成完整的單詞或文本行。

上述深度學(xué)習(xí)的字符檢測(cè),盡管取得較高的精度,但也存在幾個(gè)主要問(wèn)題:首先,硬件要求高,低平臺(tái)計(jì)算速度慢耗時(shí)嚴(yán)重;其次,深度學(xué)習(xí)檢測(cè)需標(biāo)注試卷中的符號(hào),成千上萬(wàn)張?jiān)嚲硎占щy且符號(hào)標(biāo)注費(fèi)時(shí)費(fèi)力;最后,單個(gè)符號(hào)或文本行在試卷中所占面積比例極小,深度卷積提取特征時(shí)易忽略符號(hào)特征,不能正確定位試卷中的符號(hào)位置,進(jìn)而無(wú)法獲取符號(hào)內(nèi)答案。為此,根據(jù)符號(hào)之間的相似性,本文提出基于OCR[10]多模板匹配方法,該方法對(duì)硬件要求低,且多模板的建立具有保留覆蓋機(jī)制,可以對(duì)任意張?jiān)嚲碇械姆?hào)實(shí)現(xiàn)高精度定位,具有較好的通用性。本文將通過(guò)Tesseract-OCR符號(hào)定位問(wèn)題,引出多模板匹配方法。

1 Tesseract-OCR符號(hào)定位

1.1 OCR定位流程

OCR識(shí)別原理主要包含文本檢測(cè)和文字識(shí)別兩大關(guān)鍵技術(shù)。首先,使用二值化、降噪、畸變校正和圖像增強(qiáng)等方式預(yù)處理輸入圖片;其次,分析預(yù)處理后圖片的版面信息,確定圖中文本的位置區(qū)域,逐行分割文本區(qū)域中的字符,提取字符特征送入分類器;最后,由分類器識(shí)別分割字符,再通過(guò)文本校正校訂識(shí)別字符確保識(shí)別結(jié)果的正確性,生成文本信息。如圖1所示。

圖1 定位流程

1.2 符號(hào)識(shí)別定位

學(xué)生作答試卷在空白區(qū)域留下的點(diǎn)、字跡會(huì)影響Tesseract-OCR識(shí)別定位效果,導(dǎo)致符號(hào)錯(cuò)誤定位數(shù)量增多。因此,使用OCR定位空白試卷的符號(hào),來(lái)消除學(xué)生字跡的影響,提高符號(hào)定位準(zhǔn)確率。但由于OCR缺少特殊符號(hào)語(yǔ)言包,在本文所有實(shí)驗(yàn)均使用中文包,符號(hào)識(shí)別定位如圖2所示。

圖2 符號(hào)識(shí)別定位

通過(guò)深度平滑預(yù)處理輸入的空白試卷,來(lái)消除空白黑點(diǎn)的干擾[11];使用OCR對(duì)預(yù)處理后的試卷圖片按SYMBOL方式進(jìn)行識(shí)別。根據(jù)識(shí)別結(jié)果可知,OCR識(shí)別出的字符包含漢字、數(shù)字和符號(hào)字符等,然而我們僅關(guān)心符號(hào)字符,故需要對(duì)每個(gè)識(shí)別字符做進(jìn)一步的判斷篩選,來(lái)保留符號(hào)識(shí)別結(jié)果及坐標(biāo)。分別設(shè)置圓圈、左括號(hào)、右括號(hào)、方塊判斷條件,若OCR識(shí)別字符置信度閾值大于80且滿足圓圈判斷條件,則將圓圈坐標(biāo)保存于圓圈列表中,其他符號(hào)做類似處理。至此,即可得到符號(hào)在試卷中的位置坐標(biāo)。每個(gè)自然段開(kāi)始時(shí)縮進(jìn)兩個(gè)漢字。

1.3 OCR符號(hào)定位問(wèn)題

使用OCR識(shí)別定位小學(xué)二年級(jí)試卷中的符號(hào)發(fā)現(xiàn)以下問(wèn)題:(1) 符號(hào)漏檢數(shù)量多,OCR自身缺少特殊符號(hào)語(yǔ)言包,使用中文包對(duì)特殊符號(hào)識(shí)別過(guò)程中易將符號(hào)認(rèn)定為圖片而不產(chǎn)生識(shí)別,以致符號(hào)識(shí)別定位準(zhǔn)確率較低。(2) OCR識(shí)別符號(hào)存在錯(cuò)誤,OCR將圓圈符號(hào)(“○”)識(shí)別為括號(hào)的左半邊或右半邊(“(”,“)”)。在符號(hào)識(shí)別條件判斷時(shí),圓圈符號(hào)坐標(biāo)保存于括號(hào)列表中,致使圓圈定位產(chǎn)生漏檢,括號(hào)產(chǎn)生誤檢。(3) 在三種符號(hào)同行緊密排列,OCR字符檢測(cè)過(guò)程的切割算法無(wú)法做到精確切割,識(shí)別效果較差。OCR符號(hào)識(shí)別定位如圖3所示,鑒于識(shí)別定位存在的問(wèn)題,單純使用OCR無(wú)法滿足準(zhǔn)確定位的功能要求。

(a) 試卷正面定位局部效果圖

2 多模板匹配識(shí)別定位

模板匹配[12-13]即用模板圖像在測(cè)試圖片上進(jìn)行滑動(dòng),計(jì)算模板在測(cè)試圖片上的覆蓋區(qū)域與模板的相似程度。若相似程度大于設(shè)定的閾值,則認(rèn)為覆蓋區(qū)域與模板相匹配,以此得到符號(hào)在測(cè)試圖像中的位置。多模板匹配識(shí)別流程如圖4所示。

圖4 多模板匹配識(shí)別流程

為增強(qiáng)方法的通用性及識(shí)別定位的準(zhǔn)確性,每張?jiān)嚲碇械拿糠N符號(hào)需自動(dòng)截取3~6幅子圖像作為模板,建立符號(hào)模板集;使用模板匹配判定方法,計(jì)算模板集中的模板與測(cè)試圖片的相似程度值,該值取值范圍為[0,1],設(shè)定閾值過(guò)濾相似程度較小的符號(hào);模板匹配過(guò)程中每種符號(hào)匹配出多個(gè)位置坐標(biāo),用式(1)非極大值抑制算法(Non-Maximum Suppression,NMS)[1]刪除重疊的坐標(biāo)。

nms=(A∩B)÷(A∪B)

(1)

式中:A、B代表匹配出的位置坐標(biāo)區(qū)域。

2.1 符號(hào)模板集建立

由于OCR能成功定位每張?jiān)嚲碇胁糠址?hào),因此可通過(guò)OCR建立各種符號(hào)的模板集。參考1.2節(jié)OCR識(shí)別定位方法來(lái)得到試卷中部分方塊、圓圈、左右括號(hào)位置坐標(biāo),利用二值圖對(duì)符號(hào)坐標(biāo)進(jìn)行判斷,進(jìn)而截取各個(gè)符號(hào)的多幅不同類型的子圖像建立符號(hào)模板集,如圖5所示。

圖5 建立模板集

1) 輸入整張?jiān)嚲碜鰞刹糠痔幚恚徊糠终{(diào)用1.2節(jié)方法,獲得試卷中部分符號(hào)坐標(biāo);另一部分將試卷圖片轉(zhuǎn)為灰度圖,并通過(guò)式(2)對(duì)灰度圖做二值化處理。

(2)

式中:f(x,y)為灰度圖像在(x,y)處的像素值。

2) 方塊圓圈均為單邊符號(hào)建立模板集方法相同,以方塊為例。首先計(jì)算所有識(shí)別出的方塊的寬與高,根據(jù)經(jīng)驗(yàn)保存寬度介于60~100且高度大于65的方塊(圓圈保存寬度大于60且高度大于60),并按寬從大到小順序排列,用式(3)在二值圖中判斷方塊坐標(biāo)最右側(cè)區(qū)域是否為空白區(qū)域,依次截取寬度最大、寬度居中、寬度最小三幅子圖像作為模板,模板保存名分別為Fang3.jpg、Fang2.jpg、Fang1.jpg。

(3)

式中:x2、y3分別為符號(hào)右下角水平方向及垂直方向坐標(biāo);y1為左上角垂直方向坐標(biāo)。若result=0,則坐標(biāo)最右側(cè)為空白區(qū)域,利用方塊坐標(biāo)從試卷圖像中截取方塊子圖像,建立模板,使用同名模板名覆蓋之前對(duì)應(yīng)的模板;若result≠0,則為非空白區(qū)域,設(shè)置循環(huán)50次,方塊最右側(cè)每次向右移動(dòng)一個(gè)像素點(diǎn),再進(jìn)行空白區(qū)域判斷,截取模板覆蓋此前遺留對(duì)應(yīng)模板。若退出循環(huán)仍未截取模板,則此時(shí)該部使用遺留模板,避免了截取不到模板產(chǎn)生程序報(bào)錯(cuò)問(wèn)題。

3) 左右括號(hào)模板截取方法類似,以左括號(hào)為例。觀察發(fā)現(xiàn)試卷中存在中英文輸入法下輸入的多種括號(hào)類型,不同括號(hào)類型高度有所不同。為成功匹配多種括號(hào)類型,根據(jù)計(jì)算保留寬度20~35且高度大于40的括號(hào),并按高度從大到小排列,左右括號(hào)各截取6幅長(zhǎng)寬比不同的括號(hào)子圖像。用保留左括號(hào)的個(gè)數(shù)除以6得step,每隔step取左括號(hào)坐標(biāo)。設(shè)選取的6個(gè)左括號(hào)高度為[h6,h5,h4,h3,h2,h1],設(shè)置6個(gè)比率[1.3,1.5,1.3,1.2,0.9,0.7],則需將此6個(gè)左括號(hào)右下角水平方向坐標(biāo)分別再向右延伸對(duì)應(yīng)位置的[1.3×h6,1.5×h5,1.3×h4,1.1×h3,0.9×h2,0.7×h1]個(gè)像素點(diǎn)(右括號(hào)則將左上角水平方向坐標(biāo)向左延伸),在二值圖中判斷向右延伸的區(qū)域是否為空白區(qū)域。若為空白區(qū)域,則按調(diào)整后的坐標(biāo)截取括號(hào)模板,使用同名模板名覆蓋之前對(duì)應(yīng)模板;否則跳過(guò),該位置使用遺留模板。

2.2 直線模板集

形態(tài)學(xué)濾波是重要的圖像處理操作,可以消除噪聲、連接斷點(diǎn)像素和分割圖像等,其中,腐蝕、膨脹、開(kāi)運(yùn)算與閉運(yùn)算是最為常見(jiàn)的形態(tài)學(xué)運(yùn)算。設(shè)背景色像素值為0,二值圖為F(x,y),結(jié)構(gòu)元素B(x′,y′),形態(tài)學(xué)定義運(yùn)算如下[14-15]:

腐蝕運(yùn)算:結(jié)構(gòu)元素B(x′,y′)對(duì)二值圖F(x,y)腐蝕運(yùn)算表達(dá)式(FΘB)(x,y)如下:

(FΘB)(x,y)=min{F(x+x′,y+y′)-B(x′,y′)|

(x+x′,y+y′)∈DF,(x′,y′)∈DB}

(4)

膨脹運(yùn)算:結(jié)構(gòu)元素B(x′,y′)對(duì)二值圖F(x,y)膨脹運(yùn)算表達(dá)式(F⊕B)(x,y)如下:

(F⊕B)(x,y)=max{F(x-x′,y-y′)+B(x′,y′)|

(x+x′,y+y′)∈DF,(x′,y′)∈DB}

(5)

式中:DF與DB分別是F(x,y)和B(x′,y′)的定義域。

開(kāi)運(yùn)算:結(jié)構(gòu)元素B(x′,y′)對(duì)二值圖F(x,y)開(kāi)運(yùn)算表達(dá)式F°B如式(6)所示,經(jīng)過(guò)開(kāi)運(yùn)算,可以除去二值圖中孤立的小點(diǎn),使二值圖更加光滑。

F°B=(FΘB)⊕B

(6)

閉運(yùn)算:結(jié)構(gòu)元素B(x′,y′)對(duì)二值圖F(x,y)閉運(yùn)算表達(dá)式F·B如式(7)所示,經(jīng)過(guò)閉運(yùn)算可以填平黑洞,連接斷點(diǎn),使二值圖中目標(biāo)更加完整。

F·B=(F⊕B)ΘB

(7)

輸入試卷經(jīng)式(2)二值處理后,再經(jīng)閉運(yùn)算處理后得到新的二值圖src_img,使用findContours函數(shù)查找src_img目標(biāo)輪廓。經(jīng)實(shí)驗(yàn)驗(yàn)證,直線高度小于5、寬度大于70。因此,設(shè)置判斷條件,保留輪廓高度小于5、寬度大于70的輪廓坐標(biāo),此坐標(biāo)即為試卷中直線位置所在。將直線按照寬度從大到小順序排列,用式(3)依次選取寬度最大、寬大居中、寬度最小三個(gè)直線子圖像建立直線模板集,使用同名模板名覆蓋保留上一步模板。

2.3 模板匹配判定方法

為減少計(jì)算負(fù)擔(dān),輸入圖像與模板圖像在灰度圖[16]下,采用基于歸一化相關(guān)系數(shù)匹配法求輸入圖像與模板圖像庫(kù)的匹配程度,如式(8)所示,數(shù)值越大匹配度越高,結(jié)果越可靠。設(shè)置閾值為0.8,過(guò)濾較小的符號(hào)區(qū)域坐標(biāo)。

(8)

式中:T(x′,y′)表示模板圖像(x′,y′)處的像素值;I(x′,y′)為待匹配圖像I(x+x′,y+y′)處像素值;I(x+x′,y+y′)為模板圖像在待匹配圖像(x,y)位置進(jìn)行匹配。

3 實(shí) 驗(yàn)

3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

本文所有實(shí)驗(yàn)在Ubuntu 18.04系統(tǒng)進(jìn)行,在Pycharm開(kāi)發(fā)環(huán)境下使用Python 3.6編寫測(cè)試代碼,使用Inter Core i7-4790 CPU@3.60 GHz×8處理器執(zhí)行計(jì)算。實(shí)驗(yàn)主要使用39張小學(xué)二年級(jí)不同階段試卷(試卷在排版、字體格式、清晰度等上有所不同),驗(yàn)證OCR建立符號(hào)模板集及查找輪廓建立直線模板集的多模板匹配算法。

3.2 實(shí)驗(yàn)設(shè)計(jì)

首先,輸入試卷做兩部分處理,一部分轉(zhuǎn)為灰度圖,用于后續(xù)模板匹配,對(duì)應(yīng)灰度模板匹配判定方法,另一部分使用2.1節(jié)與2.2節(jié)方法,生成多個(gè)方塊、圓圈、括號(hào)、直線模板,并將生成的符號(hào)模板轉(zhuǎn)為灰度圖;其次,采用2.3節(jié)模板匹配判定方法,匹配試卷中的符號(hào)。雖設(shè)置閾值0.8過(guò)濾相關(guān)系數(shù)較小的符號(hào),但試卷中同一符號(hào)仍保留多個(gè)相關(guān)程度較高的符號(hào)坐標(biāo),則用NMS算法過(guò)濾重復(fù)多余的坐標(biāo),每個(gè)符號(hào)有且僅保留一個(gè)。方塊圓圈直線過(guò)濾后即可得到純凈的坐標(biāo),而匹配的左括號(hào)、右括號(hào)經(jīng)過(guò)濾后,仍需做括號(hào)對(duì)的判斷及寬度調(diào)整。

括號(hào)對(duì)的判斷分為兩種情況:(1) 當(dāng)左右括號(hào)數(shù)量不相等時(shí),通過(guò)NMS判斷左右兩框是否相交。若相交則表示左右括號(hào)為同一對(duì)括號(hào),即可通過(guò)右括號(hào)坐標(biāo)減去左括號(hào)坐標(biāo)得到括號(hào)對(duì)的真實(shí)寬度,使用此寬度調(diào)整左括號(hào)坐標(biāo),并過(guò)濾右括號(hào)坐標(biāo);若無(wú)相交則使用所用成功配對(duì)括號(hào)寬度的平均值進(jìn)行左右括號(hào)寬度的調(diào)整。(2) 當(dāng)左右括號(hào)數(shù)量相等時(shí),將左右括號(hào)根據(jù)左上角坐標(biāo)按行從上到下、從左到右排列,即可成功找出所有括號(hào)對(duì),使用右括號(hào)坐標(biāo)減去其位置之前與之相鄰的左括號(hào)坐標(biāo)即可得到括號(hào)的真實(shí)寬度,使用此寬度調(diào)整左括號(hào)坐標(biāo),并過(guò)濾右括號(hào)坐標(biāo),如圖6所示。

圖6 符號(hào)混合定位

3.3 結(jié)果分析

為驗(yàn)證提出算法的有效性,每種符號(hào)分別使用OCR建立單模板法(OCRST)與OCR建立多模板法(OCRMT)測(cè)試試卷,實(shí)驗(yàn)結(jié)果如表1、表2所示。實(shí)際數(shù)代表需在符號(hào)內(nèi)填答案的個(gè)數(shù),正確數(shù)為正確檢測(cè)符號(hào)的數(shù)量,誤檢數(shù)為錯(cuò)誤定位符號(hào)的個(gè)數(shù)。使用準(zhǔn)確率、精確度、召回率對(duì)算法進(jìn)行評(píng)價(jià),計(jì)算方法如下:

準(zhǔn)確率=正確數(shù)/(實(shí)際數(shù)+誤檢數(shù))精確度=正確數(shù)/(正確數(shù)+誤檢數(shù))召回率=正確數(shù)/實(shí)際數(shù)

(9)

特殊符號(hào)誤檢主要發(fā)生于題干中,題干中存在的符號(hào)僅為提示作用并不需要作答;直線誤檢主要發(fā)生于表格中,行線與直線的相似程度較高故被定位。然而,雖然使用多模板大大提高直線的召回率,但其準(zhǔn)確率相對(duì)較低,經(jīng)測(cè)試發(fā)現(xiàn)在二值圖中查找直線輪廓,而后設(shè)置判斷條件篩選輪廓,直線定位準(zhǔn)確率可達(dá)96%。OCRMT較OCRST優(yōu)勢(shì)為可獲取不同類型的模板,較大限度提高正確數(shù),但同時(shí)也提高了誤檢的可能性。兩者相對(duì)而言,正確數(shù)的增加占據(jù)主導(dǎo)作用,提高了符號(hào)定位的準(zhǔn)確率、精確度與召回率。OCRMT定位效果如圖7所示。

(a) 正面定位局部效果圖

3.4 算法對(duì)比

計(jì)算OCRMT定位方塊、圓圈、括號(hào)的平均準(zhǔn)確率,將其與Tesseract-OCR、FCN、TextBoxes等不同檢測(cè)定位方法[8,9,17-20]進(jìn)行比較,結(jié)果如表3所示。

表3 不同算法比較 %

可以看出,本文提出的OCRMT定位試卷中的特殊符號(hào)有著較高的準(zhǔn)確率,其他一些深度學(xué)習(xí)方法定位字符或文本行時(shí),準(zhǔn)確率最高為74.4%。然而,單個(gè)符號(hào)在文本行及試卷中所占面積極小,深度卷積由于提取不到較小目標(biāo)特征,在定位試卷中符號(hào)時(shí),往往有著更低的準(zhǔn)確率。此外,在時(shí)間上效果較優(yōu)的深度學(xué)習(xí)SSTD法使用TITAN X GPU加速計(jì)算,每秒可處理7.7幀圖像,而本文使用CPU計(jì)算每幀耗時(shí)約10 s,但由于GPU加速計(jì)算能力遠(yuǎn)超CPU,所以本文提出的多模板匹配相對(duì)深度學(xué)習(xí)方法在準(zhǔn)確率與速度上占有一定的優(yōu)勢(shì)。

3.5 答案定位

以上得到空白試卷中所有方塊、圓圈、括號(hào)、直線的坐標(biāo),由于空白試卷與學(xué)生作答試卷在掃描過(guò)程中出現(xiàn)偏差,造成二者掃描圖片大小不一致,導(dǎo)致作答試卷中特殊符號(hào)及直線位置出現(xiàn)一定的偏移。此外,考慮到后續(xù)答案識(shí)別模塊的設(shè)計(jì)及識(shí)別計(jì)算量,提取學(xué)生答案時(shí)應(yīng)盡量減少空白區(qū)域的干擾。對(duì)學(xué)生的作答試卷做二值化處理,求出空白試卷符號(hào)坐標(biāo)的中心點(diǎn);將中心點(diǎn)映射于答卷二值圖中,在二值圖中向上下左右四個(gè)方向進(jìn)行掃描,直至四個(gè)方向全部掃描不到黑色像素點(diǎn),記錄此時(shí)的位置,即可得到答案在試卷中左上角及右下角坐標(biāo)。

3.6 分析討論

題干中非答題區(qū)域的方塊、圓圈、括號(hào)與作答題目中方塊、圓圈、括號(hào)相同,使用OCR獲取符號(hào)多模板匹配易定位出題干中非答題區(qū)域的方塊、圓圈、括號(hào),針對(duì)此問(wèn)題有兩種解決方案。(1) 題干中的特殊符號(hào)僅作為提示作用,并無(wú)實(shí)在意義,出卷時(shí)可使用漢字替代,以提高符號(hào)識(shí)別定位的準(zhǔn)確率;(2) 在知道試卷每題的區(qū)域及答案數(shù)量的前提下,通過(guò)逆序排列定位出符號(hào)坐標(biāo),再選取與答案數(shù)量對(duì)應(yīng)的符號(hào)坐標(biāo),可排除題干中符號(hào)的干擾,同時(shí)也可利用每題區(qū)域消除表格對(duì)直線的影響。另外,試卷中存在中英文輸入法下輸入的多種符號(hào)類型,本文為提高特殊符號(hào)識(shí)別定位的準(zhǔn)確率,使用OCR獲取多模板方式,但同時(shí)也增加了時(shí)間負(fù)擔(dān)。保持試卷中特殊符號(hào)的統(tǒng)一性、規(guī)范性,有利于保證特殊符號(hào)識(shí)別定位的準(zhǔn)確率和穩(wěn)定性,同時(shí)也可減少模板的使用,整體降低運(yùn)行時(shí)間。

4 結(jié) 語(yǔ)

基于深度學(xué)習(xí)的檢測(cè)方法定位準(zhǔn)確率低且硬件要求高,難以滿足實(shí)際應(yīng)用需求。為解決試卷智能批閱場(chǎng)景中答案定位關(guān)鍵問(wèn)題,本文提出的多模板匹配法,方塊圓圈括號(hào)的平均識(shí)別定位準(zhǔn)確率為94.5%,直線定位準(zhǔn)確率為87.8%,對(duì)于定位作答試卷截取手寫答案識(shí)別具有重要意義。獲取多模板方法具備的通用性,可實(shí)現(xiàn)任意張?jiān)嚲碇蟹?hào)的高精度定位。同時(shí)減少題干中特殊符號(hào)的個(gè)數(shù)及保持試卷特殊符號(hào)的規(guī)范性與統(tǒng)一性,不僅能提高符號(hào)識(shí)別定位的準(zhǔn)確率,而且也可通過(guò)減少模板個(gè)數(shù)來(lái)降低運(yùn)行時(shí)間。在接下來(lái)研究中,將通過(guò)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)獲取分類器,識(shí)別作答試卷符號(hào)內(nèi)答案,完成試卷的智能批閱。

猜你喜歡
方塊圓圈括號(hào)
有多少個(gè)方塊
行為判斷
行為判斷
How to Make Emoticons
“入”與“人”
謎題方塊
圓圈填數(shù)
選出括號(hào)內(nèi)正確的字
有序數(shù)方塊
主謂一致對(duì)比練習(xí)