劉昕宇
(南寧市第三中學(xué),廣西南寧,530000)
隨著科學(xué)技術(shù)的發(fā)展,人工智能中的圖像識(shí)別技術(shù)已被廣泛應(yīng)用于人類生活中[1]。人工智能中的圖像識(shí)別技術(shù)已成為信息技術(shù)發(fā)展的重要標(biāo)志,在信息發(fā)展中占有重要地位。圖像技術(shù)作為重要的發(fā)展研究項(xiàng)目引入工業(yè)智能,科學(xué)科學(xué)研究中國對(duì)未來發(fā)展有著良好的期待[2-3]。智能圖像識(shí)別技術(shù)融入工作中,智能圖像識(shí)別技術(shù)正處于中國科技時(shí)代,在快速發(fā)展的同時(shí),也必須關(guān)注智能圖像識(shí)別技術(shù)的技術(shù)原理和生活中圖像識(shí)別技術(shù)的應(yīng)用[4-5]。人工智能圖像識(shí)別技術(shù)的關(guān)鍵要素是圖像模式識(shí)別,模式識(shí)別不僅是圖像識(shí)別原理的重要組成部分,也是人工智能技術(shù)的組成部分[6]。模式識(shí)別主要應(yīng)用于處理不同類型的平面和立體圖像以實(shí)現(xiàn)圖像和實(shí)體分析的圖像處理技術(shù)。由于圖像識(shí)別技術(shù)主要使用人工智能來協(xié)調(diào)虛擬物體的分析與模式識(shí)別,物體的分析不再需要面對(duì)真實(shí)的物體,人工智能和模式識(shí)別可以使圖像立體化[7-8]。
機(jī)器視覺技術(shù)當(dāng)下應(yīng)用廣泛,其包含計(jì)算機(jī)科學(xué),人工智能、電子信息等[9]。它通過相關(guān)設(shè)備將攝取的目標(biāo)轉(zhuǎn)換成圖像,再由專門的圖像處理系統(tǒng)進(jìn)行分析,從而得到數(shù)字信號(hào)指揮現(xiàn)場設(shè)備進(jìn)行運(yùn)轉(zhuǎn)。其不僅能很好的模擬人眼視覺,且能執(zhí)行人類無法完成的高精度任務(wù)[10]。
糾錯(cuò),顧名思義,是將錯(cuò)誤的題目重新糾正,便于之后復(fù)習(xí)時(shí)能更快找到之前出錯(cuò)的題目,以防止相同的錯(cuò)誤重復(fù)出現(xiàn)。糾錯(cuò)過程中,需要學(xué)生將待糾錯(cuò)的題目謄抄到筆記本上,并且有時(shí)候還需要摘抄部分的參考答案。因此,在糾錯(cuò)過程中會(huì)產(chǎn)生大量需要抄寫的字符。得益于糾錯(cuò)的方便快捷,可以隨意記錄錯(cuò)題與筆記,隨時(shí)隨地都可以復(fù)習(xí),以及其較強(qiáng)的可操作性、效率高等優(yōu)勢,糾錯(cuò)開始成為一種主流的學(xué)習(xí)方法。
當(dāng)前,中學(xué)生的學(xué)習(xí)開始趨于追求更高效、更方便的學(xué)習(xí)方式、學(xué)習(xí)方法,糾錯(cuò)慢慢為大多數(shù)的中學(xué)生和老師青睞。而在糾錯(cuò)的過程中,大學(xué)多數(shù)的學(xué)生面臨著同樣一個(gè)問題:進(jìn)行糾錯(cuò)時(shí)需要摘抄題目,而題目常常配有大量文字和符號(hào),摘抄時(shí)費(fèi)事費(fèi)力,而且容易抄錯(cuò)??梢栽谡瓡r(shí)極大限度地解放雙手并且進(jìn)一步提高效率,能方便學(xué)生的學(xué)習(xí)和人們的日常工作。目前,國內(nèi)許多辦公軟件和手機(jī)系統(tǒng)附帶有文字識(shí)別功能。諸如此類的軟件一般較好地完成對(duì)清晰、干凈、簡單資料的文字識(shí)別,并將其轉(zhuǎn)換成為電子版。但是,一旦出現(xiàn)大量文字和符號(hào)時(shí),對(duì)于結(jié)構(gòu)復(fù)雜、生僻字以及特殊符號(hào)等的識(shí)別速度和準(zhǔn)確的便大大降低,甚至?xí)霈F(xiàn)亂碼。而機(jī)器視覺的題目符號(hào)智能識(shí)別系統(tǒng)能提高識(shí)別的準(zhǔn)確度和穩(wěn)定性,提高字符識(shí)別質(zhì)量。
因此,提出了一種機(jī)器視覺的題目符號(hào)智能識(shí)別系統(tǒng),該系統(tǒng)能夠較好的進(jìn)行題目符號(hào)的識(shí)別,并且正確率高,穩(wěn)定性強(qiáng)。
該系統(tǒng)主要包含硬件和軟件兩個(gè)部分,其主要工作的原理是:首先,當(dāng)圖像傳感器被激發(fā)之后,會(huì)向相機(jī)發(fā)出指令,相機(jī)接到指令后,進(jìn)行圖像的采集,即題目字符等圖像的采集,采集結(jié)束之后,圖像會(huì)被送到題目字符檢測系統(tǒng),系統(tǒng)通過所開發(fā)的題目字符信息特征識(shí)別算法完成對(duì)題目字符的自動(dòng)識(shí)別和檢測。系統(tǒng)框架圖如圖1所示。
圖1 系統(tǒng)框架圖
針對(duì)待測字符的特點(diǎn),本次研究我選取了MER-201-25GM工業(yè)相機(jī),它的幀率為20fps,由于彩色圖像的灰度值相差較大,處理起來比較麻煩,所以我采用了黑白的工業(yè)相機(jī),它能夠快速的對(duì)字符進(jìn)行識(shí)別檢測。
圖2 工業(yè)相機(jī)
型號(hào)為MER- 2 01 - 25GM的工業(yè)相機(jī)的感光曲線特性圖如圖3所示。
圖3 感光曲線特性圖
鏡頭方面我選擇了型號(hào)為AFT-0614MP的100萬像素的工業(yè)鏡頭,因?yàn)樗鶞y字符位置為平面,該鏡頭能夠更好的滿足要求。圖4為研究所用工業(yè)鏡頭。
圖4 鏡頭
如圖5是型號(hào)為AFT-0614MP的100萬像素的面陣工業(yè)相機(jī)的MFT曲線特性圖。
圖5 MFT曲線特性圖
攝影是光的藝術(shù),由于拍攝環(huán)境的不同,為了保證拍攝需求,需要使用光源來保證拍攝環(huán)境。由于紙張表面光滑且反光,所以此次研究我選擇了條形紅光光源來配合圖像采集。它的燈帶角度為45°,能夠較好的抑制從紙面反射光,獲得高質(zhì)量的圖像。同時(shí)它也能夠使拍攝周圍的光照環(huán)境更符合要求。
圖6 條形光源
傳感器是一種檢測裝置,能夠?qū)⒔邮盏降男畔?,轉(zhuǎn)換成電信號(hào),在題目字符識(shí)別系統(tǒng)中,使用了采集觸發(fā)傳感器和圖像處理器,能夠?qū)⒔邮艿淖址盘?hào)進(jìn)行處理。各傳感器的選型及參數(shù)如表1所示。
表1 硬件型號(hào)與參數(shù)
軟件處理部分如圖7所示,主要工作流程是:傳感器接收到信號(hào)之后,相機(jī)開始采集圖像,并將采集之后的圖像進(jìn)行預(yù)處理,輸入到字符識(shí)別檢測系統(tǒng),系統(tǒng)在進(jìn)行完一系列工作之后,輸出顯示結(jié)果。
圖7 軟件框架圖
研究所用系統(tǒng)是基于軟件開發(fā)平臺(tái),結(jié)合OpenCv開發(fā)的不同學(xué)科不同題目類型的多種題目符號(hào)融合的圖像處理算法嵌入在題目符合智能識(shí)別系統(tǒng)里面。通過該系統(tǒng),我們可以對(duì)多種題目符號(hào)融合的試卷題目進(jìn)行實(shí)時(shí)信息采集,首先設(shè)置好相關(guān)的參數(shù),然后再打開相機(jī)進(jìn)行實(shí)時(shí)的圖像采集,采集后的圖片經(jīng)過處理后被輸送到字符檢測系統(tǒng)中,字符檢測系統(tǒng)將處理之后的結(jié)果顯示在操作界面上。
圖8 顯示界面
能夠快速實(shí)時(shí)的對(duì)多種字符符合融合的題目符號(hào)進(jìn)行識(shí)別和檢測,并將識(shí)別檢測結(jié)果實(shí)時(shí)反饋到控制端,輔助進(jìn)行糾錯(cuò),顯得尤為重要。無論是數(shù)學(xué)學(xué)科的題目,還是物理等其他學(xué)科的題目,都會(huì)有2種或2種以上的字符符合融合而成,這些因素都會(huì)給檢測帶來一定的難度?,F(xiàn)利用系統(tǒng)來識(shí)別兩批相同數(shù)量的題目符合圖像,在相同環(huán)境的情況下進(jìn)行對(duì)比試驗(yàn)如表2所示。
表2 試驗(yàn)數(shù)據(jù)
系統(tǒng)識(shí)別了兩批相同數(shù)量的50張題目符合圖像,然后在同樣的環(huán)境下進(jìn)行了6組識(shí)別試驗(yàn),從表中數(shù)據(jù)可知,識(shí)別一批的誤檢率大致在4.0%內(nèi),比較穩(wěn)定,識(shí)別二批的誤檢率在8.0%以內(nèi),且比較穩(wěn)定。識(shí)別所用時(shí)間在110s以內(nèi),識(shí)別效率較高。
此次研究,我設(shè)計(jì)出了一款基于機(jī)器視覺的字符智能識(shí)別系統(tǒng),該系統(tǒng)能夠針對(duì)不同學(xué)科多種字符進(jìn)行識(shí)別檢測,展現(xiàn)了較好的性能。軟件系統(tǒng)識(shí)別檢測所用時(shí)間均在110s以內(nèi),且誤檢率在8%以內(nèi)。表明該檢測系統(tǒng)可以高效、實(shí)時(shí)的完成對(duì)不同學(xué)科、多種字符符合融合下的題目符合特征的識(shí)別和檢測。實(shí)際推廣應(yīng)用價(jià)值大,市場前景廣闊。