徐光達
摘 要:在掃描技術迅速發(fā)展的當今,筆者想利用這個技術為小學教師的父母減輕工作負擔,初步形成了一個關于掃描識別數(shù)字,達到快速統(tǒng)計分數(shù)的目的。雖然科技含量不是很高,但是該設想有著很強的實用性和操作性,希望能夠在進一步的研究中,該產品能夠得到使用,獲得社會利用價值。
關鍵詞:掃描技術;OCR;教學工作;實用
一、例舉掃描技術在當今教育領域中的運用
作為當今計算機技術中發(fā)展迅猛的一個分支,掃描技術以不同的形式在各個方面的應用逐漸趨向成熟,在支付、云技術和新興的生物識別領域中貢獻良多。同時,隨著多媒體教學的普及,掃描技術因其便捷和規(guī)?;牟僮鲀?yōu)勢,在教育領域迎合了考試中批量閱卷的需求,最終主要促進了電子閱卷系統(tǒng)的不斷革新。然而由于個體需求少而單調,掃描僅僅在中考、高考等大型考試的閱卷中得到規(guī)?;倪\用,整體上卻并未對教育創(chuàng)新提供深遠的技術支持。
而另一方面,談及掃描技術在教育方面的影響,“猿題庫”和“學霸君”等智能搜題軟件卻以一種非傳統(tǒng)的方式成為了典型例子:隨著現(xiàn)在學生日均作業(yè)練習量的不斷增大,不同學科各類題目的答案和解析逐漸成為了普遍的需求。因此為了適應市場的需要,類似“猿題庫”的一批專門提供練習答案解析的軟件才應運而生。在創(chuàng)建初期,其面臨的主要問題即是如何匹配實體紙張上的題目與電子答案,而隨著新興人工智能技術的高速發(fā)展,這個問題最終迎刃而解。
智能搜題軟件的核心科技及“匹配問題”的解決措施正是廣泛應用于人工智能領域的光學字符識別技術(OCR)和深度學習技術(DL)。在軟件開發(fā)初期,如何向電腦輸入題干信息是“匹配問題”的一個重要部分,由于題干中多含特殊運算符號、代號或者各類專有名詞,且題干本身普遍字數(shù)較多,為了方便地輸入這些繁雜的信息,搜題軟件最終選擇把這塊“燙手山芋”扔給電腦處理:直接將整個題干拍照上傳而不是嘗試逐字逐句地鍵入。而電腦能夠以高效率處理這些信息,很大程度上受益于OCR和DL的應用。
二、掃描技術在小學教師群體中的需求
高中學生心智發(fā)展較為健全,在課時練習的批改中大多采用學生自行批改訂正的方式,而初等學校中多媒體應用普及程度較低,學生因年齡較小心智發(fā)展較不健全而無法對練習進行自行批改訂正,導致初等學校中教師的工作量增大,而掃描儀的使用并不能很好地適應基礎教育對于作業(yè)練習多變、靈活的素質教育需要而普及率低,教師個體難以使用。因此,掃描技術在初高等學校中供求不平衡是其在教育方面發(fā)展受限的重要原因。
三、“閱卷掃描儀”的設計構思
(一)產品的設計源泉
近日,筆者于某知名商城內購物時,注意到結算柜臺通過掃描商品條形碼計算購物總價的細節(jié),收銀員不斷使用柜臺機機械地重復著掃碼的動作,使筆者聯(lián)想到閱卷時老師類似的重復批改、計算總分的行為,頓覺有極大的相似之處。筆者意識到,以現(xiàn)在的科技水平,完全可以將條形碼掃描儀的技術延伸到平常的人工批卷閱卷上,通過識別實體紙張上老師留下的負分標記和簡單的代數(shù)運算,完成批卷中最為繁瑣的算分過程,提高人工閱卷的效率。
(二)產品的工作原理
經過細致的考慮和資料的搜集,筆者大致形成了一個“閱卷掃描儀”的概念模型,并整理出了以下數(shù)個主要方面:
工作原理:“閱卷掃描儀”初步被設定為一款手機軟件,其工作原理主要參考、借鑒并結合了柜臺收銀機和智能搜題軟件的功能特點。在進行閱卷時:首先,在獲取設備權限的情況下通過使用設備攝像頭拍攝圖片捕獲紙張上所需的信息,并通過簡單的光學技術對捕獲圖片的對比度、亮度等進行預處理;其次,裝載OCR的程序開始對圖片進行再處理并通過字符輪廓辨別出教師的手寫字體和試卷原件的印刷字體;接著裝載DL的程序通過已有資源或從服務器下載資源對OCR識別中可能存在的錯誤信息進行識別、修正并確認最終識別負分情況;最后,裝載運算函數(shù)的程序讀取來自OCR和DL識別結果的對應數(shù)據(jù),并通過簡單運算得出全卷總分。
(三)進階設置
由于其位于智能手機這種個人移動終端,其方便靈活的極大操作優(yōu)勢和利于拓展的功能特點,“手機軟件”是“閱卷掃描儀”極其理想的發(fā)展方向??紤]到深度學習技術對于云技術和網(wǎng)絡連接的依賴,“閱卷掃描儀”無疑可以以此為優(yōu)勢發(fā)展出一系列的衍生產品。通過類比“猿題庫”等智能搜題軟件在識別試卷中不同字體的功能,“閱卷掃描儀”本質上僅僅是將智能搜題軟件的識別對象反轉,由原來的“識別印刷字體”變?yōu)椤白R別書寫字體”,便可以基本完成協(xié)助批卷閱卷的任務。然而,仍有許多技術方面的問題需要攻關。
(四)產品的技術限制
首先,雖然OCR和DL能夠識別出手寫字體和印刷字體,但是由于每個閱卷老師的書寫習慣不同,留在試卷上的負分標記的具體樣式也不同。而作為“閱卷掃描儀”,其主要目的并不僅僅是識別出印刷字體和手寫字體,更重要的是獲取數(shù)字信息,因此如何辨別數(shù)字的不同樣式是一個非常重要的問題。所幸的是,DL依然可以解決這個問題,其主要解決思路僅僅是建立一個專門的數(shù)據(jù)庫,其中存儲著一些常見的數(shù)字書寫樣式,建立此數(shù)據(jù)庫是便于DL對識別的數(shù)字輪廓進行比對參考從而提高正確辨識的概率。
在軟件的設計方面也可以為提高DL工作效率提供部分支持,通過設置識別結果的反饋,可以使得電腦便于了解使用者的具體情況,從而達到“被教育”的目的,而通過DL的本身性質,電腦得到的反饋信息日積月累,便能在統(tǒng)計學的宏觀概念上讓電腦認識到使用者筆跡的具體情況。
(五)產品的延伸發(fā)展與前景
以建立服務器為基礎,“閱卷掃描儀”同樣可以發(fā)展出一個完整的閱卷——教學輔助體系。通過建立用戶檔案,“閱卷掃描儀”對于每一個使用者的理解便不再局限于一臺硬件,而是成功完成了一對一的個性化工作輔助。換而言之,“閱卷掃描儀”軟件本身便能理解每一個用戶的字跡和閱卷風格,完成用戶群體個性化和共性化的靈活統(tǒng)一。
綜上所述,在看似發(fā)展空間狹隘的教育方面,掃描技術的應用依然有很大的更新空間,在網(wǎng)絡技術不斷發(fā)展的今天,不同電子設備之間的系統(tǒng)聯(lián)動又將進一步拓寬多媒體教育的視野,提升多元化信息輸入的新高度。