左 濤
(1.中煤航測遙感集團(tuán)有限公司, 陜西 西安 710199)
隨著人工智能、云計算、大數(shù)據(jù)的興起,特別是OCR(光學(xué)字符識別)技術(shù)商業(yè)化的日益成熟,照片文字識別正確率達(dá)95%以上,其自動化錄入文字信息成為可能。本文介紹使用“微信小程序+騰訊云+騰訊OCR”一體結(jié)構(gòu)實(shí)現(xiàn)在移動端自動化的數(shù)據(jù)錄入和采集工作。其工作全部在騰訊系統(tǒng)框架下,微信小程序?qū)崿F(xiàn)移動端拍照、傳照片工作和數(shù)據(jù)下載功能,騰訊云實(shí)現(xiàn)后臺數(shù)據(jù)庫的建立、存儲和輸出,騰訊OCR實(shí)現(xiàn)圖像文字識別算法。
微信小程序是一種下載安裝即可使用的程序,用戶掃一掃或搜一下即可打開應(yīng)用。全面開放申請后,主體類型為企業(yè)、政府、媒體、其他組織或個人的開發(fā)者,均可申請注冊小程序。小程序、訂閱號、服務(wù)號、企業(yè)號是并行的體系[1]。
光學(xué)字符識別最早是應(yīng)用在輔助盲人閱讀設(shè)備上的[2-3],1929 年OCR 的概念正式被Tausheck 提出[3-4]。OCR 是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程[2,5]。 在計算機(jī)視覺領(lǐng)域,OCR 識別是其很重要的一個分支,屬于模式識別和人工智能。如圖1 所示,圖像輸入、圖像預(yù)處理、文字檢測、 文本識別、文本輸出等一系列過程構(gòu)成了一個完整的OCR 系統(tǒng)[5-7]。其中主要過程有圖像預(yù)處理、文本檢測、文字識別、輸出識別文字等。OCR 主要解決了圖像上的文字信息計算機(jī)自動識別的問題。
圖1 OCR系統(tǒng)組成
Figure 1 OCR system composition 微 信OCR 識 別 能力是微信團(tuán)隊推出的一套提升移動端快捷信息錄入的工具,目前支持身份證、銀行卡、行駛證、營業(yè)執(zhí)照和通用OCR 的識別,廣泛適用于政務(wù)、醫(yī)療、交通、教育、教育、金融等各行各業(yè),涉及到需要用戶輸入身份信息、銀行卡信息、車輛信息場景時,即可通過ODR 快速識別、輸入信息,極大地提高輸入效率,提高用戶體驗(yàn)[1]。騰訊云文字識別基于騰訊領(lǐng)先的深度學(xué)習(xí)技術(shù),將圖片上的文字內(nèi)容智能識別成為可編輯的文本,既支持身份證、發(fā)票等卡證類和票據(jù)類的印刷體識別,也支持?jǐn)?shù)學(xué)算式等手寫體識別,可以有效地代替人工錄入信息、提升數(shù)據(jù)處理效率。
不動產(chǎn)統(tǒng)一登記工作是十八大之后,中央部署的一項(xiàng)重大的改革事項(xiàng),是我國產(chǎn)權(quán)管理體制機(jī)制的重大改革,也是維護(hù)社會主義基本經(jīng)濟(jì)制度的重要保障[5]?!安粍赢a(chǎn)登記”數(shù)據(jù)主要由兩部分組成:一是表示土地、海域、房屋、構(gòu)筑物、建筑物等不動產(chǎn)單元數(shù)據(jù),即不動產(chǎn)單元物理空間數(shù)據(jù);二是表示土地、海域、房屋、構(gòu)筑物、建筑物產(chǎn)權(quán)登記屬性的數(shù)據(jù),即產(chǎn)權(quán)登記數(shù)據(jù)。物理數(shù)據(jù)由測繪成果資源提供,權(quán)屬數(shù)據(jù)由登記成果或房地產(chǎn)檔案管理資源提供包括權(quán)利人數(shù)據(jù)、權(quán)利數(shù)據(jù)、登記業(yè)務(wù)數(shù)據(jù)等信息[8]。數(shù)據(jù)海量,分散保存在各級不同部門,資料數(shù)字化程度不同,行業(yè)之間和行業(yè)內(nèi)不同地區(qū)之間的差異較大,數(shù)據(jù)標(biāo)準(zhǔn)互不銜接,數(shù)據(jù)格式不統(tǒng)一[9]。不動產(chǎn)登記一項(xiàng)重要的內(nèi)容是需要登記權(quán)利人信息和房產(chǎn)信息,不動產(chǎn)數(shù)據(jù)量龐大,依靠人工錄入易出錯并且耗時耗力,因此,本文提出了使用騰訊云結(jié)合騰訊OCR技術(shù)在微信端實(shí)現(xiàn)應(yīng)用小程序,用戶通過手機(jī)拍照識別圖像上的文字信息進(jìn)行整理入庫,實(shí)現(xiàn)自動采集人員戶籍等信息。
本系統(tǒng)采用了“微信小程序+騰訊云+騰訊OCR”結(jié)構(gòu)模式,利用騰訊公司提供的OCR API(文字識別技術(shù))并運(yùn)用了騰訊云作為存儲和上傳下載服務(wù)??紤]到數(shù)據(jù)收集大多在戶外或現(xiàn)場,本文使用微信小程序作為客戶端,實(shí)現(xiàn)移動端數(shù)據(jù)收集工作,因此將系本統(tǒng)設(shè)計為C∕S 模式即Client∕Server(客戶移動端∕服務(wù)器結(jié)構(gòu)),客戶移動端主要用于用戶界面顯示,服務(wù)器端接收數(shù)據(jù)輸入和下載。C∕S 一般采用兩層結(jié)構(gòu),如圖2所示。
圖2 C/S兩層結(jié)構(gòu)
系統(tǒng)本系統(tǒng)功能主要過程有:利用手機(jī)拍照,使用移動端微信小程序上傳照片,在騰訊云中調(diào)用對應(yīng)的OCR接口函數(shù)連接實(shí)現(xiàn)提取圖像中的文本信息,使用自定義算法篩取文本信息中有用的數(shù)據(jù),其結(jié)果返回到手機(jī)端的文本窗口中,在手機(jī)端文檔可復(fù)制、編輯、粘貼等,確定沒有錯誤可以上傳保存或下載,本系統(tǒng)具體實(shí)施流程圖如圖3所示。
圖3 系統(tǒng)流程圖
具體微信小程序開發(fā)使用JavaScript語言,后臺云開發(fā)使用Node.js 調(diào)用API,數(shù)據(jù)在云端處理,微信小程序客戶端負(fù)責(zé)上傳照片和下載處理數(shù)據(jù)。
利用OCR函數(shù)返回值即識別圖片的文字信息,在騰訊云中使用Node.js函數(shù)保存必要信息在騰訊云數(shù)據(jù)庫中,根據(jù)客戶端的設(shè)置和要求提取并保存在Excel中進(jìn)行下載。戶口簿數(shù)據(jù)處理使用同樣的過程,其值保存在戶籍信息數(shù)據(jù)庫中等待篩選下載。
本系統(tǒng)參與本單位相關(guān)項(xiàng)目的具體實(shí)施,在四川、福建、江西等5 個不動產(chǎn)登記項(xiàng)目中進(jìn)行了測試和應(yīng)用,本系統(tǒng)效率高、速度快、錯誤率少,取得了較高的經(jīng)濟(jì)效益?;诒疚南到y(tǒng)架構(gòu)實(shí)現(xiàn)的《農(nóng)房一體化文字識別系統(tǒng)》移動端部分界面截圖(圖4~7),圖8是圖片識別后下載的身份證信息截圖。
圖4 上傳圖像識別
圖5 識別完成
圖6 單個身份證識別界面
圖7 入戶調(diào)查數(shù)據(jù)采集界面
圖8 文字識別后下載的識別結(jié)果文件(局部)
通過微信小程序的界面上傳的身份證和戶口簿照片,在騰訊云后臺服務(wù)器調(diào)用OCR 函數(shù)識別照片文字信息,返回結(jié)果通過算法篩選需要的數(shù)據(jù)進(jìn)行整理記錄到數(shù)據(jù),用戶可以根據(jù)設(shè)置時間或其他限制條件下載所需要的數(shù)據(jù)表格(如圖8 制式表格)。
本文通過騰訊云實(shí)現(xiàn)移動端文字識別技術(shù)在不動產(chǎn)登記等項(xiàng)目中的應(yīng)用,較好地解決了在項(xiàng)目實(shí)施中數(shù)據(jù)采集整理的自動化智能化問題?;谝苿佣撕芎媒鉀Q了收集資料的碎片化、無序化、及時性的問題,同時基于騰訊云后臺服務(wù)解決了數(shù)據(jù)存儲和數(shù)據(jù)處理問題,實(shí)現(xiàn)了數(shù)據(jù)采集自動化。OCR 技術(shù)應(yīng)用在數(shù)據(jù)采集中具有以下特點(diǎn):①OCR 文字識別技術(shù)成熟,識別效率高,使用方便快捷;②解決了大量人工輸入問題;③速度快、準(zhǔn)確率高,可以實(shí)現(xiàn)批量化處理。本文實(shí)現(xiàn)的系統(tǒng)不局限于不動產(chǎn)的數(shù)據(jù)采集過程,也可以使用在檔案整理、數(shù)據(jù)入庫、電子信息采集等項(xiàng)目中。