圖像OCR識別在機(jī)頂盒信息檢測中的應(yīng)用分析

2020-11-30 08:36靳國榮

科學(xué)與信息化 2020年31期

摘要隨著生活水平的提高，機(jī)頂盒已成為每個家庭必備的設(shè)備，因此，機(jī)頂盒的質(zhì)量就顯得尤為重要。但如果機(jī)頂盒寫入的信息有誤，將導(dǎo)致機(jī)頂盒無法正常運行，會極大地影響用戶的觀看體驗?，F(xiàn)有技術(shù)對機(jī)頂盒等視頻盒子的信息檢測還停留在傳統(tǒng)的人工測試判定，即通過人工的方式對視頻圖像上的信息進(jìn)行比對來檢驗正誤，但是人工檢測的方式帶有很多個人主觀觀點，無法快速準(zhǔn)確地發(fā)現(xiàn)機(jī)頂盒中信息有誤的問題。

關(guān)鍵詞 OCR;圖像預(yù)處理;文字識別

引言

本文提出的圖像OCR識別的機(jī)頂盒信息檢測方法及系統(tǒng)，技術(shù)方案概括為：獲取機(jī)頂盒的圖像，所述圖像中包含機(jī)頂盒的待檢測信息;確定所述待檢測信息對應(yīng)的待檢測區(qū)域的位置坐標(biāo)，根據(jù)所述位置坐標(biāo)對獲取的圖像進(jìn)行裁剪得到待檢測圖像;對所述待檢測圖像進(jìn)行圖像處理，使得待檢測圖像中的文字圖像和背景圖像分離，所述圖像處理至少包括：灰度處理、二值化處理和膨脹腐蝕處理;基于OCR識別處理后的待檢測圖像中的文字信息，根據(jù)所述文字信息判斷機(jī)頂盒的信息是否有誤。

圖像OCR識別的機(jī)頂盒信息檢測方法的處理流程如圖1所示。

1圖像采集處理

1.1 圖像采集

機(jī)頂盒的圖像可以通過HDMI設(shè)備獲取，機(jī)頂盒的待檢測信息可以是機(jī)頂盒生產(chǎn)序列號、機(jī)頂盒加密序列號、鎖定模式序列號、機(jī)頂盒加密卡序列號等。采集出來的圖像如圖2所示。

1.2 定位檢測區(qū)域

根據(jù)所述位置坐標(biāo)對獲取的圖像進(jìn)行裁剪得到待檢測圖像;具體而言，可以根據(jù)待檢測信息在圖像中的位置確定出裁剪區(qū)域的位置坐標(biāo)，然后根據(jù)裁剪區(qū)域的位置坐標(biāo)對獲取的圖像進(jìn)行裁剪得到待檢測圖像，待檢測圖像中包含了機(jī)頂盒的待檢測信息。如圖3所示。

1.3 圖像預(yù)處理

待檢測圖像進(jìn)行圖像處理，使得待檢測圖像中的文字圖像和背景圖像分離，所述圖像處理至少包括：灰度處理、二值化處理和膨脹腐蝕處理;

可以理解，灰度處理、二值化處理和膨脹腐蝕處理是依次進(jìn)行的，其中，灰度處理包括：

對待檢測圖像進(jìn)行灰化處理，得到只包含一種灰度值的灰度圖像，灰化公式如下：

式中，表示灰度圖像中像素的灰度值，R表示紅色分量值，G表示綠分量值，B表示藍(lán)色分量值。

二值化處理包括：確定灰度閾值，根據(jù)所述灰度閾值對灰度圖像進(jìn)行二值化處理得到二值圖像，二值圖像就是只有黑白兩種顏色表示的圖像，在數(shù)字上用0 表示黑色（0），1表示白色（255）。圖像中屬于同一物體的像素在灰度值上存在極大相似性，相反，不同物體在灰度值上通常表現(xiàn)為較大差異。因而，本實施例通過自動閾值化技術(shù)，選取能夠充分體現(xiàn)前景和背景差異的分割灰度值，使待識別的文字大致分離出來。

根據(jù)自動閾值化技術(shù)確定灰度閾值的方法包括：設(shè)定初始灰度閾值，對于灰度圖像的每個像素，計算其Kirsh算子，根據(jù)初始灰度閾值與Kirsh算子的大小對初始灰度閾值進(jìn)行動態(tài)調(diào)整得到灰度閾值。

膨脹處理包括：遍歷所述二值圖像的每一個像素，用結(jié)構(gòu)元素的中心點對準(zhǔn)當(dāng)前正在遍歷的像素，獲取當(dāng)前結(jié)構(gòu)元素所覆蓋下的二值圖像對應(yīng)區(qū)域內(nèi)的所有像素的最大值，用該最大值替換當(dāng)前像素值[1];由于二值圖像最大值就是1，所以就是用1替換，即變成了白色前景物體。如果當(dāng)前結(jié)構(gòu)元素覆蓋下，全部都是背景，那么就不會對原圖做出改動，因為都是0;如果全部都是前景像素，也不會對原圖做出改動，因為都是1;只有結(jié)構(gòu)元素位于前景物體邊緣的時候，它覆蓋的區(qū)域內(nèi)才會出現(xiàn)0和1兩種不同的像素值，這個時候把當(dāng)前像素替換成1就有變化了。膨脹后的圖像的整體亮度會有提高，圖形中較亮物體的尺寸變大，而較暗物體的尺寸會減小甚至消失。

腐蝕處理包括：遍歷所述二值圖像的每一個像素，用結(jié)構(gòu)元素的中心點對準(zhǔn)當(dāng)前正在遍歷的像素，獲取當(dāng)前結(jié)構(gòu)元素所覆蓋下的二值圖像對應(yīng)區(qū)域內(nèi)的所有像素的最小值，用該最小值替換當(dāng)前像素值;由于二值圖像最小值就是0，所以就是用0替換，即變成了黑色背景。如果當(dāng)前結(jié)構(gòu)元素覆蓋下，全部都是背景，那么就不會對原圖做出改動，因為都是0;如果全部都是前景像素，也不會對原圖做出改動，因為都是1，只有結(jié)構(gòu)元素位于前景物體邊緣的時候，它覆蓋的區(qū)域內(nèi)才會出現(xiàn)0和1兩種不同的像素值，這個時候把當(dāng)前像素替換成0就有變化了。腐蝕后的圖像整體會變暗，圖像中比較亮的區(qū)域的面積會變小甚至消失，而比較暗的區(qū)域會增大一些。

2OCR識別

通過對待檢測圖像進(jìn)行處理后，能夠得到更加易于文字識別的圖像，本實施例中，將處理后的待檢測圖像輸入至Tesseract-OCR引擎中，Tesseract-OCR引擎對待檢測圖像進(jìn)行文字識別得到待檢測圖像的文字信息。

Tesseract-OCR引擎使用到的靜態(tài)字符分類器，包含一種特別的設(shè)計思想，即分類器訓(xùn)練與分類識別過程的分離。大多數(shù)分類器，其訓(xùn)練樣本和識別字符具有同樣的處理方式，因而，只有當(dāng)待識別字符與訓(xùn)練樣本接近時，識別成功率才能夠到保證。Tesseract-OCR引擎使用了一種突破性的解決方式，在訓(xùn)練樣本集時，系統(tǒng)選取字符的近似多邊形段作為特征;而在識別過程中，系統(tǒng)選取屬于字符邊界的固定長度的短線段作為特征，并使用多對一方式對應(yīng)于系統(tǒng)的標(biāo)準(zhǔn)特征。

其文字識別的具體步驟如下[2]：

精選出可能與待檢測特征匹配的類別，未知字符每一個待識別特征通過查表可以得到一組可能與其匹配類別的向量，系統(tǒng)將這些匹配向量相加，選取出得分最高的幾個類別作為最有可能未知字符匹配的名單;

通過計算相似度確定最終類別，每一個標(biāo)準(zhǔn)字符都由一個邏輯合式代表，由此待識別特征與標(biāo)準(zhǔn)字符的“距離”可以被計算出來。最后，綜合得到的具有最短距離的類別，就是與未知字符相似度最高的類別。

Tesseract-OCR引擎的分類設(shè)計能夠識別受損字符，具有較強的魯棒性，所以在選取分類器的訓(xùn)練樣本時就不需要引入損傷字符，并且其識別的速度和準(zhǔn)確率較高。

識別出文字信息后，比較所述文字信息與預(yù)設(shè)文字信息是否一致，若一致，則表示機(jī)頂盒的信息正確，否則，表示機(jī)頂盒的信息有誤。

3結(jié)束語

經(jīng)過實際實驗及實用，該方法在機(jī)頂盒自動檢測上具有非常好的效果。達(dá)到了預(yù)期設(shè)計目標(biāo)。

參考文獻(xiàn)

[1] 章專，仲林國，朱志剛.基于圖像采集與處理的自動抄表系統(tǒng)[J].電測與儀表，2004，（1）：19.

[2] 昝元寶，靳國榮.機(jī)械式水表讀數(shù)識別圖像預(yù)處理研究[J].信息化技術(shù)應(yīng)用，2019（7）：26-27.

科學(xué)與信息化2020年31期

科學(xué)與信息化的其它文章: 淺談電力信息與電力通信技術(shù)的融合; 無線光通信的傳輸和接入應(yīng)用分析; 廬江地震臺汞觀測分析研究; 探討Oracle數(shù)據(jù)庫日常維護(hù)與優(yōu)化; 微信小程序的優(yōu)勢分析及其在企業(yè)中的應(yīng)用; 智慧社區(qū)建設(shè)存在的挑戰(zhàn)及對策研究

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

圖像OCR識別在機(jī)頂盒信息檢測中的應(yīng)用分析