童軍心,童 超,吳宇睿,王金明,單松興
(1.國網(wǎng)江西省電力有限公司電力科學(xué)研究院,江西 南昌 330096;2.南昌工程學(xué)院,江西 南昌 330096;3.國網(wǎng)江西省電力有限公司超高壓分公司,江西 南昌 330096;4.國網(wǎng)江西省電力有限公司樟樹市供電分公司,江西 宜春 336000)
為了準確了解電力系統(tǒng)輸變電設(shè)備的運行狀態(tài),需要對系統(tǒng)進行安全評估,對可能存在的風(fēng)險進行預(yù)警,需要對輸變電設(shè)備進行大量檢測試驗,而大量儀器儀表的數(shù)據(jù)需要被記錄便于進行數(shù)據(jù)挖掘和分析。在復(fù)雜的檢測場景下,一些檢測儀器無通訊接口,只能通過紙筆抄錄完成報告后再輸入系統(tǒng)中,效率低下且容錯率低。為了給變電檢測現(xiàn)場過程提質(zhì)增效,運用圖像識別技術(shù)對儀器數(shù)據(jù)進行定位識別,再將識別結(jié)果自動返回報告中[1-3]。
儀表的數(shù)字識別過程由區(qū)域定位、字符分割、字符識別三部分組成。其中,儀表區(qū)域定位是數(shù)字識別的前提,起著關(guān)鍵性作用?;赟IFT、SURF 的定位算法廣泛應(yīng)用于電力系統(tǒng)中目標檢測與研究中。文獻[4]針對SIFT 算法中特征向量的維數(shù)過高問題,提出了一種雙向SIFT 匹配的方法,降低了特征向量維數(shù),提高了匹配精度,較好地應(yīng)用在電力設(shè)備識別中。SURF 算法借鑒了SIFT 簡化近似思想,將DOH 中的高階、二階微分模板進行了近似簡化,可以采用積分圖像計算,實驗證明SURF 算法綜合性能優(yōu)于SIFT算法[5-8]。
傳統(tǒng)圖像文字識別技術(shù)大多采用傳統(tǒng)光學(xué)字符識別,該技術(shù)需輸入圖像背景干凈,字體簡單且排布整齊,才能達到很高的識別水平,對復(fù)雜儀表圖像幾乎無法識別。與純文字的圖片不同,復(fù)雜環(huán)境下的儀表信息識別則面臨著圖像背景復(fù)雜、拍攝角度和光線強弱等眾多因素造成的分辨率低、對比度和亮度不均勻等問題。
基于此,文中提出基于SURF+OCR 對變電檢測儀器數(shù)據(jù)定位[9]識別方法,根據(jù)尺度不變特征變換實現(xiàn)儀器面板特征匹配、關(guān)鍵數(shù)據(jù)位置定位與截取,實現(xiàn)對儀器面板重要信息的獲取,獲取后的圖片經(jīng)過預(yù)處理后放入Tesseract-OCR[10-11]引擎中識別,繼而得到精確的識別結(jié)果。
SURF算法的實現(xiàn)主要有以下5個步驟:
1)構(gòu)造比例空間:利用高斯模糊形成不同尺度的圖像,構(gòu)成高斯金字塔。為確保圖片中的要素與比例無關(guān),通過高斯函數(shù)計算出不受尺度和旋轉(zhuǎn)影響的極值點。
2)關(guān)鍵點本地化:對極值點進行擬合三維二次函數(shù)運算,去除影響SURF 算法的邊緣響應(yīng)點,同時確定極值點的尺度和位置,進而確定合適的特征成為關(guān)鍵點。
3)方向分配:提取圖像在某個特定小區(qū)域內(nèi)的梯度值的最大值,并作為該關(guān)鍵點的方向特征值,確保關(guān)鍵點角度不變。
4)關(guān)鍵點描述符:在關(guān)鍵點領(lǐng)域內(nèi),計算出選定區(qū)域的梯度大小,并用該梯度值表征圖像在局部區(qū)別內(nèi)光照、形狀變化,為每個關(guān)鍵點分配獨特的指紋。
5)圖像匹配:運用漢明距離、歐氏距離等方法對兩幅圖像關(guān)鍵點特征向量進行相似運算,之后通過單應(yīng)性矩陣對圖片進行調(diào)整。
為了提高識別的準確率,在對數(shù)字儀表的重要信息識別前,對圖像進行預(yù)處理。
1)中值濾波
結(jié)合圖像背景考慮,文中采用中值濾波對圖像進行圖像平滑處理。中值濾波是一種非線性的平滑技術(shù),對于胡椒噪聲和鹽噪聲有非常顯著的影響。中值濾波取當前像素點和它周圍的臨近奇數(shù)個像素點的像素值,將像素值排序,取中間位置的像素值作為當前像素點像素值。中值濾波原理用式(1)表示為:
式中:Xi,j表示像素點在坐標為(i,j)時的像素值;A為濾波窗口;Med 為中值濾波函數(shù);Yi,j為濾波窗口內(nèi)的中間像素值。
2)圖像形態(tài)學(xué)操作
為簡化圖像,對圖像采用形態(tài)學(xué)處理,以提高數(shù)字儀表圖像的質(zhì)量,減少字碼中斷帶來的影響。膨脹和腐蝕處理是形態(tài)學(xué)運算的基礎(chǔ)。設(shè)兩幅圖像X、B,若X是被處理對象,B是用來處理X的,那么則把B稱為結(jié)構(gòu)元素。
其中膨脹處理和腐蝕處理分別如式(2)、式(3)所示:
式中:B表示結(jié)構(gòu)元素;X表示為原始圖像。D為X和B的邏輯異或操作的值,B的黑色和X的黑色有一個對應(yīng)就讓該個點為黑色;E為X和B的邏輯與操作的值,B的黑色和X的黑色完全對應(yīng),就讓該個點為黑色。
3)圖像二值化
為提高識別的準確率,在對數(shù)字儀表識別前,對圖像進行二值化處理。對此,文中采用Otsu 算法,以減少光照和對比度給二值化帶來的不利影響。假設(shè)連通區(qū)域S,其像素的灰度范圍表示為[0,255],其中灰度級x的概率用p(x)表示。Otsu 就是求式(4)得到最大灰度級m值。
而上述值則為最佳的分割閾值。
Tesseract 是HP 實驗室開發(fā)由Google 維護的OCR 引擎,Tesseract-OCR[12]運行過程:首先將經(jīng)過預(yù)處理的二值化圖片傳入OCR 引擎中進行分析,通過識別引擎獲取目標區(qū)域,采用自適應(yīng)分類器定位文本行、分割字。通過兩次字符分析識別使OCR 引擎對圖片中的模糊區(qū)域進行改進,校驗字符是否正確后將圖片識別輸出文本。Tesseract-OCR 架構(gòu)圖如圖1所示。
圖1 Tesseract-OCR架構(gòu)圖
如圖2 為變壓器鐵芯接地電流測試儀面板,面板中有操作按鈕和顯示屏2 個區(qū)域。面板中間部位的電流值和頻率值是測量的結(jié)果數(shù)據(jù),即該儀器關(guān)鍵信息、數(shù)據(jù)特征為數(shù)值型,面板下部為操作按鈕區(qū)。拍照時應(yīng)滿足拍攝規(guī)范,如拍攝角度不得過大,被測儀器盡量清晰并且大部分處于圖片中。
圖2 變壓器鐵芯接地電流測試儀面板
利用尺度不變特征變換對儀器面板進行重要數(shù)據(jù)定位,需要對變壓器鐵芯接地電流測試儀面板建立標準化模板圖片,如圖3所示。該模板含有足夠的不變特征,將重要信息區(qū)域(電流值、頻率值)用純白色背景替換,減少了干擾特征。
圖3 儀器面板模板圖
對按要求拍攝情況下變壓器鐵芯接地電流測試儀圖像進行尺度旋轉(zhuǎn)不變特征檢測并匹配模板照片,其特征點匹配的效果如圖4所示,特征點匹配直線圖表明,該算法能實現(xiàn)模板的完整匹配。在此基礎(chǔ)上依據(jù)定位流程算法,依次通過優(yōu)質(zhì)關(guān)鍵點篩選、求解單應(yīng)性矩陣、計算映射四邊形、圖片旋轉(zhuǎn)擺正、定位截取數(shù)據(jù)等步驟,實現(xiàn)對電流值和頻率值的提取,如圖5所示。
圖4 角度不同的特征點匹配圖
圖5 電流值和頻率值的定位提取圖
對圖片進行預(yù)處理后,Tesseract-OCR 對圖片識別的效果更佳。因此對于本次實驗所用儀器樣本,分析由定位算法所得圖片,經(jīng)過各種方法的驗證,得到最佳的處理效果,處理步驟如圖6所示。
圖6 定位圖片預(yù)處理步驟
定位圖片處理結(jié)果如圖7所示。
圖7 定位圖片處理結(jié)果圖
本例圖片是規(guī)則的數(shù)字,根據(jù)Tesseract-OCR 引擎自帶的“chi_sim”字庫對這個字符具有較高的識別率,識別結(jié)果如表1所示。
表1 定位圖片識別結(jié)果
通過上述方法的試驗效果可知(見表2):
表2 不同角度獲得的圖片定位及識別結(jié)果
1)對圖片拍攝角度發(fā)生變化時,圖片定位成功率較高,在0°~30°之間高達100%,在45°時達90%。該定位算法實時性好、匹配點多,有較多準確的匹配點,400 張隨機拍攝的樣本整體定位成功比例高于97.5%,證明該算法穩(wěn)定性好,具有一定的魯棒性。
2)通過對比定位圖片前后的識別率,處理后的圖片識別率遠高于處理前的,高達95%以上,證明圖片經(jīng)過預(yù)處理后形成的二值化圖片更適合放在Tesseract-OCR引擎中識別。
在變電檢測現(xiàn)場中,為了有效減輕檢測人員儀器讀數(shù)工作強度,避免人工讀數(shù)誤差,用相機對試驗儀器進行圖像獲取,文中提出基于SURF+OCR對變電檢測儀器數(shù)據(jù)定位識別的方法,設(shè)計了在變電檢測現(xiàn)場可能出現(xiàn)的情況,對400 張受拍攝角度影響的情況下的隨機樣本圖片進行SURF 定位算法測試,樣本整體定位成功率高于97.5%。對定位的樣本圖片進一步預(yù)處理,利用Tesseract-OCR 引擎對定位樣本圖片進行識別,識別率高達95%以上。在特定場景下的儀器圖片,經(jīng)預(yù)處理后識別效果仍不佳,可以訓(xùn)練該類儀器專屬的字符庫,以提高識別率。因此,文中所提出的方法具有一定的工程實踐價值。