吳婕萍 趙文昊 于文萍 何柯辰
摘要:為實現(xiàn)對輸電線路桿塔編號的識別,本文采用基于機器視覺的字符識別方法,先對編號圖像預處理,隨后對編號定位,提取出單個字符,最后利用BP(Back Propagation)神經網絡對提取的字符進行識別。實驗結果表明,識別精度為80.6%,可以滿足特定條件下的巡檢任務,為后續(xù)輸電桿塔檢測工作的開展提供有效參考。
Abstract: This paper adopts the character recognition method which is based on machine vision to identify the transmission line tower's serial number. First, it preprocesses the numbered image, then locates the number, extracts single characters, and finally identify these characters by using BP(Back Propagation) neural net. Experimental results show that the identification accuracy is 80.6%, which can fulfill inspection tasks in certain conditions and provide valid references for the implement of subsequent tasks to transmission line tower's detection.
關鍵詞:字符識別;BP神經網絡;圖像定位;字符分割
Key words: character recognition;BP neural network;image location;character segmentation
中圖分類號:TM75? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)23-0229-02
0? 引言
輸電桿塔有著傳輸電能的作用,是電力系統(tǒng)的重要組成部分,當遭受極端惡劣天氣與環(huán)境時,輸電桿塔容易發(fā)生斷線、短路,會直接波及到整個電力網絡。因此定期對輸電桿塔及其配套設施進行檢查,對電力系統(tǒng)的穩(wěn)定運行具有重要的意義。
在對輸電桿塔進行巡檢的過程中,輸電桿塔的編號發(fā)揮著重要的作用,利用編號信息可以集中管理輸電桿塔及其配套設施狀態(tài)情況,同時也可在巡檢中提供輸電桿塔的位置信息。因此把輸電桿塔編號與巡檢任務結合起來,是一種重要的巡檢手段,可以提高巡檢效率,且可以配合無人機對輸電桿塔實現(xiàn)自動巡檢,在巡檢過程中發(fā)現(xiàn)故障時,可以通過對輸電桿塔編號的識別實現(xiàn)對故障區(qū)域的精確定位。
目前,利用輸電桿塔的編號進行巡檢已有較多技術出現(xiàn),人工巡檢是目前的主要巡檢方式,但巡檢效率很低;基于RFID字符識別技術與基于二維碼字符識別技術工作效率高,但對設施要求較高,成本高且時間周期長;而基于機器視覺的字符識別技術識別精度高、計算速度快、工作效率高、檢測手段符合人類感知且不需要對現(xiàn)有設施進行大幅度改造。
綜上,為實現(xiàn)輸電線路桿塔編號的識別,本文采用基于機器視覺的字符識別技術,對輸電桿塔編號區(qū)域自動定位,提取出單個字符并自動識別字符內容,最后應用BP(Back Propagation)神經網絡對字符進行識別。
1? 輸電桿塔編號字符提取
利用機器視覺對編號字符進行識別的技術路線如圖1所示,首先采用一種去除背景冗余信息的圖像預處理算法,然后對輸電桿塔區(qū)域進行精確定位并且提取出來,把提取出來的編號區(qū)域內的字符分割為單個字符,最后利用BP神經網絡對字符進行識別。
1.1 圖像預處理
計算機直接對原圖(如圖2(a)所示)進行處理耗時長,因此需要重新調整圖像尺寸并轉化為灰度圖像,用以提高效率。為了使視覺效果更好,便于后續(xù)算法的處理,可以利用直方圖均衡化把局部分布擴展,增加其表示范圍,優(yōu)化圖像的對比度[1]。
1.2 編號定位與字符提取
經過了圖像預處理后便需提取編號區(qū)域,提取過程如圖2所示,首先是濾波處理與邊緣檢測[2](如圖2(b)所示),在編號的邊緣位置,灰度值會出現(xiàn)突變,邊緣檢測就是計算編號灰度變化率最突出的區(qū)域[3]。由于噪聲和邊緣的灰度都會發(fā)生突變,噪聲易被誤檢為邊緣,在檢測邊緣前需要對圖像進行濾波去除噪聲信息。
邊緣檢測后圖像還存在著冗余的背景信息,需要進一步的圖像進行形態(tài)學處理。這里采用腐蝕(如圖2(c)所示)縮小圖像邊界,利用閉運算(如圖2(d)所示)和開運算(如圖2(e)所示)消除冗余信息,對編號區(qū)域的文字部分進行強調突出,方便后續(xù)對其提取。
為了將三行文字分別提取出來,采用一種基于灰度統(tǒng)計值的投影法,首先把圖像在行方向上進行投影,統(tǒng)計每一行的像素點,則文字的上下邊界在像素點統(tǒng)計圖的波谷位置,同理分別對這三塊文字部分區(qū)域進行列方向上的處理。通過行方向像素點統(tǒng)計和列方向像素點統(tǒng)計,最終能將文字部分精確的提取出來,得到編號區(qū)域的圖像。
1.3 單個字符提取
由于已經分離出字符的上下邊界,因此只需確定每個字符的左右邊界便可以提取出單個字符。這里通過列方向像素點統(tǒng)計提取單個字符,并且把單個字符進一步的處理,包括去除上下邊界和歸一化處理,一是為了統(tǒng)一標準庫的字符規(guī)格,二是為了消除字符中多余的噪聲,為后續(xù)的字符識別做準備。
2? 基于神經網絡的編號字符識別
神經網絡是模擬人的大腦中某些機能,抽象出來建立的一種模型,其優(yōu)點在于可以學習和自適應一些不確定的系統(tǒng)[4],把神經網絡應用到輸電桿塔編號識別的系統(tǒng)中是可行的。
利用BP神經網絡對編號字符進行識別,首先需要搭建并設計神經網絡的結構,實驗中調試BP神經網絡的參數設置為:誤差目標值0.0000001,終止迭代次數5000,學習速率0.003。目前學術界并沒有一個統(tǒng)一的確定隱含層神經元數目的辦法。本文根據文獻[5]的算法確定隱含層神經元個數,如公式(1):
其中輸入層神經元數m=800,輸出層神經元數n=5,可以計算出隱藏層的神經元節(jié)點數為282。最后利用處理的數據對神經網絡訓練建模,并對測試組進行識別,識別結果如圖3所示。
3? 實驗結果分析與對比
將6幅圖片對神經網絡進行訓練后,對10幅測試組圖像進行字符識別,得到的實驗結果如表1所示。造成字符識別失敗的原因是圖像背景過于復雜,且字符存在殘缺、污損、偏移等,同時訓練組太少導致誤差也較大。
4? 結論
本文針對輸電線路桿塔編號的識別,提出一種基于機器視覺的字符識別方法,采用尺寸調整、邊緣檢測、直方圖均衡化等預處理操作,對編號區(qū)域進行定位,然后按行分割為3塊字符區(qū)域,分別提取出單個字符,對字符歸一化處理后再利用BP神經網絡對字符進行識別,實驗最終的準確率為80.6%。由于圖像背景復雜、字符不完整和訓練組太少等原因,仍會出現(xiàn)誤判現(xiàn)象。
參考文獻:
[1]凌佳寧.車牌定位與車牌字符識別算法的研究與實現(xiàn)[D]. 電子科技大學,2012.
[2]吳娛.數字圖像處理[M].北京:北京郵電大學出版社,2017.
[3]楊璐雅,黃新波,張燁,等.基于邊緣檢測的瓷質絕緣子裂縫特征檢測方法[J].廣東電力,2018,31(07):106-111.
[4]張坤艷,鐘宜亞,苗松池,等.一種基于全局閾值二值化方法的BP神經網絡車牌字符識別系統(tǒng)[J].計算機工程與科學, 2010,32(02):88-90.
[5]高大啟.有教師的線性基本函數前向三層神經網絡結構研究[J].計算機學報,1998(01):80-86.