国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于投影閾值分割和數(shù)字序列校正的高噪聲數(shù)字儀表圖像識(shí)別方法

2023-10-14 02:55:58李志圣王傳啟
關(guān)鍵詞:跳動(dòng)間隔儀表

郝 琨,韓 冰,李志圣*,王傳啟

(1.天津城建大學(xué)計(jì)算機(jī)與信息工程學(xué)院 天津 西青區(qū) 300384;2.天津凱發(fā)電氣股份有限公司 天津 西青區(qū) 300384)

數(shù)字儀表在生產(chǎn)中發(fā)揮著重要作用,儀表讀數(shù)的精準(zhǔn)度是決定生產(chǎn)質(zhì)量的關(guān)鍵因素。在工業(yè)領(lǐng)域,數(shù)字儀表的數(shù)據(jù)讀取一般通過內(nèi)置裝置采集,同時(shí)配合人工定期巡檢。但由于數(shù)字儀表的工作環(huán)境噪聲復(fù)雜,采用人工讀數(shù)易受巡檢人員精力和經(jīng)驗(yàn)影響,準(zhǔn)確率較低,且成本較高。因此,大部分企業(yè)為了提高儀表識(shí)別準(zhǔn)確率、節(jié)約生產(chǎn)成本,常采用計(jì)算機(jī)圖像識(shí)別技術(shù)代替人工巡檢。

1 相關(guān)工作

數(shù)字儀表的數(shù)據(jù)讀取分為數(shù)字區(qū)域檢測階段和數(shù)字識(shí)別階段,檢測階段將圖像中可能包含數(shù)字的區(qū)域使用錨框標(biāo)記,并將標(biāo)記區(qū)域送入識(shí)別階段進(jìn)行識(shí)別。常見的數(shù)字區(qū)域檢測模型有EAST[1]、TextBox[2]、DBnet[3]等。DBnet 模型使用可微二值化方法,通過網(wǎng)絡(luò)模型訓(xùn)練得出圖像二值化閾值,相較于其他檢測模型具有較快的檢測速度和較高的檢測精度。因此本文使用DBnet 模型對數(shù)字區(qū)域進(jìn)行檢測,由于儀表數(shù)據(jù)集中數(shù)字區(qū)域和背景區(qū)域?qū)Ρ榷容^大,因此檢測精度可達(dá)100%。數(shù)字識(shí)別階段需提取圖像中的數(shù)字特征并進(jìn)行解碼識(shí)別。傳統(tǒng)的數(shù)字式儀表識(shí)別方法有特征檢測[4]和模板匹配算法等[5],但傳統(tǒng)方法模板制作復(fù)雜,在識(shí)別字符種類較多情況下識(shí)別速度較慢且對于變形字符匹配效果較差,適用范圍較窄, 對于噪聲干擾的魯棒性較低。

隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積遞歸神經(jīng)網(wǎng)絡(luò)(convolutional recurrent neural network, CRNN)[6]被廣泛應(yīng)用于數(shù)字式儀表的識(shí)別。文獻(xiàn)[7]對數(shù)字儀表進(jìn)行像素級(jí)的語義分割,提高了數(shù)字儀表的識(shí)別準(zhǔn)確率,但此方法受臟污噪聲影響較大,在臟污遮擋環(huán)境下易出現(xiàn)誤識(shí)現(xiàn)象;文獻(xiàn)[8]將可變形卷積應(yīng)用到識(shí)別網(wǎng)絡(luò)中,在傳統(tǒng)卷積和池化操作中添加二維偏置值,使得神經(jīng)網(wǎng)絡(luò)可以適應(yīng)不規(guī)則物體的識(shí)別,該方法提高了在少量臟污遮擋情況下的數(shù)字識(shí)別準(zhǔn)確率,但在光線不均勻情況下該方法識(shí)別率較低;文獻(xiàn)[9]對現(xiàn)有的CRNN 結(jié)構(gòu)做出改進(jìn),增加注意力機(jī)制,在識(shí)別算法中使用正反兩個(gè)解碼器,通過結(jié)合正序和逆序兩種識(shí)別結(jié)果得出讀數(shù),提高了字符粘連情況下的識(shí)別準(zhǔn)確率,但該方法會(huì)放大圖像中污漬噪聲的干擾;文獻(xiàn)[10]提出一種圖像增強(qiáng)算法,該算法通過計(jì)算圖像不同區(qū)域內(nèi)的動(dòng)態(tài)截?cái)嘀担罱K得到局部細(xì)節(jié)最優(yōu)圖像,解決了圖像中噪聲分布不均勻等問題。但該方法需要人工選定參數(shù)且會(huì)帶來局部失真問題,在高曝光噪聲圖像上效果不佳;文獻(xiàn)[11]使用高斯濾波平滑儀表圖像,再通過自適應(yīng)伽馬增強(qiáng)算法去除復(fù)雜光線影響,解決了圖像高曝光問題,但該方法無法去除密集噪點(diǎn)干擾;文獻(xiàn)[12]提出一種改進(jìn)的最大熵閾值分割預(yù)處理算法,能較好地去除密集噪點(diǎn)干擾,配合卷積神經(jīng)網(wǎng)絡(luò),提高了高噪聲環(huán)境下的儀表識(shí)別準(zhǔn)確率,但通過該方法計(jì)算的二值化閾值偏大,在數(shù)字部分缺失情況下容易忽略特征信息;文獻(xiàn)[13]提出一種互補(bǔ)序列對的運(yùn)動(dòng)模糊圖像復(fù)原方法,利用不同圖像的特征信息,使用互補(bǔ)幀圖像修復(fù)模糊圖像損失部分,但該方法使用范圍較窄且無法解決多幅圖像出現(xiàn)特征信息不足的情況。

綜上,在噪聲情況復(fù)雜、圖像特征信息較少的情況下,數(shù)字儀表識(shí)別技術(shù)存在識(shí)別準(zhǔn)確率較低的問題。且由于儀表圖像中缺少關(guān)鍵特征信息, 現(xiàn)有的去噪聲算法和神經(jīng)網(wǎng)絡(luò)優(yōu)化算法對于識(shí)別準(zhǔn)確率提升有限。因此,本文提出了結(jié)合投影閾值分割和數(shù)字序列校正的高噪聲數(shù)字儀表圖像識(shí)別方法PNCRNN。該方法使用投影閾值分割二值化算法(projection threshold segmentation, PTS),將圖像按噪聲強(qiáng)度劃分不同區(qū)域,并自適應(yīng)設(shè)定閾值進(jìn)行二值化處理,有效降低噪聲干擾;接著提出數(shù)字序列校正算法(number sequence correction algorithm, NSC),通過數(shù)字序列概率代替單個(gè)數(shù)字概率,利用前后幀圖像之間的數(shù)字規(guī)律,彌補(bǔ)當(dāng)前圖像缺失的特征信息,從而提高數(shù)字圖像識(shí)別準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,本文方法在高噪聲環(huán)境下具有較高的識(shí)別準(zhǔn)確率。

2 高噪聲數(shù)字儀表圖像識(shí)別方法PNCRNN

2.1 PN-CRNN 網(wǎng)絡(luò)模型

目前主流的文本識(shí)別網(wǎng)絡(luò)為CRNN。該模型包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)和時(shí)間關(guān)聯(lián)性序列分類模塊(connectionist temporal classification, CTC)[14],分別對應(yīng)卷積層,循環(huán)層和翻譯層。CRNN 模型通過CNN 網(wǎng)絡(luò)和RNN 網(wǎng)絡(luò)充分提取圖像特征信息并通過CTC 算法解碼翻譯進(jìn)行對比識(shí)別,在無噪聲干擾或低噪聲干擾情況下識(shí)別準(zhǔn)確率較高,但是在高噪聲干擾情況下,由于數(shù)字特征信息較少,導(dǎo)致識(shí)別準(zhǔn)確率較低,如圖1 所示,數(shù)字“5”由于臟污遮擋影響,數(shù)字特征信息不足,CRNN 網(wǎng)絡(luò)將其誤識(shí)為“6”。

圖1 高噪聲情況下CRNN 識(shí)別結(jié)果

因此,為提高識(shí)別準(zhǔn)確率,解決圖像中噪聲復(fù)雜以及數(shù)字特征不足導(dǎo)致的誤識(shí)等問題,本文基于CRNN 網(wǎng)絡(luò)提出PN-CRNN 模型。模型結(jié)構(gòu)如圖2 所示。PN-CRNN 首先對檢測階段得到的數(shù)字區(qū)域圖像進(jìn)行預(yù)處理,通過投影閾值分割算法PTS 去除圖像中的噪聲影響;由CRNN 網(wǎng)絡(luò)提取圖像中的特征信息,并生成預(yù)測概率矩陣;最后,利用數(shù)字序列校正算法NSC 得到精準(zhǔn)的圖像識(shí)別結(jié)果。相比于CRNN,PN-CRNN 基于數(shù)字變化規(guī)律, 利用不同儀表圖像之間的相關(guān)信息,結(jié)合投影閾值分割和數(shù)字序列校正算法,有效地提高了圖像特征信息利用率,解決了在高噪聲環(huán)境下數(shù)字儀表識(shí)別率低的問題。

圖2 PN-CRNN 模型結(jié)構(gòu)

2.2 PTS 圖像預(yù)處理

2.2.1 重復(fù)圖像篩選

在實(shí)際的生產(chǎn)過程中,當(dāng)圖像采集設(shè)備的捕捉頻率高于儀表讀數(shù)變換頻率時(shí),會(huì)出現(xiàn)圖像重復(fù)采集情況,導(dǎo)致識(shí)別過程時(shí)間損耗增加,因此本文通過對比圖像中關(guān)鍵區(qū)域的像素密度進(jìn)行重復(fù)圖像篩選。

由于數(shù)字部分在圖像中占較大比例且與背景有較大對比度,因此圖像中的關(guān)鍵區(qū)域可認(rèn)為是數(shù)字區(qū)域。本文通過垂直投影法對數(shù)字區(qū)域進(jìn)行劃分。將圖像中數(shù)字邊界像素值設(shè)為閾值進(jìn)行垂直投影,選取投影圖中波谷坐標(biāo)作為劃分邊界將圖像劃分為不同數(shù)字區(qū)域。在無噪聲情況下,圖3 所示圖片可劃分出5 個(gè)數(shù)字區(qū)域;當(dāng)圖像噪聲較大時(shí),數(shù)字出現(xiàn)粘連現(xiàn)象,導(dǎo)致投影圖中波谷相互連接,此時(shí)將連接區(qū)域作為整體處理,則圖片可劃分出3 個(gè)數(shù)字區(qū)域,如圖4 所示。

圖3 垂直投影圖

圖4 高噪聲情況下垂直投影圖

設(shè)數(shù)字邊界像素值為C0,數(shù)字區(qū)域中灰度級(jí)i的 像素個(gè)數(shù)為mi,灰度范圍為 [C0,255],則區(qū)域內(nèi)總像素?cái)?shù)為:

數(shù)字區(qū)域像素點(diǎn)密度為:

式中,l和h別表示數(shù)字區(qū)域的長度和高度。當(dāng)兩幅圖像中數(shù)字區(qū)域個(gè)數(shù)相同且對應(yīng)數(shù)字區(qū)域內(nèi)像素點(diǎn)密度相似時(shí),則判斷為重復(fù)圖像。

2.2.2 投影閾值分割算法

由于數(shù)字儀表工作環(huán)境復(fù)雜,噪聲影響較大,常見的圖像增強(qiáng)算法和圖像二值化算法均不能完全滿足實(shí)際生產(chǎn)需求[15]。因此本文結(jié)合全局閾值分割和局部閾值分割優(yōu)點(diǎn),根據(jù)圖像數(shù)字區(qū)域內(nèi)噪聲強(qiáng)度大小自適應(yīng)設(shè)定二值化閾值。通過實(shí)驗(yàn)驗(yàn)證,本文提出的投影閾值分割算法效果優(yōu)于常見的圖像增強(qiáng)算法和二值化算法。

數(shù)字區(qū)域內(nèi)二值化閾值表示為:

式中,p和pˉ分別表示該數(shù)字區(qū)域像素點(diǎn)密度和無噪聲情況下數(shù)字區(qū)域平均像素點(diǎn)密度。

圖像二值化操作后需要通過形態(tài)學(xué)算法去除剩余噪聲,當(dāng)圖像受到水滴、霧氣等噪聲影響,容易發(fā)生圖像特征丟失現(xiàn)象,如圖5a 所示。此時(shí)使用腐蝕等算法會(huì)造成部分特征丟失,受噪聲影響的數(shù)字區(qū)域經(jīng)二值化處理后出現(xiàn)斷裂現(xiàn)象,數(shù)字被分成多個(gè)連通區(qū)域,如圖5b 所示。因此需要對二值化處理后的圖像進(jìn)行修補(bǔ)。

圖5 數(shù)字修補(bǔ)對比圖

本文提出的修補(bǔ)方法是以數(shù)字“1”的橫向?qū)挾茸鳛樾扪a(bǔ)標(biāo)準(zhǔn),對數(shù)字區(qū)域內(nèi)像素點(diǎn)進(jìn)行篩選。當(dāng)以該像素點(diǎn)為中心的矩形區(qū)域內(nèi)縱向像素點(diǎn)數(shù)量過少時(shí),則認(rèn)為是噪聲點(diǎn)或是邊界點(diǎn),不做處理;若豎向像素點(diǎn)形成連通區(qū)域且橫向像素點(diǎn)數(shù)量小于標(biāo)準(zhǔn)值則進(jìn)行修補(bǔ)。

修補(bǔ)過程將圖像中斷裂數(shù)字進(jìn)行補(bǔ)全,多個(gè)特征信息融合為所需特征信息。如圖5c 所示,數(shù)字‘7’經(jīng)修補(bǔ)后僅存在一個(gè)連通區(qū)域,且數(shù)字特征十分明顯,避免了特征信息不足導(dǎo)致的誤識(shí)問題。

2.3 NSC 數(shù)字序列校正算法

2.3.1 NSC 算法概念

實(shí)際生產(chǎn)中,大部分儀表的讀數(shù)是基于一定規(guī)律變化的,如水表、電表。水表的讀數(shù)表示用水量,數(shù)字按規(guī)律逐漸變大,如“1,2,3”或“1,3,5”。因此當(dāng)規(guī)律變化的數(shù)字中有無法識(shí)別的情況,可以借助數(shù)字變化規(guī)律進(jìn)行推測,如圖6 所示,已知前兩幀圖像中最后一位數(shù)字分別為“3”和“4”,第三幀圖像中最后一位數(shù)字受到噪聲影響無法識(shí)別,但依照前兩幀圖像數(shù)字變化規(guī)律,該數(shù)字有較大的概率為“5”。

圖6 數(shù)字變化規(guī)律圖

NSC 算法基于數(shù)字規(guī)律變化的前提,將單個(gè)數(shù)字的識(shí)別變?yōu)閷Π摂?shù)字的數(shù)字序列識(shí)別。原始的CRNN 模型選擇識(shí)別概率最大的字符作為識(shí)別結(jié)果,當(dāng)遇到高噪聲導(dǎo)致的圖像特征信息不足情況,會(huì)產(chǎn)生誤識(shí)的情況。NSC 算法選擇識(shí)別概率最大的數(shù)字序列作為序列識(shí)別結(jié)果,數(shù)字序列的識(shí)別概率由組成該數(shù)列的多個(gè)數(shù)字識(shí)別概率相乘所得,因此識(shí)別準(zhǔn)確率受數(shù)字序列整體影響,降低了噪聲對單個(gè)數(shù)字識(shí)別準(zhǔn)確率的干擾權(quán)重。

2.3.2 NSC 算法流程

假設(shè)數(shù)字跳動(dòng)間隔為k,數(shù)字序列長度為n,上限為N。 STR1,STR2,···,STRm用于存放可行數(shù)字序列,m表 示可行數(shù)字序列的數(shù)量。設(shè)P1,P2,···,Pm為可行數(shù)字序列概率。Pout表 示輸出概率,Pidx表示輸出的數(shù)字序列。則NSC 算法流程如圖7 所示。

圖7 NSC 算法流程圖

1)設(shè)定數(shù)字跳動(dòng)間隔k和數(shù)字序列長度上限N,計(jì)算可行數(shù)字序列數(shù)量m和可行數(shù)字序列,并將可行數(shù)字序列存放在S TR1,STR2,···,STRm中;

2)對數(shù)字序列概率P1,P2,···,Pm和 序列長度n賦初值,令P1=1,P2=1,2,···,Pm=1,n=1;

3)判斷數(shù)字序列長度n是否大于上限N,如果不是,轉(zhuǎn)入步驟4),如果是,轉(zhuǎn)入步驟5);

4)獲取識(shí)別網(wǎng)絡(luò)對數(shù)字“0~9”的識(shí)別概率P1,P2,···,P9, 計(jì)算數(shù)字序列概率,序列長度n=n+1,轉(zhuǎn)入步驟3);

5)輸出最大識(shí)別概率Pout和對應(yīng)的數(shù)字序列Pidx作為識(shí)別結(jié)果,流程結(jié)束。

2.3.3 NSC 算法有效性證明

為說明NSC 算法的原理和有效性,本文做如下數(shù)學(xué)證明。

將圖片中某個(gè)位置數(shù)字的真實(shí)值記為i,識(shí)別為正確數(shù)字i的概率記為pi,i, 識(shí)別為錯(cuò)誤數(shù)字i′的概率記為pi,i′, 其中i,i′∈[0,9],i≠i′。假設(shè)該位置數(shù)字的跳動(dòng)間隔為1,將該位置上長度為n的數(shù)字序列 記 為S[i][i+1][i+2]···[i+j]···[i+(n-1)], 其 中i+j為(i+j)mod10 的 簡記,下文中的i+j、i+j+k等均為簡記。數(shù)字序列的概率為組成序列中數(shù)字的概率乘積,假設(shè)數(shù)字序列的初始數(shù)字為i,序列長度為n,識(shí)別為正確數(shù)字序列的概率記為:

識(shí)別為錯(cuò)誤數(shù)字序列的概率記為:

經(jīng)觀察發(fā)現(xiàn),存在以下啟發(fā)規(guī)則。

在高噪聲條件下,識(shí)別為正確數(shù)字的概率pi,i會(huì)發(fā)生下降,但從整體數(shù)據(jù)分析,識(shí)別為正確數(shù)字平均概率仍大于識(shí)別為錯(cuò)誤數(shù)字的平均概率。

數(shù)字概率分析實(shí)驗(yàn)說明了該啟發(fā)規(guī)則的正確性。

已知數(shù)字序列中,單個(gè)數(shù)字的識(shí)別概率分布相互獨(dú)立[16],假設(shè)識(shí)別為正確數(shù)字的概率服從以μˉcorrect為均值的分布;識(shí)別為錯(cuò)誤數(shù)字的概率服從以 μˉwrong為均值的分布[17]。由啟發(fā)規(guī)則和假設(shè)條件提出如下命題:

證明:正確數(shù)字序列概率乘積的期望ES(Pcorrect)和錯(cuò)誤數(shù)字序列概率乘積的期望ES(Pwrong)分別為:

則可得:

由命題1 可知在數(shù)字序列長度n達(dá) 到一定程度時(shí),正確數(shù)字序列依概率大于錯(cuò)誤數(shù)字序列,算法的有效性得到保證。在實(shí)際測試中,當(dāng)數(shù)字序列長度達(dá)到8 時(shí),PN-CRNN 模型識(shí)別準(zhǔn)確率趨于穩(wěn)定。

2.3.4 NSC 算法的影響因素

2.3.4.1 數(shù)字序列長度

2.3.4.2 可行數(shù)字序列數(shù)量

數(shù)字序列有多種可能,將滿足已知規(guī)律的數(shù)字序列定義為可行數(shù)字序列,其余為干擾數(shù)字序列。

在固定數(shù)字序列長度n的 前提下,NSC 算法受到可行數(shù)字序列數(shù)量的影響??尚袛?shù)字序列數(shù)量決定算法的時(shí)間復(fù)雜度,當(dāng)可行數(shù)字序列數(shù)量過于龐大時(shí),算法難以滿足實(shí)時(shí)識(shí)別。

可行數(shù)字序列數(shù)量受數(shù)字跳動(dòng)間隔影響,數(shù)字跳動(dòng)間隔可認(rèn)為是數(shù)字序列的規(guī)律。如數(shù)字跳動(dòng)間隔取值為1 時(shí),數(shù)字序列“1, 2, 3”為可行數(shù)字序列,數(shù)字序列“1, 5, 8”為干擾數(shù)字序列。當(dāng)數(shù)字跳動(dòng)間隔未知時(shí),數(shù)字序列沒有規(guī)律約束,所有數(shù)字序列都是可行數(shù)字序列。

2.3.5 NSC 算法參數(shù)的優(yōu)化

2.3.5.1 重復(fù)圖像篩選

重復(fù)圖像會(huì)極大增加可行數(shù)字序列的數(shù)量。以數(shù)字i∈[0,9], 序列長度n為例,此時(shí)可行數(shù)字序列共有1 0n種可能,如圖8a 所示。通過PTS 預(yù)處理算法剔除重復(fù)圖像后,可行數(shù)字序列數(shù)量降低為10×9n-1種可能,如圖8b 所示。

圖8 可行數(shù)字序列數(shù)量

2.3.5.2 數(shù)字跳動(dòng)間隔約束

在實(shí)際生產(chǎn)中,由于儀表數(shù)字變化情況不固定,因此數(shù)字跳動(dòng)間隔取值情況存在多種可能。

假設(shè)數(shù)字i∈[0,9], 數(shù)字序列長度為n, 當(dāng)數(shù)字跳動(dòng)間隔有兩種取值時(shí),以1, 2 混合情況為例,如圖9a 所示,可行數(shù)字序列數(shù)量為1 0×2n-1種;當(dāng)數(shù)字跳動(dòng)間隔有3 種取值時(shí),以1, 2, 3 混合情況為例,如圖9b 所示,可行數(shù)字序列數(shù)量為10×3n-1種。由此可得,可行數(shù)字序列數(shù)量隨數(shù)字跳動(dòng)間隔的取值數(shù)量增大而增大,因此減少數(shù)字跳動(dòng)間隔的取值數(shù)量可以有效減少可行數(shù)字序列數(shù)量。

圖9 控制數(shù)字跳動(dòng)間隔優(yōu)化

數(shù)字跳動(dòng)間隔在影響可行數(shù)字序列數(shù)量的同時(shí)也影響了NSC 算法的準(zhǔn)確率。假設(shè)數(shù)字儀表規(guī)律變化,數(shù)字跳動(dòng)間隔為1 所得數(shù)字序列如圖10a 所示,數(shù)字跳動(dòng)間隔為2 所得數(shù)字序列如圖10b 所示,數(shù)字跳動(dòng)間隔由1 加大為2 時(shí),數(shù)字序列的長度對應(yīng)由10 減少為5。當(dāng)數(shù)字跳動(dòng)間隔過大時(shí),數(shù)字之間呈現(xiàn)無序跳動(dòng),導(dǎo)致NSC 算法失效。因此減小數(shù)字跳動(dòng)間隔取值大小可以有效增加NSC算法的識(shí)別準(zhǔn)確率。

圖10 跳動(dòng)間隔對數(shù)字序列影響

實(shí)際生產(chǎn)中,數(shù)字跳動(dòng)間隔可通過改變采集設(shè)備的圖像采集頻率約束,當(dāng)儀表圖像變化規(guī)律時(shí),加快采集頻率可以減小數(shù)字跳動(dòng)間隔取值數(shù)量和取值大小。

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集

本文采用的數(shù)據(jù)集1 由電力企業(yè)通過監(jiān)控?cái)z像對儀表設(shè)備進(jìn)行實(shí)時(shí)采集制成,共3 510 張。為了驗(yàn)證NSC 算法在高噪聲情況下的效果,本文在高噪聲環(huán)境下對儀表設(shè)備進(jìn)行采集,得到噪聲圖像500 張;同時(shí)在數(shù)據(jù)集1 中隨機(jī)抽取部分圖像并通過數(shù)據(jù)增強(qiáng)方法添加噪聲,得到噪聲圖像404 張,將其與采集所得噪聲圖像混合,制作了高噪聲情況下的數(shù)據(jù)集2,共904 張,如圖11 所示,其中包括儀表鏡頭被臟污遮擋、光線過強(qiáng)導(dǎo)致的過曝、儀表電子元件損壞導(dǎo)致數(shù)字顯示不完整等情況。數(shù)據(jù)集共有4 414 張圖片,2 822 張用于網(wǎng)絡(luò)訓(xùn)練,1 592 張用于測試。

圖11 不同圖像噪聲

3.2 實(shí)驗(yàn)平臺(tái)

本文實(shí)驗(yàn)使用計(jì)算機(jī)硬件設(shè)備為Intel(R)Core(TM) i7-7800X CPU@3.50 GHz,模型訓(xùn)練使用2 個(gè)顯存為11 GB 的GeForce GTX 1080Ti 上訓(xùn)練。計(jì)算機(jī)系統(tǒng)為Ubuntu18.04LTS。

3.3 評價(jià)指標(biāo)

本文采用準(zhǔn)確率(accuracy, Acc)和每秒傳輸幀數(shù)(frames per second, FPS)作為評價(jià)指標(biāo)。correct_num是正確的識(shí)別圖像數(shù)量, all_num是圖像總數(shù),準(zhǔn)確率計(jì)算公式為:

3.4 結(jié)果分析

3.4.1 PTS 算法實(shí)驗(yàn)結(jié)果分析

預(yù)處理算法主要用于去除圖像噪聲,在保留特征信息的同時(shí)減少噪聲影響。圖像的預(yù)處理方法分為非物理模型的增強(qiáng)方法和基于物理模型的復(fù)原方法。

常用的增強(qiáng)方法有帶色彩恢復(fù)的多尺度視網(wǎng)膜增強(qiáng)算法(multi-scale retinex with color restoration,MSRCR)[19],自動(dòng)彩色均衡算法(automatic color equalization, ACE)[20],限制對比度自適應(yīng)直方圖均衡算法(contrast limited adaptive histogram equalization,CLAHE)[21]。

除圖像增強(qiáng)算法之外,圖像二值化處理也是常用的降噪方法[22]。常見的圖像二值化算法有平均灰度閾值分割和自適應(yīng)的最大類間方差法(maximum inter class variance, OTSU)[23]。

本文選擇ACE 算法、MSRCR 算法、CLAHE算法、OTSU 算法、全局閾值分割算法以及PTS算法進(jìn)行對比實(shí)驗(yàn)。

圖像增強(qiáng)算法可以增強(qiáng)圖像中前景和背景的對比度,改善過曝情況,但同時(shí)會(huì)提高噪聲影響。如圖12a~圖12d 所示,圖像增強(qiáng)算法無法去除圖像密集噪點(diǎn)。

圖12 預(yù)處理算法對比

全局閾值二值化分割時(shí)間復(fù)雜度較低,通過選取圖像中字體區(qū)域的平均像素值作為閾值對圖像進(jìn)行簡單的分割。閾值選取影響二值化圖像的質(zhì)量,閾值過大會(huì)導(dǎo)致圖像丟失部分特征,閾值過小則無法去除噪聲干擾,如圖12e 所示。自適應(yīng)的閾值分割算法,通過自適應(yīng)選取閾值對圖像進(jìn)行分割,當(dāng)圖片中前景和背景對比度較大時(shí),Otsu 算法計(jì)算所得閾值偏小,去噪效果較差,如圖12f 所示。PTS 算法通過垂直方向投影將圖像劃分為不同區(qū)域,針對區(qū)域內(nèi)噪聲強(qiáng)度自適應(yīng)選取分割閾值,并使用形態(tài)學(xué)方法減少噪聲干擾。相比于全局閾值分割算法和Otsu 算法有更好的去噪效果,如圖12g所示。

預(yù)處理算法對比實(shí)驗(yàn)使用CRNN 模型,主干網(wǎng)絡(luò)采用MobileNetV3(slim),首先在低噪聲數(shù)據(jù)集1 上測試噪聲干擾較小情況下預(yù)處理算法效果。實(shí)驗(yàn)結(jié)果如表1 所示。從表1 中可以看出,圖像增強(qiáng)算法對識(shí)別率提升效果有限;全局閾值分割算法損失了圖像部分特征,導(dǎo)致識(shí)別準(zhǔn)確率下降;Otsu算法對噪聲比較敏感,相比于原圖識(shí)別準(zhǔn)確率下降約14%;PTS 算法使用二值化處理消除部分噪聲,并通過投影分割方法解決閾值選取過高造成特征信息丟失的問題,相比于原圖識(shí)別準(zhǔn)確率提高約1.3%,相比全局閾值算法識(shí)別準(zhǔn)確率提高約2.7%。

表1 在數(shù)據(jù)集1 上的預(yù)處理算法對比

通過在低噪聲數(shù)據(jù)集1 上的預(yù)處理對比實(shí)驗(yàn)可知,圖像增強(qiáng)算法提升效果有限,且相比于圖像二值化算法,圖像增強(qiáng)算法復(fù)雜度較高[24]。為進(jìn)一步對比幾種預(yù)處理算法的效果,使用高噪聲數(shù)據(jù)集2 進(jìn)行測試,實(shí)驗(yàn)結(jié)果如表2 所示,使用PTS 算法處理后,圖像識(shí)別準(zhǔn)確率對比原圖提高約15%,對比使用全局閾值分割算法高約10%,對比使用圖像增強(qiáng)算法提高約6%。實(shí)驗(yàn)結(jié)果表明,PTS 算法對比其他算法,有更強(qiáng)的去噪效果。

表2 在高噪聲數(shù)據(jù)集2 上的預(yù)處理算法對比

3.4.2 數(shù)字序列概率分析

為驗(yàn)證NSC 算法啟發(fā)規(guī)則 μˉcorrect>μˉwrong的正確性,使用低噪聲數(shù)據(jù)集1 和高噪聲數(shù)據(jù)集2 進(jìn)行實(shí)驗(yàn)。

高噪聲數(shù)據(jù)集2 分析結(jié)果見表3,正確數(shù)字平均識(shí)別率為0.475,錯(cuò)誤數(shù)字平均識(shí)別率為0.057,錯(cuò)誤數(shù)字平均識(shí)別率小于正確數(shù)字平均識(shí)別率。低噪聲數(shù)據(jù)集1 分析結(jié)果見表4,正確數(shù)字平均識(shí)別率為0.962,錯(cuò)誤數(shù)字平均識(shí)別率為0.014,錯(cuò)誤數(shù)字平均識(shí)別率遠(yuǎn)小于正確數(shù)字平均識(shí)別率。

表3 在高噪聲數(shù)據(jù)集2 上的數(shù)字平均識(shí)別率乘積

表4 在數(shù)據(jù)集1 上的數(shù)字平均識(shí)別率乘積

表5 在高噪聲數(shù)據(jù)集2 上的正確識(shí)別率乘積

表6 在高噪聲數(shù)據(jù)集2 上的錯(cuò)誤識(shí)別率乘積

表7 在高噪聲數(shù)據(jù)集2 上的正確識(shí)別率與最大錯(cuò)誤識(shí)別率乘積比值

從兩組實(shí)驗(yàn)數(shù)據(jù)對比可知,NSC 算法的啟發(fā)規(guī)則成立。

3.4.3 NSC 算法效果測試

為驗(yàn)證NSC 算法的效果,使用高噪聲數(shù)據(jù)集2 測試。原始CRNN 模型選用PaddlePaddle 平臺(tái)數(shù)字識(shí)別模型[25],并對其添加PTS 算法和NSC 算法。如表8 所示,僅使用NSC 算法相比于原模型識(shí)別準(zhǔn)確率提高約37%,同時(shí)使用PTS 算法和NSC 算法相比于原模型提高約62%。

表8 在高噪聲數(shù)據(jù)集2 上的NSC 算法效果

3.4.4 數(shù)字序列長度對NSC 算法影響

NSC 算法的序列長度由參與運(yùn)算的數(shù)字個(gè)數(shù)決定,序列長度為1 的情況即原始模型。當(dāng)序列長度增大時(shí),模型識(shí)別準(zhǔn)確率逐漸增大,如表9 所示,因此NSC 算法效果隨數(shù)字序列長度n增加而增強(qiáng)。隨序列長度增大,識(shí)別準(zhǔn)確率上升趨勢逐漸變緩,如圖13 所示。在實(shí)際測試中,當(dāng)序列長度增大到某一閾值,識(shí)別準(zhǔn)確率達(dá)到最大值并不再增長。

圖13 序列長度與識(shí)別準(zhǔn)確率關(guān)系

3.4.5 數(shù)字跳動(dòng)間隔對NSC 算法的影響

NSC 算法受到數(shù)字序列數(shù)量影響,數(shù)字序列數(shù)量由數(shù)字跳動(dòng)間隔和起始位置決定。數(shù)字跳動(dòng)間隔由1 增加到2 時(shí),如表10 所示,準(zhǔn)確率下降約5%;當(dāng)改變起始位置時(shí),數(shù)字跳動(dòng)間隔變?yōu)? 和2 混合情況,準(zhǔn)確率下降約9%。同時(shí)改變數(shù)字跳動(dòng)間隔和起始位置,準(zhǔn)確率下降約12%。由實(shí)驗(yàn)結(jié)果可知,數(shù)字的跳動(dòng)間隔是影響算法識(shí)別準(zhǔn)確率的重要因素。在實(shí)際測試中,算法使用的序列長度較短,當(dāng)數(shù)字跳動(dòng)間隔過大時(shí),數(shù)字無法形成序列。針對此問題可通過調(diào)校設(shè)備采集時(shí)間間隔,增加采樣次數(shù),避免數(shù)字無序跳動(dòng),保證算法效果。

表10 數(shù)字間隔對NSC 算法影響

3.4.6 模型對比實(shí)驗(yàn)

在數(shù)據(jù)集1 上,對比PN-CRNN 模型與CRNN模型在正常情況下識(shí)別準(zhǔn)確率,主干網(wǎng)絡(luò)選擇MobileNetEnhance、 MobileNetV3[26], ResNet[27]和MobileNetV3(slim)。如表11 所示,添加PTS 算法和NSC 算法后模型準(zhǔn)確率均有不同程度的提高,其中MobileNetV3(slim)的識(shí)別準(zhǔn)確率可達(dá)到96.32%。

表11 在數(shù)據(jù)集1 上的模型對比

為進(jìn)一步驗(yàn)證模型效果,本文選擇基于SVTR[28]和PP-LCNet[29]的PP-OCRv3 模型進(jìn)行對比實(shí)驗(yàn)。如表12 所示,PN-CRNN 模型相比于PP-OCRv3模型在數(shù)據(jù)集1 上準(zhǔn)確率提高約2%,在高噪聲數(shù)據(jù)集2 上提高約22%。

表12 PN-CRNN 與PP-OCRv3 模型對比

4 結(jié) 束 語

本文針對儀表圖像噪聲復(fù)雜問題,提出了一種基于投影閾值分割和數(shù)字序列校正的高噪數(shù)字儀表圖像識(shí)別方法。首先使用PTS 投影閾值分割算法去除儀表圖像噪聲,以便于模型提取數(shù)字特征。然后通過NSC 數(shù)字序列校正算法將單個(gè)數(shù)字概率轉(zhuǎn)變?yōu)閿?shù)字序列概率,避免了因數(shù)字特征信息不足導(dǎo)致的誤識(shí)、漏識(shí)問題。實(shí)驗(yàn)結(jié)果表明,在高噪聲數(shù)據(jù)集上,本文算法對數(shù)字的識(shí)別準(zhǔn)確率達(dá)到93.64%,遠(yuǎn)遠(yuǎn)高于其他算法,具有很好的實(shí)用性。然而,本文算法存在對于數(shù)字序列條件要求較高、忽略了圖像中數(shù)位之間存在的規(guī)律等不足,未來將會(huì)針對這些不足繼續(xù)開展后續(xù)研究工作。

猜你喜歡
跳動(dòng)間隔儀表
◆ 儀表
◆ 儀表
儀表
間隔問題
跳動(dòng)的音符
跳動(dòng)的聲音
間隔之謎
咚,咚,咚,心臟在跳動(dòng)
上樓梯的學(xué)問
打造穩(wěn)定跳動(dòng)的“心臟”
太空探索(2014年3期)2014-07-10 14:59:39
聂荣县| 鱼台县| 峨边| 南京市| 福建省| 衢州市| 南和县| 泸州市| 钟祥市| 土默特左旗| 怀仁县| 巴中市| 东海县| 光山县| 米易县| 自治县| 故城县| 额济纳旗| 怀远县| 安庆市| 沁阳市| 抚顺市| 分宜县| 绩溪县| 柳林县| 德江县| 黎平县| 顺昌县| 汽车| 白玉县| 安达市| 崇州市| 克什克腾旗| 嵩明县| 皋兰县| 嵊州市| 宁都县| 淅川县| 桃江县| 水城县| 沂源县|