黃忠勝 劉文華 宋文容 強(qiáng)富平
1. 國(guó)家管網(wǎng)西部管道公司 新疆 烏魯木齊 830000
2. 昆侖數(shù)智科技有限責(zé)任公司 北京 102200
目前國(guó)內(nèi)外管道閥室泄漏檢測(cè)方法主要分為兩大類,即直接檢測(cè)和間接檢測(cè)[1]。這些泄漏檢測(cè)方法存在諸多缺陷,主要表現(xiàn)在:①需要實(shí)時(shí)獲取管道運(yùn)行壓力、流量、溫度等運(yùn)行參數(shù),而實(shí)際中對(duì)管道閥室獲取完整的實(shí)時(shí)數(shù)據(jù)難度大[2];②無論直接檢測(cè)或是間接檢測(cè),上述檢測(cè)方法與管道閥室信息化管理,仍然需要大量人工參與,不利于管道閥室數(shù)字化智能化建設(shè)[3];③目前檢測(cè)方法多基于單因素?cái)?shù)據(jù)(如管道),對(duì)閥室的溫度、聲音等自然環(huán)境影響參數(shù)應(yīng)用研究不足,不能從整體多維度進(jìn)行信息分析和多種檢測(cè)方法的相互校驗(yàn)[4]。
為解決上述檢測(cè)方法存在的問題,本文提出了基于多算法融合的閥室天然氣泄漏智能檢測(cè)分析研究方法,通過智能聲音識(shí)別和溫度規(guī)則綜合診斷,提高管道閥室天然氣泄漏檢測(cè)準(zhǔn)確率和可靠性。
下面主要研究數(shù)字濾波、小波降噪、譜減法3種典型的降噪方法。
1.1.1 數(shù)字濾波
數(shù)字濾波對(duì)輸入信號(hào)采樣多次,然后用特定計(jì)算方法進(jìn)行數(shù)字處理,以削弱或?yàn)V除干擾噪聲造成的隨機(jī)誤差,從而獲得真實(shí)信號(hào)過程。
1.1.2 小波降噪
基本思路是將信號(hào)通過小波變換,信號(hào)產(chǎn)生的小波系數(shù)含有信號(hào)的重要信息,將信號(hào)經(jīng)小波分解后小波系數(shù)較大,噪聲小波系數(shù)較小,通過選取合適的閥值進(jìn)行篩選[5]。
1.1.3 譜減法降噪
譜減法適用于滿足平穩(wěn)噪聲(整個(gè)時(shí)間范圍內(nèi),噪聲均值和方差基本保持不變),且噪聲為純加性噪聲的場(chǎng)景。工程中一般默認(rèn)混合信號(hào)(含噪信號(hào))的前幾幀僅包含環(huán)境噪聲,利用混合信號(hào)的前幾幀的平均幅度譜或者能量譜作為估計(jì)噪聲的幅度譜或者能量譜。最后利用混合信號(hào)(含噪信號(hào))的幅度譜或者能量譜與估計(jì)到的幅度譜與能量譜相減,得到純凈信號(hào)的幅度譜或者能量譜。
通過拾音器獲取聲音信號(hào),經(jīng)過采樣與量化,轉(zhuǎn)化為數(shù)字信號(hào)。通過對(duì)數(shù)字信號(hào)進(jìn)行分幀、加窗處理,即得到固定時(shí)間間隔的音頻幀。從這些音頻幀中取出固定維度的特征向量,再對(duì)這些特征進(jìn)行幀疊加與幀采樣,即完成了音頻由時(shí)域到頻域的特征提取,得到最終的特征幀。這些最終的特征幀將被作為機(jī)器學(xué)習(xí)算法的輸入,去完成聲音識(shí)別等高級(jí)任務(wù)。
1.3.1 基本思路
每種聲音都具有其獨(dú)特性,音頻片段A提取特征logfBank1(logfBank提取算法類似于MFCC算法,都是基于fBank特征提取結(jié)果基礎(chǔ)上,再進(jìn)行一些處理),在音頻A中加入泄漏聲音后提取混合聲音頻特征logfBank2,logfBank1與logfBank2其特征數(shù)值差異即為是否含有異常泄漏聲音。
1.3.2 基于panns_cnn14神經(jīng)網(wǎng)絡(luò)模型進(jìn)行異常檢測(cè)
本次采用pans_cnn14作為預(yù)訓(xùn)練模型,用于音頻的特征訓(xùn)練。
(1)數(shù)據(jù)集準(zhǔn)備
訓(xùn)練音頻分2組,分為泄漏音頻和非泄漏音頻,泄漏音頻內(nèi)包含有天然氣閥室真實(shí)泄漏聲音以及實(shí)驗(yàn)室模擬泄漏聲音,總計(jì)時(shí)長(zhǎng)達(dá)8h;非泄漏音頻包含天然氣閥室背景聲音以及日常生活背景聲,總計(jì)時(shí)長(zhǎng)達(dá)40h。2組音頻通過格式轉(zhuǎn)化、采樣率歸一化、音頻降噪處理、音頻切分等處理,分給每個(gè)時(shí)長(zhǎng)為5s的wav格式音頻片段。
(2)加載預(yù)訓(xùn)練模型
項(xiàng)目基于百度飛槳PaddleSpeech深度學(xué)習(xí)框架進(jìn)行開發(fā),預(yù)訓(xùn)練模型基于Audioset音頻數(shù)據(jù)進(jìn)行訓(xùn)練,該數(shù)據(jù)由谷歌發(fā)布,包括632個(gè)音頻事件類的擴(kuò)展類目和從YouTobe視頻整理的2084320個(gè)人類標(biāo)記的10s聲音剪輯的結(jié)合,可涵蓋大部分的音頻場(chǎng)景。
(3)設(shè)計(jì)分類算法
深度學(xué)習(xí)方法可以突破特征維度數(shù)量的限制,以更靈活的組網(wǎng)方式和更深的網(wǎng)絡(luò)層次,更好地提取聲音的高層特征,從而獲得更好的分類指標(biāo)[6]。
采用panns中的CNN14作為backbone,用于提取聲音的深層特征,SoundClassifer創(chuàng)建下游的分類網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)輸入音頻的分類。
(4)工程部署和實(shí)驗(yàn)測(cè)試
實(shí)驗(yàn)測(cè)試數(shù)據(jù)采用與訓(xùn)練數(shù)據(jù)相同的格式,實(shí)際泄漏音頻420個(gè),非泄漏音頻9580個(gè),合計(jì)10000個(gè)音頻。實(shí)驗(yàn)基于最新訓(xùn)練模型,預(yù)測(cè)準(zhǔn)確率99.7%,錯(cuò)誤率0.3%。
1.4.1 基本思想
提取特定時(shí)長(zhǎng)音頻特征矩陣,通過計(jì)算矩陣相似度來表示音頻之間的相似程度。獲取泄漏音頻作為比對(duì)庫,計(jì)算測(cè)試音頻與比對(duì)數(shù)據(jù)庫中所有泄漏音頻相似度均值,通過與實(shí)驗(yàn)探索的閾值進(jìn)行對(duì)比,預(yù)測(cè)測(cè)試音頻是否泄漏。
1.4.2 基于音頻MFCC特征提取矩陣進(jìn)行相似度計(jì)算
(1)數(shù)據(jù)集準(zhǔn)備
數(shù)據(jù)集準(zhǔn)備同1.3.2數(shù)據(jù)準(zhǔn)備一致。
(2)音頻特征提取
梅爾頻譜特征作為聲音識(shí)別和聲紋識(shí)別領(lǐng)域最為成熟的音頻特征,諸多音頻處理工具包如librosa、torchaudio、paddleaudio等都有MFCC特征提取函數(shù),輸入音頻文件,即可獲得相應(yīng)的特征矩陣。
利用訓(xùn)練好的聲音分類模型,截取神經(jīng)網(wǎng)絡(luò)和線性層部分作為新模型,可獲取一維音頻特征表示向量,實(shí)驗(yàn)探索中使用panns_cnn14成熟音頻分類模型,并基于實(shí)驗(yàn)音頻數(shù)據(jù)進(jìn)行訓(xùn)練微調(diào)。
實(shí)驗(yàn)探索中基于聲紋模型神經(jīng)網(wǎng)絡(luò)層(自定義多層LSTM或成熟的ECAPA-TDNN模型)加線性層作為新模型,獲取音頻一維特征向量。
(3)相似性度量與閾值探索
音頻經(jīng)過特征提取即可獲得矩陣或一維向量,通過比較矩陣或向量的相似性即可表示音頻之間的聲音相似程度:
相似性方案中閾值確定,計(jì)算每一個(gè)泄漏音頻與其他泄漏音頻的相似性,得到數(shù)組χ0,χ1,χ2…χi,同樣計(jì)算每一個(gè)非泄漏音頻與所有泄漏音頻的相似性,得到數(shù)組δ0,δ1,δ2…δj尋找最佳可區(qū)分兩組相似性的值α作為區(qū)分閾值。
(4)工程部署和實(shí)驗(yàn)測(cè)試
實(shí)驗(yàn)測(cè)試數(shù)據(jù)采用與訓(xùn)練數(shù)據(jù)相同的格式,實(shí)際泄漏音頻420個(gè),非泄漏音頻9580個(gè),合計(jì)10000個(gè)音頻。實(shí)驗(yàn)分別基于3種音頻特征提取方式進(jìn)行測(cè)試,梅爾頻譜系數(shù)診斷預(yù)測(cè)準(zhǔn)確率99.78%,效果略優(yōu)于其他2種診斷方式。
先采集一段時(shí)間的區(qū)域最低溫,以此計(jì)算平均最低溫Ta,后續(xù)測(cè)得的實(shí)時(shí)區(qū)域最低溫T低于該平均溫某個(gè)特定值(閾值A(chǔ)),即:T 根據(jù)方案設(shè)計(jì),在不同閾值設(shè)定下進(jìn)行30次(25次非泄漏,5次模擬泄漏)工況實(shí)驗(yàn),測(cè)試表明在實(shí)驗(yàn)工況條件下設(shè)置閾值為1.8℃效果最佳。 具體做法是,采集閥室不易發(fā)生泄漏位置處溫度Ta,采集閥室容易發(fā)生泄漏位置處溫度Tb,設(shè)備每隔30s采集兩區(qū)域的溫度進(jìn)行對(duì)比。正常工況條件下Ta與Tb接近,當(dāng)泄漏發(fā)生時(shí),Ta>>Tb,通過與設(shè)定閾值T對(duì)比診斷。因兩區(qū)域處于相同的工況條件,能夠影響兩區(qū)域溫度差異發(fā)生變化的因素,排除采集設(shè)備的微小差異,只有泄漏工況條件。 根據(jù)方案設(shè)計(jì),在不同T值設(shè)定下分別進(jìn)行了30次(25次非泄漏,5次模擬泄漏)工況實(shí)驗(yàn),測(cè)試表明在實(shí)驗(yàn)工況條件下設(shè)置閾值0.8℃效果最佳。 結(jié)合泄漏音頻異常檢測(cè)與泄漏音頻相似性對(duì)比兩種方案,將音頻事件檢測(cè)過程中模型預(yù)測(cè)概率值與音頻相似性賦予不同權(quán)重,再與經(jīng)驗(yàn)閾值進(jìn)行對(duì)比,從而給出音頻綜合診斷結(jié)果。 結(jié)構(gòu)化溫度診斷的2種方案,在大量實(shí)驗(yàn)基礎(chǔ)上,分別給出方案最佳閾值和在該閾值條件下預(yù)測(cè)結(jié)果的準(zhǔn)確度。賦予2種預(yù)測(cè)不同權(quán)重,再與經(jīng)驗(yàn)值閾值對(duì)比,給出溫度診斷結(jié)果。 考慮到任何單一診斷方法都很難達(dá)到完全準(zhǔn)確可靠,而天然氣泄漏的危害性極大。在綜合音頻、結(jié)構(gòu)化溫度診斷時(shí),任何一種方案監(jiān)測(cè)到泄漏即進(jìn)行報(bào)警。 在590次工業(yè)試驗(yàn)中預(yù)測(cè)準(zhǔn)確率在97%以上,測(cè)試結(jié)果如表1所示。 表1 綜合工業(yè)試驗(yàn)異常診斷實(shí)驗(yàn)結(jié)果 本文研究基于聲音、結(jié)構(gòu)化溫度綜合分析進(jìn)行診斷,針對(duì)西部管道公司輸氣管道2處閥室開展工業(yè)性試驗(yàn)。通過泄漏音頻異常檢測(cè)和音頻相似性對(duì)比進(jìn)行聲音綜合診斷;通過檢測(cè)同一采集點(diǎn)溫度隨時(shí)間變化和同時(shí)檢測(cè)不同采集點(diǎn)溫度差異進(jìn)行溫度綜合診斷。2.2 不同采集點(diǎn)溫度對(duì)比變化的閾值設(shè)置與實(shí)驗(yàn)測(cè)試
3 綜合音頻診斷與溫度數(shù)據(jù)檢測(cè)分析
3.1 音頻綜合診斷
3.2 結(jié)構(gòu)化溫度綜合診斷
3.3 音頻、結(jié)構(gòu)化溫度綜合診斷
4 結(jié)束語