翟洪婷,張慶銳,卞若晨,孫麗麗,張延童,翟 啟
(國網(wǎng)山東省電力公司 信息通信公司,山東 濟南 250001)
電力系統(tǒng)是現(xiàn)代社會最重要、最龐大的人工系統(tǒng)之一,電力調(diào)度人員承擔著確保電力系統(tǒng)安全、高效、經(jīng)濟運行的職責。為了避免或減少機器故障帶來的不利影響,在機器出現(xiàn)故障時及時調(diào)度維修人員進行維修是保障安全經(jīng)濟運行的關(guān)鍵。傳統(tǒng)的電網(wǎng)調(diào)度系統(tǒng)存在調(diào)度工序復雜、調(diào)度效率低下等問題,難以適應智能電網(wǎng)的調(diào)度需求,甚至在極端情況下存在安全隱患。此外,維修人員是維修過程中的重要資源,也是稀缺資源,然而現(xiàn)有的維修人員調(diào)度隨機性很強,忽視了不同維修人員的專業(yè)能力的差別,不能針對性開展工作。針對上述問題,智能電網(wǎng)可以引入自動化技術(shù)、通訊技術(shù)等現(xiàn)代技術(shù)手段,對電力機器進行實時監(jiān)測,對有可能出現(xiàn)的問題進行控制,實現(xiàn)故障快速診斷和人員精確調(diào)度。如今基于機器監(jiān)測的維修人員調(diào)度方法受到了越來越多的關(guān)注,根據(jù)監(jiān)測到的機器故障程度和等級,在高維電網(wǎng)運行狀態(tài)中快速、準確地將維修人員調(diào)度到其擅長的領域,從而降低調(diào)度成本,提高維修效率。因此,故障監(jiān)測對維修人員調(diào)度顯得尤為重要。
在電廠中,1臺設備是由渦輪軸承[1,2]、泵[3]和閥門[4]等機器共同運作組成的,當其中某一部件出現(xiàn)故障后就可能導致整個系統(tǒng)無法運行,極端情況下會造成人員傷亡的嚴重后果。因此,為了防止此類事故的產(chǎn)生,對機器的運行狀態(tài)進行實時監(jiān)測是很有必要的。現(xiàn)有的故障監(jiān)測方法通常集中在振動、壓力和溫度方面,例如基于振動信號的滾動軸承故障檢測[5],基于溫度的燃氣機故障檢測[6]和基于壓力的飛行器發(fā)動機故障檢測[7]。但是這些方法在發(fā)現(xiàn)問題時可能已經(jīng)為時過晚,設備已經(jīng)處在亞健康狀態(tài),甚至嚴重損壞。定期維護和維修雖然可以在一定程度上減少故障的發(fā)生,但是人工成本高、效率低、性價比低。近年來,音頻監(jiān)測方法因為其效率高和成本低逐漸被人們所知曉,基于聲音的故障檢測預警可以提前發(fā)出危險警告,從而及時對機器進行維護。
異常聲音檢測是音頻監(jiān)測方法中的關(guān)鍵技術(shù)之一[8],可以被用于機器維護[9]等。異常聲音檢測方法可以分為有監(jiān)督和無監(jiān)督方法。有監(jiān)督的異常聲音檢測(Anomalous sound detection,ASD)一般是根據(jù)機器的內(nèi)部結(jié)構(gòu)和具體故障聲音來設計的[10]。目前已有一部分相關(guān)工作[11-14],例如文獻[12]中采取盲源分離方式剝離變壓器聲音信號中的干擾信號,并根據(jù)變壓器聲音信號特征構(gòu)建識別模型,進行變壓器直流偏磁聲紋識別;文獻[14]中采集正常工作聲音和3種異常情況聲音實現(xiàn)發(fā)電機故障檢測。但是有監(jiān)督ASD方法在實際情況中很難執(zhí)行,這是因為:異常情況發(fā)生的頻率較低;異常情況發(fā)生的時間難以事先預判;故意破壞昂貴設備去采集樣本數(shù)據(jù)是不切實際的;機器故障類型繁多,很難獲取用于有監(jiān)督學習的數(shù)據(jù)集。不同于有監(jiān)督ASD方法,無監(jiān)督ASD方法則在訓練階段僅需要采集機器正常運作時發(fā)出的聲音,創(chuàng)建1個正常狀態(tài)下的模型,然后利用該模型對采樣樣本進行評估。
受該思路啟發(fā),本文提出了一種基于圖聚類的機器異常聲音檢測方法。該方法首先對信號進行自適應濾波,消除音頻信號中的干擾噪聲。然后提取聲音的調(diào)制譜特征,用來表示信號譜分量隨時間的變化率,這種特征在過去可用作語音情感識別[15]、語音增強[16]等。最后將特征劃分為若干個互不相交的子集,每個子集被稱為簇,并在檢測階段得出每個待測聲音的特征,根據(jù)其與正常聲音的簇的標準-偏差歸一化距離來計算異常評分。
本文提出的方法主要包含預處理、特征提取、異常檢測3個部分。首先通過自適應濾波方法對信號進行降噪預處理,然后通過濾波器、加窗、離散傅里葉變換(Discrete Fourier transform,DFT)和希爾伯特變換得到調(diào)制譜特征,最后使用圖的聚類方法進行異常估計和評分。
在電氣設備運行的背景環(huán)境中充滿了多種干擾噪聲,如鳥鳴聲、講話聲、汽笛聲等,此類噪聲具有時變性和非穩(wěn)定性,不同噪聲之間差異很大且發(fā)生的場景充滿隨機性,因此采用機器學習的方法學習干擾噪聲的特點并擬合其分布??紤]到如果想要精確濾除背景環(huán)境中的噪聲,需要盡可能地實地采集聲音信號,這樣會有足夠的干擾噪聲數(shù)據(jù),因此采用高斯混合模型(Gaussian mixed mode,GMM)來學習干擾噪聲的特點,然后在識別階段判斷待測音頻中干擾噪聲的種類,最終通過自適應的噪聲補償算法濾除噪聲。
GMM模型是由多個單一高斯模型組合而成的,使每一種干擾噪聲都由多個子模型描述,各子模型通過高斯密度函數(shù)中對應的權(quán)值、均值和方差描述噪聲特征的一部分,GMM的概率密度函數(shù)如下
(1)
式中:ak是第k個高斯子模型的權(quán)值;φ(x|θk)是第k個子模型的高斯密度函數(shù);θk是第k個高斯子模型的參數(shù),包括均值μk和標準差σk;K是高斯子模型數(shù)量;x是從干擾噪聲中提取的向量。
首先在訓練階段αk和θk是未知的,無法通過已知信息x精確計算未知參數(shù)的大小,只能用最大似然法把能產(chǎn)生最大x的參數(shù)作為估計結(jié)果。由于每個點發(fā)生概率小,導致乘積變得極其小,因此對其取對數(shù)使得很小的輸入值變化引起較大的輸出值變動。GMM的似然函數(shù)如式(2)所示,轉(zhuǎn)化后的似然函數(shù)如下
(2)
(3)
再以式(3)為優(yōu)化目標,使用期望最大化(Expectation and maximization,EM)算法找到最佳參數(shù),EM算法過程如下
(1)使用K-means算法初始化1組參數(shù)θk={αk,μk,σk},k∈[1,K];
(2)計算每個數(shù)據(jù)來自子模型k的概率,過程如下
(4)
(5)
(6)
(7)
經(jīng)過計算,得到的各種噪聲分布可以描述對應干擾噪聲的特點,由此可以預測某一時刻干擾噪聲的幅值。在識別階段將待測音頻中提取的向量輸入式(1)中,即可算出待測音頻中的干擾噪聲屬于該模型對應的干擾噪聲的概率。此時采集得到的聲音由機器聲音和干擾噪聲組成,如下
(8)
通過模型估計得出的噪聲ni(t)是與y(t)不相關(guān)的信號,沒有考慮y(t)的連續(xù)性?;诖藛栴},根據(jù)噪聲模型的不同取t時刻前的wi個時刻的音頻時域分布,與y(t)組成1組數(shù)據(jù){y(t-wi),y(t-wi+1),…,y(t)},按照幅值越大補償越大原則進行補償,如下
(9)
式中:ymax和ymin是{y(t-wi),y(t-wi+1),…,y(t)}這1組數(shù)據(jù)中的最大值和最小值??烧{(diào)參數(shù)wi可以根據(jù)不同的噪聲模型靈活選取。
最終的機器音頻信號如下
(10)
本文采用的調(diào)制光譜特征提取步驟如圖1所示。調(diào)制譜圖與時間-頻率譜圖相對應,能夠顯示聲紋信號長時間的動態(tài)特性。
圖1 調(diào)制光譜特征提取步驟示意圖
通常使用三角形濾波器組和Gammatone濾波器組對聲音信號提取特征。由于三角形濾波器組對于耳蝸基底膜的模擬效果比較差,在充斥著各種雜音的復雜環(huán)境中提取頻率信息的能力也比較差?;啄た梢苑治雎曇舻念l率,能夠?qū)⒉煌念l率信息放置到對應的位置,并將頻率能量的大小對應為基底膜振動大小。Gammatone濾波器組可以很好地模擬人耳基底膜的特性,因此將預處理后的聲音信號x(n)通過模擬耳蝸處理[17]的60通道Gammatone濾波器組。濾波器組的第1個濾波器以125 Hz為中心,最后1個濾波器的中心頻率在采樣率的1/2以下。帶寬遵循等效矩形帶寬(Equivalent rectangular bandwidth,ERB),即
(11)
式中:s=1,2,3,…,60代表Gammatone濾波器組的第s個通道,fs是第s個通道的中心頻率,Qear表示在高頻處的濾波器的質(zhì)量,Bmin是最小帶寬。依據(jù)文獻[18]可知,Qear設置為9.265,Bmin設置為24.7。
對通道的輸出進行希爾伯特變換得到時間包絡
(12)
式中:n是時間變量,xs(n)是第s個通道的輸出,H{·}是希爾伯特變換,es(n)是時間包絡。對時間包絡es(n),s=1,2,3,…,60,加窗長為256 ms的漢明窗,幀移設置為40 ms。
將時間包絡表示為es(m;n),其中m是幀索引,然后對其進行DFT得到調(diào)制譜,過程如下
研究中參考Wischmeier等[10]關(guān)于坡長因子的經(jīng)典算法計算坡長因子L值.考慮坡度的不同,對S因子的求解采用分段計算[11],其中,緩坡(坡度<10°)采用McCool公式,陡坡(坡度≥10°)采用Liu等的公式.
Es(m;f)=|F(es(m;n))|
(13)
式中:m代表每乘1次漢明窗后得到的第m幀,f表示調(diào)制頻率,F(·)表示離散傅里葉變換,Es(m;f)是經(jīng)過計算后得到的調(diào)制譜。
根據(jù)文獻[19]得知調(diào)制濾波器組模擬人類聽覺組織,使用1個基于聽覺激勵的調(diào)制濾波器組進一步將調(diào)制頻率分組,共8個波段,記為δ(s,k)(m),k=1,…,8。其中,k代表調(diào)制濾波器組的第k個通道,m是幀索引。最終每個聲音片段得到1個60×8的調(diào)制譜圖。
調(diào)制譜圖中存在著顯著的變量,本文采用基于改進的圖聚類的方法來捕捉這種變化。圖2顯示了滑軌2正常工作聲音的4張調(diào)制譜圖。從圖2中可以看出,同一個機器的正常聲音譜圖也存在顯著的不同。
圖2 滑軌2正常工作聲音的4張調(diào)制譜圖
考慮1個圖G,其中V是由正常的訓練聲音樣本組成的節(jié)點集,E是連接節(jié)點的邊集。2個節(jié)點va,vb∈V共享同一條邊eab∈E,且使得
vb=argmin({d(va,vc)|c∈V,c≠a})
(14)
式中:d(va,vc)是va和vc之間的距離,vb是能使距離d(va,vc)最小的vc的值。這種方式構(gòu)建的圖G是由若干不相交的子圖組成的,即G=g1∪g2,…,gn,且gi∩gj=φ,?i,j=1,2,…,n|i≠j。每一個子圖被視為1個單獨的簇,通過取每個簇內(nèi)所包含的訓練聲音的調(diào)制譜圖的均值和標準差來計算每個簇對應的均值μl和標準差σl。
(15)
式中:Et,s,k是第t個待測樣本通過Gammatone濾波器組第s個通道和調(diào)制濾波器第k個通道后得到的能量值,μl是第l個簇的均值,σl是第l個簇的標準差。
這種計算異常分數(shù)方法的原理是正常樣本會比異常樣本將更接近簇中心。相比于基礎的圖聚類算法需要計算待測樣本到每個訓練樣本的距離,本文方法只需要根據(jù)待測樣本的數(shù)據(jù)計算每個簇到訓練樣本的距離,很大程度上減少了計算量。
基于監(jiān)測的結(jié)果可以加強對電力動態(tài)安全穩(wěn)定的監(jiān)控,通過監(jiān)測動態(tài)數(shù)據(jù)對電網(wǎng)運行狀態(tài)進行分析,以此為依據(jù)進行后期電力人員調(diào)度決策,提高調(diào)度人員管控能力。
本文使用工業(yè)機器聲數(shù)據(jù)集MIMII DateSet[20],其中包含了風扇、閥門、泵和滑軌這4種機器的真實聲音,每種機器類型有4個單獨的機器,編號為0、2、4和6。每段聲音的采樣率為16 kHz,時間為10 s。訓練集中只有機器正常工作時的聲音,測試集中同時有正常工作時的聲音和出現(xiàn)異常時的聲音。
為了對系統(tǒng)進行性能評估,本文采用了受試者工作特征(Receiver operating characteristic,ROC)曲線下的面積(Area under curve,AUC)來評估實驗結(jié)果。AUC是異常檢測中最為常用的指標之一,因為ROC曲線一般是在y=x這條曲線的上方,所以AUC取值范圍一般在0.5和1之間。AUC可以理解為給出1個正常聲音片段和異常聲音片段時,模型將正常聲音樣本預測為正確聲音樣本的概率大于將異常聲音樣本預測為正常聲音樣本的可能性。因此AUC越大說明準確性越高,計算過程如下
(16)
預警信息誤報率過高會浪費很多人力和物力,所以在低假陽性率(False positive rate,FPR)的情況下提高真陽性率(True positive rate,TPR)也是相當重要的。盡管分類器在使用AUC評價時的效果一般很不錯,但是AUC代表的是在全部FPR下的性能情況,如果只針對在低FPR情況下性能的好壞,pAUC比AUC更加能夠體現(xiàn)系統(tǒng)的準確度。因此也使用pAUC作為系統(tǒng)的評估指標。pAUC是特定區(qū)間內(nèi)的AUC,一般定義為在FPR范圍為[0,p]下的AUC,p的取值為0.1,計算過程如下
(17)
本文選取DCASE2020 Task2[21]中的基礎系統(tǒng)作為對照。基礎系統(tǒng)是1個簡單的基于自編碼器的異常評分計算器,對自編碼器進行訓練以最小化正常聲音樣本的重構(gòu)誤差,以待測數(shù)據(jù)的重構(gòu)誤差作為異常分數(shù)。對4種機器的檢測結(jié)果進行了對比,結(jié)果如圖3所示。
圖3顯示了閥門、風扇、滑軌和泵在基礎系統(tǒng)和本文提出的系統(tǒng)上檢測后得出的AUC和pAUC。可以看出本文提出的系統(tǒng)在4種機器的檢測精度上均有提高。從圖3(a)可以看出,對于閥門,其檢測精度大幅度提高,平均AUC和平均pAUC提升了33%和43%。對于風扇、泵和滑軌這3種機器,平均AUC分別從65.09%、72.09%、85.39%提升至72.46%、78.67%、91.21%。泵和滑軌的pAUC從59.33%、66.16%提升至68.78%、79.80%。然而從圖3(b)中可以看出,每個風扇的pAUC均無明顯變化,這是由于異常發(fā)生的時間非常短,沒有捕捉到其長期特征所導致的。
圖3 基礎系統(tǒng)與改進系統(tǒng)檢測效果對比圖
本文提出一種面向電力人員智能調(diào)度的故障聲音檢測方法,在僅有正常聲音訓練集的情況下,先通過自適應噪聲補償算法濾除噪聲,再提取音頻的調(diào)制譜特征,最后使用圖的聚類算法進行異常估計和評分。實驗結(jié)果表明,其檢測準確性有一定的提升。在未來的工作中可以進一步將此方法與電力人員智能調(diào)度聯(lián)合優(yōu)化,使調(diào)度決策從專家智能離線粗放運行的模式變革為人工智能在線精細運行的模式,從而實現(xiàn)調(diào)度智能化。