陸正卿,方維嵐,胡曉俊,梁軍汀
(1.上海煙草集團(tuán)有限責(zé)任公司,上海 200082;2.同濟(jì)大學(xué)聲學(xué)研究所,上海 200092)
在工業(yè)企業(yè)中,制冷機(jī)或制冷機(jī)組的使用極為廣泛。目前,制冷機(jī)的故障檢測大多采用人工的方法,不僅效率低,而且容易出現(xiàn)誤檢或漏檢。在制冷機(jī)的長期運(yùn)行過程中,因氣缸、曲軸磨損以及管路、設(shè)備松動等導(dǎo)致的運(yùn)行異?;蚬收贤殡S著制冷機(jī)運(yùn)轉(zhuǎn)噪聲的加大和異常聲音的產(chǎn)生,因此,采用聲音識別技術(shù)對制冷機(jī)的運(yùn)轉(zhuǎn)噪聲進(jìn)行研究,從而實(shí)現(xiàn)制冷機(jī)運(yùn)行狀況及故障的在線監(jiān)控,不僅是可行的,也是非常有必要的。
聲音信號識別的關(guān)鍵是聲信號特征參數(shù)的選擇、提取以及分類模型的建立。關(guān)于聲信號特征參數(shù)的提取,常用的方法有線性預(yù)測倒譜系數(shù)(LPCC)法和Mel頻率倒譜系數(shù)(MFCC)法等[1-3];常用的分類模型有基于高斯混合模型(GMM)的聚類算法模型、基于機(jī)器學(xué)習(xí)的最小二乘支持向量機(jī)回歸算法模型、基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)/神經(jīng)網(wǎng)絡(luò)(RNN)/長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型等[4-8]。采用不同的特征參數(shù)及分類模型,聲信號的處理效果也不同。
筆者針對企業(yè)的實(shí)際需求,在分析、研究各種聲音識別技術(shù)的基礎(chǔ)上,根據(jù)制冷機(jī)運(yùn)轉(zhuǎn)噪聲所具有的持續(xù)時間長、噪聲信號較為平穩(wěn)等特性,提出了一種將MFCC與LSTM相結(jié)合的制冷機(jī)運(yùn)行狀態(tài)及故障識別方法,研制了一種基于聲信號無線遠(yuǎn)傳和聲紋識別的制冷機(jī)運(yùn)行及故障監(jiān)控系統(tǒng),并采用試驗(yàn)的方法驗(yàn)證該方法的有效性。
MFCC是根據(jù)人耳對聲音信號的頻率非線性感知特性,對接收到的制冷機(jī)運(yùn)轉(zhuǎn)噪聲語譜信號(即時頻分布信號)進(jìn)行一系列的處理后計算得到的,MFCC特征提取的步驟如下。
(1) 信號預(yù)處理。
包括預(yù)加重、分幀、加窗、去噪處理等,其中,預(yù)加重主要用于聲信號的高頻衰減補(bǔ)償;分幀用于聲信號的短時或瞬時特征提取,常采用交疊分段的方法,使得幀與幀之間的信號有一個較為平滑的過渡;加窗主要用于減小每幀信號在起始點(diǎn)和終點(diǎn)處可能存在的因直接分段截取而產(chǎn)生的突變,加窗常采用Hamming窗函數(shù)。
(2) 對幀長為N(采樣點(diǎn))的信號中的每幀信號求離散功率譜。
(3) Mel頻率轉(zhuǎn)換。
對求得的離散功率譜中的線性頻率f進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為非線性Mel頻率mf,則有
mf=2 595log10(1+f/700)
(1)
(4) Mel濾波器組濾波、取對數(shù)。
對頻率轉(zhuǎn)換后的離散功率譜Xa(k),用M個在Mel頻率刻度上均勻分布且相互重疊的三角帶通濾波器Hm(k) 進(jìn)行濾波,并對每個濾波器的輸出求對數(shù)能量s(m),則有
0≤m (2) 式中:k為整數(shù),且0≤k≤N-1。 (5) 離散余弦變換(DCT)。 對求得的對數(shù)能量s(m)進(jìn)行離散余弦變換,得到MFCC 系數(shù)C(n) 0 (3) 式中:L為MFCC系數(shù)的階數(shù),且L≤M。 (6) 動態(tài)特征。 式(3)求得的MFCC 系數(shù)C(n)反映了聲信號參數(shù)的靜態(tài)特性,是MFCC的靜態(tài)譜部分,可以使用C(n)的一階或二階差分來對聲信號參數(shù)的動態(tài)特征進(jìn)行描述,具有很好的魯棒性。C(n)一階差分d(n)可表示為 (4) 式中:K表示一階差分的時間差,可根據(jù)具體情況選擇1或2。 將一階差分的計算結(jié)果,按照式(4)的方法再進(jìn)行一次一階差分計算,就可以得到MFCC的二階差分參數(shù)。 1.2.1 LSTM基本結(jié)構(gòu)單元 LSTM的基本結(jié)構(gòu)單元[9]如圖1所示。圖1中,每一基本結(jié)構(gòu)單元都由遺忘門、輸入門、輸出門以及細(xì)胞狀態(tài)更新層等4部分構(gòu)成,它們以一種特殊的方式進(jìn)行信息交互,從而避免發(fā)生梯度消失和梯度爆炸現(xiàn)象。其中,遺忘門輸出值ft介于 0~1之間,“0”表示全部忽略,“1”表示全部接受,遺忘門的存在使模型具有長久保存信息的功能;輸入門分成it和t兩部分,其中it確定當(dāng)前輸入中的哪些信息需要更新,輸入門的存在可以避免無用信息被記錄。圖1中σ()為激勵函數(shù),tanh()為雙曲正切函數(shù),xt為t時刻的輸入信息;ht為t時刻的輸出信息;Ot為輸出門。 圖1 LSTM基本結(jié)構(gòu)單元示意 LSTM內(nèi)部工作流程大致可分為遺忘階段、選擇性記憶階段和輸出階段等3個階段,其中遺忘階段主要是在對上一個LSTM節(jié)點(diǎn)的輸入信息進(jìn)行判斷后,對其進(jìn)行選擇性遺忘,以便篩選出其中的重要信息向后傳導(dǎo);選擇性記憶階段主要是對前一節(jié)點(diǎn)傳輸而來的輸入信號xt進(jìn)行選擇性記憶,從而篩選出其中的重要內(nèi)容;輸出階段決定哪些信息會被作為當(dāng)前狀態(tài)的有效信息進(jìn)行輸出。 1.2.2 LSTM神經(jīng)網(wǎng)絡(luò)總體結(jié)構(gòu) 畢業(yè)要求中提到“基于科學(xué)原理”進(jìn)行研究,運(yùn)用“自然科學(xué)、工程基礎(chǔ)和專業(yè)知識”,可見機(jī)械工程材料的基本科學(xué)原理是教學(xué)的重點(diǎn)內(nèi)容。課程體系中的主要原理包括:力學(xué)、晶體學(xué)、材料凝固過程和二元合金相圖、鋼的非平衡相變和鋼的熱處理原理等。這些內(nèi)容較多且比較零碎,是重點(diǎn)又是難點(diǎn)。在教學(xué)過程中,需要把握抽象理論的內(nèi)在聯(lián)系規(guī)律,即以成分、組織、工藝和性能為主線講解,最終目標(biāo)是實(shí)現(xiàn)材料的應(yīng)用。從晶體結(jié)構(gòu)角度設(shè)計材料成分,通過制定和改進(jìn)熱處理工藝改變組織,達(dá)到期望的力學(xué)性能。 筆者設(shè)計的LSTM神經(jīng)網(wǎng)絡(luò)分類模型由輸入層、隱藏層、全連接層、Softmax分類層和輸出層構(gòu)成(見圖2)。 圖2 LSTM神經(jīng)網(wǎng)絡(luò)分類模型 輸入層用于MFCC參數(shù)的輸入;隱藏層為多層LSTM構(gòu)成的LSTM網(wǎng)絡(luò),用于對輸入MFCC特征參數(shù)進(jìn)行多層次抽象或者更好地展現(xiàn)其抽象化特征,以便對這些特征進(jìn)行更好地線性劃分;全連接層用于增加模型的非線性表達(dá)能力,提高模型的學(xué)習(xí)能力并指定輸出類別的個數(shù);Softmax分類層用于接收來自全連接層的經(jīng)過處理的特征數(shù)據(jù),計算并輸出各類別分類的概率;輸出層用于輸出最后的分類結(jié)果。 研制的基于聲信號無線遠(yuǎn)傳和聲紋識別的制冷機(jī)運(yùn)行及故障監(jiān)控系統(tǒng)結(jié)構(gòu)框圖如圖3所示。 圖3 故障監(jiān)控系統(tǒng)結(jié)構(gòu)框圖 圖3中,信號調(diào)理采集及無線遠(yuǎn)傳儀將麥克風(fēng)接收到的制冷機(jī)運(yùn)轉(zhuǎn)噪聲信號進(jìn)行調(diào)理、放大、采集后,通過通用分組無線業(yè)務(wù)(GPRS)網(wǎng)絡(luò)、廣域互聯(lián)網(wǎng)以及云平臺傳送給上位計算機(jī),接收信號的處理、識別主要在上位計算機(jī)中進(jìn)行。 接收信號調(diào)理采集及無線遠(yuǎn)傳儀采用低噪聲、微功耗設(shè)計,其電路原理框圖如圖4 所示。 圖4 接收信號調(diào)理采集及無線遠(yuǎn)傳儀電路原理框圖 圖4中,采用由前置放大器、可控增益放大器、濾波器、主放大器構(gòu)成的四級運(yùn)算放大器結(jié)構(gòu)對麥克風(fēng)接收到的制冷機(jī)運(yùn)轉(zhuǎn)噪聲信號進(jìn)行放大、調(diào)理,其中前置放大器和主放大器的增益固定;可控增益放大器的增益由單片機(jī)通過控制數(shù)字電位器的電阻來實(shí)現(xiàn);有源帶通濾波器的帶寬根據(jù)制冷機(jī)運(yùn)轉(zhuǎn)噪聲的頻率特性設(shè)定。 筆者采用MATLAB語言編制了相關(guān)的MFCC特征提取及LSTM神經(jīng)網(wǎng)絡(luò)分類識別軟件,并用自行研制的故障監(jiān)控系統(tǒng),對現(xiàn)場使用的離心式制冷機(jī)的運(yùn)轉(zhuǎn)噪聲進(jìn)行了采集、遠(yuǎn)傳及相關(guān)的分類識別試驗(yàn)。試驗(yàn)時,根據(jù)制冷機(jī)運(yùn)轉(zhuǎn)噪聲的頻率特性將有源帶通濾波器的帶寬設(shè)置為100 Hz~2 kHz,接收信號的AD(模數(shù))采樣位數(shù)為16位,采樣率在1 kHz~16 kHz內(nèi)可任意設(shè)置。 試驗(yàn)中,將聲信號的AD采樣率設(shè)置為16 kHz,每次采集的信號時間長度設(shè)置為5 s,F(xiàn)MCC特征提取主要參數(shù)設(shè)置如表1所示。 表1 MFCC特征提取主要參數(shù)設(shè)置 Mel濾波器的個數(shù)為36個,以便對接收聲信號的整個頻率范圍進(jìn)行良好的覆蓋;MFCC階數(shù)為18,可以在不影響測試性能的前提下有效減少特征參數(shù)的數(shù)據(jù)量;每幀長度設(shè)為256個采樣點(diǎn),在16 kHz采樣率下對應(yīng)的時間長度為16 ms,符合短時信號時間長度一般為10~30 ms的限制性要求;每幀位移設(shè)為80個采樣點(diǎn),能夠保證每幀之間有相對平滑的過渡;小信號切除閾值設(shè)為5%,用來切除接收聲信號中存在的微小噪聲;窗函數(shù)采用比較常用的Hamming窗。 提取的MFCC特征參數(shù)包含靜態(tài)特性參數(shù)和一階差分動態(tài)特性參數(shù)兩部分。以MFCC靜態(tài)特性參數(shù)為例,試驗(yàn)中實(shí)測的聲信號波形及對應(yīng)的MFCC特征譜圖如圖5所示。 圖5 實(shí)測的聲信號波形及對應(yīng)的MFCC特征譜圖 試驗(yàn)中,LSTM神經(jīng)網(wǎng)絡(luò)的主要參數(shù)設(shè)置如表2所示。 表2 LSTM神經(jīng)網(wǎng)絡(luò)的主要參數(shù)設(shè)置 根據(jù)現(xiàn)場制冷機(jī)的實(shí)際運(yùn)行情況,將制冷機(jī)的工作狀態(tài)分為閑置狀態(tài)(制冷機(jī)未開啟)、正常啟動狀態(tài)(制冷機(jī)正常從停止到開啟)、正常運(yùn)轉(zhuǎn)狀態(tài)(制冷機(jī)正常運(yùn)轉(zhuǎn))、正常關(guān) 閉狀態(tài)(制冷機(jī)正常從運(yùn)轉(zhuǎn)到停止) 、異常/故障狀態(tài)(聲信號特征有別于前4類的狀態(tài))等5類。試驗(yàn)時,松動正常運(yùn)轉(zhuǎn)的制冷機(jī)外殼固定螺絲進(jìn)行,使其產(chǎn)生輕微的振動聲,以模擬制冷機(jī)出現(xiàn)故障時可能出現(xiàn)的聲音。 在各個狀態(tài)下分別采集200個時長均為5 s的聲音信號,隨機(jī)選取其中的100個信號作為MFCC特征提取及LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,剩下的100個信號作為測試樣本,得到的制冷機(jī)運(yùn)轉(zhuǎn)狀態(tài)識別結(jié)果如表3所示。 表3 制冷機(jī)運(yùn)轉(zhuǎn)狀態(tài)識別結(jié)果 采用MFCC與LSTM相結(jié)合的方法,可以有效提取制冷機(jī)運(yùn)轉(zhuǎn)噪聲在不同狀態(tài)下的時頻分布特征并對其進(jìn)行有效識別,具有很高的分類識別率及故障預(yù)測性能。利用研制的制冷機(jī)運(yùn)行及故障監(jiān)控系統(tǒng),不僅可以及時發(fā)現(xiàn)各種部件損傷或損壞引起的制冷機(jī)運(yùn)行異常,實(shí)現(xiàn)故障的及時預(yù)測與報警,而且對于降低企業(yè)的人力成本、運(yùn)營成本等具有重要意義。1.2 LSTM神經(jīng)網(wǎng)絡(luò)原理
2 系統(tǒng)的實(shí)現(xiàn)
3 試驗(yàn)結(jié)果及分析
3.1 MFCC特征提取
3.2 基于LSTM的制冷機(jī)運(yùn)行狀態(tài)及故障識別
4 結(jié)語