吳耀春,趙榮珍,靳伍銀,何天經(jīng),武 杰
(1.蘭州理工大學(xué)機電工程學(xué)院 蘭州,730050)(2.安陽工學(xué)院機械工程學(xué)院 安陽,455000)
在機械領(lǐng)域,航空發(fā)動機、大型風(fēng)電裝備、高檔數(shù)控機床等重大裝備正在朝著高速、高效、高精度方向發(fā)展,裝備的安全可靠運行必須依靠故障診斷技術(shù)保駕護(hù)航[1]。然而,由于設(shè)備結(jié)構(gòu)復(fù)雜、需要診斷的零部件數(shù)量多,多年來僅使用單個傳感器采集局部振動信號去解決機械系統(tǒng)故障辨識,發(fā)展至今已呈現(xiàn)難以為繼的困境。對此,充分利用布置在機械裝備關(guān)鍵截面處的系列傳感器,采集盡量多信息的集合實施智能故障決策技術(shù),這種觀點已獲得工業(yè)大數(shù)據(jù)技術(shù)研究展望的共識[2]。用多個傳感器在多個測點對復(fù)雜設(shè)備進(jìn)行監(jiān)測,能夠擴(kuò)展獲取故障信息的物理屬性、空間范圍或時間范圍,融合多傳感器信號特征能夠增加故障信息的多樣性和完整性,提高故障診斷魯棒性與辨識率[3-4]。傳統(tǒng)的數(shù)據(jù)融合算法[5]多是基于BP神經(jīng)網(wǎng)絡(luò)(back propagation neural work,簡稱BPNN)、支持向量機(support vector machine,簡稱SVM)等淺層網(wǎng)絡(luò)模型,它們的非線性映射能力與對復(fù)雜數(shù)據(jù)的特征表示能力相對來說較弱,直接影響了數(shù)據(jù)融合的效果。與之相比,深層模型能夠更好地逼近復(fù)雜函數(shù),數(shù)據(jù)特征表示能力和泛化能力更強,但是其非凸損失函數(shù)使其訓(xùn)練容易造成局部最優(yōu),這使得深層模型的使用受到較大制約[6]。
Hinton等[7]指出,可通過“逐層預(yù)訓(xùn)練”來有效克服深層神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的困難,首次提出了深度學(xué)習(xí)理論,開啟了深度學(xué)習(xí)在學(xué)術(shù)界和工業(yè)界的浪潮。許多領(lǐng)域[8-11]開始嘗試?yán)蒙疃葘W(xué)習(xí)解決本領(lǐng)域的一些問題。
作為一種重要的深度學(xué)習(xí)模型,DCNN[12]采用局部連接、權(quán)值共享及池化等獨特結(jié)構(gòu),有效降低網(wǎng)絡(luò)的復(fù)雜度,減少訓(xùn)練參數(shù)的個數(shù),使模型對噪聲、平移、扭曲、縮放具有一定程度的不變性,并具有較強的魯棒性和容錯能力,且易于訓(xùn)練和優(yōu)化?;谶@些優(yōu)越性,它在故障診斷領(lǐng)域的信號與信息處理中也開始受到關(guān)注。文獻(xiàn)[13]將DCNN應(yīng)用于電機故障診斷中,提高了電機故障的辨識率。文獻(xiàn)[14]將滾動軸承振動信號由一維時間序列轉(zhuǎn)化為二維平面圖,利用DCNN實現(xiàn)了滾動軸承的故障分類。文獻(xiàn)[15-16]利用一維DCNN直接對滾動軸承的振動信號進(jìn)行故障識別,并取得了優(yōu)異的辨識率。文獻(xiàn)[17]將加速度傳感器、麥克風(fēng)、電流傳感器和光學(xué)編碼器4種不同傳感器監(jiān)測的信號經(jīng)預(yù)處理后拼成一維長序列,利用DCNN對多傳感器數(shù)據(jù)融合實現(xiàn)了對齒輪箱的故障診斷。
上述基于DCNN的故障診斷方法都取得了優(yōu)異的診斷效果,但對于網(wǎng)絡(luò)的設(shè)計均采用單通道輸入。為了充分利用多傳感器采集的信號來實施更有效的故障決策,筆者欲對利用DCNN融合多通道信號特征的機械故障診斷方法進(jìn)行研究,該方法的不同之處是網(wǎng)絡(luò)采用多通道輸入,為科學(xué)發(fā)展復(fù)雜機械設(shè)備故障診斷技術(shù)提供理論參考依據(jù)。
深度學(xué)習(xí)是通過建立一種類似人腦分層的模型結(jié)構(gòu),對輸入信息逐層進(jìn)行特征融合提取,層級越深,提取的特征越抽象復(fù)雜。DCNN作為深度學(xué)習(xí)的主要模型之一,是一種多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。模型的典型結(jié)構(gòu)如圖1所示。
圖1 DCNN典型結(jié)構(gòu)Fig.1 The typical structure of DCNN
卷積層由多個特征面組成,每個特征面由多個神經(jīng)元組成。卷積層中每一個節(jié)點的輸入只是上一層神經(jīng)網(wǎng)絡(luò)的一小塊,這個小塊的長和寬都是人為指定,叫做卷積核。在卷積層中,卷積核對前一層輸出的特征面進(jìn)行卷積操作,利用非線性激活函數(shù)構(gòu)建輸出特征面,數(shù)學(xué)模型描述為
其中:l為當(dāng)前層;k為卷積核;b為當(dāng)前層的偏置;Mj為第j個卷積核對應(yīng)的卷積窗口為 第l層 輸 出,為第l層輸入。
在DCNN中,非線性激活函數(shù)f通常選用修正線性單元(rectified linear unit,簡稱ReLU),其優(yōu)勢在于使一部分神經(jīng)元的輸出為0,增加了網(wǎng)絡(luò)的稀疏性,減少參數(shù)間相互依存關(guān)系,緩解過擬合問題的發(fā)生。ReLU函數(shù)的表達(dá)式為
池化層由多個特征面組成,它的特征面與卷積層的特征面一一對應(yīng)。池化不改變特征面的個數(shù),但縮小特征面的大小。通常使用的最大值池化在減少模型訓(xùn)練參數(shù),防止過擬合的同時,提高系統(tǒng)魯棒性。最大值池化層模型為
其 中:max為 次抽樣函數(shù);β為網(wǎng)絡(luò)乘性參數(shù);b為偏置。
全連接層位于DCNN模型最后位置,輸出網(wǎng)絡(luò)最終結(jié)果。分類任務(wù)中,在這一層訓(xùn)練一個softmax回歸分類器。假設(shè)訓(xùn)練數(shù)據(jù)中輸入樣本為x,對應(yīng)標(biāo)簽為y,則將樣本判定為類別j的概率為p(y=j|x)。因此,對于一個C類分類器,輸出的將是C維的向量(向量元素的和為1)。計算公式為
其中:θ1,θ2,…,θC∈Rn+1為模型參數(shù)為歸一化系數(shù),對概率分布進(jìn)行歸一化,使得所有概率之和為1。
DCNN模型的訓(xùn)練過程主要包括前向傳播和反向傳播兩個階段。前向傳播,進(jìn)行樣本從輸入層到輸出層的特征學(xué)習(xí),得到預(yù)測值;反向傳播,依據(jù)損失函數(shù)計算出預(yù)測值與期望值之間的誤差,并根據(jù)誤差來矯正模型參數(shù)。
深度卷積神經(jīng)網(wǎng)絡(luò)的前向傳播與普通神經(jīng)網(wǎng)絡(luò)相似,具體形式見式(1)。文中激活函數(shù)選擇ReLU函數(shù)。
DCNN的反向傳播算法與BPNN一樣。為了評價模型的預(yù)測值與期望值的一致性,采用交叉熵作為損失函數(shù),定義為
其中:m為輸入樣本的批量大小;C為訓(xùn)練集樣本的種類;q為softmax輸出的預(yù)測值;p為樣本的標(biāo)簽。
DCNN反向傳播算法根據(jù)定義的損失函數(shù)優(yōu)化模型中的參數(shù)取值,從而使模型在訓(xùn)練數(shù)據(jù)集上的損失函數(shù)值最小。
權(quán)值系數(shù)與偏置量優(yōu)化的方向為
其中:η為模型的學(xué)習(xí)率,用來控制損失值反向傳播的強度。
DCNN起初廣泛應(yīng)用于圖像處理中,網(wǎng)絡(luò)的輸入大多是圖片等二維矩陣,如圖1所示,卷積核、特征圖等網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)也是二維的。機械狀態(tài)多傳感器監(jiān)測振動信號為多通道一維時間序列,若將其直接轉(zhuǎn)換為二維形式,則原始序列中時間與空間的關(guān)聯(lián)性將遭到破壞,導(dǎo)致部分故障相關(guān)的信息可能流失。因此,本研究設(shè)計融合多傳感器信號特征診斷模型采用一維DCNN,網(wǎng)絡(luò)的輸入采用一維向量、多通道,卷積核和特征面也是一維的,如圖2所示。該模型融合多傳感器信號特征的機械故障診斷過程可以分成3個階段,構(gòu)造多通道一維特征面集合、特征融合與故障診斷。
圖2 融合多傳感器信號特征的診斷模型Fig.2 Diagnostic model based on fusion of multi-sensor signal characteristics
多通道一維特征面集合的構(gòu)造,輸入層將n個通道的信號分別按長度s進(jìn)行截取,預(yù)處理后構(gòu)建m×(s×n)的樣本集,其中m為樣本個數(shù)。特征層對輸入樣本按照不同通道根據(jù)特征指標(biāo)進(jìn)行特征提取,將得到特征向量作為一個特征面,組成一個包含n個一維特征面的集合。m個樣本可以生成m個一維特征面集合。依靠交替的多個卷積與池化層實現(xiàn)對多通道輸入信號非線性特征的層級式融合提取。診斷結(jié)果由兩個全連接層輸出,其中第1個全連接層作用是對特征面的“展平”,即將所有的一維特征面首尾相連組成一維向量。第2個全連接層的神經(jīng)元個數(shù)與故障類別的種類相同,利用softmax回歸分類器實現(xiàn)目標(biāo)的多分類輸出。
模型參數(shù)設(shè)計主要是卷積核個數(shù)及大小的確定。文獻(xiàn)[18]中指出,在設(shè)置深度學(xué)習(xí)隱層神經(jīng)元數(shù)目時,遵循后一層神經(jīng)元數(shù)目不超過前一層神經(jīng)元數(shù)目一半的規(guī)律,文中采納該建議將兩層卷積層的神經(jīng)元數(shù)目分別設(shè)為32和16。卷積核均采用3×1的小卷積核設(shè)計,這樣卷積核參數(shù)較少,有利于網(wǎng)絡(luò)加深,同時可以抑制過擬合,每層卷積后進(jìn)行2×1的最大值池化。
模型訓(xùn)練的效果還受訓(xùn)練參數(shù)的影響。批次設(shè)置過小,模型的損失函數(shù)振蕩嚴(yán)重,在最大迭代次數(shù)下難以收斂;批次設(shè)置過大,影響模型泛化能力。經(jīng)過反復(fù)調(diào)試,模型的批次大小設(shè)為64,最大迭代次數(shù)設(shè)為30。對于深度卷積神經(jīng)網(wǎng)絡(luò),由于參數(shù)和超參數(shù)多,本模型選用學(xué)習(xí)率自適應(yīng)、對超參數(shù)選擇具有魯棒性的Adam算法進(jìn)行優(yōu)化,學(xué)習(xí)率為0.001。模型的結(jié)構(gòu)及參數(shù)如圖2所示。
DCNN融合多傳感器信號特征的機械故障診斷方法,通過布置在復(fù)雜設(shè)備不同監(jiān)測點上的傳感器獲取多通道振動信號,利用獲取的信號對圖2所示的模型進(jìn)行有監(jiān)督訓(xùn)練,將訓(xùn)練好的模型用于機械故障的診斷。具體診斷過程步驟如下:
1)機械設(shè)備多通道振動信號的采集;
2)將每一個通道的振動信號預(yù)處理后按特征指標(biāo)提取特征向量,即一維特征面,構(gòu)造多通道一維特征面集合;
3)初始化模型的權(quán)值和偏置參數(shù);
4)將樣本輸入到模型,通過前向傳播求得預(yù)測值與目標(biāo)值的誤差;
5)判斷網(wǎng)絡(luò)是否收斂,若收斂,則跳轉(zhuǎn)執(zhí)行步驟7,否則執(zhí)行步驟6;
6)反向傳播和權(quán)值更新,利用BP算法將步驟4得到的誤差反向逐層傳播到每個節(jié)點,并根據(jù)式(6)更新權(quán)值與偏置,重復(fù)執(zhí)行步驟4~6,直到網(wǎng)絡(luò)收斂;
7)測試樣本輸入到訓(xùn)練好的模型進(jìn)行測試,判斷精度是否滿足實際要求,如果滿足則執(zhí)行步驟8,否則跳轉(zhuǎn)到步驟3;
8)輸出網(wǎng)絡(luò)用于機械故障診斷。
所提方法的具體診斷流程如圖3所示。
實驗中采用混淆矩陣和平均準(zhǔn)確率作為模型的評價指標(biāo),混淆矩陣的行為測試樣本的模型預(yù)測結(jié)果,列為測試樣本的標(biāo)簽,對角線表示模型預(yù)測值和樣本標(biāo)簽一致的樣本數(shù)目。平均準(zhǔn)確率為
其中:Ai為第i次實驗的準(zhǔn)確率;N為實驗次數(shù)。
圖3 所提方法的診斷流程圖Fig.3 Diagnosis flow chart of the proposed method
本研究實驗對象為文獻(xiàn)[19]中的一套雙跨轉(zhuǎn)子實驗臺。選取6個關(guān)鍵截面以相互垂直的方位安裝12路電渦流傳感器用于監(jiān)測轉(zhuǎn)子系統(tǒng)運行狀態(tài),在靠近電機端安裝的第13路傳感器用于檢測轉(zhuǎn)速。
實驗中,模擬轉(zhuǎn)子系統(tǒng)的動靜碰磨、軸系不對中、轉(zhuǎn)子不平衡、支承松動和正常5種運行狀態(tài)。在采樣頻率5 000 Hz,轉(zhuǎn)速2 800 r/min的條件下以1 024點隨機選取各通道每種運行狀態(tài)振動信號800組,其中500組作為訓(xùn)練樣本,300組作為測試樣本。為從多角度全面分析轉(zhuǎn)子運行狀態(tài),從振動信號的時域、頻域提取不同特征量構(gòu)造一維特征面,如表1所示為第i通道的特征參數(shù)。拓展至多通道建立12個通道的一維特征面(22×1)集合,作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入。實驗將從以下5個方面驗證本研究方法的有效性。
將訓(xùn)練集12個通道信號輸入到2.1中建立的模型中進(jìn)行多次迭代訓(xùn)練,文中設(shè)定最大迭代次數(shù)為30次,為了防止深度學(xué)習(xí)的過擬合現(xiàn)象,采用Early-stopping機制,當(dāng)損失函數(shù)在一定步數(shù)內(nèi)不再顯著變化時即停止模型訓(xùn)練。訓(xùn)練集和測試集損失函數(shù)值和準(zhǔn)確率如圖4所示??梢钥闯觯ㄟ^Early-stopping機制,建立的模型經(jīng)過10次迭代后達(dá)到終止條件,停止訓(xùn)練,同時模型在測試集上的準(zhǔn)確率達(dá)到99.93%,沒有發(fā)生過擬合現(xiàn)象,表明模型訓(xùn)練效果良好。
表1 第i通道振動信號選用的特征指標(biāo)Tab.1 Characteristic indicators of vibration signal for the ith channel
為了更清楚地說明模型對測試集各故障類別的識別效果,通過混淆矩陣對測試結(jié)果進(jìn)行詳細(xì)分析,如圖5所示。除支承松動狀態(tài)有1個測試樣本被錯誤分類為正常外,其他4種狀態(tài)分類準(zhǔn)確率都達(dá)到100%,表明本方法具有較高的故障識別準(zhǔn)確率。
圖4 訓(xùn)練集與測試集損失函數(shù)與準(zhǔn)確率曲線Fig.4 Loss function and accuracy curve of training set and test set
圖5 測試集識別結(jié)果Fig.5 Recognition results of test set
圖6 各層級的可視化結(jié)果Fig.6 Visualization results of each layer
為了更清晰地展示模型卷積池化層對多通道信號特征融合的過程和效果,引入主成分分析(principle component analysis,簡稱PCA)維數(shù)約簡算法對模型各層的輸出特征進(jìn)行維數(shù)為2的約簡并可視化,結(jié)果如圖6所示。圖6(a)為原始信號的狀態(tài)分布情況,由于振動信號本身存在噪聲和冗余,各個類別難以區(qū)分。輸入信號經(jīng)特征層的時、頻域特征提取后,各類別樣本分布有所改善,但仍難以區(qū)分,如圖6(b)所示。經(jīng)過第1個卷積池化層的特征融合學(xué)習(xí)后,轉(zhuǎn)子不平衡和軸系不對中兩類樣本基本分開,但其他3類依然難以區(qū)分,如圖6(c)所示。經(jīng)過第2個卷積池化層進(jìn)一步特征融合學(xué)習(xí),轉(zhuǎn)子不平衡、軸系不對中兩類樣本分的更好,同時剩余三類聚集情況有明顯改善,如圖6(d)所示。本研究設(shè)計的模型中有2個全連接層,其中第2個全連接層是用于分類的,因此僅對第1個全連接層的特征融合結(jié)果進(jìn)行可視化,結(jié)果如圖6(e)所示,可見測試集的5類樣本已完全聚集在自己的區(qū)域,與圖5的混淆矩陣結(jié)果相符。最終模型在測試集上分類的整體準(zhǔn)確率為99.93%。
運用重疊采樣的樣本增強技術(shù)[15]擴(kuò)充樣本集,分別選用樣本總量為100,200,300,400,500,2 000組的訓(xùn)練樣本訓(xùn)練文中建立的模型,觀察訓(xùn)練集大小對模型診斷能力的影響。由于神經(jīng)網(wǎng)絡(luò)的權(quán)值初值是隨機生成的,為了驗證模型的穩(wěn)定性,每個實驗重復(fù)20次,實驗結(jié)果如圖7所示。
由圖7可以看出,當(dāng)訓(xùn)練樣本增加時,準(zhǔn)確率逐漸上升,20次實驗標(biāo)準(zhǔn)差逐漸下降,即模型診斷的穩(wěn)定性增加。當(dāng)訓(xùn)練樣本數(shù)為2 000時,準(zhǔn)確率為100%,標(biāo)準(zhǔn)差為0.01%,當(dāng)訓(xùn)練樣本數(shù)為100時,準(zhǔn)確率僅為83.5%。這說明模型的診斷性能受訓(xùn)練樣本個數(shù)影響較大。當(dāng)訓(xùn)練樣本數(shù)為500,識別率達(dá)到99%以上,模型在使用較少訓(xùn)練數(shù)據(jù)情況下,也能達(dá)到很高的準(zhǔn)確率,模型抑制過擬合能力較強。
圖7 不同訓(xùn)練樣本數(shù)目下模型診斷準(zhǔn)確率Fig.7 Model diagnosis accuracy under different training sample
為了驗證融合多傳感器信號特征能夠更全面、更完整的表征機械設(shè)備的運行狀態(tài),提供更精確的故障識別率,將每一個通道的信號以相同的方式輸入模型作為一種方法,共12種方法(方法1~方法12)與文中方法進(jìn)行對比實驗,每種方法重復(fù)進(jìn)行20次,求每種狀態(tài)識別率的平均值和準(zhǔn)確率的平均值,結(jié)果如表2所示。
表2 融合多傳感器信號特征與單傳感器信號診斷結(jié)果對比Tab.2 Comparison of diagnostic results between fusion multi?sensor signal characteristics and single?sensor signal
實驗結(jié)果表明,單傳感器信號在相同模型上測試的平均準(zhǔn)確率最高為95.46%,如方法7所示,最低為60.07%,如方法9所示,均低于本方法的平均準(zhǔn)確率99.85%,并且本方法識別準(zhǔn)確率波動較小。因此,融合多傳感器信號特征能夠為機械故障診斷提供更全面更準(zhǔn)確的信息。
為了驗證本算法相較于目前常用機械故障診斷算法在識別性能上具有一定優(yōu)勢,將PCA+SVM,BPNN作為對比算法進(jìn)行實驗,其中SVM的核函數(shù)選擇高斯核函數(shù),BPNN隱含層結(jié)構(gòu)為(32,16),實驗結(jié)果如圖8所示。采用PCA+SVM算法,測試樣本中正常狀態(tài)有19個樣本被錯誤分類成支承松動,支承松動有15個樣本錯誤分類成正常,分類準(zhǔn)確率為97.73%,如圖8(a)所示;采用BPNN算法,測試樣本中支承松動狀態(tài)有68個樣本分別被錯誤分為正常和碰磨狀態(tài),不平衡有1個樣本錯誤分為正常,分類準(zhǔn)確率為95.4%,如圖8(b)所示;采用本算法,只有1個支承狀態(tài)的測試樣本被錯誤分為正常,分類準(zhǔn)確率為99.93%,如圖5所示。本算法具有一定的優(yōu)勢。
圖8 不同算法的性能比較Fig.8 Performance comparison of different algorithms
多個傳感器多測點對復(fù)雜設(shè)備進(jìn)行監(jiān)測,能夠擴(kuò)展獲取信息的物理屬性、空間范圍或時間范圍,有效融合多傳感器信號特征能夠增加信息的多樣性和完整性。筆者提出的利用深度卷積神經(jīng)網(wǎng)絡(luò)融合多傳感器特征的機械故障診斷方法,可完整地利用多傳感器采集的原始信號的特征進(jìn)行故障診斷,提高了故障辨識準(zhǔn)確率。與傳統(tǒng)的淺層模型算法相比,由于卷積神經(jīng)網(wǎng)絡(luò)的深度結(jié)構(gòu)與強大的非線性特征學(xué)習(xí)能力,該算法具有較好的魯棒性和環(huán)境自適應(yīng)性。同時,由于多通道信號及特征層增加了算法的計算量,下一步考慮如何提高算法的運算效率。