霍天龍 梁耀方 張博 覃帥興
(桂林航天工業(yè)學(xué)院 電子信息與自動化學(xué)院,廣西 桂林 541004)
旋轉(zhuǎn)機(jī)械設(shè)備已遍布于工業(yè)生產(chǎn)及日常生活,如航空發(fā)動機(jī)、高檔數(shù)控機(jī)床、風(fēng)力發(fā)電機(jī)、軌道交通等。這些裝備的安全運行對工業(yè)穩(wěn)定生產(chǎn)起著舉足輕重的作用[1]。運行中如發(fā)生故障,輕者停機(jī)停產(chǎn),重者則會造成巨大的經(jīng)濟(jì)損失和惡劣的社會影響。因此,必須依靠有效的故障診斷方法為其保駕護(hù)航[1-3]。實際應(yīng)用中,機(jī)械裝備的結(jié)構(gòu)復(fù)雜,用于狀態(tài)監(jiān)測和故障診斷的傳感器數(shù)量較多,僅使用單一傳感器采集的信號進(jìn)行故障判別易導(dǎo)致誤判。故充分利用多傳感器采集的多信息數(shù)據(jù)集實施智能故障診斷已獲得“大數(shù)據(jù)”背景下學(xué)術(shù)界和工業(yè)界的共識[1,4-5]。傳統(tǒng)的用于故障診斷的數(shù)據(jù)融合算法大多是淺層網(wǎng)絡(luò)模型,如BP 神經(jīng)網(wǎng)絡(luò)(back propagation neural work,簡稱 BPNN)、支持向量機(jī)(support vector machine,簡稱 SVM)等,但這些模型都需要復(fù)雜的信號處理和較為全面的數(shù)據(jù)特征提取作為模型的樣本輸入,同時因其淺層的網(wǎng)絡(luò)結(jié)構(gòu)難以提取到深層的特征信息而降低了故障診斷的準(zhǔn)確率[6]。
近年來,人工智能技術(shù)的迅猛發(fā)展帶動著相關(guān)技術(shù)的長足進(jìn)步。傳統(tǒng)的需依賴專家經(jīng)驗的基于信號處理、特征提取、數(shù)據(jù)降維和故障分類技術(shù)的診斷方法逐步向以數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)為核心的智能故障診斷技術(shù)發(fā)展[7]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN )作為深度學(xué)習(xí)的一種重要模型已廣泛應(yīng)用于圖像處理、語音識別、目標(biāo)檢測等領(lǐng)域。在故障診斷領(lǐng)域,CNN以其強大的非線性特征提取和模式識別能力已取得豐碩的科研成果[3]。文獻(xiàn)[8]利用集合經(jīng)驗?zāi)B(tài)分解(EEMD)對信號進(jìn)行降噪等處理,將處理后的信號轉(zhuǎn)化為二維信號,應(yīng)用CNN進(jìn)行故障診斷,提高了診斷準(zhǔn)確率。文獻(xiàn)[9]對轉(zhuǎn)子振動信號進(jìn)行特征提取,構(gòu)建了一種利用深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,簡稱 DCNN)融合多傳感器信號特征的機(jī)械故障診斷方法,模型具有較好的魯棒性和泛化性。文獻(xiàn)[10]提出了一種基于深度時頻特征的機(jī)車軸承故障診斷新方法,具有一定的工程價值。文獻(xiàn)[11] 對齒輪箱故障振動信號采用連續(xù)小波變換構(gòu)造其時頻圖,以其為輸入構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,通過多層卷積池化形成深層分布式故障特征表達(dá),獲得了較高的故障識別準(zhǔn)確率。雖然上述研究在故障辨識方面取得了優(yōu)異成績,但均使用了信號特征提取或單一傳感器的數(shù)據(jù)作為網(wǎng)絡(luò)的數(shù)據(jù)輸入。一方面,特征提取需要根據(jù)信號特點依賴專家經(jīng)驗開展,增加了故障診斷數(shù)學(xué)模型的復(fù)雜度。另一方面,單一或少數(shù)幾種特征提取方法不能全面反映數(shù)據(jù)的特征,造成故障診斷模型的泛化性能變差。
針對以上不足,本文提出了一種融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法,把轉(zhuǎn)子實驗臺上各種狀態(tài)下采集的多通道傳感器振動信號直接送入1D-CNN進(jìn)行模型訓(xùn)練,應(yīng)用模型辨識轉(zhuǎn)子實驗臺的實際運行狀態(tài)。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN )是一類包含卷積運算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[12]。研究表明,通過卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的特征相對于人工設(shè)計的特征具有更強的判別能力和泛化能力[13]。卷積神經(jīng)網(wǎng)絡(luò)一般由輸入層、卷積層、池化層、全連接層和輸出層組成,其內(nèi)部通過梯度下降算法最小化損失函數(shù)對網(wǎng)絡(luò)的權(quán)重進(jìn)行反向調(diào)節(jié),同時不斷迭代訓(xùn)練來提高網(wǎng)絡(luò)的精度。一維卷積神經(jīng)網(wǎng)絡(luò)有類似的結(jié)構(gòu)且原理相同,更適合用于處理時間序列。
卷積層由多個卷積核組成,卷積核的數(shù)量是根據(jù)數(shù)據(jù)特點及模型結(jié)構(gòu)人為設(shè)定的。卷積核運算是將核函數(shù)與局部的時間序列進(jìn)行運算,從而實現(xiàn)數(shù)據(jù)的特征提取與降維處理,數(shù)學(xué)公式如下:
(1)
在卷積層后一般都需設(shè)置池化層,它由多個特征面組成,且一一對應(yīng)于上一卷積層輸出的特征面。通過人為設(shè)定的“窗口”大小對局部接受域進(jìn)行下采樣,池化層不改變特征面的數(shù)量,但會根據(jù)“窗口”大小縮小特征面的大小。常用的池化方法有最大池化、均值池化等,最大池化運算的數(shù)學(xué)描述為:
(2)
全連接層一般位于“卷積+池化”模塊后,用于特征的再次提取與匯總,該層的每一個神經(jīng)元均與上一層的所有神經(jīng)元連接并對提取的特征進(jìn)行組合,然后映射到樣本標(biāo)記空間,最后使用softmax分類器輸出最終分類結(jié)果。Softmax分類過程的數(shù)學(xué)模型為:
(3)
式中:yj是樣本的分類值,zj是第j個神經(jīng)元的節(jié)點值,M是類別總數(shù)。
使用激活函數(shù)可以對上一層的輸出結(jié)果進(jìn)行非線性變換,將網(wǎng)絡(luò)的線性模型轉(zhuǎn)化為非線性模型,使得網(wǎng)絡(luò)能夠解決數(shù)據(jù)線性不可分問題,提升網(wǎng)絡(luò)的學(xué)習(xí)和分類能力。常用的激活函數(shù)有sigmoid、tanh、ReLU和Maxout等。ReLU函數(shù)的計算公式為:
ReLU=max(0,x)
(4)
式中:x是時間序列。
本文要處理的是從轉(zhuǎn)子實驗臺上采集的多通道一維時間振動信號,如圖1所示,采用1D-CNN設(shè)計了多源傳感器信號故障診斷模型。該模型大致可分為3個部分,依據(jù)采集的振動信號構(gòu)造一維數(shù)據(jù)集,利用數(shù)據(jù)集對卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練與驗證,使用訓(xùn)練好的模型對未知標(biāo)簽的振動信號進(jìn)行故障診斷。
圖1 多源傳感器信號故障診斷模型
在多種工作狀態(tài)下采集轉(zhuǎn)子實驗臺的多通道振動信號并進(jìn)行歸一化數(shù)據(jù)處理,在n個傳感器通道上分別按照長度l截取隨機(jī)截取數(shù)據(jù),獲得k個樣本,得到形狀為k×(n×l)的數(shù)據(jù)集,再對數(shù)據(jù)中的每個樣本進(jìn)行標(biāo)簽。打亂數(shù)據(jù)和標(biāo)簽一一對應(yīng)的k樣本,按6∶2∶2的比例劃分出訓(xùn)練集、驗證集和測試集。把訓(xùn)練集數(shù)據(jù)送入1D-CNN模型進(jìn)行訓(xùn)練。
一維卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù)主要包括學(xué)習(xí)率設(shè)置、批次數(shù)量、循環(huán)次數(shù)等。網(wǎng)絡(luò)參數(shù)主要包括卷積層的卷積核大小、數(shù)量和移動步長,池化層的核大小及步長,網(wǎng)絡(luò)的深度等。欲使得網(wǎng)絡(luò)具有更強的魯棒性和泛化性,核心思想是獲得更大的感受野[14]。
轉(zhuǎn)子的運動是周期性轉(zhuǎn)動,運行過程中難免會受到周圍環(huán)境和設(shè)備自身的噪聲干擾,故傳感器采集到的“真實”信號中混合了大量噪聲,有些噪聲是線性疊加的平穩(wěn)隨機(jī)噪聲,有些則以強脈沖干擾形式出現(xiàn)。因此,計算出傳感器在一個轉(zhuǎn)動周期內(nèi)采集的數(shù)據(jù)長度對1D-CNN的模型設(shè)計是至關(guān)重要的。設(shè)轉(zhuǎn)子的轉(zhuǎn)速為v/r·min-1,采樣頻率為f/Hz,則單周期的數(shù)據(jù)長度N的計算公式如下:
(5)
一維卷積神經(jīng)網(wǎng)絡(luò)的卷積層從本質(zhì)上說是信號消噪濾波和數(shù)據(jù)特征提取的過程,故希望第一卷積層的卷積核大小應(yīng)大于N。且為了獲取更多的故障信息,最后的池化層的單位神經(jīng)元至少可以獲得N個點的數(shù)據(jù)。
考慮上述討論,設(shè)計1D-CNN模型時,第n層池化層的感受野Fn與上一層池化層的感受野Fn-1的計算關(guān)系如下式:
(6)
式中:kn是第n層卷積層中卷積核的大小,sn是第n層的卷積層移動的步長,pn是第n層池化層核的大小。由上式可知,對最后池化層感受野的影響因素主要是上一層卷積層的步長核池化層核的大小。
確定最后池化層參數(shù)后還應(yīng)考慮網(wǎng)絡(luò)深度的設(shè)計,網(wǎng)絡(luò)過深易導(dǎo)致學(xué)習(xí)時間過程,在樣本數(shù)量較少時還會出現(xiàn)過擬合問題,網(wǎng)絡(luò)過淺會出現(xiàn)模型分類精度低。經(jīng)多次探索和實驗確定該模型由4層卷積層、4層池化層、2層全連接層和1層分類層組成。參數(shù)優(yōu)化方面使用了結(jié)合SGDM和RMSProp魯棒性能更好的 Adam的優(yōu)化器,能夠為不同參數(shù)產(chǎn)生自適應(yīng)的學(xué)習(xí)速率。網(wǎng)絡(luò)參數(shù)如表1所示。
表1 1D-CNN網(wǎng)絡(luò)參數(shù)
通過布置在轉(zhuǎn)子實驗臺上的傳感器獲得的多通道振動信號,根據(jù)圖1的模型結(jié)構(gòu)設(shè)計融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法流程如圖2所示,詳細(xì)診斷流程如下:
1)使用多通道傳感器采集轉(zhuǎn)子實驗臺多種工作狀態(tài)的振動信號;
2)對信號進(jìn)行歸一化處理;
3)構(gòu)造多通道一維數(shù)據(jù)集;
4)按上文比例劃分出訓(xùn)練集、驗證集和測試集樣本;
5)初始化1D-CNN網(wǎng)絡(luò)模型參數(shù);
6)把訓(xùn)練集數(shù)據(jù)輸入至模型,通過前向傳播,計算誤差,使誤差最?。?/p>
7)通過反向傳播,更新網(wǎng)絡(luò)參數(shù);
8)使用驗證集數(shù)據(jù)判斷誤差是否最小,如最小,則輸出訓(xùn)練完成的網(wǎng)絡(luò)模型;如不是,則返回步驟6);
9)使用得到的網(wǎng)絡(luò)模型對測試集數(shù)據(jù)進(jìn)行故障分類。
圖2 多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法流程
本研究所使用的故障模擬實驗裝置如圖3所示,圖(a)是轉(zhuǎn)子實驗臺的外觀全貌,圖(b)是結(jié)構(gòu)示意圖,顯示了采集轉(zhuǎn)子系統(tǒng)振動響應(yīng)的13個通道電渦流傳感器的布置情況。其中的ch1-ch12通道用于拾取轉(zhuǎn)子振動信號,ch0通道用于采集轉(zhuǎn)速信號。實驗過程中,分別模擬了轉(zhuǎn)子正常、動靜碰磨、轉(zhuǎn)子不平衡、支座松動和軸系不對中5中狀態(tài)。在轉(zhuǎn)速為2 800 r/min,采樣頻率為5 000 Hz的情況下分別采集5種工作狀態(tài)的數(shù)據(jù)。
圖3 轉(zhuǎn)子試驗臺及其結(jié)構(gòu)示意圖
根據(jù)式(5)計算出當(dāng)前參數(shù)下轉(zhuǎn)子轉(zhuǎn)動一個周期的數(shù)據(jù)長度為107,考慮輸入網(wǎng)絡(luò)的數(shù)據(jù)應(yīng)至少大于一個周期數(shù)據(jù)長度,并結(jié)合網(wǎng)絡(luò)模型大小、深度等因素,確定時間序列數(shù)據(jù)長度應(yīng)大于4個周期。最終按數(shù)據(jù)長度512采樣點在轉(zhuǎn)子實驗臺各工作狀態(tài)下隨機(jī)采集12個通道的振動信號,共獲得包含了各種狀態(tài)下的5 000組數(shù)據(jù),與轉(zhuǎn)子運行狀態(tài)一一對應(yīng)對每組數(shù)據(jù)進(jìn)行標(biāo)簽,隨機(jī)打亂數(shù)據(jù)后按2.1節(jié)提到的比例劃分?jǐn)?shù)據(jù),得到3 000×12×512數(shù)據(jù)形狀的訓(xùn)練集、1 000×12×512數(shù)據(jù)形狀的驗證集和1 000×12×512數(shù)據(jù)形狀的測試集。
把訓(xùn)練集數(shù)據(jù)輸入到表1參數(shù)下的1D-CNN模型中,實驗過程中發(fā)現(xiàn)學(xué)習(xí)率設(shè)置太大,模型驗證集的損失值下降迅速,下降過程中損失值震蕩嚴(yán)重,最終訓(xùn)練出的模型不穩(wěn)定,泛化性能不好;設(shè)置太小,經(jīng)過數(shù)輪次的訓(xùn)練后損失值不下降或下降很小,網(wǎng)絡(luò)收斂速度慢,驗證集識別準(zhǔn)確率不高。批次設(shè)置太大,影響模型訓(xùn)練速度的同時,驗證集的識別準(zhǔn)確率不能達(dá)到最優(yōu)值,批次設(shè)置太小,訓(xùn)練集和驗證集的識別準(zhǔn)確率很高,但測試集識別準(zhǔn)確率很低,模型容易陷入局部最優(yōu)。
經(jīng)反復(fù)實驗選取最優(yōu)超參數(shù),最終設(shè)置學(xué)習(xí)率為0.000 1,批次為16,迭代次數(shù)為40,循環(huán)迭代訓(xùn)練網(wǎng)絡(luò)模型。為防止網(wǎng)絡(luò)訓(xùn)練過程發(fā)生過擬合現(xiàn)象,在Adam優(yōu)化器中設(shè)置權(quán)重衰減為0.000 01,在每個卷積層后使用了Batch Normalization進(jìn)行批標(biāo)準(zhǔn)化,在2個全連接層后使用Dropout隨機(jī)丟棄20%的神經(jīng)元連接,同時采用Early-stop-ping機(jī)制,在驗證集損失值經(jīng)過5個循環(huán)后不再下降時停止網(wǎng)絡(luò)的訓(xùn)練。訓(xùn)練集和驗證集的損失值和識別準(zhǔn)確率曲線如圖4所示。圖4(a)中訓(xùn)練集和驗證集的損失值隨著迭代次數(shù)的增加下降相對較為平穩(wěn),最終驗證集損失值為0.000 996;同時圖4(b)中訓(xùn)練集和驗證集的識別準(zhǔn)確率也在不斷上升,最終驗證集識別準(zhǔn)確率為99.57%,整個迭代學(xué)習(xí)訓(xùn)練過程表明卷積神經(jīng)網(wǎng)絡(luò)模型收斂速度快,識別準(zhǔn)確率高,模型參數(shù)設(shè)計合理。
圖4 訓(xùn)練集和驗證集的損失值與精度曲線
把測試集數(shù)據(jù)隨機(jī)抽選500個樣本輸入至訓(xùn)練好的模型中進(jìn)行測試,最終的識別準(zhǔn)確率為99.4%,僅有3個標(biāo)記為支座松動的樣本被誤識別為正常,其余497個樣本均被正確識別。測試結(jié)果表明模型對從未見過的數(shù)據(jù)也具有較高的識別準(zhǔn)確率,證明了模型具有較強的泛化能力。為清楚的展示識別效果,使用混淆矩陣可視化測試集的識別結(jié)果,如圖5所示。
圖5 測試集數(shù)據(jù)識別混淆矩陣
為了更清晰的展示多源傳感器數(shù)據(jù)與1D-CNN模型集成的轉(zhuǎn)子故障診斷識別過程和結(jié)果,采用非線性降維算法t-SNE(t-distributed stochastic neighbor embedding)把模型中各層數(shù)據(jù)降為2維并對數(shù)據(jù)進(jìn)行可視化。模型中各層數(shù)據(jù)可視化結(jié)果如圖6所示,圖6(a)為原始信號降維后可視化結(jié)果,由于未對信號進(jìn)行處理,轉(zhuǎn)子各工作狀態(tài)下信號類別很難區(qū)分。圖6(b)數(shù)據(jù)經(jīng)過1D-CNN模型的第1卷積+池化層后,支座松動類別基本能夠和其余類別區(qū)分,表明這種故障狀態(tài)信號特征較其他類別明顯,但其余類別仍然混疊在一起無法區(qū)分。圖6(c)為數(shù)據(jù)通過第2卷積+池化層后,軸系不對中樣本聚類效果明顯,支座松動類別聚集范圍也進(jìn)一步縮小,其余類別雖難以區(qū)分,但數(shù)據(jù)逐漸在聚集。圖6(d)為經(jīng)過第3卷積+池化層后,5種類別樣本數(shù)據(jù)基本被區(qū)分開,但數(shù)據(jù)聚集面積較大,分界面也不夠明顯。圖6(e)為數(shù)據(jù)經(jīng)過最后的卷積+池化層后,每種類別數(shù)據(jù)聚集面積縮小,類與類之間的間距增大,但仍有部分標(biāo)記為正常和動靜碰磨的樣本數(shù)據(jù)被錯誤聚類。圖6(f)為數(shù)據(jù)進(jìn)入最終分類層后,5種類別樣本已完全分開,聚集面積進(jìn)一步縮小,類別間的間距進(jìn)一步增大,可視化結(jié)果與圖5的混淆矩陣吻合。實驗結(jié)果表明所設(shè)計的模型能夠高精準(zhǔn)地對測試集數(shù)據(jù)進(jìn)行辨識。
圖6 模型中各層數(shù)據(jù)可視化結(jié)果
為了驗證所設(shè)計的1D-CNN模型具有良好的抗噪性,對多源傳感器采集到的信號進(jìn)行了降噪處理,對比了信號消噪前后模型的訓(xùn)練過程和對測試集的分類準(zhǔn)確率。如圖7所示,圖7(a)為布置在轉(zhuǎn)子實驗臺上的3#傳感器采集的振動信號原始波形圖,信號中包含了大量的強脈沖干擾和平穩(wěn)隨機(jī)噪聲,采用文獻(xiàn)[15 ]中的濾波消噪算法得到圖7(b)的信號波形圖。把降噪后的12個通道數(shù)據(jù)按3.2節(jié)的實驗方法輸入到本文設(shè)計的1D-CNN模型中進(jìn)行訓(xùn)練,模擬擬合后,用測試集數(shù)據(jù)測得模型的分類準(zhǔn)確率為99.36%。
圖7 振動信號時域波形圖
模型參數(shù)學(xué)習(xí)過程的損失曲線和精度曲線如圖8所示,對比上文圖4可知,經(jīng)過消噪濾波后的數(shù)據(jù)送入模型后,除訓(xùn)練迭代次數(shù)由14次減少至10次外,損失值衰減曲線和識別準(zhǔn)確率曲線隨迭代次數(shù)的變化趨勢基本相同。實驗結(jié)果證明了卷積神經(jīng)網(wǎng)絡(luò)對模型輸入信號是否需消噪預(yù)處理不敏感,同時也驗證了其強大的非線性數(shù)據(jù)處理能力。
圖8 信號消噪后訓(xùn)練集和驗證集的損失值與精度曲線
為驗證融合多源傳感器數(shù)據(jù)能夠全方位的反應(yīng)設(shè)備實際運行狀態(tài),為診斷模型設(shè)計提供完整的數(shù)據(jù),保證模型具有更高精度的識別率。使用單通道傳感器數(shù)據(jù)作為對比進(jìn)行實驗,把采集到的數(shù)據(jù)按3.1節(jié)進(jìn)行預(yù)處理,構(gòu)建出12個數(shù)據(jù)集。不同點在于所構(gòu)建的數(shù)據(jù)集通道數(shù)是1,即由5 000×12×512變?yōu)? 000×1×512。把12個數(shù)據(jù)集分別輸入至模型中進(jìn)行訓(xùn)練,并使用測試集數(shù)據(jù)對模型分類準(zhǔn)確率性能進(jìn)行測試,每個實驗重復(fù)30次,實驗結(jié)果如圖9所示。
圖中橫坐標(biāo)代表單獨使用布置在轉(zhuǎn)子實驗臺上的傳感器1~12的數(shù)據(jù)輸入至模型進(jìn)行訓(xùn)練集測試,記為方法1~12??v坐標(biāo)代表每種實驗方法下測試集數(shù)據(jù)的分類準(zhǔn)確率。從圖中可以看出,單獨使用1個傳感器在本文模型中進(jìn)行測試,平均識別準(zhǔn)確率最高為方法7,達(dá)到了96.52%。準(zhǔn)確率最低的是單獨使用傳感器9,僅為78.03%。本文所提的方法識別準(zhǔn)確率為99.48%,均高于其他方法。因此,證明了融合多傳感器數(shù)據(jù)能夠為模型的訓(xùn)練和診斷提供更全面的信息。
圖9 多源傳感器數(shù)據(jù)與單傳感器數(shù)據(jù)診斷結(jié)果對比
使用數(shù)據(jù)增強技術(shù)擴(kuò)充數(shù)據(jù)集樣本,使得總樣本數(shù)分別為500,1 000,2 000,5 000,10 000和20 000組,打亂數(shù)據(jù)后統(tǒng)一按照2.1節(jié)比例劃分樣本。分別把樣本數(shù)不同的訓(xùn)練集數(shù)據(jù)輸入至本文設(shè)計的1D-CNN模型中進(jìn)行訓(xùn)練,并使用測試集數(shù)據(jù)對模型的分類能力進(jìn)行測試。鑒于樣本制作過程是通過計算機(jī)程序隨機(jī)在時間序列上進(jìn)行的,且網(wǎng)絡(luò)模型參數(shù)的初始化也是隨機(jī)的,為保證驗證樣本數(shù)量對模型測試結(jié)果的穩(wěn)定性,每個實驗重復(fù)30次,實驗結(jié)果如表2所示。
表2 樣本數(shù)量對模型識別準(zhǔn)確的對比
通過表2可以看出,隨著數(shù)據(jù)樣本數(shù)量的增加,模型對驗證集和測試集數(shù)據(jù)的識別準(zhǔn)確率逐漸上升,當(dāng)總數(shù)據(jù)超過5 000組后,模型的總體識別準(zhǔn)確率趨于平穩(wěn),且對驗證集和測試集的識別準(zhǔn)確率幾乎相同,說明模型的泛化性能優(yōu)良。但當(dāng)總數(shù)據(jù)樣本數(shù)為500組時,模型對驗證集的識別準(zhǔn)確率可達(dá)90%以上,但在測試集上的準(zhǔn)確率僅為82.45%,說明驗證集數(shù)據(jù)在模型驗證時有一部分也參與了模型的學(xué)習(xí),但對從未見過的測試集數(shù)據(jù)準(zhǔn)確率卻很低,實驗結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)模型的辨識性能和泛化能力受數(shù)據(jù)樣本數(shù)量大小的影響較大。
本文提出了一種融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法。實驗結(jié)果表明,該方法所設(shè)計的模型易于網(wǎng)絡(luò)訓(xùn)練、識別準(zhǔn)確率高,為轉(zhuǎn)子故障診斷研究提供了有價值的參考。通過多方面的對比實驗,得到以下結(jié)論:
1)通過模型輸入層采用大于4個周期長度的數(shù)據(jù),第一層使用至少可以覆蓋1個周期數(shù)據(jù)長度的較大卷積核,可以獲取更多的數(shù)據(jù)信息并傳遞給網(wǎng)絡(luò)的輸出層,保證最后池化層的單位神經(jīng)元至少可以獲得1個周期的數(shù)據(jù)長度。同時使用了BN、Dropuot、Early-stop-ping及在Adam優(yōu)化器中增加權(quán)重等策略防止過擬合現(xiàn)象的發(fā)生,提升了模型的魯棒性和分類準(zhǔn)確率。
2)所設(shè)計的模型可直接作用于多傳感器采集的一維時間序列,無須專家經(jīng)驗的信號消噪和人工特征提取過程。
3)使用多傳感器數(shù)據(jù)同時輸入至網(wǎng)絡(luò)與單傳感器數(shù)據(jù)相比,其更能完整、全面的表征機(jī)械設(shè)備實際工作狀態(tài),提高了模型的故障診斷精度。