王克定,李敬兆,石晴,胡迪
(1.安徽理工大學(xué)電氣與信息工程學(xué)院,安徽淮南 232001;2.淮北合眾機(jī)械設(shè)備有限公司,安徽淮北 235000)
礦井通風(fēng)機(jī)作為煤礦大型旋轉(zhuǎn)機(jī)械設(shè)備之一,其正常運(yùn)行是礦山安全生產(chǎn)的前提[1-2]。而軸承作為旋轉(zhuǎn)機(jī)械最關(guān)鍵的部件,常受磨損和環(huán)境因素影響,故障發(fā)生率較高[3]。因此,研究軸承故障診斷方法對于保障煤礦機(jī)械設(shè)備的高效運(yùn)行具有重要意義。
近年來,基于深度學(xué)習(xí)的故障診斷方法因?qū)收闲畔⒆蕴崛∨c分類特性,且不依賴專門知識和專家經(jīng)驗(yàn),成為軸承故障診斷領(lǐng)域的主流方法[4-5]。其中,CNN網(wǎng)絡(luò)因極大簡化診斷步驟被廣泛使用,雷春麗等[6]提出采用馬爾科夫轉(zhuǎn)移場編碼方式將原始一維振動信號轉(zhuǎn)換為二維特征圖形,輸入CNN網(wǎng)絡(luò)中進(jìn)行滾動軸承故障診斷;丁承君等[7]結(jié)合變模態(tài)分解與深度CNN網(wǎng)絡(luò)實(shí)現(xiàn)滾動軸承故障類別以及損傷程度的精準(zhǔn)判定;DING、 HE[8]利用小波包能量作為CNN網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)對軸承故障診斷;陳保家等[9]提出一種CNN網(wǎng)絡(luò)與長短時(shí)記憶網(wǎng)絡(luò)結(jié)合的深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于滾動軸承故障診斷。上述深度學(xué)習(xí)模型依靠對深層次特征的自提取與識別分類,在軸承故障診斷中獲得較高的診斷準(zhǔn)確率,但深度學(xué)習(xí)模型需要大量有標(biāo)簽數(shù)據(jù)作為支撐,且訓(xùn)練集與測試集要滿足同分布[10]。然而,煤礦大型旋轉(zhuǎn)機(jī)械設(shè)備在實(shí)際運(yùn)行過程中故障數(shù)據(jù)獲取困難,導(dǎo)致有標(biāo)簽故障數(shù)據(jù)較少。因此利用小樣本重新訓(xùn)練深度學(xué)習(xí)模型未必能取得較好的診斷效果。
為了解決上述問題,遷移學(xué)習(xí)(Transfer Learning,TL)在故障診斷方面得到了廣泛關(guān)注,遷移學(xué)習(xí)旨在通過源域的可轉(zhuǎn)移特征信息,建立與目標(biāo)域共享的特征信息,彌補(bǔ)目標(biāo)域樣本不足的缺點(diǎn)[11]。因此,本文作者綜合深度學(xué)習(xí)模型與遷移學(xué)習(xí)(TL)的優(yōu)點(diǎn),先構(gòu)建一種CNN-BiGRU-RF的深度學(xué)習(xí)模型,利用源域充足樣本訓(xùn)練取得高精度分類效果;再引入遷移學(xué)習(xí),完成模型參數(shù)遷移,并利用少量目標(biāo)域有標(biāo)簽數(shù)據(jù)微調(diào)模型參數(shù),得到適用于目標(biāo)域的故障診斷模型,在缺乏大量負(fù)樣本的條件下實(shí)現(xiàn)目標(biāo)域故障識別。
CNN網(wǎng)絡(luò)是深度學(xué)習(xí)經(jīng)典模型之一,主要包括卷積層、池化層、全連接層[12]。其中卷積層以卷積核為核心,通過卷積核的卷積計(jì)算,自提取輸入信號隱含的空間特征信息,卷積計(jì)算過程如下:
(1)
池化層是對經(jīng)卷積層提取的空間特征信息進(jìn)行降維,并突出明顯的特征信息。文中采用最大池化作為池化方式,其計(jì)算過程為
(2)
式中:L為池化局部區(qū)域長度。
全連接層通常與Softmax分類器組合使用,進(jìn)一步計(jì)算經(jīng)卷積池化后的特征信息,實(shí)現(xiàn)故障分類。
因軸承的一維時(shí)序信號各數(shù)據(jù)點(diǎn)之間存在隱藏的相互依賴關(guān)系,而傳統(tǒng)CNN網(wǎng)絡(luò)更多的是提取空間特征,忽略了時(shí)間依賴特征。因此,文中結(jié)合BiGRU網(wǎng)絡(luò)捕捉軸承數(shù)據(jù)在時(shí)間序列前后的特征信息,提取更深層次、更全面的特征,達(dá)到更好的識別效果。
BiGRU網(wǎng)絡(luò)在結(jié)構(gòu)上由2個運(yùn)算方向相反的門控循環(huán)單元(GRU)組成[13],如圖1所示。BiGRU網(wǎng)絡(luò)的輸出是由2個GRU運(yùn)算結(jié)果共同決定,具體運(yùn)算過程如下:
圖1 BiGRU結(jié)構(gòu)
(3)
(4)
(5)
隨機(jī)森林算法由BREIMAN提出,它是由多個決策樹組成的集成分類器模型。利用Bootstrap重采樣方法訓(xùn)練決策樹,構(gòu)建關(guān)聯(lián)度小的決策樹,然后利用決策樹得到樣本的分類結(jié)果,最終結(jié)果由每顆決策樹投票決定[14]。
相比傳統(tǒng)CNN網(wǎng)絡(luò)中采用的Softmax分類器,RF分類器只有2個參數(shù),對參數(shù)不敏感,避免了復(fù)雜的梯度計(jì)算操作;同時(shí)對于含噪信號具有較好的降噪效果且各決策樹之間關(guān)聯(lián)性小,不容易過擬合,對小樣本具有更好的分類效果。
傳統(tǒng)CNN網(wǎng)絡(luò)對于時(shí)間特征利用不充分,以及Softmax分類層僅對最終分類結(jié)果做一次符合概率分布的操作,導(dǎo)致分類效果不理想,無法進(jìn)一步提高故障分類精度[15]。因此文中將CNN網(wǎng)絡(luò)與BiGRU網(wǎng)絡(luò)對軸承特征深層次的提取能力和RF分類器針對小樣本較好的分類效果相結(jié)合,提出一種CNN-BiGRU-RF深度學(xué)習(xí)模型用于軸承故障診斷。
模型結(jié)構(gòu)如圖2所示,它由兩層卷積與池化交替,可實(shí)現(xiàn)軸承數(shù)據(jù)空間特征深層次的提取與降維,其中考慮到輸入的軸承數(shù)據(jù)為一維時(shí)序信號,卷積層采用不同尺寸的卷積核,以便于提取軸承更多的特征信息;再經(jīng)BiGRU層進(jìn)一步提取時(shí)間序列上的特征信息,為了避免BiGRU層發(fā)生過擬合現(xiàn)象,引入Dropout技術(shù),保證輸出稀疏度;然后采用全連接層實(shí)現(xiàn)特征的展平操作,作為RF分類器的輸入特征向量;最后利用RF分類器實(shí)現(xiàn)故障分類。模型結(jié)構(gòu)相關(guān)參數(shù)設(shè)置如表1所示。
表1 模型參數(shù)設(shè)置
圖2 CNN-BiGRU-RF結(jié)構(gòu)
遷移學(xué)習(xí)主要利用源域的有標(biāo)簽且充足的數(shù)據(jù)建立一個學(xué)習(xí)模型,將源域?qū)W習(xí)知識遷移至目標(biāo)域,實(shí)現(xiàn)目標(biāo)域無標(biāo)簽數(shù)據(jù)分類[16]。因此,在負(fù)樣本稀少的情況下,引入遷移學(xué)習(xí)對于礦井通風(fēng)機(jī)軸承故障診斷具有很好的適用性。
文中將CNN-BiGRU-RF深度學(xué)習(xí)模型與遷移學(xué)習(xí)結(jié)合,提出一種基于深度遷移學(xué)習(xí)的礦井通風(fēng)機(jī)軸承故障診斷方法,其遷移診斷框架如圖3所示,具體診斷流程如下:
圖3 遷移診斷框架
(1)源域數(shù)據(jù)預(yù)訓(xùn)練模型。對數(shù)據(jù)進(jìn)行批量分割處理,構(gòu)建數(shù)據(jù)樣本,按照一定比例隨機(jī)劃分為訓(xùn)練集和測試集。將源域數(shù)據(jù)訓(xùn)練集輸入到CNN-BiGRU-RF模型中,使用網(wǎng)格搜索法尋找模型最優(yōu)初始參數(shù),并通過CNN層自提取軸承數(shù)據(jù)空間特征、BiGRU層學(xué)習(xí)軸承數(shù)據(jù)時(shí)間特征、RF分類器進(jìn)行故障分類。訓(xùn)練期間采用時(shí)序反向傳播算法(Back Propagation Through Time,BPTT)隨時(shí)間反向更新模型參數(shù),直至預(yù)訓(xùn)練完畢,保存預(yù)訓(xùn)練模型參數(shù),為下一步的模型遷移做準(zhǔn)備。
(2)目標(biāo)域數(shù)據(jù)微調(diào)模型。將預(yù)訓(xùn)練模型參數(shù)遷移至目標(biāo)域模型中,凍結(jié)CNN層及BiGRU層參數(shù),即CNN層及BiGRU層參數(shù)不隨迭代訓(xùn)練而改變。然后利用少量目標(biāo)域有標(biāo)簽數(shù)據(jù)輸入預(yù)訓(xùn)練模型中,對模型全連接層及分類層的參數(shù)進(jìn)行微調(diào),通過BPTT算法反向更新模型結(jié)構(gòu)參數(shù),減少模型對目標(biāo)域數(shù)據(jù)診斷的誤差。經(jīng)目標(biāo)域數(shù)據(jù)微調(diào)完成后,保存微調(diào)后的模型參數(shù)。
(3)測試模型分類效果。經(jīng)目標(biāo)域數(shù)據(jù)微調(diào)后的模型已經(jīng)具備對無標(biāo)簽?zāi)繕?biāo)域數(shù)據(jù)分類識別的能力。將目標(biāo)域的測試集輸入到微調(diào)后的模型中,經(jīng)RF分類器進(jìn)行故障分類,通過輸出結(jié)果驗(yàn)證模型對于目標(biāo)域樣本的故障診斷性能。
實(shí)驗(yàn)基于PyCharm 2020.1.2中的PyTorch框架,硬件環(huán)境CPU為i7-12700F,GPU為Nvidia GeForce RTX 2080 @8GB GDDR6。首先,利用MATLAB對軸承數(shù)據(jù)進(jìn)行降噪和預(yù)處理;然后,將處理好的數(shù)據(jù)輸入到模型中,使用GPU加速訓(xùn)練。
源域數(shù)據(jù)集來源于美國凱斯西儲大學(xué)滾動軸承試驗(yàn)臺,分別在0、735、1 470 W工況下獲取驅(qū)動端軸承振動數(shù)據(jù),表示為數(shù)據(jù)集A、B、C,每個數(shù)據(jù)集均包括內(nèi)圈、外圈、滾動體故障以及正常狀態(tài)4種類型的樣本,取2 048個數(shù)據(jù)點(diǎn)作為一個樣本長度,各狀態(tài)均有1 000組樣本,共有4 000組,按照8∶2劃分訓(xùn)練集和測試集。
目標(biāo)域數(shù)據(jù)表示為數(shù)據(jù)集D,來源于淮南丁集煤礦通風(fēng)機(jī),現(xiàn)場實(shí)驗(yàn)如圖4所示。在礦井通風(fēng)機(jī)長期運(yùn)行過程中,獲取通風(fēng)機(jī)軸承正常狀態(tài)、內(nèi)圈故障、外圈故障及滾動體故障等4種軸承數(shù)據(jù),所有故障數(shù)據(jù)均在詢問現(xiàn)場工作人員后劃分。礦井通風(fēng)機(jī)運(yùn)行環(huán)境復(fù)雜,設(shè)備所采集的數(shù)據(jù)中會含有大量噪聲,采用小波包對采集的數(shù)據(jù)進(jìn)行分解和重構(gòu),以達(dá)到濾除環(huán)境噪聲的目的。因礦井通風(fēng)機(jī)軸承故障樣本有限,采用時(shí)間重疊式數(shù)據(jù)擴(kuò)容技術(shù),增加樣本數(shù)量,使得礦井通風(fēng)機(jī)軸承每種狀態(tài)下各有100組樣本,共400個。
圖4 礦井通風(fēng)機(jī)現(xiàn)場實(shí)驗(yàn)
模型訓(xùn)練時(shí)迭代次數(shù)設(shè)置為120次,選擇Adam作為優(yōu)化器,學(xué)習(xí)率設(shè)置為0.01,批次為16,Dropout設(shè)置為0.5。目標(biāo)域數(shù)據(jù)集D按照8∶2劃分訓(xùn)練集與測試集,對CNN-BiGRU-RF模型進(jìn)行訓(xùn)練和測試,診斷準(zhǔn)確率如圖5所示??梢钥闯觯耗P驮跍y試集上的平均識別率僅65.03%,存在識別率低且不穩(wěn)定的情況,說明在目標(biāo)域負(fù)樣本稀少情況下,重新訓(xùn)練深度學(xué)習(xí)模型,難以實(shí)現(xiàn)高精度的故障診斷。
圖5 目標(biāo)域數(shù)據(jù)集直接訓(xùn)練模型的診斷準(zhǔn)確率
以源域數(shù)據(jù)集A遷移至目標(biāo)域數(shù)據(jù)集D(A→D)為例,先利用源域數(shù)據(jù)集A預(yù)訓(xùn)練CNN-BiGRU-RF模型,再使用預(yù)訓(xùn)練模型分別對目標(biāo)域數(shù)據(jù)集D進(jìn)行不遷移故障診斷實(shí)驗(yàn)和遷移故障診斷實(shí)驗(yàn)。以目標(biāo)域數(shù)據(jù)集D各狀態(tài)下20%的樣本微調(diào)模型,剩余樣本用來測試模型的診斷準(zhǔn)確率,診斷結(jié)果如圖6所示??梢钥闯觯何匆脒w移學(xué)習(xí)的模型在測試集上的準(zhǔn)確率僅78.82%,而引入遷移學(xué)習(xí)的模型的準(zhǔn)確率為94.41%,診斷準(zhǔn)確率提高了15%左右。說明當(dāng)源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)之間存在分布差異時(shí),將源域數(shù)據(jù)預(yù)訓(xùn)練的模型直接運(yùn)用到目標(biāo)域進(jìn)行故障診斷,分類效果會受到很大影響,導(dǎo)致診斷準(zhǔn)確率低于引入遷移學(xué)習(xí)模型的診斷準(zhǔn)確率。
圖6 遷移與未遷移方法在目標(biāo)域測試集上準(zhǔn)確率
混淆矩陣能更加直觀表現(xiàn)不同故障被錯分的數(shù)量和類型。在目標(biāo)域測試集上引入遷移學(xué)習(xí)模型,診斷結(jié)果的混淆矩陣如圖7所示。可以看出:對正常狀態(tài)的識別精度可以達(dá)到100%,對外圈故障的識別率也可以達(dá)到98.75%,僅內(nèi)圈故障識別率最低,其中有10個樣本被錯誤識別。說明遷移診斷模型總體分類效果良好,診斷識別率較高。
因此,上述診斷結(jié)果說明引入遷移學(xué)習(xí)的診斷方法能有效解決深度學(xué)習(xí)模型因缺乏大量訓(xùn)練樣本導(dǎo)致故障診斷準(zhǔn)確率低的限制,使用少量目標(biāo)域有標(biāo)簽數(shù)據(jù)微調(diào)的模型也具有較高的診斷準(zhǔn)確率。
為了測試遷移診斷模型對于礦井通風(fēng)機(jī)軸承故障識別精度與穩(wěn)定性,將它與TL+CNN模型、TL+CNN-BiGRU模型進(jìn)行對比分析。同樣以A→D為例,先以源域數(shù)據(jù)集A訓(xùn)練模型,然后以目標(biāo)域數(shù)據(jù)集D中20%樣本微調(diào)模型,剩余樣本用來測試模型的診斷準(zhǔn)確率,各模型在目標(biāo)域測試集上的準(zhǔn)確率如圖8所示。
圖8 各模型在目標(biāo)域測試集上的準(zhǔn)確率
由圖8對比分析可知:隨著迭代次數(shù)的增加,3種模型的診斷準(zhǔn)確率均趨于平穩(wěn),但文中所提模型相較于TL+CNN模型和TL+CNN-BiGRU模型準(zhǔn)確率更高且上升速度更快,20個迭代次數(shù)后,目標(biāo)域測試集上的準(zhǔn)確率就達(dá)到了94.89%,并在之后的訓(xùn)練中趨于平穩(wěn)且無明顯波動。
為了驗(yàn)證文中遷移診斷模型的泛化能力,分別使用源域不同工況數(shù)據(jù)集遷移到目標(biāo)域進(jìn)行診斷,為了避免偶然性,每種方法均進(jìn)行10次隨機(jī)實(shí)驗(yàn),3種模型的診斷準(zhǔn)確率如表2所示。
表2 不同診斷模型準(zhǔn)確率對比
由表2可以看出:TL+CNN模型、TL+CNN-BiGRU模型在源域不同工況數(shù)據(jù)集遷移到目標(biāo)域時(shí)診斷準(zhǔn)確率并不穩(wěn)定,而TL+CNN-BiGRU-RF模型的平均診斷準(zhǔn)確率均保持在94%以上,優(yōu)于其他2種模型,尤其在B→D的遷移診斷中,識別準(zhǔn)確率達(dá)到了95.27%,證明文中所提模型能夠運(yùn)用于礦井通風(fēng)機(jī)軸承的故障診斷中,與其他模型相比具有更好的泛化能力和更高的診斷精度。
(1)結(jié)合CNN網(wǎng)絡(luò)、BiGRU網(wǎng)絡(luò)和RF分類器各自優(yōu)勢設(shè)計(jì)了CNN-BiGRU-RF模型,提取了礦井通風(fēng)機(jī)軸承更深層次、更全面的故障特征。
(2)基于CNN-BiGRU-RF模型引入遷移學(xué)習(xí),利用軸承數(shù)據(jù)之間的相似性在目標(biāo)域訓(xùn)練模型共享參數(shù),再使用少量目標(biāo)域數(shù)據(jù)微調(diào)模型參數(shù),使模型參數(shù)滿足目標(biāo)域數(shù)據(jù)分類需求,完成了礦井通風(fēng)機(jī)軸承負(fù)樣本稀少條件下的高精度故障診斷。
(3)通過實(shí)驗(yàn)對比驗(yàn)證,在礦井通風(fēng)機(jī)軸承故障診斷中,基于CNN-BiGRU-RF的遷移診斷模型相較于其他診斷模型具備更高的診斷精度與穩(wěn)定性。