張品楊,陳長征
(沈陽工業(yè)大學(xué) 機械工程學(xué)院,遼寧 沈陽 110870)
行星齒輪箱作為風(fēng)力發(fā)電機的關(guān)鍵部件之一,其具有結(jié)構(gòu)緊湊、傳動比大、運行平穩(wěn)等特點[1]。因為風(fēng)力發(fā)電機常常處于惡劣的工作環(huán)境中,所以行星齒輪箱也是風(fēng)機傳動鏈中最容易發(fā)生故障的部件。因此,通過對行星齒輪箱進行狀態(tài)監(jiān)測,盡早地發(fā)現(xiàn)其故障,避免發(fā)生計劃外停機或嚴(yán)重的事故,對保證風(fēng)電設(shè)備的安全運行具有重要意義[2]。
振動信號的分析方法一般可以分為時域、頻域和時頻域3類[3]。其中,時頻域分析是處理非穩(wěn)態(tài)信號的有力工具。
CHEN Xiao-long等人[4]提出了一種迭代廣義時頻重分配方法,其將非平穩(wěn)多分量信號分解為恒定頻率的單分量信號,采用該方法可以提高風(fēng)電機組齒輪箱故障診斷中的時頻可讀性。孔子遷等人[5]利用卷積神經(jīng)網(wǎng)絡(luò)和雙向門控循環(huán)單元,實現(xiàn)了時頻特征融合背景下的行星齒輪箱端到端故障診斷目標(biāo)。孟玲霞等人[6]建立了一個時變轉(zhuǎn)速變載荷的風(fēng)電機組齒輪箱振動信號模型,并在此基礎(chǔ)上提出了一種新的時頻脊階次譜故障特征提取方法。DHAMANDE L S等人[7]針對軸承齒輪復(fù)合故障,提出了一種基于離散小波變換和連續(xù)小波變換的時頻統(tǒng)計特征的故障診斷方法。
上述研究雖然能夠進行較高精度的故障診斷任務(wù),但是缺少直觀的時頻域證據(jù)來支撐診斷結(jié)論。
時頻分割是分析時頻分布的重要手段之一。例如,YAN Bao-kang等人[8]提出了一種基于多分辨率時頻譜分割和振動信號稀疏分解的融合方法,該方法提高了最佳原子的計算速度和逼近精度。HUANG Chao-ming等人[9]采用時頻域幾何分布特征來分析經(jīng)典的最大類間方差(OTSU)算法結(jié)果,并提出了一種評估摩擦副磨損程度的新方法。
上述研究雖然實現(xiàn)了對故障特征區(qū)域的分割目的,但是沒有提出全局性的診斷模型。
綜上所述,上述研究工作已經(jīng)將深度學(xué)習(xí)應(yīng)用于基于時頻分析的故障診斷研究中,但是這些研究者通常旨在開發(fā)一種不可拆分的智能系統(tǒng),以此來完成基于時頻信息的行星齒輪箱故障診斷任務(wù)[10-13]。而時頻分析的過往研究尚缺乏對于最新的全卷機神經(jīng)網(wǎng)絡(luò)的應(yīng)用[14]。
因此,如果將時頻分析和基于時頻信息的故障診斷納入到一個連續(xù)但模塊化的診斷框架中(這與人工診斷過程更加相似),其就能為操作者提供更多、更全面的關(guān)于設(shè)備健康狀態(tài)的支撐信息,并且使得故障診斷結(jié)果更為可信。為此,筆者構(gòu)建一種用于風(fēng)電機組齒輪箱振動時頻分析和故障診斷的兩階段框架。
由于傳統(tǒng)基于閾值的方法在處理高分辨率時頻圖時容易受到噪聲干擾,因此,筆者在該框架中使用基于全卷積神經(jīng)網(wǎng)絡(luò)的語義分割方法,即以逐個像素點的形式對時頻圖像進行標(biāo)記。
筆者使用U-net算法,將時頻圖中屬于故障特征的像素點與背景區(qū)分開,然后使用形狀特征來提取分割得到的二值圖像中的有用信息;最后使用隨機森林算法對行星齒輪箱的健康狀態(tài)做出診斷。
U-net模型是由RONNEBERGER O等人[15]234在2015年首次提出的,其最初被應(yīng)用于醫(yī)學(xué)圖像分割領(lǐng)域。
作為全卷積神經(jīng)網(wǎng)絡(luò)的一種重要變體,U-net不包含全連接層,而是使用對稱布置的卷積層對特征信息進行壓縮和重構(gòu),從而在多尺度上利用上下文信息生成像素級的圖像分割結(jié)果。目前,U-net模型及其變體在醫(yī)學(xué)圖像分割領(lǐng)域應(yīng)用最多,并且正在向機器視覺、基于圖像的故障診斷等領(lǐng)域拓展。
U-net的結(jié)構(gòu)如圖1所示。
圖1 U-net的結(jié)構(gòu)
U-net模型的左邊是壓縮路徑,也被稱為編碼路徑,它由多個重復(fù)出現(xiàn)的壓縮模塊組成。壓縮模塊具有卷積神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu),包含3×3的卷積層、ReLU激活函數(shù)、批量歸一化層、2×2的池化層等。
U-net模型的右邊是擴張路徑,也被稱為解碼路徑。它的總體結(jié)構(gòu)與壓縮路徑非常相似,同樣包含若干個重復(fù)出現(xiàn)的擴張模塊。相比于壓縮模塊,擴張模塊中使用反卷積運算代替了卷積運算,并增加了來自壓縮路徑的跳躍連接層。基于上述設(shè)計,U-net呈現(xiàn)出簡潔、優(yōu)雅的U型結(jié)構(gòu)。
為了更加細致地說明U-net模型,筆者將介紹其中的幾個關(guān)鍵構(gòu)件:
1)卷積層。它由一組可以設(shè)置高、寬的卷積核組成??蓪W(xué)習(xí)的卷積核使得卷積層能夠?qū)斎胫械奶卣餍畔⑦M行概括,并映射到新的特征空間中。此外,共享權(quán)重的設(shè)置使得卷積層與全連接層相比具有更低的計算復(fù)雜度。對于每個卷積核,其輸出為:
(1)
式中:Xj為第j個輸入通道;Oi為特征映射的第i個通道;f為激活函數(shù);ωij為權(quán)重;bi為偏置項;
2)反卷積(有時也被稱為轉(zhuǎn)置卷積)。在U-net模型中,它的作用是提高特征映射的分辨率。為了獲得與壓縮路徑相匹配的擴張能力,反卷積層采用2×2的反卷積核,并設(shè)置卷積步長為2;
3)激活函數(shù)。它賦予了卷積網(wǎng)絡(luò)建模非線性映射的能力。常見的激活函數(shù)包括Sigmoid函數(shù)、Tanh函數(shù)、ELU、ReLU等。作為一種非飽和激活函數(shù),ReLU函數(shù)能夠緩解梯度消失和爆炸的問題,同時能夠加速模型學(xué)習(xí)。因此,ReLU被用作壓縮模塊和擴張模塊中的激活函數(shù),其計算方法如下:
ReLU(x)=max(0,x)
(2)
4)批量歸一化層。它是解決批量訓(xùn)練過程中的特征分布漂移問題的重要工具。嚴(yán)重的特征分布漂移會降低網(wǎng)絡(luò)訓(xùn)練的穩(wěn)定性,加劇過擬合現(xiàn)象發(fā)生,這在深度神經(jīng)網(wǎng)絡(luò)中尤為明顯。批量歸一化處理則將每層神經(jīng)元的輸出轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。對于一個批量訓(xùn)練數(shù)據(jù)[x1,x2,…,xm],歸一化處理后的結(jié)果如下:
(3)
(4)
(5)
(6)
標(biāo)記后的時頻圖結(jié)果可以被看作一種二值圖像,它具有和輸入圖像相同的分辨率。因此,對下一步的故障分類算法來說,其存在數(shù)據(jù)冗余的問題。所以,筆者使用基于區(qū)域的形狀特征方法來對數(shù)據(jù)進行特征提取。
幾何矩[16]是一種簡潔有效的基于區(qū)域的形狀特征提取方法。對于函數(shù)f(x,y),它的(p,g)階幾何矩表達式為:
(7)
圖形的一些重要區(qū)域?qū)傩钥梢詮膸缀尉匮苌鰜?M00定義了一個圖形的質(zhì)量;(M10/M00,M01/M00)定義了一個圖形的重心;(M20,M02)定義了一個圖形的慣性矩,它描述了圖形相對于坐標(biāo)軸的質(zhì)量分布。
上述性質(zhì)對于表征標(biāo)記后的時頻圖像中的特征區(qū)域分布情況十分有用。
隨機森林是一種基于集成學(xué)習(xí)思想的人工智能技術(shù)。針對傳統(tǒng)決策樹算法易發(fā)生過擬合的問題,LEO BREIMAN[17]開發(fā)了基于多個分類回歸樹(classific-ation and regression tree,CART)和裝袋算法(bootstrap aggregating,Bagging)的集成分類器,并將其成功運用到圖像分類領(lǐng)域。
在準(zhǔn)備階段,筆者先將原始數(shù)據(jù)集按比例劃分為訓(xùn)練集和測試集(其中,訓(xùn)練集將用于后續(xù)決策樹的訓(xùn)練,測試集將用于決策樹的性能驗證),然后使用Bagging方法,從訓(xùn)練集中有放回地隨機抽取訓(xùn)練樣本,并使用隨機選取的特征子集對決策樹進行訓(xùn)練,這種設(shè)置為決策樹的構(gòu)建增加了獨立性,能夠增強模型最終的抗噪聲性能和泛化能力。在訓(xùn)練集中反復(fù)使用Bagging方法直到構(gòu)建所需的所有決策樹。隨機森林算法的最終輸出由所有決策樹的結(jié)果統(tǒng)計得出。對于回歸問題,通常將不同決策樹預(yù)測值的平均值作為隨機森林的輸出。對于分類問題,基于決策樹的輸出采用多數(shù)投票的機制來確定最終輸出。
隨機森林算法主要步驟及流程如圖2所示。
圖2 隨機森林算法流程圖
隨機森林算法的詳細過程如下:
1)構(gòu)建訓(xùn)練樣本集,設(shè)置決策樹個數(shù)、特征集大小等超參數(shù);
2)對訓(xùn)練樣本集進行隨機采樣,構(gòu)建訓(xùn)練子集;
3)隨機抽取特征;
4)基于CART算法,使用只含部分特征的訓(xùn)練子集建立決策樹;
5)重復(fù)上述過程,直至得到完整森林;
6)將測試集代入訓(xùn)練好的隨機森林;
7)將所有決策樹的輸出匯總投票,得到最終結(jié)果。
筆者提出的兩階段框架旨在發(fā)展一種有普遍適用性的故障診斷框架,其從時頻數(shù)據(jù)中自動分析故障現(xiàn)象,并完成對風(fēng)電齒輪箱的故障診斷任務(wù)。
為此,筆者提出了一種用于時頻分析和故障分類的兩階段框架:在第一階段,使用U-net對時頻圖中代表故障的特征區(qū)域進行標(biāo)記,而后提取標(biāo)記后的二值圖像中的形狀特征;在第二階段,筆者訓(xùn)練隨機森林算法,對形狀特征進行分類,確定齒輪箱的健康狀態(tài)。
兩階段框架的整體結(jié)構(gòu)如圖3所示。
圖3 兩階段框架的結(jié)構(gòu)
筆者使用3種評價指標(biāo)來定量地評估不同算法標(biāo)記時頻圖中特征區(qū)域的能力,包括精度(P)、召回率(R)和F1分?jǐn)?shù)。
共同使用3種指標(biāo)有利于從更全面的角度分析算法性能:召回率能夠反映算法避免遺漏有價值信息的能力;精度能夠反映算法精準(zhǔn)選取有價值信息的能力;F1分?jǐn)?shù)能夠反映算法在上述能力間的協(xié)調(diào)。3種指標(biāo)的計算公式如下:
(8)
(9)
(10)
式中:TP為真陽性的像素點數(shù);FP為假陽性的像素點數(shù);FN為假陰性的像素點數(shù)。
實驗中使用的振動信號采集自華北地區(qū)某風(fēng)電場的1.5 MW變槳控制風(fēng)力發(fā)電機。
實驗中配備的行星齒輪箱如圖4所示。
圖4 實驗中的行星齒輪箱
傳動鏈主要包括葉片轉(zhuǎn)子、速比為100.48∶1的行星齒輪箱和雙饋式異步發(fā)電機。行星齒輪箱包含兩級行星齒輪傳動和一個平行齒輪傳動。
筆者采集數(shù)據(jù)時,加速度傳感器以磁吸方式固定在第二個行星級的外齒圈處。
齒輪箱內(nèi)部結(jié)構(gòu)和測點位置如圖5所示。
圖5 行星齒輪箱內(nèi)部結(jié)構(gòu)及測點位置示意圖
該實驗共有4種健康狀態(tài),包括正常、齒圈齒面點蝕、行星輪嚙合不對中、點蝕-不對中并發(fā)。上述故障都發(fā)生在第2個行星級,每種健康狀態(tài)對應(yīng)4臺行星齒輪箱,所以該實驗中共使用16臺齒輪箱的振動數(shù)據(jù)。
風(fēng)力機變轉(zhuǎn)速運行的特點以及多變的環(huán)境因素,增加了齒輪箱分析和診斷的難度,使實驗任務(wù)更具挑戰(zhàn)性。
離線采集的采樣頻率設(shè)置為16 384 Hz,每個信號持續(xù)10 s,從每條信號中截取10個片段用于計算時頻圖。筆者使用歸一化S變換[18],從信號片段中計算生成大小為512×512的時頻圖像,將計算所用的歸一化因子設(shè)置為2。
4種健康狀態(tài)下的振動信號片段如圖6所示。
圖6 4種健康狀態(tài)下的振動信號片段
4種健康狀態(tài)下的時頻圖像如圖7所示。
圖7 4種健康狀態(tài)下的時頻圖
圖7(a)、圖7(c)分別在行星齒輪一倍、二倍嚙合頻率處顯示出連續(xù)存在的帶狀特征區(qū)域;而圖7(b)、圖7(d)分別在行星齒輪一倍、二倍嚙合頻率處顯示出近似相等時間間隔的斑塊狀特征區(qū)域。
通常情況下,使用過小的數(shù)據(jù)集容易造成深度學(xué)習(xí)算法發(fā)生過擬合問題。鑒于此,筆者使用基于Python語言的Augmentor工具包[19]對原始圖像進行鏡像或扭曲,從而將總樣本數(shù)擴增了5倍,達到960個,基本上能夠滿足算法對數(shù)據(jù)總量的要求。
實驗中所用的U-net結(jié)構(gòu)主要參考RONNEBERGER O等人[15]235-237的論文,并做了一些改動,以適應(yīng)行星齒輪箱時頻故障診斷任務(wù)。筆者使用Adam作為優(yōu)化算法,使用交叉熵代價函數(shù),將學(xué)習(xí)率設(shè)置為1×10-3,小批量訓(xùn)練的樣本數(shù)設(shè)置為24,以加快訓(xùn)練速度。優(yōu)化的最大迭代次數(shù)為50次,當(dāng)算法在驗證數(shù)據(jù)集上的代價經(jīng)過連續(xù)5次迭代都不下降或沒有明顯改善時,模型即停止訓(xùn)練。
筆者在一臺配置酷睿i5-10400處理器和英偉達GeForce GTX1660顯卡的計算機上對所有實驗進行操作。筆者使用的計算機為64位Windows10操作系統(tǒng),其使用基于Python3.8的PyTorch深度學(xué)習(xí)框架。此外,筆者還使用了NumPy科學(xué)計算庫以及PIL等圖像處理庫。
在語義分割方法中,圖像中每個像素點都分配了一個標(biāo)簽。在該節(jié)中,時頻圖中的特征區(qū)域以灰度255突出顯示,其他部分的灰度則被設(shè)置為0。實驗數(shù)據(jù)按4:1比例被分割為不重疊的兩個部分,分別作為訓(xùn)練集和測試集使用。
U-net模型對測試集中部分?jǐn)?shù)據(jù)的分析結(jié)果如圖8所示。
圖8 U-net對4種健康狀態(tài)下時頻譜的分析結(jié)果
從圖8中可以看到:總體而言,對于4種健康狀態(tài)的樣本,U-net都能準(zhǔn)確地標(biāo)記出故障特征區(qū)域,揭示時頻圖中包含的嚙合或沖擊現(xiàn)象。另一方面,齒面點蝕故障和點蝕-不對中并發(fā)故障是處理效果相對較差的2種故障,網(wǎng)絡(luò)輸出中有少量的噪點和錯誤邊界。這是因為斑塊狀特征區(qū)域容易與強背景噪聲相混淆。
為了更具體地展示U-net的分析性能和不同類型樣本分析結(jié)果間的差異性,實驗中詳細的性能指標(biāo)如表1所示。
表1 U-net方法的性能指標(biāo)
從表1中可以發(fā)現(xiàn):U-net方法的精度、召回率、F1分?jǐn)?shù)3項指標(biāo)都是令人滿意的。其中,F1分?jǐn)?shù)達到了94.2%。齒面點蝕故障和點蝕-不對中并發(fā)2種故障的分析結(jié)果相對稍差,這與圖8中顯示的現(xiàn)象一致。
為了進一步驗證U-net模型的性能,在使用相同數(shù)據(jù)集的情況下,筆者將其與OTSU方法和傅立葉濾波2種分析方法進行了對比,實驗結(jié)果如圖9所示。
圖9 不同算法的性能和時間消耗比較
圖9中還給出了算法處理每個樣本所消耗的時間。
由圖9可知:得益于其強大的學(xué)習(xí)能力和上下文信息處理能力,U-net展現(xiàn)出比其他2種對比方法更優(yōu)秀的綜合性能;OTSU方法雖然給出了最高的計算效率,但是它的精度和召回率之間明顯失調(diào),即分割結(jié)果中包含過多的假陽性像素點;傅立葉濾波方法表現(xiàn)出比OTSU方法更好的性能,F1分?jǐn)?shù)達到了84.5%,但是因為在圖像處理過程中需要優(yōu)化濾波器中掩膜的尺寸,所以其在計算效率方面表現(xiàn)不佳;U-net作為一種深度學(xué)習(xí)方法,其能夠通過跳躍連接自動捕捉多尺度區(qū)域信息,無需手動調(diào)整模型參數(shù),同時,也能夠快速處理數(shù)據(jù)樣本,滿足實際工程應(yīng)用中的實時性要求。
綜上所述,在筆者提出的兩階段框架中,U-net能夠勝任風(fēng)電齒輪箱時頻分析任務(wù)。
筆者開發(fā)這種高精度的時頻分析方法的最終目的是為了對風(fēng)電機組齒輪箱故障進行快速分類。
為了消除二值時頻圖中的冗余信息,筆者使用3個形狀特征來提取標(biāo)記后圖像中的有價值特征。3個形狀特征分別為:圖像質(zhì)量M00和兩個方向的慣性矩M20、M02。其中,前者用于區(qū)分特征斑塊與特征條帶,后兩者則對其相對位置做出判斷。經(jīng)過區(qū)域形狀特征提取后,診斷階段的輸入信息總量從二維512×512=262 144壓縮為一維1×3=3,實現(xiàn)了極大幅度的壓縮目的。
被大幅壓縮的特征空間使得使用簡單的分類器成為可能。在兩階段框架中,筆者選擇了隨機森林算法來對4種齒輪箱健康狀態(tài)進行快速分類。
隨機森林算法在測試數(shù)據(jù)集上的分類混淆矩陣如圖10所示。
圖10 故障分類混淆矩陣
由圖10可知:總體而言,診斷的平均精度達到了97.4%,有限的數(shù)據(jù)量和壓縮后的特征空間都沒有對診斷結(jié)果產(chǎn)生不利影響;具體而言,行星輪嚙合不對中故障和點蝕-不對中并發(fā)故障是容易相互混淆的兩類故障,因為它們都具有二倍嚙合頻帶能量偏高的特征;齒面點蝕故障是診斷精度最低的一類故障,根據(jù)上一小節(jié)中的觀察,這是因為它更容易受到噪聲污染。
綜上所述,形狀特征提取搭配隨機森林算法能夠有效地提取時頻圖像中的故障特征,并對風(fēng)電機組齒輪箱的健康狀態(tài)做出準(zhǔn)確分類。
采用時頻分析方法對風(fēng)力發(fā)電機齒輪箱進行分析時,存在智能化程度低、故障診斷結(jié)論缺乏多域支撐、時頻分析與故障診斷有功能鴻溝等問題,為此,筆者提出了一種用于風(fēng)電齒輪箱振動時頻分析和故障分類的兩階段框架,包含作為第一階段的深度神經(jīng)網(wǎng)絡(luò)時頻譜分析方法,和作為第二階段的隨機森林故障分類方法。
研究結(jié)論如下:
1)基于U-net模型的風(fēng)電機組齒輪箱時頻分析方法能夠精準(zhǔn)地標(biāo)記振動時頻圖中的故障特征區(qū)域,解決了傳統(tǒng)方法受背景噪聲影響大、計算效率低、需要設(shè)置經(jīng)驗參數(shù)等問題。U-net模型通過對時頻數(shù)據(jù)進行了對稱壓縮和擴張,捕捉了圖像中的空間關(guān)聯(lián)信息,實現(xiàn)了對故障特征斑塊或條帶的精準(zhǔn)分割目的;
2)針對分析后的時頻圖像中存在數(shù)據(jù)冗余的問題,筆者采用形狀特征法對二值圖像中的形狀信息和位置信息進行了提取,大幅度壓縮了數(shù)據(jù)總量,減輕了第二階段故障診斷系統(tǒng)的計算壓力,同時為故障診斷結(jié)論提供了額外的支撐信息;
3)使用在役風(fēng)力發(fā)電機行星齒輪箱振動數(shù)據(jù)對兩階段框架進行了實驗驗證,結(jié)果發(fā)現(xiàn)該兩階段框架達到了97.4%的平均診斷精度和0.942的時頻分析F1分?jǐn)?shù)。通過對比其他2種方法,證明了該兩階段框架的先進性,對實際工程中的風(fēng)電機組齒輪箱時頻分析和故障診斷具有一定的參考價值。
在后續(xù)的研究中,筆者將繼續(xù)研究新型全卷積神經(jīng)網(wǎng)絡(luò)在時頻分析領(lǐng)域的應(yīng)用,并探索此類框架端到端的模型構(gòu)建。