劉玉山,張旭幫,王靈梅*,孟恩隆,郭東杰
(1.山西大學 自動化與軟件學院,山西 太原 030006;2.國家電投集團 山西新能源有限公司,山西 太原 030006)
隨著風電機組運行年限的增加,那些較早投產的機組即將面臨退役。而齒輪箱作為風電機組傳動鏈的關鍵部件之一,長期處于變工況、非平穩(wěn)運行狀態(tài),故障率較高。
為了指導運維和最大限度地延長機組壽命,需要對齒輪箱關鍵部件如軸承的異常狀態(tài)及剩余壽命進行準確預測。
通常情況下,軸承RUL預測包括兩部分:
1)退化指標構建。LI Nan-peng等人[1]提出了自適應首次預測時間,并利用粒子濾波降低隨機過程的隨機誤差來改進指數模型。LEI Ya-guo等人[2]建立了考慮多重機械退化因素的隨機過程,并利用卡爾曼濾波估計系統(tǒng)狀態(tài)預測RUL。
近年來,基于神經網絡的退化指標被用于軸承RUL預測。RAI A等人[3]提出了利用健康狀態(tài)下提取的振動特征對自組織神經網絡進行概率訓練的方法,然后利用檢測樣本構建了健康指標,采用狀態(tài)方程模型預測RUL。YU Jian-bo[4]將高斯混合模型與K-means聚類算法相結合,以此來選取故障特征,利用自組織神經網絡對數據分布空間進行了建模,把對數似然概率作為健康指標。張全德等人[5]采用自組織神經網絡對所提取的原始振動信號特征進行了訓練,對比健康狀態(tài)與待檢測狀態(tài)的最小量化誤差,以判斷軸承健康狀態(tài);但是,上述退化指標容易受噪聲干擾出現(xiàn)異常波動,在實際生產中容易造成誤報,影響維護人員的決策判斷。為此,GUO Wei等人[6]利用模糊C均值聚類算法和JRD構建了新的健康指標,清晰地區(qū)分了軸承的狀態(tài)。RAI A等人[7]利用高斯混合模型,分別計算了健康與缺陷狀態(tài)下的樣本后驗概率,利用JRD構建了退化指標,實驗驗證該指標可有效識別軸承初始故障;但該指標的單調性會影響軸承RUL預測精度,亟待進一步改進。
2)軸承RUL預測。RUL預測又可分為基于模型的預測方法和基于數據驅動的預測方法。前者根據軸承物理失效機理進行了建模,常用的有Pairs-Erdogan和粒子濾波方法。
LIAO Lin-xia等人[8]采用Pairs-Erdogan模型描述了軸承故障部位的裂紋增長,并采用連續(xù)貝葉斯更新方法預測了軸承RUL。丁顯等人[9]將粒子濾波算法與維納過程相結合,對風力發(fā)電機組軸承剩余壽命進行了準確預測,并用風電場數據進行了驗證。然而,在工業(yè)應用中,軸承的失效機制通常多種多樣,基于模型的預測方法需要一些先驗知識或大量經驗數據來初始化模型參數。因此,基于模型的方法在軸承RUL預測中應用有限。
隨著人工智能技術的發(fā)展,基于數據驅動的方法被廣泛用于軸承RUL的預測中,其優(yōu)點在于可以直接從可用的傳感器數據中了解到軸承的潛在退化趨勢,無需了解軸承的確切故障機制。例如,利用人工神經網絡[10-11]來訓練預測模型,然后利用訓練好的模型估計軸承的RUL;但是,基于人工神經網絡的預測方法往往需要大量數據訓練模型,在工程實際中想要獲得大量故障數據較為困難。因此,一些學者仍然沿用傳統(tǒng)算法對軸承RUL開展預測。例如,何茂[12]對高斯混合模型進行了改進以提高無標簽數據的聚類性能,同時引入了JRD構建健康指標,選取RVM不同核寬度以確定最優(yōu)退化曲線,對軸承的長期壽命進行了預測。張龍龍[13]利用支持向量機分類模型對所提取的時域、頻域及熵指標進行了軸承健康狀態(tài)的分類,并建立了退化期與失效期的支持向量機預測模型。WANG Dong等人[14]利用指數模型擬合相關向量,并外推至失效門限,得到了鋰電池RUL。
然而,以上方法并未考慮擬合誤差對預測結果的影響,導致RUL預測精度不高。
針對上述問題,筆者提出一種改進JRD及誤差修正的雙指數模型軸承RUL預測方法。
首先,筆者利用GMM與改進JRD,建立軸承退化指標,以提高指標的單調性與平滑性;同時提出新的預測框架,對從初始健康狀態(tài)退化至檢查時刻的CV值進行相空間重構,以此作為相關向量機(RVM)的訓練集,獲得相關向量;然后,用雙指數模型擬合相關向量,并外推至失效門限,以計算剩余壽命,利用ARIMA模型預測雙指數模型的擬合誤差;最后,利用山西某風電場的齒輪箱故障振動信號與實驗臺驗證,對退化指標識別故障的有效性進行驗證,并對軸承的RUL進行預測。
由于軸承的性能退化特征一般呈現(xiàn)多模態(tài)的特點,當軸承發(fā)生性能退化時往往并沒有相應的數據標簽對其進行表征。因此,筆者采用高斯混合模型對軸承退化階段進行建模。
高斯混合模型(GMM)是一種基于無監(jiān)督學習的聚類方法,它是多個高斯個體的線性組合,能夠平滑近似任意復雜的數據分布。
給定樣本數據X=(x1,x2,…,xN),N為樣本個數,假設每個樣本數據均可由多個高斯分布生成,但高斯分布的參數未知,則某一樣本的概率密度函數可用GMM模型可表示為:
(1)
GMM的概率密度函數參數可用Θ=(w1,…,wk,μ1,…,μk,∑1,…,∑k)表示。
GMM模型的建立需要根據輸入的樣本數據求取模型參數Θ,其原理是為每個高斯個體尋找一組參數wk,μk,∑k,使得生成該樣本的概率最大。具體方式是采用最大似然估計方法對GMM未知參數進行估計。其對數似然函數表示為:
(2)
利用期望最大化算法[15]使式(2)的期望達到最大值。由貝葉斯公式計算樣本數據的后驗概率公式如下:
(3)
利用下式迭代求解直至Θ收斂得到wk,μk,∑k:
(4)
(5)
(6)
其中式(3)作為GMM模型的輸出,為數據樣本分配類別后驗概率標簽,即表示屬于該類的概率大小,達到數據聚類的目的。
香農熵是一種常被用來量化信號信息概率的方法,用以反映系統(tǒng)的各種狀態(tài)。由于其對數據微小變化不夠敏感,因此筆者在此基礎上提出瑞麗熵,其定義為:
(7)
式中:Renα(p)為數據樣本X=(x1,x2,…,xn)對應的離散概率分布p=(p1,p2,…,pn)的α階瑞麗熵,當α→1時,上式為香農熵,文獻[7]將該指數設為0.5,有較好的分析效果,故筆者設定其為0.5。
杰森-瑞麗散度(JRD)是在KL散度的基礎上采用瑞麗熵表示概率分布之間的差異性,JRD距離越小,其概率分布越相似。具體表達式如下:
(8)
式中:p與bi,(i=1,2…,n)為n個概率密度分布及相對應的權重系數,p=(p1,p2,…,pn)。
通常將概率密度函數的權重系數bi設置為均勻型權重,即1/n,而權重bi對指標的平滑性具有重要影響。文獻[16]指出采用均勻型權重的JRD易受噪聲干擾,導致指標平滑度、單調性較差。
為了降低噪聲對JRD的影響,筆者引入指數型權重,并將其應用于軸承性能退化指標的構建中。
指數型權重如下:
(9)
式中:λ為平滑因子,主導著JRD的平滑程度。
由上式可知:當λ=0時,即為均勻型權重。
為了準確描述軸承的退化趨勢,筆者對JRD指標進行標準量化處理。通常采用的是歸一化方法,將其映射到[0-1]的范圍內,得到量化指標置信值CV。
筆者采用如下的歸一化方法[12],其公式為:
CV=1-tanh2(JRD)
(10)
性能退化量化指標CV為1時表示軸承處于健康狀態(tài),為0時表示失效狀態(tài)。筆者設定初始故障CV閾值為0.99,失效門限CV閾值為0.4。性能退化指標的實時變化用于反映軸承故障程度的變化,即隨著故障程度的加深,性能退化指標也呈現(xiàn)相應下降趨勢。
筆者所采用的訓練樣本RVM回歸模型可表示如下:
(11)
式中:X為輸入向量,x=(x1,x2,…,xN)T;Z為目標向量,z=(z1,z2,…,zN)T;δ為均值和方差分別為0、σ2的高斯白噪聲,表示擬合誤差;W為核函數的權重系數向量,w=(w1,w2,…,wN)T;K(x,xi)為核函數;Φ(x)為N×N+1的核函數矩陣。
由式(11)可以看出:目標zi服從均值、方差分別為y(xi)、σ2的高斯分布。
由貝葉斯理論可得目標向量的似然函數為:
(12)
為了對未知參數w和σ2進行估計,一般利用最大似然函數法(此處筆者不再贅述)。
在獲得相關向量后,常利用多項式模型或指數模型擬合相關向量,并外推擬合曲線至失效門限,以得到剩余壽命,而軸承退化往往滿足指數退化趨勢。故筆者利用雙指數模型對軸承進行建模,其形式如下:
CV=ae(bt)+ce(dt)
(13)
式中:CV為軸承退化指標;t為時間;a,b,c,d為未知參數。
筆者采用最小二乘法優(yōu)化擬合退化指標,求解4個未知參數。
此外,上述方法雖能達到軸承RUL預測的目的,但未考慮雙指數擬合相關向量得到的擬合結果與真實的軸承退化軌跡之間的誤差。
為了更加精確地預測軸承RUL,筆者將考慮擬合誤差對預測結果的影響,并利用ARIMA模型(p,q均為2,d為1)預測擬合誤差,將預測值作為誤差修正項加入到雙指數模型中。
筆者所提出的軸承RUL預測方法流程如圖1所示。
圖1 軸承壽命預測流程Fig.1 Bearing life prediction process
軸承RUL預測方法具體步驟如下:
步驟1。從軸承振動信號中提取時域特征(均方根、峭度、偏度、波峰因子、峰-峰值、方差)、頻域特征(頻率標準差、重心頻率、均方根頻率)、時-頻域特征(一級小波能量、二級小波能量),將這11個特征組成特征矩陣,經GMM、JRD處理,并歸一化得到CV;
步驟2。對檢查時刻至當前時刻的CV數據進行相空間重構。重構形式如下:
(14)
式中:左邊部分為特征矩陣;右邊部分為目標向量;m為嵌入維度,設為2;C1,…,CN為進入退化階段至當前時刻的CV值;N為數據長度;
步驟3。將式(14)輸入RVM模型訓練,得到相關向量;
步驟4。利用雙指數模型擬合相關向量,獲取雙指數模型未知參數,同時求解擬合誤差;
步驟5。外推雙指數模型至失效門限,得到預測退化曲線;
步驟6。利用ARIMA模型迭代預測擬合誤差,得到擬合誤差預測曲線;
步驟7。將ARIMA預測誤差曲線補充到步驟5的預測曲線中,得到誤差修正曲線;
步驟8。計算剩余壽命。
筆者采用FEMTO研究所PRONOSTIA實驗臺3種不同工況下的軸承加速壽命數據[17]作為RUL預測實驗數據集。該數據集中,振動數據的采樣頻率為25.6 kHz,每10 s采集0.1 s數據,以2 560個數據點為1個樣本[18-19]。
具體實驗工況以及所選用的軸承振動數據設置如表1所示。
表1 實驗臺軸承加速壽命實驗工況介紹Table 1 Introduction of experimental conditions of accelerated life of bearing on test bench
為了突出該退化指標相比目前常見的退化指標的優(yōu)勢,筆者引入均方根(root mean square, RMS)、自組織映射—最小量化誤差(self-organizing map-minimum quantifying error,SOM-MQE)[20]、均勻型權重JRD作為指標對比。
實驗臺中3種不同工況下,4種軸承退化的對比結果如圖2所示。
圖2 退化指標性能對比Fig.2 Performance comparison of degradation indicators
由圖2(a)、圖2(b)可知:RMS和SOM-MQE指標波動較大,存在異常波動的情況,且單調性較差,易發(fā)生誤報。圖2(c)為采用均勻型權值JRD構建的退化指標,用CV1表示,相較RMS、SOM-MQE較為平滑,受噪聲干擾較小,但單調性不太理想。圖2(d)表示筆者所提的指數型權值JRD構建的退化指標,用CV2表示,其相比CV1指標更加光滑。
為了進一步評價退化指標的優(yōu)劣,筆者引入單調性評價指標[21],該值越大,表明健康指標單調性越好。
單調性評價結果如表2所示。
表2 指標單調性對比Table 2 Comparison of monotonicity of indicators
由表2可知,除軸承B1采用均勻型權值的CV1單調性最優(yōu)以外,筆者所構建的CV2指標單調性要優(yōu)于其余幾個指標。
此外,筆者所引入的指數型權重即式(9)中,平滑因子λ會影響退化指標的性能。
筆者以軸承B1為例,分析其對指標單調性的影響,分析結果如圖3所示。
圖3 λ取值實驗Fig.3 λ value experiment
圖3(a)為λ取值(1,10]時的CV2退化曲線。
由圖3(b)可知:隨著λ取值增大,健康指標單調性逐漸上升并逐步穩(wěn)定;當λ取值為6時,健康指標單調性最高。
因此,此處筆者將λ設置為6。
為了驗證改進JRD后所構建的退化指標能夠有效識別風電機組傳動系統(tǒng)的初始故障,筆者利用自主研發(fā)并已安裝到山西某風電場的風電機組狀態(tài)監(jiān)測與故障診斷系統(tǒng)采集齒輪箱振動信號,在傳動鏈的主軸承、齒輪箱高、低速軸軸承、發(fā)電機前后軸軸承等部位安裝美國PCB公司振動傳感器,利用采集儀采集振動數據。
現(xiàn)場數據采集平臺如圖4所示。
圖4 齒輪箱振動數據采集平臺Fig.4 Gear box vibration data acquisition platform
已知該風電場2#機組齒輪箱于2016年11月底發(fā)生故障,2017年3月中旬更換齒輪箱。數據采集儀采樣頻率為51.2 kHz,每次數據采集時長1.28 s,每個振動數據文件共計65 536個數據點。
筆者分別采集了健康振動數據和已知故障振動數據。其中,齒輪箱健康振動信號長度為65 536個,截取1 024個數據點為一個樣本,健康狀態(tài)樣本個數為64個;同時,分別提取2個不同時刻的齒輪箱故障振動數據,每個對應時刻提取數據長度為65 536,同樣截取1 024個數據點為一個樣本,得到故障數據樣本共計128個。
筆者應用改進JRD后所構建的退化指標對樣本數據進行分析,所得到的結果如圖5所示。
圖5 風電機組齒輪箱故障退化曲線Fig.5 Fault degradation curve of wind turbine gearbox
由圖5(a)可知:在第64個樣本處退化指標發(fā)生變化,齒輪箱進入故障階段。其中,未改進前CV1和筆者改進后CV2的單調性分別為0.010 5、0.670 2。由此可知,筆者所構造的健康指標能夠準確識別初始故障,其指標更加平滑、單調性更好。同時,筆者采用截取初始故障點前后的振動信號數據,即圖5(b)、圖5(c)進行分析,發(fā)現(xiàn)振動信號幅值變大,進一步說明改進后的退化指標對初始故障較為敏感。
4.3.1 評價指標
在設定的檢查時刻Tc,筆者將預測曲線第一次穿越設定的失效門限時所對應的時刻記為Tf,則剩余壽命L(Tc)定義如下:
L(Tc)=Tf-Tc
(15)
為了更加直觀地驗證方法的有效性及優(yōu)勢,筆者利用相對誤差對其進行衡量。其表達式如下:
(16)
式中:L真(Tc),L預(Tc)為在設定檢查時刻Tc處,實際的RUL與預測得到的RUL。
4.3.2 剩余壽命預測
此處,筆者以軸承B1為例進行預測。在檢查時刻788處的預測結果如圖6所示。
圖6 軸承788時刻預測結果Fig.6 Prediction results of bearing 788 time
筆者對初始退化時刻至當前檢查時刻CV2進行相空間重構作為RVM模型訓練集,以得到相關向量,即圖6(a)中圓圈所示;再利用雙指數模型擬合相關向量,并外推雙指數模型至失效門限得到預測曲線1,并計算擬合誤差,即圖6(b)所示;利用ARIMA模型進行誤差修正得到的預測結果,即圖6(a)中預測曲線2。
由圖6(a)可計算得到788時刻的預測RUL為410(利用筆者所提方法),其中,實際RUL為494,相對預測誤差(relative error,RE)為17.0%;而采用未經誤差修正的方法所預測的軸承剩余壽命為391,相對誤差為20.9%。
同時,筆者引入粒子濾波方法作為對比實驗,其余時刻的預測結果如表3所示。
表3 軸承B1不同檢查時刻預測結果Table 3 Prediction results of bearing B1 at different inspection times
由表3可知:相對于未進行誤差修正及粒子濾波的方法,利用改進JRD及誤差修正的雙指數模型軸承RUL預測方法的預測精度更高,有較好的長期預測效果。
軸承B2在軸承退化階段的前期、中期、后期的預測結果如表4所示。
表4 軸承B2不同檢查時刻預測結果Table 4 Prediction results of bearing B2 at different inspection times
軸承B3在軸承退化階段的前期、中期、后期的預測結果如表5所示。
表5 軸承B3不同檢查時刻預測結果Table 5 Prediction results of bearing B3 at different inspection times
由表4、表5可知:在軸承退化的不同時刻,利用改進JRD及誤差修正的雙指數模型軸承RUL預測方法均能對軸承進行RUL預測。而在302時刻,由于B3軸承退化指標的非線性較強,給精準預測帶來了一定的挑戰(zhàn)。
總體而言,相比其他方法,利用改進JRD及誤差修正的雙指數模型軸承RUL預測方法的RE更小,預測精度更高。這有助于提高軸承的使用效率,降低維修成本。
筆者提出了一種利用改進JRD及誤差修正的雙指數模型軸承RUL預測方法,針對預測模型中未考慮擬合誤差對壽命預測結果的影響,利用ARIMA模型對擬合誤差進行迭代預測,作為預測結果的誤差修正項,進一步提高了齒輪箱軸承的壽命預測精度;最后利用風電場數據與試驗臺數據對該方法的有效性和優(yōu)越性進行了驗證。
研究結果表明:
1)采用所構造的性能退化指標,可以對風電機組齒輪箱的初始故障進行準確識別;
2)相對未改進前的退化指標,經權值改進以后的退化指標單調性更好,退化指標的單調性提高了約14.3%,這可以提高后期軸承壽命預測的準確性;
3)利用ARIMA模型對擬合誤差修正后,在不同檢查時刻進行預測,結果的準確性都有不同程度的提高。
筆者為風電機組齒輪箱軸承剩余壽命預測提供了一種方法,為機組齒輪箱的預測性維護制定了計劃。然而,該研究目前還存在一些不足之處,即在軸承實際性能退化的過程中,其失效閾值并不是固定不變的。因此,筆者下一步會將失效門限的動態(tài)化、區(qū)間化作為研究方向。