王秀娜,魯守銀,2,任 飛
(1.山東建筑大學(xué)信息與電氣工程學(xué)院,山東 濟(jì)南 250101;2.山東建筑大學(xué)機(jī)器人技術(shù)與智能系統(tǒng)研究院)
近年來(lái),預(yù)測(cè)性維護(hù)在研究和工業(yè)界都得到了廣泛關(guān)注,被認(rèn)為是第四次工業(yè)革命(“工業(yè)4.0”)背后的驅(qū)動(dòng)力。在大數(shù)據(jù)時(shí)代的今天,嵌入式智能傳感器收集的數(shù)據(jù)用于對(duì)當(dāng)前和未來(lái)的健康狀況或剩余使用壽命進(jìn)行估計(jì)和預(yù)測(cè)。雖然近年來(lái)在高質(zhì)量傳感器的開(kāi)發(fā)和預(yù)測(cè)建模方面取得了較大進(jìn)展,但是近年來(lái)的一些研究顯示,工業(yè)界尚未對(duì)預(yù)測(cè)性維護(hù)解決方案感到滿意。研究表明,預(yù)測(cè)性維護(hù)在工業(yè)環(huán)境中的應(yīng)用仍然需要對(duì)真實(shí)的工業(yè)數(shù)據(jù)和整體框架進(jìn)行廣泛的研究。整體框架包括預(yù)測(cè)性維護(hù)信息在生產(chǎn)中的部署,以提供決策支持來(lái)確定最佳維護(hù)時(shí)間點(diǎn)。生產(chǎn)和維護(hù)的綜合調(diào)度使制造業(yè)能夠優(yōu)化維護(hù)時(shí)間,同時(shí)避免代價(jià)高昂的機(jī)器故障,優(yōu)化了機(jī)器退化建模和維護(hù)集成生產(chǎn)調(diào)度領(lǐng)域的交互。
提高故障預(yù)測(cè)的準(zhǔn)確性不僅可以提高安全性和可靠性,降低平均維護(hù)成本,還可以為設(shè)備的維修決策提供參考?,F(xiàn)有的研究將故障預(yù)測(cè)方法分為兩大類:基于物理模型和基于數(shù)據(jù)驅(qū)動(dòng)的方法?;谖锢淼哪P托璨东@失效機(jī)制或物理現(xiàn)象,以建立一個(gè)退化過(guò)程的數(shù)學(xué)模型表示。由于系統(tǒng)的復(fù)雜性或降解機(jī)制的不明確,使其在實(shí)際應(yīng)用中不可行或無(wú)效。與基于物理的方法不同,數(shù)據(jù)驅(qū)動(dòng)的方法不需要理解復(fù)雜的退化機(jī)制。該方法通常依賴于數(shù)據(jù)分析,對(duì)數(shù)據(jù)進(jìn)行挖掘,以預(yù)測(cè)系統(tǒng)狀態(tài)的變化。因此,數(shù)據(jù)驅(qū)動(dòng)方法常用于預(yù)測(cè)系統(tǒng)的剩余使用壽命,其預(yù)測(cè)結(jié)果能夠很好地表現(xiàn)設(shè)備健康狀況。在數(shù)據(jù)驅(qū)動(dòng)方法中,很多機(jī)器學(xué)習(xí)方法在剩余使用壽命預(yù)測(cè)中有不錯(cuò)的表現(xiàn)。Huang 等利用傳統(tǒng)的多層感知器(Multilayer Perceptron,MLP)方法對(duì)實(shí)驗(yàn)室測(cè)試軸承的剩余使用壽命進(jìn)行建模,得出預(yù)測(cè)結(jié)果優(yōu)于基于可靠性的方法的結(jié)論。Tian開(kāi)發(fā)了一種人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)方法來(lái)估計(jì)設(shè)備的剩余使用壽命,該模型以當(dāng)前和之前檢查點(diǎn)的年齡以及多條件監(jiān)測(cè)測(cè)量值作為輸入,以設(shè)備壽命百分比作為輸出。Khawaja 等引入了一種帶有置信分布節(jié)點(diǎn)的置信預(yù)測(cè)方法。Malhi 等人提出了一種基于競(jìng)爭(zhēng)性學(xué)習(xí)的方法,使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)進(jìn)行機(jī)器健康狀態(tài)的長(zhǎng)期預(yù)測(cè)。
隨機(jī)森林算法是一種集成學(xué)習(xí)方法,通過(guò)在訓(xùn)練時(shí)構(gòu)建大量決策樹(shù)來(lái)進(jìn)行操作,隨機(jī)森林算法計(jì)算所有特征的重要性,從而得出特征等級(jí)。通過(guò)排列所有樣本的特征值,袋外數(shù)據(jù)(Out of Bag,OOB)誤差的增量或者是OOB準(zhǔn)確率的降低,可用于計(jì)算該特征的重要性。具體步驟如下:
⑵對(duì)于第條特征,為OOB 樣本排列其值,并在第棵樹(shù)上測(cè)試這些樣本,以獲得其精度A,=1,2,,,=1,2,,ntree;
⑶特征的重要性指標(biāo)計(jì)算公式為:
為了提高模型的預(yù)測(cè)性維護(hù)性能,采用時(shí)間卷積網(wǎng)絡(luò)(TCN)。TCN 采用的擴(kuò)展卷積結(jié)構(gòu)如圖1 所示。因果卷積層確保僅使用當(dāng)前和過(guò)去的樣本來(lái)計(jì)算其在時(shí)間的輸出。并且TCN為了處理梯度消失等問(wèn)題,采用擴(kuò)張卷積層,在獲得足夠大的感受野時(shí),盡可能的通過(guò)減少卷積層的數(shù)量來(lái)降低計(jì)算量。其中一維輸入向量x的第個(gè)元素處的擴(kuò)張卷積計(jì)算公式如下:
其中,q ∈0,1,…,k -1 表示過(guò)濾器,表示膨脹系數(shù),表示過(guò)濾器的大小。
TCN 的剩余塊體結(jié)構(gòu)如圖1 所示,殘差連接結(jié)構(gòu)由兩個(gè)相同的連續(xù)部分組成,其結(jié)構(gòu)按照擴(kuò)展因果卷積、權(quán)值規(guī)范化、激活函數(shù)和隨機(jī)失活排列的順序構(gòu)成。如圖1 所示,圖中d 代表采樣率,d=1 代表每個(gè)點(diǎn)都采集,層級(jí)越高d 越大。數(shù)據(jù)被送入1×1 卷積層確保輸入輸出的寬度一致,同時(shí)還通過(guò)擴(kuò)展卷積、權(quán)值規(guī)范化、激活函數(shù)和隨機(jī)失活結(jié)構(gòu)兩次以輸出。
圖1 殘差連接結(jié)構(gòu)和擴(kuò)展因果卷積結(jié)構(gòu)
本文所提出的基于隨機(jī)森林算法進(jìn)行特征選擇,并且提取重要性特征的滾動(dòng)平均值和滾動(dòng)標(biāo)準(zhǔn)差以重構(gòu)特征變量,將處理后的特征變量輸入至?xí)r間卷積網(wǎng)絡(luò)以進(jìn)行故障狀態(tài)預(yù)測(cè)性維護(hù)的具體步驟為:
隨機(jī)森林算法對(duì)輸入特征變量進(jìn)行重要性排序,選擇與故障相關(guān)的重要性特征;
對(duì)選擇出的重要性特征進(jìn)行滾動(dòng)平均值和滾動(dòng)標(biāo)準(zhǔn)差提取,來(lái)得到重構(gòu)特征;
將重要性特征結(jié)合重構(gòu)后的特征,組成新的輸入特征變量;
將新的時(shí)間序列,輸入至?xí)r間卷積網(wǎng)絡(luò)以實(shí)現(xiàn)預(yù)測(cè)性維護(hù)過(guò)程。
本文的實(shí)驗(yàn)數(shù)據(jù)來(lái)源于美國(guó)國(guó)家航空航天局的故障預(yù)測(cè)研究,使用C-MAPSS 發(fā)動(dòng)機(jī)仿真軟件模擬了發(fā)動(dòng)機(jī)的各個(gè)部件從健康運(yùn)行到故障的整個(gè)生命周期,收集了整套的傳感器退化數(shù)據(jù),用于預(yù)測(cè)性維護(hù)領(lǐng)域算法開(kāi)發(fā)和驗(yàn)證。
在構(gòu)建預(yù)測(cè)性維護(hù)模型之前對(duì)數(shù)據(jù)進(jìn)行特征工程處理,既可以通過(guò)篩選與故障更相關(guān)的特征變量,又可以通過(guò)對(duì)特征變量進(jìn)行提取重構(gòu),來(lái)達(dá)到提高模型訓(xùn)練效果的作用。已知數(shù)據(jù)集的原始特征是從setting1 到setting3,以及傳感器的記錄值s1-s21,其中一些傳感器的記錄值幾乎沒(méi)有變化。因此,我們對(duì)上述特征變量進(jìn)行了標(biāo)準(zhǔn)差和相關(guān)性分析并排序,其結(jié)果如圖2所示。
圖2 訓(xùn)練數(shù)據(jù)集的特征變量標(biāo)準(zhǔn)差與變異系數(shù)絕對(duì)值
性能評(píng)價(jià)指標(biāo)
在本文中,使用均方根誤差(Root Mean Square Error,RMSE),平均絕對(duì)誤差(Mean Absolute Error,MAE),平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)和決定系數(shù)(R),公式如下:
隨機(jī)森林和時(shí)間卷積網(wǎng)絡(luò)模型設(shè)置
在本文所提出的預(yù)測(cè)性維護(hù)過(guò)程中,首先,采用隨機(jī)森林算法進(jìn)行與故障相關(guān)的特征重要性排序,從21 個(gè)傳感器值的特征變量中選擇重要性排名前16 個(gè)特征作為后續(xù)時(shí)間卷積網(wǎng)絡(luò)的輸入數(shù)據(jù)。其中隨機(jī)森林算法進(jìn)行特征重要性選擇時(shí)的參數(shù)設(shè)置為:森林中決策樹(shù)的個(gè)數(shù)為10;度量分裂的標(biāo)準(zhǔn)為:gini;尋找最佳分裂點(diǎn)時(shí)考慮的特征數(shù)目為“:auto”;分裂內(nèi)部節(jié)點(diǎn)為:2;最少葉子節(jié)點(diǎn)數(shù)為:1。數(shù)據(jù)特征選擇結(jié)果如圖3 所示,其中柱狀圖的排列高低按照所選擇特征的重要性進(jìn)行排序。
圖3 隨機(jī)森林特征選擇重要性排序
將上述篩選出的特征變量提取滾動(dòng)平均值和滾動(dòng)標(biāo)準(zhǔn)差進(jìn)行特征重構(gòu),輸入至TCN 以進(jìn)行訓(xùn)練。TCN的網(wǎng)絡(luò)參數(shù)設(shè)置為:網(wǎng)絡(luò)層數(shù)為4層,卷積核為2,Dropout為0.5,epochs為10,batch_size為256,學(xué)習(xí)率為0.002,優(yōu)化器為adam,損失函數(shù)為binary-crossentropy,度量值為accuracy。將設(shè)置好參數(shù)的TCN網(wǎng)絡(luò)用于模型訓(xùn)練,在利用訓(xùn)練集將模型訓(xùn)練完畢后,進(jìn)而利用測(cè)試集對(duì)訓(xùn)練好的模型進(jìn)行預(yù)性維護(hù)過(guò)程的結(jié)果驗(yàn)證。
通過(guò)研究隨時(shí)間變化的傳感器值,利用預(yù)測(cè)性維護(hù)模型來(lái)學(xué)習(xí)傳感器值和傳感器值變化與歷史故障數(shù)據(jù)之間的關(guān)系,從而進(jìn)行未來(lái)故障的預(yù)測(cè)。在上一節(jié)中,通過(guò)檢查數(shù)據(jù)特征的可變性,對(duì)特征數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)性分析,從而得出對(duì)因變量有顯著影響的部分特征。在保證模型訓(xùn)練精度的基礎(chǔ)上,減少模型訓(xùn)練的時(shí)間。為提高模型在特征選擇方面的效率,采用隨機(jī)森林算法對(duì)數(shù)據(jù)進(jìn)行分析,選擇出重要性靠前的特征,并且將選擇出的特征進(jìn)行特征重構(gòu),其預(yù)測(cè)性能結(jié)果與其他模型相比的數(shù)據(jù)如表1 所示,可視化結(jié)果如圖4、圖5所示。
表1 不同模型下的性能指標(biāo)對(duì)比
圖4 不同模型下評(píng)價(jià)指標(biāo)對(duì)比柱狀圖
由表1,圖4和圖5可以看出,對(duì)于C-MAPSS數(shù)據(jù)集,本文提出的基于隨機(jī)森林和時(shí)間卷積網(wǎng)絡(luò)的混合預(yù)測(cè)性維護(hù)模型,能夠較好對(duì)故障進(jìn)行預(yù)測(cè),在四種評(píng)價(jià)指標(biāo)上都有很大的改善,其中相較于RMSE 至少提升了56.87%,MAE 至少提升了55.63%,MAPE 至少提升了36.37%,R至少提升了46.70%。
圖5 不同模型下的故障預(yù)測(cè)曲線對(duì)比
由于現(xiàn)代工業(yè)具有更為復(fù)雜和龐大的數(shù)據(jù),導(dǎo)致原先的故障預(yù)測(cè)方法無(wú)法直接應(yīng)用于現(xiàn)階段計(jì)算難度大等問(wèn)題。本文針對(duì)現(xiàn)存?zhèn)鞲衅鲾?shù)據(jù)具有維度高、非線性和隨機(jī)性等特點(diǎn),提出一種基于隨機(jī)森林算法和時(shí)間卷積網(wǎng)絡(luò)的故障預(yù)測(cè)方法。
首先利用隨機(jī)森林算法選擇出與故障相關(guān)性大的重要性特征變量。然后將篩選出的重要性特征進(jìn)行滾動(dòng)平均值和滾動(dòng)標(biāo)準(zhǔn)差等相關(guān)特征的提取,重構(gòu)輸入特征變量。最后利用時(shí)間卷積網(wǎng)絡(luò)強(qiáng)大的非線性、并行性處理能力,來(lái)進(jìn)行預(yù)測(cè)性維護(hù)的二分類問(wèn)題預(yù)測(cè)。在C-MAPSS 數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證表明,該模型的預(yù)測(cè)性能與其他機(jī)器學(xué)習(xí)模型相比有很大的提高,表現(xiàn)出很高的預(yù)測(cè)精度。