黃 曦,卿新林 ,王奕首 ,殷 鍇,趙 奇
(1.廈門大學(xué)航空航天學(xué)院,福建廈門361102;2.中國航發(fā)商用航空發(fā)動機有限責(zé)任公司,上海200241)
航空發(fā)動機工作在高溫、高壓、高速等極端條件下,容易產(chǎn)生故障,致使飛機迫降停飛,甚至誘發(fā)飛行事故、危及飛行安全[1]。NASA的統(tǒng)計資料表明:在民用領(lǐng)域,發(fā)動機故障占所有飛機機械故障中的1/3。全世界每年花費的310億美元維修費用中發(fā)動機日常維護占31%,翻修占27%[2]。為了在飛行過程中對航空發(fā)動機的健康狀態(tài)實時監(jiān)控,需要建立相應(yīng)的參數(shù)基線。以往航空發(fā)動機的相關(guān)參數(shù)基線無法直接測量,一般由發(fā)動機生產(chǎn)商經(jīng)過大量試驗才能得到,屬于發(fā)動機生產(chǎn)商的機密信息。隨著大數(shù)據(jù)時代的到來,使用飛行數(shù)據(jù)建立基線模型的方法越來越普遍,需要根據(jù)基線值與實際值的偏差來判斷發(fā)動機的運行狀態(tài),確定維修方案等。燃油流量是發(fā)動機重要參數(shù)之一,建立準確的燃油流量基線對于預(yù)防飛行事故的發(fā)生具有重要意義。
國內(nèi)外的專家學(xué)者對于發(fā)動機重要參數(shù)基線模型開展了大量研究工作,取得了不少成果。朱睿和劉志榮[3]利用線性擬合建立發(fā)動機整體及風(fēng)扇、壓氣機、高壓渦輪和低壓渦輪4個單元體性能的健康曲線,用于判斷發(fā)動機整體及單元體的性能衰退情況;鐘詩勝[4]采用基于核函數(shù)的多元非線性回歸分析方法,對Rolls-Royce公司的發(fā)動機排氣溫度、燃油流量、高壓轉(zhuǎn)速和低壓轉(zhuǎn)速基線方程進行了求解;閆鋒[5]設(shè)計了以高斯函數(shù)為隱含層激勵函數(shù)、以線性函數(shù)為輸出層激勵函數(shù)的多輸入單輸出的RBF神經(jīng)網(wǎng)絡(luò),建立了發(fā)動機燃油流量的健康基線來監(jiān)測巡航過程中發(fā)動機狀態(tài)參數(shù)的異常變化。但這些傳統(tǒng)的算法普遍存在診斷精度不高、魯棒性差等缺點。
目前常見的深度學(xué)習(xí)算法有自動編碼器(Autoencoder,AE)[6]、深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)[7]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[8]以及循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[9]等。其中自編碼器在圖像識別[10]、語音識別[11]、自然語言處理[12]等領(lǐng)域已經(jīng)廣泛應(yīng)用。堆疊降噪自動編碼器(Stacked Denoising Autoen-coders,SDAE)算法由Vincent在2010年提出[13],是在自動編碼器和降噪自動編碼器(Denoising Autoencoder,DAE)[14]基礎(chǔ)上的改進算法,精度高、抗噪聲能力強。為了克服傳統(tǒng)機器學(xué)習(xí)算法在故障診斷領(lǐng)域的不足,本文采用SDAE建立了發(fā)動機的燃油流量的健康基線模型。
自動編碼器利用SDAE算法對燃油流量F建立基線模型的步驟如下:
(1)從真實的飛行數(shù)據(jù)中選取與F相關(guān)的參數(shù)作為輸入;
(2)對初始數(shù)據(jù)進行預(yù)處理及其參數(shù)的修正;(3)將預(yù)處理的數(shù)據(jù)按照7∶3∶3的比例來構(gòu)建訓(xùn)練集、驗證集和測試集;
(4)將訓(xùn)練集輸入到SDAE模型中,根據(jù)驗證集結(jié)果調(diào)整SDAE模型的超參數(shù);
(5)將測試集輸入到近似最優(yōu)的SDAE模型中,來確定模型的擬合精度;
(6)將預(yù)處理的數(shù)據(jù)加上隨機高斯噪聲,重復(fù)第(4)、(5)步驟,檢驗SDAE模型的抗噪聲能力。
試驗數(shù)據(jù)選自某航空公司波音787客機的真實飛行數(shù)據(jù),其部分參數(shù)的原始巡航數(shù)據(jù)見表1。
考慮到飛行數(shù)據(jù)存在一些異常點和缺失點,建模前必須要對數(shù)據(jù)進行預(yù)處理。本文利用滑動中位數(shù)法對數(shù)據(jù)進行異常點去除,即建立1個滑動窗口,統(tǒng)計窗口內(nèi)數(shù)據(jù)的中位數(shù),若窗口內(nèi)數(shù)據(jù)與中位數(shù)相差大于一定的閾值,則判定為異常點,對異常點和缺失數(shù)據(jù)點利用滑動窗口的均值補全。
表1 波音787客機部分飛行數(shù)據(jù)
在建模前需要將燃油流量、壓力、溫度和轉(zhuǎn)速修正到標(biāo)準大氣壓海平面狀態(tài)下。在此引入溫度修正因子θ和壓力修正因子δ[15]
式中:H為飛行高度,根據(jù)θ和δ對參數(shù)進行修正。溫度修正公式為
式中:Tcor為修正后溫度;Traw為修正前溫度。
壓力修正公式為
式中:Pcor為修正后壓力;Praw為修正前壓力。
轉(zhuǎn)速修正公式為
式中:Ncor為修正后轉(zhuǎn)速;Nraw為修正前轉(zhuǎn)速。
燃油流量修正公式為
式中:Fcor為修正后燃油流量;Fraw為修正前燃油流量。
自動編碼器(Auto-Encoder,AE)是深度學(xué)習(xí)網(wǎng)絡(luò)中常見的基礎(chǔ)結(jié)構(gòu),是1種無監(jiān)督的學(xué)習(xí)算法,主要用于學(xué)習(xí)輸入數(shù)據(jù)集壓縮的抽象表達?;镜腁E由1個3層神經(jīng)網(wǎng)絡(luò)構(gòu)成:1個輸入層,1個隱藏層和1個輸出層,如圖1所示。由輸入層(L1)到隱藏層(L2)的過程稱為編碼階段,由隱藏層(L2)到輸出層(L3)的過程稱為解碼階段。
圖1 AE網(wǎng)絡(luò)結(jié)構(gòu)
令f和g分別代表編碼函數(shù)與解碼函數(shù)。則有
式中:Sf、Sg分別代表編碼器和解碼器的激活函;Wf為編碼權(quán)重矩陣;Wg為解碼權(quán)重矩陣;bf、bg分別為編碼器和解碼器偏置向量。一般選擇sigmoid函數(shù)
且權(quán)重矩陣Wg通常取自編碼網(wǎng)絡(luò)的作用是將輸入樣本X壓縮到隱藏層Y,再在輸出端Z重建樣本。其目標(biāo)是使輸出和輸入之間誤差盡量小。一般使用平方誤差
作為自動編碼器的損失函數(shù)。式中:d為輸入和輸出的維度。
對于樣本容量為N的訓(xùn)練樣本,自動編碼器的風(fēng)險函數(shù)為
最后通過隨機梯度下降算法最小化J(θ),求出參數(shù)空間θ。
DAE是在自動編碼器的基礎(chǔ)上為了防止過擬合問題而對輸入的數(shù)據(jù)(網(wǎng)絡(luò)的輸入層)加入噪聲,使學(xué)習(xí)得到的編碼器具有較強的魯棒性,從而增強模型的泛化能力,其結(jié)構(gòu)如圖2所示。對輸入數(shù)據(jù)加入噪聲的方法,一般為加入與輸入數(shù)據(jù)同分布的高斯噪聲,或以一定概率將輸入向量的分量置0。
圖2 DAE結(jié)構(gòu)
SDAE是多個降噪自動編碼器堆疊組成的1種深度網(wǎng)絡(luò)結(jié)構(gòu),利用前1層編碼器的輸出作為當(dāng)前層編碼器的輸入。為了解決深度網(wǎng)絡(luò)訓(xùn)練過程中出現(xiàn)的梯度消失等問題,Hinton基于深度置信網(wǎng)絡(luò)提出了1種貪婪逐層訓(xùn)練算法,即每次只訓(xùn)練1層網(wǎng)絡(luò),然后再將訓(xùn)練好的網(wǎng)絡(luò)固定去訓(xùn)練下1層[16],如圖3所示。通過第1層DAE的學(xué)習(xí)得到的編碼輸出,再以此輸出通過相同的方法添加噪聲進行訓(xùn)練得到第2層的編碼輸出,最后根據(jù)需要重復(fù)此過程。
圖3 SDAE結(jié)構(gòu)
通過無監(jiān)督訓(xùn)練得到的SDAE只是得到的原始數(shù)據(jù)精煉、抽象的1種表達,稱為整個基線模型的預(yù)訓(xùn)練階段,還不具備對基線的擬合能力。要想建立準確的健康基線,一般需要在SDAE頂端再添加1個回歸層(如線性回歸層),并結(jié)合少量有標(biāo)注的訓(xùn)練數(shù)據(jù)在損失函數(shù)的指導(dǎo)下對系統(tǒng)的參數(shù)進行微調(diào),使得整個網(wǎng)絡(luò)能夠完成對發(fā)動機燃油流量基線的建立。
試驗共選取1300組數(shù)據(jù)用于建立基線模型,其中700組用作模型的訓(xùn)練集,300組用作模型的驗證集,300組用作模型的測試集。令
利用深度學(xué)習(xí)開源框架Keras構(gòu)建BP(Back Propa-gation)神經(jīng)網(wǎng)絡(luò)和SDAE模型。針對2種模型分別選取一些不同的網(wǎng)絡(luò)結(jié)構(gòu)進行訓(xùn)練,記錄驗證集的均方誤差(Mean Squared Error,MSE)隨著迭代次數(shù)的變化,從而確定較優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)和迭代次數(shù)。其中BP分別選取網(wǎng)絡(luò)結(jié)構(gòu)為 (9,10,1)、(9,15,1)、(9,20,1)、(9,10,10,1)、(9,15,15,1)、(9,10,20,1)進行驗證。驗證結(jié)果如圖4所示。從圖中可見,當(dāng)BP網(wǎng)絡(luò)結(jié)構(gòu)為(9,10,1),迭代次數(shù)為750次時,驗證集的MSE最小。
圖4 BP模型驗證集的MSE
同理,分別選取結(jié)構(gòu)為(9,10,5,1)、(9,10,7,1)、(9,7,4,1)、(9,8,5,1)的 SDAE 模型進行驗證,其結(jié)果如圖 5所示。當(dāng) SDAE 模型結(jié)構(gòu)為(9,10,7,1),迭代次數(shù)為250次時,驗證集的MSE最小。
圖5 SDAE模型驗證集的MSE
對訓(xùn)練好的近似最優(yōu)的BP模型和SDAE模型在測試集上的MSE比較可知,BP的MSE為0.023,而SDAE的MSE為0.017?;贐P模型和SDAE模型的燃油流量預(yù)測曲線分別如圖6、7所示。從圖中可見,SDAE模型在波動聚集區(qū)間的預(yù)測效果明顯優(yōu)于BP模型的。
BP模型和SDAE模型的預(yù)測誤差百分比分別如圖8、9所示。從圖中可見,SDAE模型的預(yù)測誤差百分比小于BP模型的。
圖6 基于BP模型的燃油流量預(yù)測曲線
圖7 基于SDAE模型的燃油流量預(yù)測曲線
圖8 BP模型預(yù)測誤差百分比
圖9 SDAE模型預(yù)測誤差百分比
實際飛行數(shù)據(jù)中不可避免地存在噪聲,需要評估所建立模型的抗噪聲能力。本文對輸入數(shù)據(jù)加入不同等級的高斯噪聲,比較BP模型和SDAE模型在不同噪聲等級下的擬合精度。2種模型抗噪聲能力的比較如圖10所示。從圖中可見,隨著噪聲等級的增加,2種模型的MSE都在上升,但是SDAE模型的MSE上升的趨勢相對更平緩,因此判斷SDAE模型比BP模型有更好的抗噪聲能力。
圖10 BP模型和SDAE模型抗噪聲能力比較
本文首次將深度學(xué)習(xí)算法中的堆疊降噪自編碼用于發(fā)動機燃油流量基線模型的構(gòu)建。利用真實民航飛行數(shù)據(jù)對模型進行驗證,并將其與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法在基線建立精度和抗噪聲能力上進行比較。試驗結(jié)果表明,基于SDAE的航空發(fā)動機燃油流量基線模型的精度和抗噪能力都優(yōu)于基于BP算法的基線模型的。