瞿紅春,林文斌,許旺山,郭龍飛
(中國民航大學(xué)航空工程學(xué)院,天津 300300)
性能參數(shù)的偏差值,即參數(shù)測量值與基線值之間的差值是評估發(fā)動機(jī)性能狀態(tài)的依據(jù),獲取基線值是發(fā)動機(jī)狀態(tài)監(jiān)控的前提。新出廠或大修后的同一構(gòu)型航空發(fā)動機(jī)性能參數(shù)與工況參數(shù)(低壓轉(zhuǎn)子轉(zhuǎn)速N1或發(fā)動機(jī)壓比EPR)之間的關(guān)系稱為發(fā)動機(jī)的基線。原始設(shè)備制造商(OEM,original equipment manufacture)將發(fā)動機(jī)基線作為核心機(jī)密隱藏在狀態(tài)監(jiān)控系統(tǒng)中,拒絕向用戶公開[1]。用戶必須依賴OEM 提供的狀態(tài)監(jiān)控系統(tǒng)才能開展發(fā)動機(jī)狀態(tài)監(jiān)控工作。若用戶始終沒有自主建立發(fā)動機(jī)基線模型,必然要承受高昂的發(fā)動機(jī)監(jiān)控服務(wù)費(fèi)用,增加發(fā)動機(jī)維護(hù)成本。因此,自主開發(fā)發(fā)動機(jī)基線模型對航空公司至關(guān)重要。
建立自主基線模型存在兩大難點(diǎn):①難以獲取滿足建模條件的數(shù)據(jù)量;②基線值由多個參數(shù)共同決定,與各參數(shù)之間呈復(fù)雜的非線性映射關(guān)系,增加建模難度。為建立自主基線模型,文獻(xiàn)[1]采用高斯牛頓迭代方法解出各參數(shù)基線的非線性方程組;文獻(xiàn)[2]采用一元多項式回歸分析得到Trent700 發(fā)動機(jī)的近似表達(dá)式;文獻(xiàn)[3]利用正交實驗設(shè)計和最小二乘擬合方法建立了JT9D 發(fā)動機(jī)的基線方程;文獻(xiàn)[4]首次利用
飛機(jī)快速存儲記錄器(QAR, quick access recorder)數(shù)據(jù)針對PW4056 發(fā)動機(jī)建立了基于支持向量機(jī)(SVM,support vector machines)的多參數(shù)回歸模型。文獻(xiàn)[5]利用遺傳算法優(yōu)化后的BP 誤差反向傳播網(wǎng)絡(luò)(error back propagation)建立了CFM56-7B 發(fā)動機(jī)的發(fā)動機(jī)排氣溫度(EGT,exhaust gas temperature)基線模型。上述基線模型均取得了一定效果,但基線擬合精度不理想,因此,提出混沌PSO_Elman模型用于基線擬合。
Elman網(wǎng)絡(luò)是一種具有局部記憶單元和局部反饋的前向神經(jīng)網(wǎng)絡(luò)[6],其拓?fù)浣Y(jié)構(gòu)如圖1所示。輸入層將輸入數(shù)據(jù)傳入網(wǎng)絡(luò),隱含層進(jìn)行數(shù)據(jù)處理,承接層接收隱含層的反饋數(shù)據(jù),記憶隱含層前一時刻的輸出值,數(shù)據(jù)經(jīng)該層的延遲與儲存再次輸入到隱含層。由于承接層的存在,使得該網(wǎng)絡(luò)對歷史數(shù)據(jù)具有敏感性,更加適用于處理復(fù)雜信息[7]。
圖1 Elman網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig.1 Elman network topology
圖1 中各層間傳遞數(shù)據(jù)的表達(dá)式為
其中:μ為i 維輸入向量;y為j 維輸出向量;x為k 維隱含層輸出向量;xc為m 維承接層輸出向量。g(x)為輸出層神經(jīng)元的激活函數(shù),函數(shù)表達(dá)式為y(k)=w3x(k)。w1為承接層至隱含層的權(quán)值向量;w2為輸入層至隱含層的權(quán)值向量;w3為隱含層至輸出層的權(quán)值向量;α為反饋增益因子;f(x)為隱含層神經(jīng)元的激活函數(shù),一般為sigmoid 函數(shù),即
判斷Elman網(wǎng)絡(luò)是否停止訓(xùn)練的依據(jù)為
其中:d(k)為期望輸出向量,當(dāng)E 小于預(yù)設(shè)值或訓(xùn)練次數(shù)到達(dá)預(yù)設(shè)上限時,停止訓(xùn)練Elman網(wǎng)絡(luò)。
PSO算法的基本原理見文獻(xiàn)[8],粒子更新公式為
其中:c1和c2為相等的常數(shù),rand()為[0,1]區(qū)間內(nèi)的隨機(jī)數(shù);pbest[i]為歷史最優(yōu)位置;gbest[i]為當(dāng)前最優(yōu)位置;vi為速度;w為慣性因子。粒子不僅運(yùn)動位置和速度需滿足式(4),在運(yùn)動過程中也必須受到速度[-vmax,vmax]和位移[-xmax,xmax]的限制。
當(dāng)粒子接近最優(yōu)解時,如果w 過大,將導(dǎo)致粒子運(yùn)動速度過大,可能直接“越過”最優(yōu)值,不斷地在最優(yōu)值附近運(yùn)動,但難以靠近最優(yōu)值,導(dǎo)致算法的收斂精度降低[9]。為保證尋優(yōu)收斂速度,可在尋優(yōu)過程的前期保持較大的w,以保持較大的運(yùn)動步長。為保證收斂精度,可在尋優(yōu)過程中后期逐步減小w,以減小運(yùn)動步長。據(jù)此提出w的改進(jìn)表達(dá)式為
其中:wmax為慣性因子最大值;wmin為慣性因子最小值;n為粒子種群當(dāng)前迭代次數(shù);N為預(yù)設(shè)迭代總次數(shù);β為大于10的常數(shù)。
隨著尋優(yōu)過程的推進(jìn),解的搜索范圍將逐步減小,粒子種群的趨同效應(yīng)愈加明顯,如果當(dāng)前最優(yōu)粒子位置并非全局最優(yōu)位置,這將導(dǎo)致粒子種群陷入局部最優(yōu)陷阱[10]。為避免該現(xiàn)象,提出引入混沌的方法改變種群粒子的位置,從而保持粒子間的多樣性。當(dāng)種群陷入局部最優(yōu)解時,使多數(shù)粒子跳出局部最優(yōu)位置[11]。據(jù)此提出改進(jìn)的粒子位置更新表達(dá)式,即
其中:k為經(jīng)驗值,對于EGT 基線挖掘模型,k=400 最佳;ε為[0,1]區(qū)間的變量,當(dāng)ε 無限趨近于1 時,位置更新表達(dá)式為
此時xi+1相當(dāng)于進(jìn)入混沌狀態(tài),即粒子位置在某一區(qū)間內(nèi)隨機(jī)且不重復(fù)地分布,目的是使種群跳出局部最優(yōu)位置。當(dāng)ε 無限趨近于0 時,位置更新公式為xi+1=xi+vi,此時xi+1的更新公式與式(4)相同,為普通粒子群位置更新公式。式(7)中,cho為混沌變量,采用Logistics 映射作為混沌變量,其表達(dá)式為
其中:n為大于0的正整數(shù)。根據(jù)Logistics 映射軌道分岔原理[12],當(dāng)cho 初始值?。?,1)內(nèi)的任意值,且u=4時,隨著n的增加,chon可能取到[0,1]內(nèi)任何不重復(fù)的數(shù),即混沌的遍歷性,Logistics 映射如圖2所示。
圖2 Logistics 映射Fig.2 Logistics mapping
當(dāng)粒子群陷入局部最優(yōu)值時,粒子的位置會集中在局部最優(yōu)值附近。因此采用標(biāo)準(zhǔn)差作為粒子種群是否陷入局部最優(yōu)的判定標(biāo)準(zhǔn),即
其中:σ(fit)為粒子種群適應(yīng)度的標(biāo)準(zhǔn)差;m為粒子種群總數(shù);fiti為個體粒子適應(yīng)度值;fit為粒子種群適應(yīng)度的平均值;n為粒子種群當(dāng)前迭代次數(shù);N為預(yù)設(shè)迭代總次數(shù)。σ(fit)設(shè)定為0.1,即當(dāng)適應(yīng)度的標(biāo)準(zhǔn)差小于0.1,且粒子迭代次數(shù)少于最大迭代次數(shù)的0.9 倍時,引入混沌。
發(fā)動機(jī)數(shù)據(jù)主要來源于廠家監(jiān)控系統(tǒng)和QAR 數(shù)據(jù),但廠家監(jiān)控系統(tǒng)每個航班只產(chǎn)生一組巡航數(shù)據(jù),數(shù)據(jù)量不足。QAR 數(shù)據(jù)量雖大,但QAR 報文中沒有偏差值,只能通過監(jiān)控系統(tǒng)趨勢報告中對應(yīng)時段的平均偏差值,反推估算出基線值,這將影響基線擬合的精度。
為獲取足夠量的滿足基線擬合的巡航數(shù)據(jù),與某航空公司合作,利用該公司的單機(jī)版SAGE 監(jiān)控系統(tǒng),嚴(yán)格按照CFM56-7B 發(fā)動機(jī)巡航標(biāo)準(zhǔn)[13],采用人工輸入的方式按照一定間隔輸入巡航數(shù)據(jù)。目前航空公司已采用網(wǎng)絡(luò)版監(jiān)控系統(tǒng),單機(jī)版系統(tǒng)只是作為備用系統(tǒng),該研究不會影響公司的監(jiān)控工作,單機(jī)系統(tǒng)可以人為輸入數(shù)據(jù),更適用于研究。CFM56-7B 發(fā)動機(jī)巡航標(biāo)準(zhǔn)如表1所示。
表1 CFM56-7B 穩(wěn)定巡航標(biāo)準(zhǔn)Tab.2 CFM56-7B standard of stable cruise
最后在SAGE 輸出報告中找到對應(yīng)參數(shù)的偏差值,利用偏差公式推出基線值。各參數(shù)偏差公式為
其中:EGT為發(fā)動機(jī)排氣溫度;N2為高壓轉(zhuǎn)子轉(zhuǎn)速;FF為燃油流量;ΔEGT、ΔN1、ΔN2為偏差值;下標(biāo)t 標(biāo)識測量值,下標(biāo)b 標(biāo)識基線值。
模型由Elman網(wǎng)絡(luò)和混沌PSO算法兩大部分組成。其中Elman網(wǎng)絡(luò)輸入層的輸入數(shù)據(jù)為發(fā)動機(jī)基線的影響因子。輸入層需設(shè)置3個節(jié)點(diǎn),接收N1(低壓轉(zhuǎn)子轉(zhuǎn)速)、ALT(飛行高度)、Ma(馬赫數(shù))數(shù)據(jù)[14]。目前沒有精確的理論公式確定隱含層節(jié)點(diǎn)數(shù),但可通過實驗法和經(jīng)驗公式來確定。參照經(jīng)驗公式[10],隱含層節(jié)點(diǎn)數(shù)依次取5、7、10、15、20,驗算后發(fā)現(xiàn),隱含層和承接層均為15個節(jié)點(diǎn)時擬合精度最高。輸出參數(shù)為基線擬合值,故輸出層設(shè)置1個節(jié)點(diǎn)。采用類似于BP網(wǎng)絡(luò)的梯度下降權(quán)值訓(xùn)練方法對Elman網(wǎng)絡(luò)進(jìn)行訓(xùn)練。與混沌PSO算法結(jié)合尋優(yōu)時,訓(xùn)練步數(shù)為20 步。尋優(yōu)結(jié)束后,訓(xùn)練步數(shù)設(shè)置為2 000 步。當(dāng)網(wǎng)絡(luò)訓(xùn)練誤差低于
混沌PSO優(yōu)化算法設(shè)置種群中的粒子數(shù)為100,Elman網(wǎng)絡(luò)中需要優(yōu)化的權(quán)值和閾值構(gòu)成的空間向量視為混沌PSO算法中的一個粒子。單個粒子向量的維度由Elman網(wǎng)絡(luò)的結(jié)構(gòu)確定,即
其中:d1為待優(yōu)化權(quán)值數(shù)量;d2為待優(yōu)化閾值數(shù)量;d為粒子向量的維度;in為網(wǎng)絡(luò)輸入層神經(jīng)元個數(shù);hid為隱層神經(jīng)元數(shù);out為輸出層神經(jīng)元個數(shù)。
根據(jù)式(11),模型中待優(yōu)化權(quán)值數(shù)量d1為60個,待優(yōu)化閾值數(shù)量d2為16個,故粒子維度d=76。粒子向量中,元素的初始值為[-1,1]間的隨機(jī)數(shù)。最大尋優(yōu)迭代次數(shù)為10 000。經(jīng)實驗驗算,當(dāng)權(quán)值和閾值處于[-1.5,1.5]時,模型具備較高擬合精度,故粒子位置參數(shù)限制為[-1.5,1.5];速度參數(shù)限制為[-0.05,0.05];慣性權(quán)重w=0.8;自我學(xué)習(xí)因子c1=0.5;群體學(xué)習(xí)因子c2= 0.5。以單個粒子代表Elman網(wǎng)絡(luò)的一組權(quán)值和閾值,網(wǎng)絡(luò)輸出值與期望值間的絕對誤差作為粒子適應(yīng)度值。當(dāng)適應(yīng)度值小于0.001 時,結(jié)束粒子群尋優(yōu)過程。
混沌PSO_Elman模型主要由兩大部分構(gòu)成,如圖3所示。圖中左側(cè)為混沌PSO尋優(yōu)算法部分,可為Elman網(wǎng)絡(luò)尋找更優(yōu)的權(quán)值和閾值,并賦給Elman網(wǎng)絡(luò)。右側(cè)為Elman網(wǎng)絡(luò)部分,將優(yōu)化后的權(quán)值、閾值作為初始權(quán)值、閾值,對網(wǎng)絡(luò)訓(xùn)練后,可用于基線擬合。
圖3 混沌PSO_Elman模型流程圖Fig.3 Flow chart of chaotic PSO_Elman model
混沌PSO_Elman模型的具體算法步驟為:
1)隨機(jī)生成[-1,1]內(nèi)、維度為76的粒子種群100個;
2)定義一個全新的Elman網(wǎng)絡(luò),并將步驟1 中的粒子作為權(quán)值和閾值賦給Elman網(wǎng)絡(luò);
3)對Elman網(wǎng)絡(luò)輸入測試集,計算每個粒子(一組權(quán)值和閾值)對應(yīng)的適應(yīng)度值;
4)根據(jù)優(yōu)化后的公式更新粒子種群的速度和位置;
5)計算每次更新后的粒子對應(yīng)的適應(yīng)度值方差,并判斷種群是否陷入局部最優(yōu)解。如果是,則引入混沌使部分粒子跳出局部最優(yōu);如果否,則再次計算個體粒子的適應(yīng)度值;
6)根據(jù)判定標(biāo)準(zhǔn),判斷是否終止尋優(yōu)過程,若未達(dá)到終止標(biāo)準(zhǔn),則重復(fù)步驟3~6,直至達(dá)到終止標(biāo)準(zhǔn)后結(jié)束尋優(yōu)過程;
7)PSO尋優(yōu)過程結(jié)束后,將種群中適應(yīng)度值最優(yōu)的粒子所對應(yīng)的權(quán)值、閾值賦給Elman網(wǎng)絡(luò),并輸入訓(xùn)練集對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,若滿足訓(xùn)練終止標(biāo)準(zhǔn)之一,則結(jié)束網(wǎng)絡(luò)訓(xùn)練過程;
8)測試混沌PSO_Elman模型對基線的擬合精度。
以EGT 基線為例,首先對比混沌PSO尋優(yōu)算法與傳統(tǒng)算法的收斂速度和收斂精度。之后對比混沌PSO_Elman模型和其他模型對EGT 基線的擬合精度。
分別選用PSO、混沌PSO、GA(genetic algorithm)算法對結(jié)構(gòu)完全相同的Elman網(wǎng)絡(luò)進(jìn)行優(yōu)化,比較3種優(yōu)化算法的收斂速度和收斂精度。設(shè)3 種優(yōu)化算法種群數(shù)均為100,最大優(yōu)化更新次數(shù)均為100,當(dāng)適應(yīng)度值小于0.01 時,結(jié)束尋優(yōu)過程。訓(xùn)練樣本為10 組。以EGT 基線的期望值與模型擬合值之差為適應(yīng)度值。3種尋優(yōu)算法更新步數(shù)與適應(yīng)度值間的關(guān)系如圖4所示。
可以看出,GA 優(yōu)化算法適應(yīng)度不穩(wěn)定,且收斂精度低,更新到第10 步即收斂,陷入局部最優(yōu)。隨著訓(xùn)練步數(shù)的增加,PSO算法的EGT 誤差逐步減小,但其收斂精度不如混沌PSO算法?;煦鏟SO算法收斂速度和精度均優(yōu)于GA與PSO算法。
選用混沌PSO_Elman網(wǎng)絡(luò)與未經(jīng)優(yōu)化的Elman網(wǎng)絡(luò)、傳統(tǒng)BP網(wǎng)絡(luò)、SVM模型進(jìn)行對比。所有模型的訓(xùn)練集均為300 組數(shù)據(jù),測試集均為相同的30 組數(shù)據(jù)?;煦鏟SO_Elman、Elman、BP網(wǎng)絡(luò)的訓(xùn)練步數(shù)均為2 000步,隱含層均含15個節(jié)點(diǎn)。對比結(jié)果如圖5所示。
圖4 尋優(yōu)算法對比Fig.4 Comparison of optimization algorithms
圖5 訓(xùn)練集為300的EGT 誤差對比Fig.5 Comparison diagram when training set is 300
可以看出,混沌PSO_Elman模型擬合精度最高,誤差小于0.1 ℃;其次是Elman網(wǎng)絡(luò)模型和SVM模型,擬合誤差小于0.3 ℃。BP網(wǎng)絡(luò)擬合精度最低,最大誤差達(dá)到了0.65 ℃。雖然當(dāng)訓(xùn)練集足夠大時,4 種模型的擬合誤差均滿足工程應(yīng)用的要求[1](EGT 誤差小于1.5 ℃),但混沌PSO_Elman模型擬合誤差最小且誤差分布范圍最穩(wěn)定。其他模型誤差相對較大且誤差分布范圍非常不穩(wěn)定。
訓(xùn)練集下降至100 時,EGT 誤差分布如圖6所示?;煦鏟SO_Elman模型依然具有最高的擬合精度,誤差小于0.5 ℃,且誤差分布最穩(wěn)定。BP網(wǎng)絡(luò)的擬合誤差則整體較大,大部分誤差高于1.5 ℃,無法滿足實際工程需求。Elman網(wǎng)絡(luò)模型和SVM模型的擬合精度雖基本滿足工程需求,但精度均低于混沌PSO_Elman模型。
為比較各模型在訓(xùn)練樣本減少時的學(xué)習(xí)能力,在樣本庫中選取訓(xùn)練樣本300 組、200 組、100 組,對4個模型進(jìn)行訓(xùn)練,再選取測試樣本30 組,求30 組擬合誤差的平均值,在訓(xùn)練和測試樣本均相同的前提下比較4個模型的擬合精度,各模型結(jié)果如表2所示。
圖6 訓(xùn)練集為100的EGT 誤差對比Fig.6 Comparison diagram when training set is 100
表2 平均擬合誤差Tab.2 Average fitting error
可以看出,隨著訓(xùn)練樣本數(shù)的減少,4個模型的平均擬合誤差均有所增大。但混沌PSO_Elman模型的平均擬合誤差增幅最小,且始終保持在較低范圍內(nèi)。Elman網(wǎng)絡(luò)模型和SVM模型的擬合誤差相近。BP網(wǎng)絡(luò)模型平均誤差增幅最大,且訓(xùn)練樣本為100 組時,其平均擬合誤差已不滿足工程需求。綜上所述,混沌PSO_Elman模型在小樣本時的學(xué)習(xí)能力優(yōu)于其他模型。
1)混沌PSO尋優(yōu)算法解決了傳統(tǒng)PSO尋優(yōu)算法的收斂精度低和局部最優(yōu)問題。其尋優(yōu)時的收斂速度和收斂精度均高于傳統(tǒng)PSO和GA 尋優(yōu)算法。
2)混沌PSO_Elman模型對EGT 基線的擬合誤差可控制在0.1 ℃以內(nèi),精度高于其他傳統(tǒng)模型,且訓(xùn)練收斂速度更快。說明該模型相對于傳統(tǒng)人工智能模型更具有工程應(yīng)用價值。
3)混沌PSO_Elman模型在訓(xùn)練樣本較少的情況下仍然具有較高的擬合精度,說明該模型的學(xué)習(xí)能力優(yōu)于傳統(tǒng)模型,更加適用于工程應(yīng)用。