李耀華,王簽簽
(中國(guó)民航大學(xué)航空工程學(xué)院,天津 300300)
液壓系統(tǒng)是飛機(jī)重要的功能系統(tǒng),主要用于起落架、襟翼和減速板的收放、前輪轉(zhuǎn)彎操縱和燃油泵的液壓馬達(dá)等,其故障會(huì)直接影響飛機(jī)的飛行安全[1-3]。據(jù)統(tǒng)計(jì),相比飛機(jī)其他系統(tǒng)來說,液壓系統(tǒng)發(fā)生故障概率較高,約占飛機(jī)機(jī)械系統(tǒng)總故障的30%左右,其健康狀態(tài)直接影響飛機(jī)的安全性和可靠性[1-2]。因此對(duì)飛機(jī)液壓系統(tǒng)進(jìn)行故障檢測(cè)和診斷,成為飛機(jī)健康管理技術(shù)的一個(gè)研究熱點(diǎn)。
目前,針對(duì)液壓系統(tǒng)故障診斷問題國(guó)內(nèi)外學(xué)者從不同的角度展開了研究,文獻(xiàn)[1]利用人工蜂群優(yōu)化BP神經(jīng)網(wǎng)絡(luò),以提高飛機(jī)液壓系統(tǒng)故障診斷精度。文獻(xiàn)[4]基于BNfinder軟件數(shù)據(jù)處理優(yōu)化貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),分析液壓系統(tǒng)故障原因。文獻(xiàn)[5]提出一種基于LSTM與CNN相結(jié)合的高速柱塞泵故障診斷方法。對(duì)于液壓系統(tǒng)故障診斷,大多學(xué)者著重于故障診斷模型的改進(jìn),對(duì)冗余特征影響模型準(zhǔn)確率方面研究不是太多,但特征選擇對(duì)于民機(jī)液壓系統(tǒng)的故障診斷有非常重要的影響。
文獻(xiàn)[6]通過DPCA對(duì)故障特征進(jìn)行降維,然后采用GA-SVM實(shí)現(xiàn)液壓系統(tǒng)故障診斷。文獻(xiàn)[7]通過對(duì)所提取特征參數(shù)進(jìn)行敏感度分析,結(jié)合EMD-PNN實(shí)現(xiàn)快速有效的柱塞泵故障診斷。但是,對(duì)于敏感且重要特征參數(shù)的選取,需要綜合考慮特征與類別之間的多方面因素。
特征選擇作為機(jī)器學(xué)習(xí)的一個(gè)非常重要的預(yù)處理步驟在計(jì)算機(jī)等其他領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用[8-9]。變精度鄰域粗糙集[10-11]結(jié)合了變精度粗糙集和鄰域粗糙集的優(yōu)勢(shì),綜合考慮了條件屬性對(duì)決策屬性結(jié)果的影響,而隨機(jī)森林[12]基于變量重要性度量對(duì)特征進(jìn)行重要度計(jì)算,相較于過濾性特征選擇算法具有模型性能優(yōu)良的優(yōu)點(diǎn),故將變精度鄰域粗糙集(VPNRS)與隨機(jī)森林(RF)相結(jié)合進(jìn)行分階段特征選擇。并在液壓系統(tǒng)故障分類階段,采用OS-ELM作為分類模型對(duì)飛機(jī)液壓系統(tǒng)進(jìn)行故障診斷。
特征選擇的核心是在全部特征集合中去除無關(guān)特征,保留與類別相關(guān)的條件屬性,使得所選子集具有最大相關(guān)性和最小冗余性。不同評(píng)判特征間類別可分能力指標(biāo)擁有不同的篩選能力和約簡(jiǎn)范圍,單一的評(píng)價(jià)指標(biāo)易造成約簡(jiǎn)集合次優(yōu)。為了有效的選取對(duì)故障信號(hào)較為敏感的特征,提出一種變精度鄰域粗糙集與隨機(jī)森林相結(jié)合的特征選擇方法。該方法利用VPNRS度量特征與類別間的關(guān)聯(lián)度,RF作為分類器評(píng)判特征的類別可分能力,來作為一種特征排序度量標(biāo)準(zhǔn)。
VPNRS-RF算法是一種基于屬性依賴度和分類器的特征重要度的階段特征選擇方法。設(shè)在原始數(shù)據(jù)集中,有M種故障類型,每種故障類型有K種統(tǒng)計(jì)特征,則可表示為:
求解F的子集S={f1*,f2*…fN*}(N<M)。
為獲取含有N個(gè)特征的最優(yōu)特征子集,將決策屬性對(duì)條件屬性的依賴度作為條件屬性對(duì)決策屬性的影響程度的評(píng)價(jià)指標(biāo),可用以下公式計(jì)算特征重要度大?。?/p>
式中:a∈B,a—條件屬性;
B—條件屬性子集;
D—決策屬性;
γB(D)—D對(duì)B的依賴度。
含有N個(gè)特征的子集可能只是次優(yōu)約簡(jiǎn),當(dāng)其中一個(gè)特征信息可以由另外特征推斷得知,特征刪除時(shí)不會(huì)對(duì)分類結(jié)果造成太大影響,因此,采用基于分類器平均精確率減少作為評(píng)價(jià)指標(biāo),直接度量每個(gè)特征對(duì)模型準(zhǔn)確率的影響,賦予特征重要性權(quán)重。
式中:errOOB1—添加噪聲前的袋外數(shù)據(jù)誤差;
errOOB2—添加噪聲后的袋外數(shù)據(jù)誤差。
變精度鄰域粗糙集是在鄰域粗糙集的基礎(chǔ)上引入了包含度閾值,擴(kuò)大正域,使模型具有一定的容錯(cuò)性,使得邊界域中一些有用的信息進(jìn)入正域,極大程度地保留了核心特征,但是仍然存在著對(duì)類別屬性影響較弱的條件屬性,而隨機(jī)森林算法基于變量重要性度量在變精度鄰域粗糙集屬性約簡(jiǎn)后,極大程度的降低了特征相關(guān)性冗余度的基礎(chǔ)上,對(duì)特征進(jìn)行重要性排序,使得賦予特征重要性權(quán)重準(zhǔn)確度提升,進(jìn)行進(jìn)一步篩選后可獲取最優(yōu)特征子集。算法流程,如圖1所示。
圖1 VPNRS-RF特征選擇流程圖Fig.1 Flowchart of VPNRS-RF Feature Selection
構(gòu)建VPNRS-RF特征選擇算法基本步驟如下:
(1)設(shè)置鄰域半徑δ和閾值β取值范圍為步長(zhǎng)分別為Δδ和Δβ,則約簡(jiǎn)屬性次數(shù)為:
(2)初始化屬性約簡(jiǎn)次數(shù)1 ≤i≤N。
(3)使用變精度鄰域粗糙集計(jì)算鄰域半徑δ=δmin+(i-1) Δδ,閾值β=βmin+(i-1) Δβ時(shí)的約簡(jiǎn)特征子集{red1,red2…redN}。
變精度鄰域粗糙集算法主要步驟:
①初始化red=?;②根據(jù)鄰域半徑δ和閾值β,計(jì)算鄰域關(guān)系NA及其對(duì)應(yīng)屬性依賴度γai(D);③對(duì)任意ai∈C-red,計(jì)算sig(ai,red,D)=γred∪{ai}(D)-γred(D);④選擇屬性重要度大的條件 屬 性ak,其 滿 足sig(ak,red,D)=Max(sig(ai,red,D));⑤若sig(ak,red,D)>0,則red=red∪ak,轉(zhuǎn)到步驟(3);⑥輸出red。
(4)利用PNN 神經(jīng)網(wǎng)絡(luò)分別計(jì)算在不同鄰域半徑和閾值下的約簡(jiǎn)集合redi的分類精度。
(5)選擇分類精度最高的約簡(jiǎn)集合特征Selectred作為步驟6)的輸入數(shù)據(jù)。
(6)隨機(jī)森林重要度計(jì)算方法主要有三種,在此采用置換法OOB data 計(jì)算誤差值,以平均精度降低作為特征重要性評(píng)價(jià)指標(biāo),對(duì)特征進(jìn)行排序,該步驟主要分為2個(gè)過程:
第一個(gè)過程為對(duì)于隨機(jī)森林中的每一顆決策樹,使用相應(yīng)的OOB(袋外數(shù)據(jù))數(shù)據(jù)來計(jì)算它的袋外數(shù)據(jù)誤差,記為errOOB1。然后隨機(jī)地對(duì)袋外數(shù)據(jù)OOB所有樣本特征加入噪聲干擾,再次計(jì)算它的袋外數(shù)據(jù)誤差,記為eerOOB2。
第二個(gè)過程為利用特征重要性的計(jì)算式(3)來計(jì)算特征重要性并對(duì)特征進(jìn)行排序。
(7)使用序列后向選擇方法(SBS)從特征的全集開始搜索,每次從特征子集中去掉一個(gè)特征,采用PNN神經(jīng)網(wǎng)絡(luò)來獲取不同特征子集分類準(zhǔn)確率。
(8)由于隨機(jī)森林的固有隨機(jī)性,可能每次給予特征不同的重要性權(quán)重,導(dǎo)致得到的特征數(shù)隨準(zhǔn)確率變化趨勢(shì)產(chǎn)生差錯(cuò),可以通過再次返回步驟(6),以選出分類準(zhǔn)確率最高的特征子集作為集成模型的輸入數(shù)據(jù)集。
2.3.1 OS-ELM算法
OS-ELM 算法[13-14]對(duì)于單隱層神經(jīng)網(wǎng)絡(luò)的輸出權(quán)重的學(xué)習(xí)過程主要分為兩部分:
第一部分是初始階段,假設(shè)有N0個(gè)任意訓(xùn)練樣本(Xi,ti)∈Rn×Rm,其中Xi=[xi1,xi2…xin]T為學(xué)習(xí)模型的輸入值,ti=[ti1,ti2…tin]T為學(xué)習(xí)模型的期望輸出,利用ELM 數(shù)學(xué)模型,求得使?jié)M足‖H0β-T0‖的最小值β0,其中:
式中:g(·)—隱含層的激活函數(shù);
ai—輸入層與隱含層之間的權(quán)值;
bi—隱含層的偏差。
所用到的激活函數(shù)有:
接著采用最小二乘法和廣義逆的思想,求出隱含層權(quán)值β0為
第二部分是在線學(xué)習(xí)階段,當(dāng)有新的樣本進(jìn)入模型時(shí),由在線學(xué)習(xí)的遞推公式可得出輸出權(quán)值:
2.3.2 飛機(jī)液壓系統(tǒng)故障診斷模型這里液壓系統(tǒng)故障診斷模型構(gòu)建主要分為如下兩個(gè)部分:
(1)特征選擇:由飛機(jī)液壓系統(tǒng)仿真信號(hào)得到的量化特征集存在高維度及大量冗余問題,利用VPNRS-RF 特征選擇算法選取維度低、敏感度高且分類錯(cuò)誤率小的主要特征向量。
(2)模型構(gòu)建:OS-ELM具備了ELM模型的速度和泛化能力上的優(yōu)點(diǎn),并且可以隨著新數(shù)據(jù)的到來不斷更新模型,可以進(jìn)一步提高飛機(jī)液壓系統(tǒng)故障準(zhǔn)確率。流程圖,如圖2所示。
圖2 基于VPNRS-RF的OS-ELM流程圖Fig.2 OS-ELM Flow Chart Based on VPNRS-RF
步驟如下:
(1)基于Amesim飛機(jī)起落架收放系統(tǒng)仿真模型的壓力信號(hào),構(gòu)建特征向量。
(2)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,基于變精度鄰域和模糊熵粗糙集理論,對(duì)數(shù)據(jù)樣本進(jìn)行屬性約簡(jiǎn)。
(3)基于步驟(2)屬性約簡(jiǎn)特征,利用RF算法OOB data計(jì)算誤差并對(duì)特征進(jìn)行重要度排序。
(4)利用PNN神經(jīng)網(wǎng)絡(luò)選擇合適的特征數(shù)目K。
(5)基于ELM分類模型,將VPNRS-RF與其他特征選擇方法進(jìn)行對(duì)比,驗(yàn)證VPNRS-RF算法的優(yōu)越性。
(6)將選擇特征作為OS-ELM輸入?yún)?shù),進(jìn)行故障診斷和結(jié)果分析。
建模完成后,按照飛機(jī)液壓系統(tǒng)相關(guān)資料輸入相關(guān)參數(shù),具體設(shè)置參數(shù),如表1所示。
表1 起落架收放系統(tǒng)仿真模型參數(shù)設(shè)置Tab.1 Parameter Setting of Simulation Model of Landing Gear Retraction System
選取對(duì)象是某型飛機(jī)液壓系統(tǒng)起落架收放系統(tǒng),在AMESim仿真平臺(tái)下建立液壓系統(tǒng)仿真模型,建立的模型[1,3,15],如圖3所示。
圖3 飛機(jī)液壓系統(tǒng)仿真模型Fig.3 Simulation Model of Aircraft Hydraulic System
相關(guān)參數(shù)設(shè)置完成后,運(yùn)行該模型,液壓泵輸出壓力隨時(shí)間變化曲線,如圖4所示。飛機(jī)液壓系統(tǒng)的故障模式通過改變模型的物理參數(shù)來設(shè)置,通過改變模型的泄露系數(shù)、油濾孔徑、油液空氣含量來分別模擬泄露、堵塞、氣塞、堵塞和氣塞、泄露和堵塞五種故障模式。
圖4 飛機(jī)液壓系統(tǒng)正常情況下泵輸出壓力仿真結(jié)果Fig.4 Simulation results of Pump Output Pressure Under Normal Conditions of Aircraft Hydraulic System
這里要監(jiān)測(cè)和采集的數(shù)據(jù)是飛機(jī)液壓系統(tǒng)的液壓泵出口壓力信號(hào),以飛機(jī)起落架放下過程為仿真的工作過程,在6種狀態(tài)下分別采集了3000個(gè)樣本,從中各選取2500個(gè)樣本,將其分成50段,每段50個(gè)樣本,構(gòu)建特征集合,并利用VPNRS-RF算法進(jìn)行特征篩選,以獲取最優(yōu)特征子集作為OS-ELM故障診斷模型輸入,來提高飛機(jī)起落架收放系統(tǒng)故障診斷精度。首先選取決策屬性D={1,2,3,4,5,6},分別對(duì)應(yīng)6種狀態(tài),選擇分別于系統(tǒng)相關(guān)的18個(gè)條件屬性C={c1,c2…c18}。在變精度鄰域粗糙集算法中,有兩個(gè)變量鄰域半徑δ和閾值β,不同的鄰域半徑δ和閾值β,將得到不同的約簡(jiǎn)集合。設(shè)置變量δ的值從(0.05~0.5)以步長(zhǎng)0.05變化,變量β的值從(0.5~1)以步長(zhǎng)0.1變化。選擇特征個(gè)數(shù)和PNN分類精度隨δ和β的變化,如圖5、圖6所示。從圖6可以得出當(dāng)δ和β為(0.1,0.5)和(0.15,0.7)時(shí)分類精度最高,特征選擇個(gè)數(shù)為8,分別為{c1,c4,c5,c7,c8,c10,c12,c15}和{c1,c4,c5,c7,c8,c10,c14,c15},由 于δ和β在這兩種情況下,選擇特征大多重合且分類精度相等,因此將選擇的特征融合為{c1,c4,c5,c7,c8,c10,c12,c14,c15}。
圖5 特征個(gè)數(shù)隨δ和β的變化Fig.5 Variation of the Number of Features with δ and β
圖6 分類精度隨δ和β的變化Fig.6 Variation of Classification Accuracy with δ and β
接著利用RF 算法OOB data 計(jì)算誤差并對(duì)由VPNRS 和FISEN分別選擇的特征進(jìn)行重要度排序,如圖7、圖8所示。
圖7 變精度鄰域選擇特征排序圖Fig.7 Sequencing Diagram of Variable Precision Neighborhood Selection Features
圖8 模糊熵選擇特征排序圖Fig.8 Sequencing Diagram of Fuzzy Entropy Selection Features
由圖7、圖8得出特征重要性排序后需進(jìn)行特征篩選,為了選擇合適的特征數(shù)目K,使用序列后向選擇方法(SBS)從特征的全集開始搜索,每次從特征子集中去掉一個(gè)特征,采用PNN神經(jīng)網(wǎng)絡(luò)模型對(duì)不同的K值進(jìn)行試驗(yàn),通過比較不同的K值對(duì)分類準(zhǔn)確度的影響來選擇最優(yōu)的K值,實(shí)驗(yàn)結(jié)果,如圖9所示。
圖9 特征數(shù)對(duì)分類精度的影響Fig.9 Influence of Feature Number on Classification Accuracy
從圖9可以看出,當(dāng)VPNRS-RF-PNN和FISEN-RF-PNN模型輸入特征個(gè)數(shù)分別為4和3時(shí),分類精度高于VPNRS-PNN和FISEN-PNN 分類模型,且VPNRS-RF-PNN 分類精度高于FISEN-RF-PNN模型,說明了VPNRS-RF相比單一VPNRS特征選擇方法,在輸入特征更少的基礎(chǔ)上獲取更高的分類精度。因此最后作為輸入數(shù)據(jù)特征為中值、最大值、均方根、調(diào)和平均數(shù)。
3.2.1 基于ELM模型的特征選擇驗(yàn)證評(píng)估
為了比較特征篩選算法的性能,基于飛機(jī)液壓系統(tǒng)故障仿真數(shù)據(jù)集對(duì)不同特征選擇算法進(jìn)行試驗(yàn)對(duì)比,并采用ELM算法對(duì)其進(jìn)行訓(xùn)練,具體結(jié)果,如表2所示。
表2 不同特征選擇算法基于ELM模型結(jié)果對(duì)比Tab.2 Comparison of Results of Different Feature Selection Algorithms Based on ELM Model
從表2 可知,VPNRS-RF 模型分類精度高于WMNRS、GA、PCA、熵權(quán)法,雖然PCA和熵權(quán)法在特征降維上表現(xiàn)良好,但是并不能較好的保留數(shù)據(jù)信息。表明了VPNRS-RF特征選擇方法相比應(yīng)用于液壓系統(tǒng)中傳統(tǒng)單一的GA、PCA、熵權(quán)法等方法,不僅可以減少計(jì)算量,去除冗余特征,而且可以提高分類準(zhǔn)確率。
OS-ELM故障診斷模型需要對(duì)一些參數(shù)進(jìn)行人為的選擇,不同參數(shù)的選取會(huì)對(duì)診斷精度和算法性能產(chǎn)生影響。
3.3.1 OS-ELM隱含層神經(jīng)元及激活函數(shù)的選取
故障樣本的分配、隱含層神經(jīng)元、激活函數(shù)的選取會(huì)對(duì)故障診斷算法的訓(xùn)練時(shí)間和診斷精度產(chǎn)生一定的影響,因此,分別采用樣本比例為4:1、3:2、1:1對(duì)OSELM隱含層神經(jīng)元個(gè)數(shù)和激活函數(shù)進(jìn)行分析結(jié)果,如圖10~圖12所示。
圖10 診斷準(zhǔn)確率隨OS-ELM 網(wǎng)絡(luò)神經(jīng)元數(shù)量的變化Fig.10 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network
圖11 診斷準(zhǔn)確率隨OS-ELM 網(wǎng)絡(luò)神經(jīng)元數(shù)量的變化Fig.11 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network
圖12 診斷準(zhǔn)確率隨OS-ELM 網(wǎng)絡(luò)神經(jīng)元數(shù)量的變化Fig.12 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network
從圖10~圖12可知,在不同故障樣本比例下,四種激活函數(shù)的診斷準(zhǔn)確率隨著OS-ELM網(wǎng)絡(luò)神經(jīng)元數(shù)量的增加呈現(xiàn)出先增大后減小的趨勢(shì)。其中,當(dāng)樣本比例大于1,且神經(jīng)元數(shù)量較少時(shí),隱含層激活函數(shù)選取rb(f)或sig()函數(shù),診斷準(zhǔn)確率較高;當(dāng)神經(jīng)元數(shù)量較多時(shí),選取hardlim()函數(shù)較好。
經(jīng)過飛機(jī)起落架收放系統(tǒng)仿真數(shù)據(jù)分析,OS-ELM網(wǎng)絡(luò)各參數(shù)設(shè)置為:N0:BLOCK=4:1,nHiddenNeurons=80,ActivationFunc‐tion=’rbf’。
3.3.2 故障診斷結(jié)果分析對(duì)比
為驗(yàn)證OS-ELM 故障診斷方法的穩(wěn)定有效性,選取PNN、ELM、C4.5三種分類模型進(jìn)行對(duì)比,均采用VPNRS-RF約簡(jiǎn)后的數(shù)據(jù)作為模型輸入結(jié)果,如表3所示。
表3 不同模型的故障識(shí)別對(duì)比Tab.3 Comparison of Fault Identification of Different Models
從表3可以看出,OSELM模型的識(shí)別準(zhǔn)確率最高且OS-ELM明顯優(yōu)于ELM、PNN、C4.5模型,說明了OSELM模型具有較好的精度和泛化能力。因此VPNRS-RF-OSELM 模型在飛機(jī)液壓系統(tǒng)故障診斷中可達(dá)到理想的效果。
這里采用VPNRS-RF-OSELM故障診斷模型,利用變精度鄰域和模糊熵分別對(duì)原始特征集合進(jìn)行屬性約簡(jiǎn),然后用RF對(duì)約簡(jiǎn)后的特征進(jìn)行重要度排序,選擇最優(yōu)的特征個(gè)數(shù),最后利用OS-ELM算法構(gòu)建飛機(jī)液壓系統(tǒng)故障檢測(cè)模型。所采用的特征選擇算法相比WMNRS、GA、PCA等特征選擇算法精確度更高,因此,在模型對(duì)飛機(jī)液壓系統(tǒng)故障診斷時(shí),應(yīng)用VPNRS-RF特征選擇的OS-ELM模型相比于其他特征選擇算法和分類模型在分類精確度上具有一定優(yōu)勢(shì)。