劉傳魯 李常亮 高伊萱 章雷 薛彬
(航天科工空間工程發(fā)展有限公司,北京 100854)
隨著衛(wèi)星硬件性能的提升,衛(wèi)星由在軌運(yùn)行的簡(jiǎn)單傳感器和數(shù)據(jù)發(fā)送接收器向集高精密電子計(jì)算機(jī)及自動(dòng)控制等多種先進(jìn)技術(shù)為一體的復(fù)雜航天器轉(zhuǎn)變,其系統(tǒng)內(nèi)載荷及平臺(tái)內(nèi)連接部件之間互相關(guān)聯(lián)且緊密耦合,致使現(xiàn)在的工作狀況異常特征往往具有微弱性、非線性、不確定性以及因果關(guān)系復(fù)雜等特點(diǎn)[1]。因此,當(dāng)衛(wèi)星上設(shè)備工作狀況出現(xiàn)異常后,如何及時(shí)發(fā)現(xiàn)、定位以及處置,對(duì)提升在軌衛(wèi)星生存能力和保障其使用壽命具有重要意義。
采用人工監(jiān)測(cè)的方式對(duì)衛(wèi)星系統(tǒng)運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),存在判讀反應(yīng)慢和受主觀因素影響的問(wèn)題,面對(duì)已經(jīng)產(chǎn)生異常運(yùn)行數(shù)據(jù)的衛(wèi)星或者即將進(jìn)入異常運(yùn)行狀態(tài)的衛(wèi)星,受制于星地測(cè)控鏈路等因素,往往難以采取實(shí)時(shí)檢測(cè)與處置措施,這對(duì)于衛(wèi)星系統(tǒng)的安全性存在一定隱患。數(shù)字化技術(shù)的發(fā)展對(duì)衛(wèi)星多種工作狀況監(jiān)測(cè)范圍變廣,產(chǎn)生的健康管理數(shù)據(jù)急劇增加,促進(jìn)了以大數(shù)據(jù)為背景的智能判讀發(fā)展,并逐漸成為故障診斷研究的主流[2]?;跀?shù)據(jù)驅(qū)動(dòng)的判讀模型從衛(wèi)星運(yùn)行過(guò)程中積累的大量數(shù)據(jù)中訓(xùn)練系統(tǒng)健康狀態(tài)模型和判據(jù),在很大程度上擺脫對(duì)人工特征設(shè)計(jì)與工程診斷經(jīng)驗(yàn)的依賴,提升了監(jiān)視發(fā)現(xiàn)異常問(wèn)題并預(yù)判潛在風(fēng)險(xiǎn)的能力。當(dāng)前傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)的判讀方法分為無(wú)監(jiān)督的聚類方法和有監(jiān)督的分類方法。采用聚類方法的判讀包含了通過(guò)分析擬合數(shù)據(jù)與異常數(shù)據(jù),設(shè)計(jì)兩者之間的差異,建立航天器故障診斷模型[3]。通過(guò)生成健康狀態(tài)知識(shí)庫(kù),與健康狀態(tài)的差異大小來(lái)定量描述衛(wèi)星的健康狀態(tài),區(qū)分衛(wèi)星異常狀態(tài)的等級(jí)[4]。采用分類方法的判讀是通過(guò)有監(jiān)督的方式訓(xùn)練多分類模型對(duì)故障進(jìn)行診斷[5]。衛(wèi)星系統(tǒng)復(fù)雜性的快速增長(zhǎng)同樣給以數(shù)據(jù)驅(qū)動(dòng)的傳統(tǒng)智能診斷方法帶來(lái)了極大地挑戰(zhàn),主要表現(xiàn)在:①表征衛(wèi)星狀態(tài)的參數(shù)越來(lái)越多,復(fù)雜的衛(wèi)星參數(shù)間關(guān)系難量化且冗余參數(shù)多,關(guān)鍵參數(shù)難以確定;②現(xiàn)有智能判讀方法可以定性確定是否故障狀態(tài)卻難以定量判讀健康狀態(tài)。
本文研究了可量化衛(wèi)星網(wǎng)絡(luò)系統(tǒng)參數(shù)間關(guān)聯(lián)復(fù)雜關(guān)系的空間數(shù)據(jù)挖掘方法,衛(wèi)星健康狀態(tài)關(guān)鍵關(guān)聯(lián)參數(shù)提取方法和衛(wèi)星健康狀態(tài)定量判讀的方法。提出一種結(jié)合相關(guān)性聚類分析的數(shù)據(jù)處理機(jī)制和多分類器集成的健康狀態(tài)判讀模型。
數(shù)據(jù)提煉過(guò)程是在海量遙測(cè)管理數(shù)據(jù)中提煉出與故障關(guān)聯(lián)的關(guān)鍵信息,生成訓(xùn)練衛(wèi)星自主健康監(jiān)測(cè)判讀模型的知識(shí)庫(kù)。挖掘方法包含了相關(guān)性分析、關(guān)鍵關(guān)聯(lián)參數(shù)選擇和聚類分析3個(gè)部分。其中,相關(guān)性分析是識(shí)別海量健康管理數(shù)據(jù)中各參數(shù)之間的關(guān)聯(lián)關(guān)系,關(guān)聯(lián)的強(qiáng)弱以及強(qiáng)弱的分布情況,為故障的關(guān)鍵關(guān)聯(lián)參數(shù)提取提供依據(jù);關(guān)鍵關(guān)聯(lián)參數(shù)選擇是在高維遙測(cè)數(shù)據(jù)中篩選出與故障高度相關(guān)且彼此之間低冗余的參數(shù),其關(guān)鍵關(guān)聯(lián)參數(shù)也作為智能判讀模型的輸入,避免了高維冗余參數(shù)輸入模型造成的額外空間和時(shí)間開(kāi)銷(xiāo);聚類分析是對(duì)健康狀態(tài)關(guān)鍵關(guān)聯(lián)參數(shù)樣本劃分為不同的狀態(tài),為模型訓(xùn)練提供健康狀態(tài)樣本知識(shí)庫(kù),以此實(shí)現(xiàn)故障的定量判讀。
相關(guān)性分析方法采用最大信息系數(shù)(MIC)。MIC是建立在互信息上的方法,其核心思想是如果兩個(gè)變量之間存在某種關(guān)系,則可以在其散點(diǎn)圖中用網(wǎng)格劃分?jǐn)?shù)據(jù)點(diǎn)來(lái)封裝這種關(guān)系[6]。在處理高維健康管理數(shù)據(jù)時(shí),相比于其他相關(guān)性度量方法如皮爾森(Pearson)相關(guān)系數(shù)[7],斯皮爾曼(Spearman)相關(guān)系數(shù)[8],距離相關(guān)系數(shù)(Dcor)[9-10],MIC最重要的優(yōu)勢(shì)是兼具通用性和均勻性,不僅可以檢測(cè)出各種類型的關(guān)系,線性和非線性,單調(diào)和非單調(diào),甚至是非函數(shù)類型的廣泛關(guān)系,而且對(duì)于相同噪聲水平的不同函數(shù)關(guān)系,可以給出相近的評(píng)估值,受異常值的影響較少。
給定二元變量數(shù)據(jù)集D,以及在橫向劃分?jǐn)?shù)量為y與在縱向劃分?jǐn)?shù)量x滿足的上限條件xy
(1)
式中:B(n)是關(guān)于樣本量n的函數(shù)B(n)=nα,參數(shù)α的默認(rèn)值為0.6[6],max 表示取最大值函數(shù),M表示特征矩陣。
衛(wèi)星遙測(cè)數(shù)據(jù)的參數(shù)樣本為時(shí)間段t1~tn記錄的狀態(tài)值。如圖1所示,當(dāng)每個(gè)參數(shù)的樣本量相同,那么既可以衡量單個(gè)載荷內(nèi)部參數(shù)間的關(guān)聯(lián),也可以衡量載荷間參數(shù)的關(guān)聯(lián)。若考慮單個(gè)載荷A內(nèi)部參數(shù)間的關(guān)聯(lián),那么僅需要對(duì)載荷A的Ka個(gè)參數(shù)進(jìn)行兩兩組合,并按相關(guān)性強(qiáng)弱進(jìn)行排序選出強(qiáng)相關(guān)的參數(shù)。若考慮兩個(gè)載荷及以上參數(shù)間的關(guān)聯(lián),如圖1中兩個(gè)載荷A與載荷B,其參數(shù)的個(gè)數(shù)分別為Ka與Kb,那么需要對(duì)K=Ka+Kb個(gè)參數(shù)進(jìn)行兩兩組合,并量化參數(shù)之間的關(guān)系,其中識(shí)別過(guò)程如圖2所示。
圖2 強(qiáng)相關(guān)關(guān)系識(shí)別
高維遙測(cè)數(shù)據(jù)是指在遙測(cè)終端接收到的實(shí)時(shí)數(shù)據(jù),其維度高是典型特點(diǎn)。提取與故障高度相關(guān)且彼此間低冗余的參數(shù),要求故障特征具有維度少、表征故障信息量豐富、故障特征與故障模式存在明確的關(guān)聯(lián)關(guān)系。
本文對(duì)關(guān)鍵關(guān)聯(lián)參數(shù)的選擇分為3個(gè)階段(見(jiàn)圖3),其中第一階段是通過(guò)分析特征本身特性對(duì)海量特征數(shù)據(jù)進(jìn)行預(yù)篩選,降低后續(xù)兩個(gè)階段的計(jì)算量;第二階段與第三階段是基于最大信息系數(shù)MIC篩選高相關(guān)低冗余特征,第二階段是度量特征與類別間的相關(guān)性,應(yīng)用特征排序方法獲得與不同特征與類別之間的強(qiáng)弱關(guān)系;第三階段是冗余性分析階段[11],綜合考慮特征與類別間的強(qiáng)弱關(guān)系以及特征間的冗余性進(jìn)行特征選擇。
注:M、K為特征數(shù)。
健康管理數(shù)據(jù)特征維數(shù)高,其中有些特征值對(duì)于整體判讀影響極小,且增加判讀模型的復(fù)雜性。由于這一部分特征數(shù)據(jù)表現(xiàn)特點(diǎn)就是值的變動(dòng)幅度小,為了降低時(shí)間成本,在進(jìn)行MIC的相關(guān)性特征選擇之前,采用計(jì)算簡(jiǎn)單快速的方差篩選方法,過(guò)濾掉與健康狀態(tài)相互關(guān)聯(lián)程度低的特征。
對(duì)于K-1個(gè)特征 (f1,f2,…,fK-1),計(jì)算每一個(gè)特征的方差,然后根據(jù)方差的大小進(jìn)行排序,并按比例刪除排名靠后的特征。
將進(jìn)行方差過(guò)濾之后的特征子集,首先進(jìn)行高相關(guān)特征的確定,在本文處理中,刪除與指定關(guān)鍵特征目標(biāo)變量Tv弱相關(guān)特征。分別計(jì)算選擇特征(FS)中特征和關(guān)鍵特征Tv之間的相關(guān)性,若大于給定的閾值,則將其保留。
刪除冗余特征基于近似馬爾科夫毯。對(duì)于給定的兩個(gè)特征變量fi、fj(i≠j)和目標(biāo)變量Tv,fi是fj的近似馬爾科夫毯當(dāng)且僅當(dāng)如下條件滿足FMIC(fi,Tv) >FMIC(fj,Tv)且FMIC(fj,Tv) 聚類分析是對(duì)健康狀態(tài)關(guān)鍵關(guān)聯(lián)參數(shù)樣本劃分為不同的狀態(tài),進(jìn)而對(duì)不同的工作狀態(tài)進(jìn)行區(qū)分識(shí)別,以此實(shí)現(xiàn)故障的定量判讀。基于密度聚類算法在處理空間數(shù)據(jù)具有快速、有效處理噪聲點(diǎn)和發(fā)現(xiàn)不同形狀簇的特點(diǎn)[12],本文采用密度聚類算法(DBSCAN)對(duì)表述衛(wèi)星運(yùn)行狀態(tài)的關(guān)鍵遙測(cè)參數(shù)數(shù)據(jù)進(jìn)行聚類。 DBSCAN包含2個(gè)參數(shù),即掃描半徑(Eps)和最小包含點(diǎn)數(shù)(MinPts)。Eps描述了某一樣本的鄰域距離閾值,MinPts描述了某一樣本距離為Eps的鄰域中樣本個(gè)數(shù)的閾值。 (1)任選一個(gè)未被訪問(wèn)(unvisited)的點(diǎn)p,找出與其距離在Eps之內(nèi)(包括Eps)的所有點(diǎn),若包含的點(diǎn)數(shù)不小于MinPts,則當(dāng)前點(diǎn)與其附近點(diǎn)形成一個(gè)新簇C,將其中的所有點(diǎn)加入候選集N,標(biāo)記p為已訪問(wèn)(visited); (2)對(duì)候選集N中所有未被訪問(wèn)(unvisited)的點(diǎn)q,檢查其鄰域,若包含的點(diǎn)數(shù)不小于MinPts,則將這些點(diǎn)加入N;如果q未歸入任何一個(gè)簇,則將q加入C; (3)重復(fù)步驟(2),繼續(xù)遍歷N中的剩余點(diǎn); (4)重復(fù)步驟(1)~(3),直到所有對(duì)象都?xì)w入了某個(gè)簇或標(biāo)記為離群點(diǎn)。 在聚類算法中,作為輸入的每一個(gè)衛(wèi)星運(yùn)行狀態(tài)的關(guān)鍵遙測(cè)參數(shù)樣本表示一個(gè)點(diǎn),不同類簇結(jié)果對(duì)應(yīng)了不同的實(shí)際工作狀態(tài)。通常情況下,衛(wèi)星運(yùn)行狀態(tài)可以分為正常、異常和故障。其中,正常狀態(tài)的數(shù)量最多,異常狀態(tài)的數(shù)量次之,故障狀態(tài)數(shù)量最少。在本文故障模式即表示為異常狀態(tài)和故障狀態(tài),不同狀態(tài)的差異通過(guò)聚類結(jié)果的不同簇集表現(xiàn)。正常運(yùn)行狀態(tài)的數(shù)據(jù)簇內(nèi)點(diǎn)數(shù)量多,異常運(yùn)行狀態(tài)和故障狀態(tài)數(shù)據(jù)的簇內(nèi)點(diǎn)數(shù)量少(在聚類結(jié)果上表現(xiàn)為離群點(diǎn))。正常狀態(tài)與異常和故障狀態(tài)在數(shù)據(jù)上表現(xiàn)出的簇間距差異是定量描述衛(wèi)星的健康狀態(tài),區(qū)分衛(wèi)星異常狀態(tài)的等級(jí)的理論依據(jù)。 判讀模型采用4種分類方法集成對(duì)健康狀態(tài)進(jìn)行綜合判讀,較單一模型具備更高魯棒性和預(yù)判的準(zhǔn)確性。模型的訓(xùn)練數(shù)據(jù)是經(jīng)過(guò)挖掘分析降維后的簡(jiǎn)化數(shù)據(jù),這保證軟件部署之后,軟件的數(shù)據(jù)輸入和計(jì)算的復(fù)雜性都大幅簡(jiǎn)化。 圖4所示為生成模型的檢測(cè)過(guò)程,其中關(guān)鍵關(guān)聯(lián)參數(shù)通過(guò)1.1節(jié)中最大信息系數(shù)和1.2節(jié)中關(guān)鍵表征參數(shù)選擇確定,關(guān)鍵關(guān)聯(lián)參數(shù)數(shù)據(jù)將作為模型的輸入。判讀模型集成了4種方法,分別為神經(jīng)網(wǎng)絡(luò)(NNs)[13],邏輯回歸(LR)[14],自適應(yīng)提升(AdaBoost)[15],K最鄰近法(KNN)[16]。每個(gè)方法都采用由1.3節(jié)DBSCN聚類的樣本數(shù)據(jù)單獨(dú)訓(xùn)練出一個(gè)最優(yōu)分類器,在工作判讀時(shí),每一個(gè)分類器都有一個(gè)結(jié)果,最后集成作為輸出。健康管理中的工作狀況定量分為4種,其中第1種狀態(tài)是故障,第2種狀態(tài)是異常,第3和第4種狀態(tài)是兩種健康工作狀態(tài)。在本文中的多個(gè)分類器的集成是結(jié)合投票機(jī)制和權(quán)重相結(jié)合的方式,4種分類器算法集成對(duì)4種健康狀態(tài)的判讀機(jī)制如下。 注:W為權(quán)重。 情形1:4個(gè)分類器的分類結(jié)果為同一個(gè)類別C1,那么判讀結(jié)果是類別C1; 情形2:4個(gè)分類器的判讀結(jié)果為兩個(gè)類別C1和C2,且其中3個(gè)分類器分類結(jié)果為C1,那么判讀結(jié)果是類別C1; 情形3:4個(gè)分類器的判讀結(jié)果為兩個(gè)類別C1和C2,且其中2個(gè)分類器分類結(jié)果為C1,2個(gè)分類器分類結(jié)果為C2,那么判讀結(jié)果是訓(xùn)練過(guò)程中分類準(zhǔn)確率最高的分類器分類結(jié)果; 情形4:4個(gè)分類器的判讀結(jié)果為3個(gè)類別C1,C2和C3,且其中2個(gè)分類器分類結(jié)果為C1,那么判讀結(jié)果為C1; 情形5:4個(gè)分類器的判讀結(jié)果為4個(gè)類別C1、C2、C3和C4,那么判讀結(jié)果是訓(xùn)練過(guò)程中分類準(zhǔn)確率最高的分類器分類結(jié)果。 為了對(duì)本文所提出的數(shù)據(jù)驅(qū)動(dòng)的衛(wèi)星健康狀態(tài)判讀模型進(jìn)行驗(yàn)證,采用某星的載荷遙測(cè)數(shù)據(jù)進(jìn)行驗(yàn)證。其中用于訓(xùn)練的數(shù)據(jù)集有486個(gè)樣本,測(cè)試數(shù)據(jù)集有1142個(gè)樣本,樣本特征個(gè)數(shù)為146個(gè)。在這里樣本特征即是遙測(cè)參數(shù),代表了統(tǒng)計(jì)中的隨機(jī)變量。 首先對(duì)載荷遙測(cè)數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集進(jìn)行相關(guān)性分析,篩選健康狀態(tài)的關(guān)鍵關(guān)聯(lián)參數(shù)。采用MIC方法對(duì)146個(gè)特征的兩兩組合進(jìn)行度量,相關(guān)性分布結(jié)果如圖5所示,其中相關(guān)性主要集中在3個(gè)大部分:第1部分是強(qiáng)相關(guān)性的,相關(guān)性的值在0.8到1之間;第2部分的相關(guān)值是中等相關(guān),值在0.4到0.6之間;第3部分是弱相關(guān),值在0到0.1之間。 圖5 載荷任意變量組相關(guān)性 作為通信載荷,其內(nèi)部必然存在強(qiáng)相關(guān)的參數(shù)關(guān)系。從圖5中的強(qiáng)相關(guān)參數(shù)的數(shù)量,也驗(yàn)證了這種預(yù)計(jì)的設(shè)想,通過(guò)對(duì)相關(guān)性的值為1的關(guān)系進(jìn)行散點(diǎn)圖觀測(cè),其中的關(guān)系主要呈現(xiàn)一種線性相關(guān),側(cè)面反映出這些特征之間存在明顯的冗余,這種冗余在實(shí)際判讀體現(xiàn)在以隨機(jī)變量T表示故障變量,隨機(jī)變量X與T相關(guān),隨機(jī)變量Y也與T相關(guān),X和Y表示與故障相關(guān)的兩個(gè)變量[17]。若X與Y也相關(guān),那么這兩個(gè)變量是相互冗余的,在高維數(shù)據(jù)中存在的類似大量相互冗余的參數(shù)即為高維冗余參數(shù)。 在本文以饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)作為一個(gè)降維關(guān)鍵指標(biāo)參數(shù),相關(guān)性參數(shù)閾值設(shè)置為0.7,從146個(gè)特征中篩選出7個(gè)關(guān)鍵關(guān)聯(lián)參數(shù),關(guān)鍵關(guān)聯(lián)參數(shù)即與饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)強(qiáng)相關(guān),而彼此之間相關(guān)性又極弱。7個(gè)與故障相關(guān)的參數(shù)分別為:T7檢波2;饋線鏈路發(fā)射機(jī)A機(jī)電壓模擬;T7檢波7;接收+6V主份電壓狀態(tài)量;饋線鏈路開(kāi)關(guān)加電;接收-6V主份電壓狀態(tài)量;饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)。 以饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)作為工作狀態(tài)主要參考指標(biāo),其余6個(gè)參數(shù)特征都與其存在明顯關(guān)聯(lián)關(guān)系,6個(gè)參數(shù)特征之間彼此弱相關(guān),表示出6個(gè)參數(shù)是非冗余特征。7個(gè)關(guān)鍵關(guān)聯(lián)參數(shù)表示衛(wèi)星載荷是否出現(xiàn)在軌故障的情況。例如,對(duì)于正常工作狀態(tài)的數(shù)據(jù),饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)值為0的情況下,T7檢波2與T7檢波7顯示值應(yīng)為0;倘若饋線鏈路發(fā)射機(jī)輸出功率監(jiān)測(cè)值為0,T7檢波2與T7檢波7兩個(gè)參數(shù)中任何一個(gè)參數(shù)顯示值為非0,那么就是異常的數(shù)據(jù)。 部署在衛(wèi)星上的判讀模型越簡(jiǎn)單,那么對(duì)星上的計(jì)算資源和內(nèi)存資源占用越少。判讀模型中的超參數(shù)設(shè)置決定了其計(jì)算的復(fù)雜性,為了選擇合適的超參數(shù)配置簡(jiǎn)化判讀模型,在本節(jié)采用窮舉遍歷的方式來(lái)確定模型超參數(shù)。超參數(shù)作為一個(gè)未知常量,KNN超參數(shù)為近鄰個(gè)數(shù),AdaBoost超參數(shù)為基分類器的個(gè)數(shù),NNs超參數(shù)為神經(jīng)網(wǎng)絡(luò)的層數(shù)和節(jié)點(diǎn)個(gè)數(shù)。在這里對(duì)KNN的超參數(shù)近鄰個(gè)數(shù),AdaBoost的超參數(shù)基分類器個(gè)數(shù)都在2至20之間進(jìn)行遍歷。NNs的超參數(shù)層數(shù)和節(jié)點(diǎn)個(gè)數(shù)分別在2至30之間遍歷。其中超參數(shù)結(jié)果如圖6所示。 圖6 分類器的參數(shù)選擇 根據(jù)圖6(a)與圖6(b)所示,其中KNN方法隨著近鄰個(gè)數(shù)增加,準(zhǔn)確率沒(méi)有改變;AdaBoost超參數(shù)基分類器個(gè)數(shù)隨著基分類器個(gè)數(shù)的增加,準(zhǔn)確率也沒(méi)有改變;NNs的超參數(shù)層數(shù)和節(jié)點(diǎn)個(gè)數(shù)分別在2至30之間遍歷,其中參數(shù)結(jié)果如圖6(c)所示。當(dāng)層數(shù)為3,每一層神經(jīng)元個(gè)數(shù)為6時(shí),準(zhǔn)確率已經(jīng)達(dá)到最大值。因此,KNN方法近鄰個(gè)數(shù)選擇2,AdaBoost超參數(shù)基分類器個(gè)數(shù)選擇2,NNs的層數(shù)選擇為3層。 為了模擬生成的判讀模型部署在星上的性能,在ZYNQ7045ARM嵌入式開(kāi)發(fā)平臺(tái)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)測(cè)試數(shù)據(jù)集為不同時(shí)間產(chǎn)生的1142個(gè)樣本,經(jīng)過(guò)相關(guān)性降維和聚類后數(shù)據(jù)維度為7,每一個(gè)維度即是一個(gè)參數(shù),每一個(gè)樣本表示某個(gè)功能模塊當(dāng)前的一個(gè)工作狀態(tài),涵蓋了故障,異常和正常的工作狀態(tài)。首先對(duì)4種單獨(dú)方法NNs,邏輯回歸(LR),KNN,AdaBoost以及4種方法集成的方法集成(Ensemble)進(jìn)行準(zhǔn)確率的測(cè)試。 圖7所示為5種方法對(duì)測(cè)試數(shù)據(jù)健康狀態(tài)的預(yù)測(cè)結(jié)果。NNs、LR、KNN和AdaBoost中都存在將故障以及異常判讀錯(cuò)誤的情況,而Ensemble沒(méi)有將故障以及異常判讀失誤的情況。對(duì)于4種狀態(tài)的判讀,誤判出現(xiàn)最多的是在兩種正常狀態(tài)之間,其中標(biāo)簽為-1的狀態(tài)是故障,標(biāo)簽為0的狀態(tài)是異常,標(biāo)簽為1或2的狀態(tài)是健康。 圖7 5種方法對(duì)測(cè)試數(shù)據(jù)健康狀態(tài)的預(yù)測(cè) 表1為訓(xùn)練樣本與測(cè)試樣本中4個(gè)類別的準(zhǔn)確率,對(duì)于訓(xùn)練樣本中4個(gè)類別的判讀結(jié)果,NNs、KNN和集成分類器Ensemble的準(zhǔn)確率都是最高值1。Ensemble僅在第4個(gè)正常類別沒(méi)有達(dá)到1,其余均達(dá)到最大值。 表1 訓(xùn)練樣本與測(cè)試樣本4種類別的準(zhǔn)確率 表2為5種方法的虛警率(FAR)和漏警率(MAR)結(jié)果,其中FAR是誤報(bào)為故障的正常樣本數(shù)目與正常樣本總數(shù)目的比值。正常樣本是狀態(tài)1和2的兩種健康狀態(tài)樣本;MAR為誤報(bào)為正常的故障樣本數(shù)目與故障樣本總數(shù)目的比值。故障樣本是狀態(tài)-1和0的故障和異常狀態(tài)。 表2 5種方法的虛警率和漏警率 由表2可知,對(duì)于虛警率,5種方法在訓(xùn)練樣本上的值都是0,而在測(cè)試樣本上,僅LR和Ensemble的值為0。對(duì)于漏警率,5種方法在訓(xùn)練樣本上的值是0的方法是NNs、KNN和Ensemble,在測(cè)試樣本上,僅LR為大于0的值0.015,其余方法的值都為0。由虛警率和漏警率越低,模型的判讀效果越好。對(duì)于訓(xùn)練集和測(cè)試集,僅Ensemble模型的虛警率和漏警率都為0,可以得出集成模型的判讀結(jié)果最好。 此外,數(shù)據(jù)庫(kù)中每一組樣本都有正?;虍惓5臉?biāo)簽,集成模型對(duì)每一組樣本進(jìn)行判讀,若預(yù)測(cè)結(jié)果與標(biāo)簽一致,則判斷準(zhǔn)確,經(jīng)統(tǒng)計(jì)對(duì)每一組樣本平均判讀時(shí)間僅為15 ms,且準(zhǔn)確率達(dá)98%。由于每一組樣本可以看作某一個(gè)時(shí)間點(diǎn)衛(wèi)星載荷工作記錄的多個(gè)參數(shù)值,因此具備在星上有限的算力下,實(shí)現(xiàn)高效判讀的能力。 針對(duì)衛(wèi)星系統(tǒng)變得越來(lái)越復(fù)雜,其工作狀況的健康狀態(tài)也越來(lái)越難實(shí)時(shí)判讀的問(wèn)題,本文提出了一種數(shù)據(jù)驅(qū)動(dòng)的判讀模型,對(duì)衛(wèi)星工作狀況的健康狀態(tài)進(jìn)行實(shí)時(shí)定量判讀。模型包含了數(shù)據(jù)處理和訓(xùn)練判讀兩個(gè)部分,其中數(shù)據(jù)處理部分作用是對(duì)數(shù)據(jù)的簡(jiǎn)化,降低數(shù)據(jù)判讀難度,提高狀態(tài)判讀效率。首先是對(duì)特征進(jìn)行相關(guān)性分析并提取關(guān)鍵關(guān)聯(lián)參數(shù),然后對(duì)關(guān)鍵參數(shù)數(shù)據(jù)聚類分析,劃分出工作狀況的數(shù)據(jù),為多分類器提供訓(xùn)練知識(shí)庫(kù)。訓(xùn)練判讀部分是多分類集成,通過(guò)多個(gè)分類器的分類結(jié)果綜合判讀,以此來(lái)提升對(duì)健康狀態(tài)判讀的泛化能力。根據(jù)上述方法針對(duì)某衛(wèi)星載荷的遙測(cè)數(shù)據(jù)對(duì)該模型有效性進(jìn)行了驗(yàn)證,通過(guò)在載荷遙測(cè)訓(xùn)練數(shù)據(jù)中提煉出與故障關(guān)鍵關(guān)聯(lián)參數(shù)測(cè)試數(shù)據(jù)對(duì)智能判讀模型驗(yàn)證。模擬結(jié)果表明:該集成判讀模型具有較好的衛(wèi)星異常狀態(tài)識(shí)別能力,有望為未來(lái)在軌衛(wèi)星自主健康監(jiān)測(cè)技術(shù)提供一種新型手段。1.3 聚類分析
1.4 判讀模型生成
2 仿真結(jié)果與分析
2.1 相關(guān)性降維分析
2.2 模型超參數(shù)選擇
2.3 模型性能評(píng)估
3 結(jié)束語(yǔ)