侯曉東,楊江平,常春賀,孫知建,郭 健
(1.中國人民解放軍94969部隊,上海 200137;2.空軍預警學院, 武漢 430019)
T/R組件(發(fā)射/接收組件,T/R Module)是大型相控陣雷達天線陣面的重要組成部分,是大型相控陣雷達的核心部件。T/R組件由高功率放大器、移相器、限幅器、收發(fā)轉換開關和低噪聲放大器等器件組成,主要完成發(fā)射功率放大、收發(fā)隔離和接收低噪聲放大等功能,具有集成度高、設備量大、可靠性高的特點[1-2]。T/R組件剩余壽命預測能夠指導裝備維修保障人員及時掌握裝備的健康狀態(tài),對部隊提高裝備戰(zhàn)備完好率和縮短維修保障時間具有重要的實際意義[3]。
裝備的剩余壽命預測一直是故障預測與健康管理(Prognostics and System Health Management,PHM)的熱點和難點問題。裝備的剩余壽命是指裝備失效前能夠保證持續(xù)正常運行的能力,即距離失效發(fā)生的大概時間[4]。為了合理有效預測裝備的剩余壽命,Wang[5]提出了相似性剩余壽命預測方法,該方法的思想是若兩個樣本在某段時間內的表現相似,則這兩個樣本在該段時間內的剩余壽命也相似。孟光[6]和張仕新[7]分別對設備壽命預測方法進行了全面論述,分析和總結了基于相似性的剩余壽命預測方法。尤明懿[8-10]提出了一種能同時利用失效歷史數據和未失效數據的拓展的相似性剩余壽命預測方法,并對其魯棒性和不確定性進行了研究,提高了相似性壽命預測的應用范圍。文獻[11-12]分別對相似性及其改進方法的應用進行了研究。
以上方法是針對簡單機械設備(如軸承、齒輪和基礎元部件)的剩余壽命預測,由于其失效機制已得到比較充分的認知,可以根據實際經驗和對失效的理解采用,單退化變量下的相似性壽命預測方法,具有較好的預測效果。對于具有多種失效機制和故障模式的T/R組件而言,因結構復雜,性能退化或失效均為多種因素共同作用的結果,不同的狀態(tài)監(jiān)測指標包含了反映不同故障模式的信息,單個狀態(tài)退化變量難以準確反映狀態(tài)退化過程,造成了最終的剩余壽命預測結果與實際剩余壽命存在較大的誤差。如T/R組件發(fā)射通道中輸出功率下降,可能出現的一種情況是較低的輸入功率也會使輸出功率下降,然而并不是T/R組件本身出現故障,必須在輸出功率下降基礎上,結合發(fā)射增益的變化來判斷輸出功率的下降是輸入功率低造成的結果還是組件發(fā)生故障造成的結果,這種情況下如果只選擇發(fā)射通道的輸出功率進行剩余壽命預測,將會得到錯誤的預測結果,依據錯誤的預測結果制定的維修保障方法,不僅錯過了最佳的有效維修時間,而且對于裝備的性能有著重要的影響,因此對于具有多故障模式的T/R組件而言,需要深入分析性能退化過程,提取如實反映該過程的所有性能參數,然后據此采用合適的剩余壽命預測方法進行預測。
為了及時準確掌握T/R組件的健康狀態(tài),本文提出了兩種基于相似性的剩余壽命預測方案。首先,通過分析T/R組件的故障機理和故障特點,采用基于關聯規(guī)則的提取方法提取了準確反映T/R組件性能狀態(tài)退化過程的狀態(tài)監(jiān)測指標。然后,在提取到的狀態(tài)退化指標的基礎上,根據基于相似性的剩余壽命預測的對象的不同,提出了先融合后預測的方案A和先預測后融合的方案B,并對兩種方案的具體預測過程進行了研究。最后,通過實例對兩種方案進行了比較,結果表明了先預測后融合的方案B具有更高的預測精度。
開展基于相似性的剩余壽命預測的研究,首先需要確定出能夠反映裝備性能退化過程的狀態(tài)退化指標。在實際應用中,由于性能退化過程是隨機的,獲取到的某些性能退化特征信息存在測量誤差和對性能退化過程敏感性不高,不能很好地反映裝備性能退化過程,直接影響了剩余壽命預測的精度。為了有效地預測裝備的剩余壽命,減少原始數據的冗余信息和相關誤差,需要對初始狀態(tài)監(jiān)測指標進行提取,以獲得反映裝備性能退化過程的有效成分。當前針對此類問題的研究較少,沒有提出統(tǒng)一的具有指導性的理論與方法。梁澤明[13]采用Spearman系數計算出每個參數的趨勢,依據對裝備退化過程敏感參數具有單調的退化趨勢選擇用于壽命預測的關鍵參數。谷夢瑤[14]利用累積貢獻率對退化變量進行約簡。
在大型相控陣雷達裝備系統(tǒng)中,為了及時準確掌握裝備的健康狀態(tài),系統(tǒng)內部安裝了大量的機內測試設備(Build-In Test Equipment, BITE),實現了裝備功能檢查、故障診斷與隔離、性能指標測試等功能[15],經BITE得到的特征信息對裝備的故障與剩余壽命預測等提供了重要的特征數據。通過對T/R組件的故障進行分析,T/R組件主要有三種故障模式:發(fā)射通道故障、接收通道故障和發(fā)射、接收通道同時發(fā)生故障。不同的故障模式下不同監(jiān)測指標的變化趨勢是不同的,因此以上文獻采用的分析指標的單調退化趨勢的思路只局限于單故障模式的情況?;赥/R組件的多故障模式問題,需要從故障模式入手,分析不同故障模式下的不同監(jiān)測指標的特點,確定出能夠反映不同故障模式下狀態(tài)退化過程的狀態(tài)退化指標。
關聯規(guī)則是通過尋找同一個事件中出現的不同項之間的相關性,來確定此事件中頻繁發(fā)生的項或屬性的所有子集,以及它們之間的相互關聯性[16]。記D為事務數據庫,D={f1,f2,…,fn},其中,n為事務數據庫中子集數據的個數。子集事務為fi={x1,x2,…,xn},x稱為項。設D={x1,x2,…,xj}為D中所有項的集合,X的任何子集A稱為項集,|A|=k稱A為k項集。在事務數據庫D中,包含某特定項集A的事務個數稱為A的支持度計數,記為σ(A)。假設項集A?D,B?D,且A∩B=?,則定義關聯式A→B為關聯規(guī)則。A和B分別成為關聯規(guī)則A→B的前提和結論。以T/R組件為例,若A為初始狀態(tài)監(jiān)測指標,B為T/R組件發(fā)生的故障模式,則關聯規(guī)則A→B表示初始狀態(tài)監(jiān)測指標與相應的故障模式之間的關聯程度。
在關聯規(guī)則中通過支持度和置信度這兩個指標來衡量其有效性和可信性。支持度表示當T/R組件發(fā)生某種故障時,相關狀態(tài)監(jiān)測指標超出警示值的概率,即在事務D中出現A∪B的概率,如果在某種故障模式下某一狀態(tài)監(jiān)測指標的支持度接近于1,說明該指標與該故障的緊密程度越大,該監(jiān)測指標的有效性就越大。支持度表示為:
(1)
置信度用來表示該關聯規(guī)則的可信程度,即度量發(fā)生的故障模式與狀態(tài)監(jiān)測指標間的相關關系。在事務D中,出現A的同時出現B的概率,記為P(B|A),當某個監(jiān)測指標超出警示值時,發(fā)生相應故障的概率和置信度越高,則監(jiān)測指標對相應故障的依賴性、可靠度也越高。置信度表示為:
(2)
根據上面的定義,可以得到量化監(jiān)測指標和故障模式之間的關系:
1) 事務數據庫Di={第i個故障發(fā)生};
2) 子集Aij={第i個故障模式下第j個指標超出預警值};
3) 子集Bi={第i類故障發(fā)生}。
通過式(1)和(2)可得,規(guī)則Aij→Bi的支持度和置信度分別為:
(3)
(4)
由于不同的狀態(tài)監(jiān)測指標反映了T/R組件不同的故障類型和程度,即某個狀態(tài)監(jiān)測指標對應某種故障類型,某些指標對應多種故障類型。而當支持度和置信度都達到一定閾值時,可認為T/R組件的故障狀態(tài)和狀態(tài)監(jiān)測指標存在著一定的關系。結合上面的分析,通過計算故障狀態(tài)和狀態(tài)監(jiān)測指標之間的支持度和置信度,篩選出反應T/R組件狀態(tài)退化過程的狀態(tài)退化指標,需要滿足最小閾值,即:
(5)
熵最先由香農引入信息論,目前已在工程技術、社會經濟等領域得到了非常廣泛的應用。熵權法是一種客觀賦權方法,在具體使用過程中,熵權法根據各指標的變異程度,利用信息熵計算出各指標的熵權,再通過熵權對各指標的權重進行修正,從而得出較為客觀的指標權重[17]。一般來說,若某個指標的信息熵越小,表明指標值的變異程度越大,提供的信息量越多,在綜合評價中所能起到的作用也越大,其權重也就越大。
根據信息論中信息熵的定義,一組數據的信息熵為:
(6)
根據信息熵的定義公式(6),計算得到k個狀態(tài)退化指標的信息熵為E=(E1,E2,…,Ek),通過信息熵計算得到各個狀態(tài)退化指標的權重為:
(7)
開展多狀態(tài)退化指標下基于相似性的T/R組件剩余壽命預測,有以下兩套方案。
先融合后預測方案借鑒了信息融合的思路,信息融合是對多個傳感器或其他信息源的數據進行多級別、多方面、多層次的組合或者融合處理,以便得到更好的綜合估計[18]。在T/R組件的剩余壽命預測問題中,將多個狀態(tài)退化指標通過信息融合轉化為一個表征T/R組件健康狀態(tài)和退化程度的參數(HI)用于剩余壽命預測,該方案如圖1所示。
圖1 方案A示意圖
先預測后融合方案的思路是分別對每個狀態(tài)退化指標應用剩余壽命預測方法進行預測,將得到的每個指標對應的剩余壽命信息進行信息融合,從而得到裝備最終剩余壽命。剩余壽命信息指從單個狀態(tài)退化指標的角度,應用剩余壽命預測方法得到的裝備的一部分剩余壽命,這是不完整的,不能代表裝備實際剩余壽命。對于復雜的裝備系統(tǒng),其性能退化過程是非常復雜的,表現在多個狀態(tài)退化指標的變化上,因此,裝備的最終剩余壽命是綜合多個狀態(tài)退化指標對應的剩余壽命信息進行加權融合得到的。該方案如圖2所示。
圖2 方案B示意圖
從圖1和圖2可以看出,兩個方案是有明顯區(qū)別的,雖然整個過程中都存在信息融合,但是信息融合的對象和層次都是不同的,最終反映在T/R組件剩余壽命預測結果與實際剩余壽命的誤差大小。兩種方案的詳細比較如圖3所示。
圖3 兩種方案的比較框圖
由圖3可知,方案A的重點在于如何構造和提取HI的過程,即將多狀態(tài)退化指標融合為一維的HI,表1對常用的指標融合方法進行了梳理。
表1 指標融合方法
在此基礎上,文獻[25]提出了健康度的概念,系統(tǒng)健康度是衡量系統(tǒng)健康程度的一個量化指標,能夠從整體上更全面地反映系統(tǒng)的健康狀態(tài),并提出了多退化變量下基于實時健康度的相似性剩余壽命預測方法,該方法首先從狀態(tài)退化指標維度融合的角度,采用PCA法、馬氏距離和負向轉換函數等將多個狀態(tài)退化指標轉化為能夠反映機電設備退化狀態(tài)的定量指標—實時健康度,然后,采用單退化變量下的相似性剩余壽命預測方法來預測機電設備的剩余壽命,實例驗證的結果表明了采用健康度的融合思路具有顯著的優(yōu)越性。實時健康度的計算過程如圖4所示。
圖4 實時健康度的計算過程框圖
基于以上分析,確定出了方案A的預測路線,具體的預測路線如圖5所示。
圖5 方案A的預測路線框圖
本節(jié)主要對方案B的詳細預測過程進行設計?;谙嗨菩缘氖S鄩勖A測需要兩類樣本:服役樣本和參照樣本。
1) 服役樣本指在正在運行的T/R組件(即預測對象)上采集到的,應用關聯規(guī)則提取方法得到的狀態(tài)監(jiān)測指標的數據集合。
2) 參照樣本為在相同或相近運行條件下,在已失效的T/R組件上采集的同類指標的數據集合,參照樣本有多個,其整個壽命周期的信息都是已知的,包括整個退化過程中狀態(tài)退化指標的連續(xù)監(jiān)測記錄和失效時間。
記xoi(n·Δt)為服役樣本o第i個指標從開始運行以來的第n個采樣點,其中,n為自然數,Δt為狀態(tài)監(jiān)測采樣區(qū)間。記r為參照樣本的編號,第r個參照樣本第i個指標的第m個采樣點記為xri(m·Δt),其中,m為自然數。在相似性有效測度區(qū)間H=(h+1)·Δt中,服役樣本的和參照樣本分別可以表示為:
Xoi(k,h)=[xoi((k-h)·Δt),…,xoi(k·Δt)]
(8)
Xri(k′,h)=[xri((k′-h)·Δt),…,xri(k′·Δt)]
(9)
式中:h為非負整數;(k-h)和(k′-h)分別為服役樣本和參照樣本的起始狀態(tài)監(jiān)測點。服役樣本和參照樣本的第i個指標的采樣區(qū)間如圖6所示。
圖6 狀態(tài)監(jiān)測指標采樣區(qū)間示意圖
考慮各點相同權重的基于ED的第i個指標的服役樣本和參照樣本相似度計算方法為:
(10)
實際情況中,在系統(tǒng)衰退過程的非穩(wěn)態(tài)階段,系統(tǒng)狀態(tài)改變程度是非常快的,服役樣本最新的指標狀態(tài)監(jiān)測值對比之前的監(jiān)測值更能夠真實反映裝備系統(tǒng)的實際狀態(tài),在計算剩余有效壽命時應該賦予最新的指標狀態(tài)監(jiān)測值較高的權重[26]。在此引入權重因子α表達第i個狀態(tài)退化指標在不同狀態(tài)監(jiān)測點對剩余壽命預測的貢獻程度。考慮變權重的基于改進ED的服役樣本和參照樣本之間狀態(tài)監(jiān)測指標i的相似度為:
(11)
式(11)中:α為引入的權重因子,α∈[0,1);g為實數,且0≤g≤h。當α=0時,式(11)即為傳統(tǒng)ED的形式,即式(10),當g的值在逐漸增加的過程中(采樣點越靠近起始狀態(tài)監(jiān)測點),(1-α)g的值在逐漸減小,實現了越新的信息應該具有更高的權重。
基于公式(11),對同一個參照樣本,在時刻t=k·Δt,第i個指標的相似性為:
(12)
式(12)中:Mr為參照樣本r失效或故障狀態(tài)監(jiān)測點。
假設參照樣本有R個,其中r∈R,定義相似樣本為參照樣本的第i個指標對應相似性Soi?ri(k)滿足下式的參照樣本。
(13)
式(13)中:λ為引入的約束因子,λ∈[0,1],其大小決定了相似樣本的數量,直接對預測結果的精度產生影響。在此取λ=0.5,符合式(13)的參照樣本即為相似樣本,同時得到了相似樣本在參照樣本R中的編號r和相似樣本的數量n。
rulri(k′)=(Mr-Nri(k′))·Δt
(14)
式(14)中,h≤k′≤Mr;Mr·Δt是參照樣本r的有效壽命。
由此可得服役樣本的剩余壽命信息為:
(15)
式(15)中:r為式(13)計算得到的相似樣本編號;n為相似樣本的個數。
由此可得裝備系統(tǒng)實際剩余壽命為:
(16)
式(16)中:i為得到的狀態(tài)退化指標的個數;Wi為相似樣本經式(7)得到的每個指標對應的權重。
在此定義預測精度指標:平均預測誤差(Average Prediction Error,APE)來評估基于相似性的剩余壽命預測方法的合理性,即某個狀態(tài)監(jiān)測點預測值與實際值之間的平均絕對差值。
(17)
式(17)中:PRLi(k)為檢驗樣本i在監(jiān)測點k的剩余壽命預測值;ARLi(k)為檢驗樣本i在監(jiān)測點k的實際剩余壽命;r為檢驗樣本的個數。通過式(17)可以看出,APE(k)的值越小,說明預測值與實際值越接近,對應的預測方法的精度就越高。
定義預測精度指標:總體預測誤差(Overall Prediction Error,OPE)來評估預測方法的總體表現程度。即整個預測區(qū)間范圍內的預測值與實際值的平均絕對差值。
(18)
式(18)中,Mi為檢驗樣本i的失效時間點。
由式(18)可知,OPE的值越小,說明該預測方法的總體預測精度就越高。
通過式(11)可以看出,權重因子α的取值對剩余壽命預測結果有著直接的影響。為了得到較高的預測精度,可以通過預測誤差來優(yōu)化權重因子α的值。采用交叉驗證法(Cross Validation,CV)的思想進行驗證。通過對α賦予不同的值,根據式(18)計算OPE,滿足OPE最小時α的值即為最終確定出的權重因子(同理λ的值通過OPE來確定)。即:
(19)
方案B的具體計算步驟如下:
步驟1 確定出時間范圍H。即參與相似性計算的狀態(tài)監(jiān)測點H=[(k-h)·Δt,k·Δt]=(h+1)·Δt,一般根據實際情況進行確定。
步驟2 狀態(tài)退化指標的提取。對T/R組件狀態(tài)監(jiān)測指標的多組數據序列通過式(3)~(5)進行狀態(tài)退化指標提取,得到如實反映裝備實際狀態(tài)退化過程的指標序列,并進行數據標準化處理,利用式(7)計算得到每個指標對應的權重。
步驟3 相似度計算。對狀態(tài)退化指標序列計算每一個指標對應的服役樣本和參照樣本的相似性程度s(k,k′,i,α),通過式(12)得第i個指標的相似性Soi?ri(k)。
步驟4 剩余壽命信息融合預測。已知第i個指標對應的參照系統(tǒng)r的剩余壽命rulri(k),利用式(14)確定出相似樣本的個數n和編號r,然后通過式(15)、式(16)得到最終的裝備系統(tǒng)實際剩余壽命RULo(k)。
方案B的預測路線如圖7所示。
圖7 方案B的預測路線框圖
T/R組件是大型相控陣雷達天線陣面的重要組成部分,設備量占整機的80%以上,由于數量龐大、故障率高,BITE覆蓋率達到了100%。選擇雷達裝備BITE和現場測試設備能夠直接獲取的主要指標數據,來驗證本文所提出的狀態(tài)退化指標提取方法的有效性。
根據部隊實際情況,每天雷達裝備在開機前,裝備維修保障人員會對所有T/R組件進行測試,判斷其健康狀態(tài),當故障單元達到一定數量時要及時維修或更換,使裝備能夠時刻保持良好的狀態(tài),以滿足任務的需求。為衡量T/R組件的性能,需全面測試T/R組件的性能與狀態(tài)監(jiān)測指標多達幾十種,在兼顧全面性和易得性基礎上,從不同側面反應T/R組件的狀態(tài)退化信息,本文選擇的狀態(tài)監(jiān)測指標如表2所示。
表2 T/R組件狀態(tài)監(jiān)測指標
已知大型相控陣雷達天線陣面T/R組件的主要故障機理為自激和晶體管失效或老化,經BITE統(tǒng)計得到的故障模式有3種,如表3所示。
表3 T/R組件的故障模式
根據2015年更換故障T/R組件的數據得知,2015年全年共更換故障T/R組件413個,三種故障模式的T/R組件分別有302、69和42個,結合表2對這些故障樣本進行分析統(tǒng)計,得到T/R組件的故障狀態(tài)統(tǒng)計數據如表4所示。
在表4基礎上,根據式(3)、式(4),分別計算不同故障模式下每個狀態(tài)監(jiān)測指標的支持度和置信度,設置其最小閾值為:Support≥70%,Confidence≥50%,從而提取出T/R組件狀態(tài)退化指標,如表5所示。
表4 T/R組件故障統(tǒng)計數據
表5 T/R組件狀態(tài)退化指標
根據表5的結果可以看出:發(fā)射通道的狀態(tài)退化指標主要有輸出功率、發(fā)射增益和雜散,接收通道的狀態(tài)退化指標主要有噪聲系數和接收增益。結合前文的分析,選出來的這些指標與實際情況相符,涵蓋了T/R組件的所有通道,并且能夠全面刻畫不同故障模式的狀態(tài)退化過程,可以作為剩余壽命預測的狀態(tài)退化指標進行預測。
已知大型相控陣雷達平均每天運行時間為12 h,平均每天發(fā)生故障的T/R組件數為0.849個,故障T/R組件的半年累積數量平均為206個[30]。在相似性有效測度區(qū)間H=(h+1)·Δt中,選擇h=5,Δt=5 min,即選擇時間長度為H=30 min內的6組狀態(tài)監(jiān)測指標采樣數據,在所有的故障樣本中隨機選擇10個樣本作為檢驗樣本,分別使每一個檢驗樣本作為服役樣本,剩余9個樣本作為參照樣本對本文方法的有效性與實用性進行驗證。
分別根據方案A和方案B對10組檢驗樣本的剩余壽命進行預測,得到了剩余壽命預測結果(在此取α=0.3,后文有具體分析)。同時給出了實際剩余壽命作為參照和常規(guī)剩余壽命預測方法(參考文獻[14]的方法)的結果進行對比,如圖8所示。
圖8 預測結果曲線
通過圖8的對比可以看出,方案A和方案B都可以實現對T/R組件的剩余壽命預測,而方案B與實際剩余壽命更加接近。為了使結果更具有說服力,同時給出了方案A和方案B與常規(guī)方法的平均預測誤差(APE)如圖9所示。表6表示了總體預測誤差(OPE)。
圖9 APE曲線
表6 三種方案的OPE值
圖9和表6顯示了方案B確實具有更高的預測精度。從理論角度,方案B與實際剩余壽命能夠更加接近,圖9和表6從數據的角度證實了方案B具有更高的預測精度。
式(11)中引入的權重因子α表達了第i個狀態(tài)退化指標不同監(jiān)測點對預測結果的貢獻程度,直接對預測結果的精度產生影響。通過對α賦予不同的值,得到總體預測誤差(OPE)如圖10所示。
圖10 α與OPE的關系曲線
由圖10可知,當α=0.3時,總體預測誤差(OPE)值最小為0.516,所以取α=0.3,可以得到更精確的剩余壽命預測結果。
綜上所述,基于方案B的T/R組件剩余壽命預測方法在實現T/R組件剩余壽命預測的同時,改善了方案A中一維狀態(tài)退化指標融合過程中的信息丟失問題,且通過實例驗證了方案B具有更高的預測精度,對部隊裝備的維修保障具有重要的意義。方案A在具有單一故障模式的裝備中具有較好的應用效果,計算過程簡單、預測效率高。而對于具有多種故障模式的T/R組件而言,由于在不同故障模式下指標反映了裝備性能退化過程的差異性,如采用方案A將會導致一些剩余壽命預測信息的丟失,最終的預測精度不如方案B,因此對于具有多種故障模式的裝備而言,方案B具有更好的預測精度。
1) 在分析T/R組件故障機理和模式的基礎上,通過關聯規(guī)則方法提取了反映T/R組件性能狀態(tài)退化過程的狀態(tài)退化指標,并通過熵權法計算了狀態(tài)退化指標權重,為進行有效的剩余壽命預測提供了基礎。
2) 方案A將多個狀態(tài)退化指標融合為一維的健康參數(HI),采用單指標下的基于相似性的剩余壽命預測方法對T/R組件剩余壽命進行預測。方案B通過計算不同指標對應的相似性,結合相似樣本的剩余壽命,得到剩余壽命信息,通過融合多個指標對應的剩余壽命信息得到T/R組件的剩余壽命。
3) 算例仿真與分析對兩種方案進行了對比,結果表明了兩種方案都能夠解決T/R組件的剩余壽命預測問題,方案B具有較高的預測精度。