李 良, 李 原, 黃家彬
(96921 部隊, 北京 100020)
由于日趨復雜的裝備功能集成和使用環(huán)境影響因素的增加, 其發(fā)生故障和功能失效的幾率逐漸增大,因此故障診斷和健康維護逐漸成為裝備正常運行的重要保障。 而當前傳統(tǒng)的基于專家知識、基于統(tǒng)計數(shù)據(jù)分析和基于模型的故障診斷方法難以適用功能日趨復雜的現(xiàn)代化裝備保障需求。 隨著人工智能、大數(shù)據(jù)技術迅速發(fā)展,應用相關的機器學習、總線控制、數(shù)據(jù)挖掘方法對裝備試驗和操作使用過程中產生的大量數(shù)據(jù)進行采集、分析,學習、挖掘“海量”數(shù)據(jù)中隱藏的知識,有效地認識和掌握裝備運行規(guī)律,并通過機器學習、智能搜索快速定位故障,這對現(xiàn)代化作戰(zhàn)背景下實現(xiàn)復雜裝備的故障檢測、故障定位、故障識別和健康預測具有特別重要的意義。
隨著現(xiàn)代裝備的復雜性、綜合化、智能化程度不斷提高,其研制、生產尤其是維護和保障的成本越來越高,基于復雜系統(tǒng)可靠性、安全性、經濟性考慮,以診斷和預測技術為核心的故障診斷、 預測和健康管理(Diagnosis,Prognostics and Health Management,DPHM)策略獲得越來越多的重視和應用。 研制、生產DPHM 是對復雜系統(tǒng)傳統(tǒng)使用的機內測試(build-in test,BIT)和狀態(tài)(健康)監(jiān)控能力的進一步擴展,它是從狀態(tài)監(jiān)控向健康管理的轉變,這種轉變引入了對系統(tǒng)未來可靠性的預測能力, 有效提高電氣系統(tǒng)安全性、完好性和任務成功性,從而以較少的維修投入, 實現(xiàn)基于狀態(tài)的維修或視情維修 (conditionbased maintenance,CBM)和自主式保障[1]。
故障診斷、預測及健康管理技術(PHM)起源于20 世紀90 年代末,綜合診斷系統(tǒng)向測試、監(jiān)控、診斷、預測和維修管理一體化方向發(fā)展, 并從最初側重考慮的電子系統(tǒng)擴展到電子、機械、結構、動力等各種主要分系統(tǒng)。 總的來說,PHM 系統(tǒng)是在需求牽引、技術推動下,并借助高技術裝備項目的研制契機而誕生的。 美軍20 世紀90 年代末引入民用領域的視情維修, 作為一項戰(zhàn)略性的裝備保障策略,其目的是對裝備狀態(tài)進行實時或近實時的監(jiān)控,根據(jù)電氣系統(tǒng)的實際狀態(tài)確定最佳維修時機。 隨著高速數(shù)據(jù)采集、大容量數(shù)據(jù)存儲、高速數(shù)據(jù)傳輸和處理、信息融合、MEMS 和網(wǎng)絡等信息技術和高新技術的迅速發(fā)展,意味著允許在裝備中完成更多的數(shù)據(jù)存儲和處理功能,以消除過多依賴地面站來處理信息的需求,為提高PHM能力創(chuàng)造了條件。近年來,PHM 技術受到各國軍方和工業(yè)界的廣泛關注, 各方都在積極采取各種方式加速這類軍民兩用技術的開發(fā)和利用。
在軍事領域, 美軍為F-35 JSF 開發(fā)的PHM 系統(tǒng)是最早、也是目前技術水平最高的應用,F(xiàn)-35 的PHM 系統(tǒng)代表了目前CBM 應用的最高水準。 同時,PHM 技術也已廣泛應用于英、美、加拿大等國研制的各類飛機系統(tǒng)中,稱作“健康與使用監(jiān)控系統(tǒng)(HUMS)”的集成應用平臺。美國各軍種及其他機構也開展了與PHM/HUMS 類似的技術發(fā)展項目, 如美國空軍研究實驗室提出的綜合系統(tǒng)健康管理(ISHM)系統(tǒng)方案:海軍的綜合狀態(tài)評估系統(tǒng)(ICAS)和預測增強診斷系統(tǒng)(PEDS)項目;陸軍的診斷改進計劃(ADIP)、嵌入式診斷和預測同步(EDAPS)計劃等。
目前國內在故障診斷、預測和健康管理方面,也開展了較為廣泛的研究工作。 研究需求和研究對象主要集中在航空、航天、船舶和兵器等復雜高技術裝備研究和應用領域。研究主體以高校和研究院所居多,雖然在一些設計中進行了積極的嘗試, 但是總體的應用研究規(guī)模和水平仍然不太成熟,各機構的研究能力和水平參差不齊,行業(yè)或技術領域專業(yè)研究組織薄弱。雖然近年來,也出現(xiàn)了一些基礎研究成果,但是由于缺乏良好的研究管理機制,研究體系分散,統(tǒng)一高效的協(xié)調機制欠缺,造成了理論和應用脫節(jié), 基礎研究缺乏背景支撐和實驗驗證等致命的缺陷??梢哉f,國內對于故障預測和健康管理技術的研究目前正處于研究探索階段, 尚未上升到設備視情維護所要求的剩余壽命預測階段。
在航空航天、 國防軍事以及工業(yè)各領域中應用的不同類型的PHM 系統(tǒng),其體現(xiàn)的基本思想是類似的,區(qū)別主要表現(xiàn)在不同領域其具體應用的技術和方法的不同。視情維修的開放體系結構 (open system architecture for condition-based maintenance,OSA-CBM ) 綜合了這些PHM 系統(tǒng)共同的設計思想以及應用技術和方法,可用于指導實際構建應用于機械、 電子和結構等領域的各種具體類型的PHM 系統(tǒng)。
在裝備電氣系統(tǒng)全壽命周期健康管理總體架構下,采用基于數(shù)據(jù)驅動和知識相結合的方法,對電氣系統(tǒng)全生命周期故障診斷和預測技術展開研究, 主要包括數(shù)據(jù)管理、特征提取、智能診斷與健康預測。 基于測試數(shù)據(jù)的裝備電氣系統(tǒng)智能故障診斷技術,可實現(xiàn)電氣系統(tǒng)測試數(shù)據(jù)的存儲和管理,利用數(shù)據(jù)挖掘、人工智能、機器學習等理論和方法實現(xiàn)對數(shù)據(jù)的特征提取, 通過智能搜索和定位技術實現(xiàn)快速、準確故障定位。故障診斷的實現(xiàn)方法包括基于規(guī)則推理的專家系統(tǒng)和智能推理方法等; 知識庫通過專家添加或離線模式挖掘獲??; 故障預測方法包括回歸分析、外推趨勢預測、智能預測方法[2-4]。
智能故障診斷技術研究方法包括故障特征提取方法、故障定位方法和故障預測方法。每一部分的實現(xiàn)需要通過算法構建模型來完成, 本論文提出了智能故障診斷系統(tǒng)實現(xiàn)的具體算法。
針對系統(tǒng)測試數(shù)據(jù)的特點, 故障特征提取擬采用的具體算法包括閾值分析、包絡分析、相似性分析。
3.1.1 閾值分析
閾值分析法,即給出實測數(shù)據(jù)的閾值范圍,若實測數(shù)據(jù)超過該閾值范圍, 判斷該組數(shù)據(jù)不正常閾值分析包括臨界值判別法和N%誤差閾值定制法。 臨界值判別法是在分析模擬量或數(shù)字量時, 根據(jù)歷史數(shù)據(jù)或經驗確定正常數(shù)據(jù)的上下臨界值,將實測數(shù)據(jù)與閾值進行比較,得到數(shù)據(jù)正常或不正常的結論。如判斷電壓、溫度值是否正常時,首先設定一個正常的閾值范圍,當電壓或溫度超過閾值時,則判斷為異常。
N%誤差閾值制定法以所測得數(shù)字量或模擬量在均值N%的誤差范圍內為正常狀態(tài),其中N 根據(jù)需求制定。
3.1.2 包絡分析
傳感數(shù)據(jù)的類型多樣,有的傳感數(shù)據(jù)呈波形分布,閾值并不是固定不變的,在不同的時刻,閾值不同。 因此其包絡線有一定的規(guī)律或趨向, 采用包絡線分析方法可以對作更詳細的分析。
如圖1 和圖2 所示,實線表示實測數(shù)據(jù),虛線表示對應準則,當實測數(shù)據(jù)在上下包絡線之內,表示數(shù)據(jù)正常,若超過包絡線,表示某時刻數(shù)據(jù)異常,此時提取異常數(shù)據(jù)信息(對應值)。
圖1 包絡線分析圖例1
圖2 包絡線分析圖例2
在包絡線分析法中,包絡線來源于準則庫,根據(jù)理論值設置,或根據(jù)歷史數(shù)據(jù)提取包絡線。
3.1.3 相似性分析
相似性度量意在量化分析給定數(shù)據(jù)之間的近似程度, 對于時間序列而言, 相似性度量主要衡量的是序列之間是否具有相似的趨勢和形態(tài)。 由于時間序列往往容易受到噪聲、 延遲和波動等因素的影響, 其數(shù)據(jù)在表現(xiàn)形式上往往呈現(xiàn)振幅不一致、平移和不連續(xù)等特點。 同時相似性度量在序列搜索、聚類等任務中有重要應用,因此如何設計和實現(xiàn)有效的相似性度量方法將極大影響時間序列上層應用分析的準確和有效性。對于系統(tǒng)健康管理系統(tǒng)中的故障特征提取, 同樣可以通過對時間序列的相似性分析來完成。
所提出的故障定位方法包含4 個主要步驟: 控制系統(tǒng)的故障樹模型的構建、故障編碼、神經網(wǎng)絡建模、以及測試評估,見圖3。
圖3 神經網(wǎng)絡故障定位流程
第一階段,根據(jù)系統(tǒng)結構、功能和行為方面知識的構建故障樹模型。 它是以某一故障事件為根節(jié)點,以該故障發(fā)生的前提條件為父節(jié)點、測點信息為子節(jié)點而建立的反映事件邏輯與或關系的倒樹狀結構圖。
第二階段,依據(jù)故障樹模型,對測點狀態(tài)信息和故障事件進行編碼。用0 和1 表示某個測點的狀態(tài)信息,表征是否出現(xiàn)異常值,異常為0,正常為1,所有測點測量值的狀態(tài)編碼組合成測試編碼。 對具體位置發(fā)生的故障事件用二進制編碼,作為故障編碼。從而建立控制系統(tǒng)的測試編碼和故障編碼。
第三階段,以測試編碼作為神經網(wǎng)絡的輸入,故障編碼作為神經網(wǎng)絡的輸出,基于大量歷史數(shù)據(jù),訓練神經網(wǎng)絡,建立特定的網(wǎng)絡模型。
第四階段,在建立的故障定位模型的基礎上,根據(jù)實時測點的狀態(tài)信息,進行故障定位。對模型輸出結果的準確性進行評估。
在基于人工智能和數(shù)據(jù)挖掘的控制系統(tǒng)診斷與預測方案下,具體實現(xiàn)控制系統(tǒng)的故障功能,有三種模式,即基于關鍵測試參數(shù)的故障預測、 基于主成分分析的故障預測和基于健康因子的故障預測。
3.3.1 基于關鍵測試參數(shù)的故障預測
基于關鍵測試參數(shù)的故障預測包括關鍵參數(shù)選擇、預測模型、診斷推理,最后得出故障預測結論。 該方法通過離線構建回歸預測模型(構建方法有神經網(wǎng)絡、LSTM、SVM 等),對關鍵狀態(tài)量進行預測,得到未來時間點的參數(shù)值,即控制系統(tǒng)的未來狀態(tài),在對未來狀態(tài)進行故障診斷,判讀是否發(fā)生故障。
關鍵測試參數(shù)選擇: 整個電氣控制系統(tǒng)測試數(shù)據(jù)量多,對每個參數(shù)進行預測會造成處理量大和冗余,因此從數(shù)據(jù)庫中選擇能表征未來變化狀態(tài)的關鍵測試參數(shù)。
預測模型:由于不同的參數(shù)分布特點和變化趨勢不同,因此預測時所采用的預測模型不同, 預測模型通過離線構建和訓練。 預測算法有神經網(wǎng)絡、SVM、LSTM、線性回歸等。
診斷推理:預測模型得到參數(shù)未來的值,表征電氣控制系統(tǒng)未來的狀態(tài),基于參數(shù)值進行故障診斷,包括異常檢測、針對推理。
預測結論: 診斷推理的結果可判斷系統(tǒng)未來是否發(fā)生故障。
3.3.2 基于主成分分析的故障預測
基于主成分分析的故障預測是在基于關鍵測試參數(shù)的故障預測基礎上加入主成分分析。 該方法不直接對測試參數(shù)進行預測,先對測試數(shù)據(jù)降維和特征提取,選擇主成分,提取出有效信息,降低冗余,減少運算量。在對提取出來的主成分進行分析和預測[5]。
3.3.3 基于健康因子的故障預測
基于健康因子的故障預測是構建能夠表征系統(tǒng)當前狀態(tài)的健康因子,即對當前狀態(tài)進行健康評估,再對健康因子進行預測和分析,得到系統(tǒng)未來的健康狀態(tài)。
本文分析了智能故障診斷的國內外發(fā)展現(xiàn)狀, 并結合國內外的一些研究成果給出了智能故障診斷系統(tǒng)的實現(xiàn)方案, 并結合實現(xiàn)方案給出了診斷和預測方案流程中每一部分功能實現(xiàn)擬采用的具體算法, 為智能故障診斷技術工程化設計提供參考和借鑒。