国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SVM-BP 集成學(xué)習(xí)的艦船蒸汽動力系統(tǒng)故障診斷

2023-05-04 14:01王瑞涵
艦船科學(xué)技術(shù) 2023年5期
關(guān)鍵詞:分類器故障診斷準(zhǔn)確率

鄭 鑫,陳 輝,管 聰,王瑞涵

(1.武漢理工大學(xué) 高性能船舶技術(shù)教育部重點試驗室,湖北 武漢 430063;2.武漢理工大學(xué) 船海與能源動力工程學(xué)院,湖北 武漢 430063)

0 引 言

蒸汽動力系統(tǒng)設(shè)備眾多、結(jié)構(gòu)復(fù)雜,設(shè)備運行參數(shù)之間耦合度高,關(guān)聯(lián)性強。傳統(tǒng)的艦船故障識別只能依靠船員的經(jīng)驗判斷,故障識別的及時性及準(zhǔn)確率很難得到保障,無法滿足實際要求[1]。因此,對于艦船蒸汽動力系統(tǒng)的智能化故障診斷意義重大。

隨著機器學(xué)習(xí)在工業(yè)領(lǐng)域的發(fā)展與應(yīng)用,艦船故障診斷領(lǐng)域的研究也大量開展。高建強等[2]提出多維BP 神經(jīng)網(wǎng)絡(luò)的方法用于鍋爐故障診斷,以鍋爐管路泄漏為例,進行故障仿真試驗,得出多維BP 神經(jīng)網(wǎng)絡(luò)能快速有效地對故障進行診斷與響應(yīng)。徐鵬等[3]提出采用附加動量-自適應(yīng)學(xué)習(xí)速率調(diào)整,運用“小網(wǎng)絡(luò)集群”的思路分別構(gòu)建網(wǎng)絡(luò)以進行故障識別和故障溯源的方法,并將提出的方法用于船舶動力系統(tǒng)給水泵轉(zhuǎn)速異常的相關(guān)故障診斷,最后得出優(yōu)化的算法明顯優(yōu)于普通的BP 神經(jīng)網(wǎng)絡(luò)。受數(shù)學(xué)原理的限制,單一分類器在解決工業(yè)領(lǐng)域故障診斷問題時表現(xiàn)一般,雖通過對算法的超參數(shù)尋優(yōu)得到最優(yōu)診斷模型,但不能使模型突破準(zhǔn)確率上限,最終的準(zhǔn)確率不高,且單一分類器的診斷結(jié)果存在偶然因素的影響。此外艦船設(shè)備不可能長期處于故障工況運行,因此面對艦船領(lǐng)域故障診斷時存在非均衡數(shù)據(jù)集的問題。在面對非均衡數(shù)據(jù)集時單一分類器的故障識別準(zhǔn)確率更低。

集成學(xué)習(xí)在艦船領(lǐng)域中的應(yīng)用較少,主要集中在其他工業(yè)領(lǐng)域。許玉格等[4]提出了一種基于Bagging 集成算法的故障診斷模型,利用虛擬少數(shù)過采樣算法(SMOTE)增加少數(shù)類樣本的數(shù)量,保證樣本分布的均衡性以及分類器間的多樣性,提高了故障的識別率。張展等[5]將包括K 近鄰算法、支持向量機算法、決策樹算法、隨機森林算法及邏輯斯諦回歸算法在內(nèi)的5 種子分類器,使用投票方法進行集成,將集成算法和單一算法進行比較分析。結(jié)果顯示,集成算法的故障診斷的準(zhǔn)確率有明顯的提升。傳統(tǒng)的集成算法并沒有考慮到非均衡數(shù)據(jù)集這一問題,導(dǎo)致出現(xiàn)少數(shù)類樣本學(xué)習(xí)力度不夠,最終模型的準(zhǔn)確率不高、誤分類等情況。通過算法改進,將非均衡數(shù)據(jù)集納入考慮,但是改進算法復(fù)雜,且診斷流程耗時過長。為此,本文提出將多個SVM 算法并行運行,利用BP 神經(jīng)網(wǎng)絡(luò)替代傳統(tǒng)集成算法對診斷結(jié)果融合,實現(xiàn)原始數(shù)據(jù)集的二次學(xué)習(xí),進行二次診斷,加強對非均衡數(shù)據(jù)集中少數(shù)類樣本的學(xué)習(xí)力度,最終提高了少數(shù)類樣本的召回率,還提升了模型的準(zhǔn)確率及穩(wěn)定性。

1 診斷模型

本文針對艦船蒸汽動力系統(tǒng)中鍋爐端燃油輔助系統(tǒng)的故障問題設(shè)計了故障診斷模型。故障數(shù)據(jù)來源于GenSystem 一體化仿真平臺開發(fā)的蒸汽動力系統(tǒng)操作平臺。該平臺仿真了某一艦船完整的動力系統(tǒng),具有模塊管理及數(shù)據(jù)管理等功能模塊,采用基于共享內(nèi)存的數(shù)據(jù)通信模式,仿真平臺構(gòu)成如圖1 所示。

圖1 GenSystem 模擬器仿真平臺Fig.1 GenSystem simulator emulation platform

故障診斷模型由三大部分構(gòu)成:1)原始數(shù)據(jù)預(yù)處理模塊,完成數(shù)據(jù)預(yù)處理工作;2)第一層故障診斷模塊,各分類器單獨診斷并輸出結(jié)果;3)第二層故障診斷模塊,完成數(shù)據(jù)融合并基于融合結(jié)果完成最終診斷,獲得模型診斷結(jié)果。診斷模型運行流程如圖2 所示。

圖2 故障診斷模型流程圖Fig.2 Troubleshooting model flowchart

2 案例分析

2.1 非均衡數(shù)據(jù)集獲取

以GenSystem 艦船蒸汽動力系統(tǒng)仿真平臺采集的狀態(tài)參數(shù)作為原始數(shù)據(jù)集,利用數(shù)據(jù)管理模塊中的實時與歷史數(shù)據(jù)管理功能,將數(shù)據(jù)導(dǎo)出到本地使用。在實際運行過程中,艦船長時間處于正常工況運行,因此在采集試驗數(shù)據(jù)時,做到與實際一致,即大部分為正常工況數(shù)據(jù),少量為故障工況樣本[6]。

以鍋爐燃燒供油量不足這一故障現(xiàn)象為例進行故障診斷,鍋爐燃油系統(tǒng)如圖3 所示。在GenSystem 仿真平臺上進行全局化仿真,分別設(shè)置了燃油過濾器堵塞、汽輪燃油泵本體故障、汽輪燃油泵進氣卡死、燃油總管泄漏4 種工作中常見故障。根據(jù)圖3 分析,燃油供給與燃燒鍋爐及風(fēng)煙系統(tǒng)具有強耦合關(guān)系,在選擇指標(biāo)參數(shù)時應(yīng)選擇包含信息量全面的參數(shù)。在相應(yīng)工作狀態(tài)下,采集了汽包壓力、汽包液位、過熱蒸汽產(chǎn)量、飽和蒸汽產(chǎn)量、燃油總管流量、燃油總管溫度、燃油總管壓力、燃油泵出口壓力、燃油泵汽輪機轉(zhuǎn)速、燃油泵噴嘴前壓力、爐膛進口燃油量、爐膛實際燃油消耗量12 個參數(shù)。將采集的樣本數(shù)據(jù)按照故障種類分為5 組,分別為:正常工況(0)、燃油過濾器堵塞(1)、汽輪燃油泵本體故障(2)、汽輪燃油泵進氣卡死(3)、燃油總管泄漏(4),樣本分布如表1 所示。

圖3 蒸汽動力燃油系統(tǒng)Fig.3 Steam-powered fuel system

表1 原始數(shù)據(jù)樣本分布Tab.1 Sample distribution of raw data

2.2 數(shù)據(jù)預(yù)處理與分析

考慮到12 種系統(tǒng)參數(shù)具有很大的量綱和數(shù)量級差異,對樣本的特征數(shù)據(jù)集進行標(biāo)準(zhǔn)化處理,將樣本數(shù)據(jù)映射到[0,1]的區(qū)間上,以避免樣本數(shù)據(jù)的量綱單位或數(shù)量級相差太大對模型分類的準(zhǔn)確率帶來影響。

參數(shù)之間的相關(guān)性導(dǎo)致信息量堆疊冗余,會影響模型收斂的速度,采用PCA 降低原始特征矩陣的維度,通過計算累計貢獻率來確定降維后特征空間的維度。降維后,各個向量的主成分對應(yīng)貢獻率如表2 所示。前3 個主成分的累計貢獻率達到了98.65%,包含了絕大部分原始特征數(shù)據(jù)集的信息。同時為了更好地進行數(shù)據(jù)分析,將原始12 維空間經(jīng)PCA 降維到3 維空間,不僅避開信息量的冗余,且信息量得到最大化保留,大大提高了模型的運算效率。

表2 PCA-主成分累計貢獻率Tab.2 PCA - principal component cumulative contribution rate

圖4 為降維后5 種工況的特征數(shù)據(jù)在三維空間中的分布。可以看出,工況3 樣本空間分布集中,且遠(yuǎn)離其他4 組,故障診斷時容易識別;而其他4 組中,工況1、工況2 與工況0、工況4 互相遠(yuǎn)離,有明顯的分界,但工況1、工況2 之間,工況0、工況4 組之間不存在明顯的間隙,尤其是工況0、工況4 之間存在明顯的交叉分布,故障診斷時容易出現(xiàn)誤分類的情況。

圖4 樣本的空間分布Fig.4 Spatial distribution of samples

2.3 試驗對比

SVM 在解決非線性問題時,需要通過核函數(shù)將數(shù)據(jù)映射到另一個高維空間上,以此為基礎(chǔ)進行分類操作,SVM 的核函數(shù)可分為:RBF(徑向基函數(shù))、Poly(多項式核函數(shù))、Linear(線性核函數(shù))。SVM 在對非均衡數(shù)據(jù)集進行分類時容易出現(xiàn)誤分類,導(dǎo)致召回率低的現(xiàn)象[7]。經(jīng)過研究發(fā)現(xiàn),是因為少數(shù)類樣本量有限,算法對其學(xué)習(xí)的力度不夠,不能完全挖掘出樣本包含的信息量。因此,設(shè)計3 個并行的以核函數(shù)種類為區(qū)分的SVM,通過不同的方式挖掘數(shù)據(jù)集的特征信息,保證提取信息的多樣性,加大對數(shù)據(jù)集包含信息的挖掘程度,將3 個并行的SVM 的預(yù)測結(jié)果融合,將融合結(jié)果作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,對數(shù)據(jù)的信息進行二次挖掘?qū)W習(xí),得到最終的診斷結(jié)果。作為對比,與3 個SVM 單獨診斷、常規(guī)Bagging 集成算法和單一BP 神經(jīng)網(wǎng)絡(luò)診斷的結(jié)果進行比較。3 個弱分類器更多的參數(shù)選擇如表3 所示。

表3 SVM-參數(shù)設(shè)置Tab.3 SVM-parameter settings

將樣本數(shù)據(jù)按8∶2 的比例劃分訓(xùn)練集和測試集,模型分別訓(xùn)練后,得到3 個單獨的SVM 故障診斷模型,將測試集代入進行驗證,得到模型的故障識別準(zhǔn)確率,并繪制混淆矩陣,評估模型性能,如圖5 所示。

圖5 3 個SVM 弱分類器的混淆舉證Fig.5 The confusion matrixes of the three SVM weak classifiers

使用Bagging 法對3 個弱分類器的預(yù)測結(jié)果集成,依據(jù)集成模型的診斷結(jié)果繪制混淆矩陣,如圖6 所示。

圖6 Bagging 集成算法的混淆舉證Fig.6 The confusing matrixes of bagging integration algorithms

設(shè)計單獨試驗的BP 神經(jīng)網(wǎng)絡(luò)的參數(shù),如表4 所示。用劃分的訓(xùn)練集訓(xùn)練模型后用測試集進行模型驗證,依據(jù)測試集診斷結(jié)果繪制混淆矩陣,如圖7 所示。

圖7 BP 神經(jīng)網(wǎng)絡(luò)模型的混淆舉證Fig.7 The Confusing matrixes of BP neural network models

表4 BP 神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置Tab.4 BP-parameter settings

驗證本文提出的故障診斷模型,將上述的3 個SVM 并行運行,將劃分好的訓(xùn)練集通過K 折驗證獲取子訓(xùn)練集,分別用于訓(xùn)練3 個SVM,用訓(xùn)練好的3 個SVM 對測試集進行特征提取,得到3 組特征提取結(jié)果,將得到的結(jié)果通過矩陣拼接融合,最后將融合得到的新特征矩陣作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,進行深層次的數(shù)據(jù)挖掘,進行二次診斷,最后得到模型故障診斷的結(jié)果,繪制混淆矩陣如圖8 所示。

圖8 基于SVM-BP 集成模型的混淆舉證Fig.8 The confusing matrixes based on the SVM-BP integration model

重復(fù)上述測試30 次,來對比各個診斷模型的穩(wěn)定性,表5 為各個診斷模型的平均準(zhǔn)確率、準(zhǔn)確率的方差及對工況4 的平均召回率,圖9 為各個模型的準(zhǔn)確率曲線。

圖9 各個模型準(zhǔn)確率曲線Fig.9 The accuracy curves for each model

表5 各模型的分類結(jié)果Tab.5 The classification results for each model

通過以上混淆矩陣對比可以看出,對工況0~工況3,參與對比的6 種診斷模型很好地識別分類出來。根據(jù)圖4 可知,因為前4 種工況的空間分布分散,意味著4 種工況的數(shù)據(jù)樣本之間差異性很大,各模型根據(jù)已有的樣本能夠充分挖掘每種工況的信息量,故前4 種工況的召回率都很高。但是對于工況4,6 種診斷模型的區(qū)別很大,參與對比的5 種診斷模型都存在很嚴(yán)重的誤分類現(xiàn)象。分析圖4 可知,工況4 和工況0 的空間分布比較重合,說明工況4 和工況0 樣本所包含的信息具有很強相似性,在故障樣本數(shù)量遠(yuǎn)少于正常工況樣本數(shù)量的情況下,模型對工況4 樣本的數(shù)據(jù)特征學(xué)習(xí)力度不夠,容易出現(xiàn)將工況4 樣本學(xué)習(xí)分類為工況0 的情況,即容易出現(xiàn)誤分類現(xiàn)象。傳統(tǒng)的Bagging 集成學(xué)習(xí)算法中,通過對并行的SVM 的結(jié)果進行投票篩選,遵循少數(shù)服從多數(shù)原則,該方法一定程度上提高了工況4 的分類正確率,但總的來說,3 個并行的分類器學(xué)習(xí)力度都不足,會出現(xiàn)3 個SVM同時分類錯誤的情況,因此傳統(tǒng)的Bagging 集成法診斷時通常是對3 個錯誤的分類結(jié)果進行投票,并沒有加強對原始數(shù)據(jù)集的學(xué)習(xí)力度,故集成診斷的結(jié)果也是錯誤的,所以雖有提升,但幅度很小,診斷結(jié)果依舊不佳。而本文提出的利用BP 神經(jīng)網(wǎng)絡(luò)替代傳統(tǒng)的集成手段,將3 個SVM 的輸出的概率分布矩陣進行融合,進一步學(xué)習(xí)提取融合矩陣的特征,利用BP 神經(jīng)網(wǎng)絡(luò)的誤差反向傳播、不停迭代更新權(quán)值及閾值,對概率分布矩陣進行線性運算,實現(xiàn)對原始數(shù)據(jù)的特征二次挖掘,進一步對數(shù)據(jù)的特征進行學(xué)習(xí),得到最后的診斷結(jié)果。通過以上混淆矩陣的對比可知,此方法很大程度上提高了模型對相似度高的少數(shù)樣本類工況的分類正確率。

圖9 和表5 表明,本文提出的基于SVM-BP 集成學(xué)習(xí)的故障診斷模型針對蒸汽動力燃油系統(tǒng)故障診斷有好的效果,工況4 的平均召回率達到了84%,較SVM算法提成了一倍有余,較常用的Bagging 集成學(xué)習(xí)算法提升了16%,模型的準(zhǔn)確率也明顯優(yōu)于其他模型。

3 結(jié) 語

本文以艦船蒸汽動力系統(tǒng)鍋爐的燃油輔助系統(tǒng)故障為對象,針對非均衡數(shù)據(jù)集故障識別存在的準(zhǔn)確率低及少數(shù)類樣本誤分類等問題,通過對樣本空間分布以及傳統(tǒng)故障診斷方法出現(xiàn)問題的原因進行分析,提出了基于SVM-BP 集成學(xué)習(xí)的故障診斷模型。經(jīng)過試驗分析并對比證明,最終得到了如下結(jié)論:

1)原始非均衡數(shù)據(jù)集中的各個特征參數(shù)數(shù)據(jù)存在信息堆疊冗余的問題,使用PCA 能在降低原始特征維度及復(fù)雜度的同時很好地保留原始數(shù)據(jù)集包含的信息量。經(jīng)過PCA 降維后保留了3 個主成分,累計貢獻率為98.65%。

2)本文提出的基于SVM-BP 集成算法在非均衡數(shù)據(jù)集上表現(xiàn)良好,通過對數(shù)據(jù)集的多次信息挖掘,得到最終的診斷結(jié)果。經(jīng)過30 次重復(fù)試驗,對少數(shù)類樣本(工況4)的平均召回率為84%,模型的平均準(zhǔn)確率為95.04%,相較參與對比的診斷模型,該方法的準(zhǔn)確率及少數(shù)類樣本的召回率明顯高于其他診斷方法。

基于SVM-BP 集成算法的準(zhǔn)確率以及少數(shù)類樣本的召回率明顯高于其他診斷方法,該方法提高了蒸汽動力系統(tǒng)鍋爐燃油供給故障診斷準(zhǔn)確率,具有一定的理論參考和應(yīng)用價值。

猜你喜歡
分類器故障診斷準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
BP-GA光照分類器在車道線識別中的應(yīng)用
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
因果圖定性分析法及其在故障診斷中的應(yīng)用
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
基于LCD和排列熵的滾動軸承故障診斷