王 平,吳文波,楊友蘭,馬毅華,許 江,宗智誠
(中國鐵路上海局集團有限公司 信息技術(shù)所,上海 200071)
近年來,我國高速鐵路(簡稱:高鐵)事業(yè)飛速發(fā)展,高鐵動車組列車保有量快速增長,服役車型種類日益增多,高鐵產(chǎn)業(yè)正由制造為主的階段轉(zhuǎn)向全壽命周期運營維護(簡稱:運維)為主的階段。因此,提高動車組運行的安全性和可靠性,降低運維成本,具有重大意義。
目前,動車組故障預測與健康管理(PHM ,Prognostic and Health Management)系統(tǒng)[1]已在全國鐵路投入使用[2],基于對24種動車組關(guān)鍵部件傳感器數(shù)據(jù)的分析,構(gòu)建了預警預測、視情維修等故障診斷和預測應用。2021年,動車組PHM系統(tǒng)(由中國鐵路上海局集團公司開發(fā)的部分)生成故障診斷預警數(shù)據(jù)近3萬條,準確率約為80%,預報了動車組聯(lián)軸節(jié)脫開、軸箱軸承故障、蓄電池燒損等典型故障,有效保障了動車組運行安全;針對動車組的散熱裝置進行健康度預測,動車組濾棉更換次數(shù)、散熱裝置清潔沖洗次數(shù)顯著下降,降低了維修成本。
現(xiàn)階段的動車組PHM系統(tǒng)運維算法模型尚存在如下問題:(1)模型設(shè)計依賴于專家經(jīng)驗,具有主觀性[3-4];(2)模型主要基于動車組系統(tǒng)運行機理構(gòu)建,對較復雜的部件故障難以進行有效預測;(3)利用傳統(tǒng)故障診斷方法難以構(gòu)建動車組部件“健康”與“非健康”的狀態(tài)分界面,不利于健康管理的深化;(4)利用監(jiān)督學習構(gòu)建算法需要高質(zhì)量的數(shù)據(jù)標注,但動車組關(guān)鍵部件的故障標注數(shù)據(jù)尚在積累階段,健康度標注則還在研究中。
為深化發(fā)展高鐵動車組智能運維算法,亟需在基于人工智能(AI ,Artificial Intelligence)的高鐵動車組智能運維算法研究平臺中構(gòu)建數(shù)據(jù)分析系統(tǒng),將AI算法引入特征工程和數(shù)據(jù)標注環(huán)節(jié),利用AI算法打通高鐵動車組智能運維算法研究的全過程。
高鐵動車組智能運維算法研究平臺包括數(shù)據(jù)分析系統(tǒng)和建模分析系統(tǒng),如圖1所示。動車組PHM系統(tǒng)將動車組車載信息無線傳輸系統(tǒng)(WTDS ,Wireless Transmission Device System)數(shù)據(jù)存入離線數(shù)據(jù)倉庫,作為平臺的數(shù)據(jù)支撐,數(shù)據(jù)接入平臺后,經(jīng)過數(shù)據(jù)處理、特征工程、數(shù)據(jù)標注、模型訓練和模型驗證等步驟,反復迭代、優(yōu)化形成穩(wěn)定可靠的模型,最終部署至動車組PHM系統(tǒng)。
圖1 高鐵動車組智能運維算法研究平臺總體架構(gòu)
數(shù)據(jù)分析系統(tǒng)負責進行數(shù)據(jù)處理、特征工程和數(shù)據(jù)標注,包括數(shù)據(jù)管理、數(shù)據(jù)處理、特征管理和數(shù)據(jù)標注功能模塊;建模分析系統(tǒng)負責進行模型訓練和模型驗證[5-6],包括算法管理、任務管理、模型管理和成果管理功能模塊。數(shù)據(jù)分析系統(tǒng)作為建模分析系統(tǒng)的前置環(huán)節(jié),可為建模分析系統(tǒng)作好特征工程與數(shù)據(jù)標注準備。
動車組部件的數(shù)據(jù)海量而繁雜,在現(xiàn)階段數(shù)據(jù)標注較為匱乏的情況下,難以進行高效的算法探索與模型分析,針對此問題,數(shù)據(jù)分析系統(tǒng)設(shè)計了具體的處理流程,如圖2所示。系統(tǒng)的特征工程部分細分為降維聚類和結(jié)果分析2個流程。降維聚類后的結(jié)果需經(jīng)專業(yè)人員分析確認后才能作為特征工程環(huán)節(jié)的輸出。數(shù)據(jù)特征數(shù)量較多時,高維度數(shù)據(jù)樣本在空間的分布呈現(xiàn)稀疏性,難以進行進一步分析,在數(shù)據(jù)處理中被稱為“維數(shù)災難”[7],降維是解決維數(shù)災難的重要方法,降維的目的是在壓縮數(shù)據(jù)的同時讓信息損失最小化。在降維的基礎(chǔ)上,聚類算法可顯著降低數(shù)據(jù)分析的復雜性,提高聚類結(jié)果的可解釋性。經(jīng)“降維—聚類”后的數(shù)據(jù)可更加直觀地反映數(shù)據(jù)間的潛在關(guān)系,有助于后續(xù)的數(shù)據(jù)標注和建模分析。
圖2 數(shù)據(jù)分析系統(tǒng)的處理流程
2.1.1 主成分分析
主成分分析(PCA ,Principal Component Analysis)是一種經(jīng)典的線性降維方法[8]。PCA的主要思想是將高維數(shù)據(jù)通過線性變換投影到低維空間中,并期望在所投影維度上數(shù)據(jù)的信息量最大(方差最大)。
2.1.2 t-分布隨機鄰域嵌入
t-分布隨機鄰域嵌入(t-SNE ,t-distributed Stochastic Neighbor Embedding)是一種非線性降維算法[9]。該算法的基本思想是保持樣本點在高維空間和低維空間中的概率分布盡量相似,以達到降維的目的。
2.1.3 均勻流形逼近和投影
均勻流形逼近和投影(UMAP ,Uniform Manifold Approximation and Projection)是一種基于黎曼幾何和代數(shù)拓撲理論框架構(gòu)建的非線性流形學習算法[10]。UMAP依據(jù)高維空間映射到低維空間相似度的定性結(jié)論,將高維數(shù)據(jù)的拓撲結(jié)構(gòu)進行低維映射以達到降維結(jié)果,主要包含構(gòu)造1個特殊的加權(quán)K鄰域圖和計算該圖低維表示2個階段。
2.2.1 K-means
K-means算法是一種劃分聚類算法。給定一個數(shù)據(jù)點集合和需要的聚類數(shù)目K,該算法根據(jù)距離函數(shù)反復把數(shù)據(jù)分入K個聚類中。
2.2.2 Louvain
Louvain算法[11]是一種基于圖數(shù)據(jù)的社區(qū)發(fā)現(xiàn)算法,優(yōu)化目標為最大化整個數(shù)據(jù)的模塊度,模塊度的計算公式為
其中,m為圖中邊的總數(shù)量;ki、kj分別表示所有指向節(jié)點i、j的連邊權(quán)重之和;Ai,j表示節(jié)點i、j之間的連邊權(quán)重,Ci表示節(jié)點i所屬的社區(qū),當Ci=Cj時 , δ (Ci,Cj)=1,否則 δ (Ci,Cj)=0。 通過Q值可確定社區(qū)的分類度,其取值范圍為 [0,1],Q值越大,分類度越好。
2.2.3 變分自編碼器
變分自編碼器(VAE ,Variational Auto-Encoder)是自編碼器(AE,Auto Encoder)在生成模型上的變體。基于深度學習的聚類模型選用不同的神經(jīng)網(wǎng)絡提升聚類效果,AE、VAE、生成式對抗網(wǎng)絡(GAN ,Generative Adversarial Networks)用于聚類的原理類似。
VAE要求AE的中間特征服從給定的高斯分布,通過變分推斷法推斷出樣本概率的最大下界,最大化下界的過程會使樣本的中間特征逼近給定的先驗分布。
故障的發(fā)生具有突發(fā)性和隱蔽性,故障診斷和預測有較大難度。本文采用“PCA+Louvain+UMAP”的降維聚類算法,以高鐵動車組客室空調(diào)的數(shù)據(jù)分析為例,說明高鐵動車組智能運維數(shù)據(jù)分析系統(tǒng)的應用。高鐵動車組客室空調(diào)故障是動車組夏季常見的故障之一,動車組在運行過程中車體呈全密閉式,當空調(diào)制冷系統(tǒng)發(fā)生故障時,車內(nèi)室溫不斷升高,將影響車內(nèi)乘客的乘車環(huán)境,甚至可能導致動車組無法繼續(xù)運行,嚴重影響動車組運行秩序[3]。
本文選取動車組客室空調(diào)相關(guān)部件傳感器數(shù)據(jù)用于分析其健康狀況的特征,數(shù)據(jù)來源為20列CRH380B型和20列CRH380BL型動車組在2020年6月~8月運行期間的客室空調(diào)相關(guān)WTDS數(shù)據(jù),共4 725 120條記錄,每條記錄的10維特征選取如表1所示。
表1 客室空調(diào)特征列表
本文對選取的10維特征進行缺失值處理、去量綱等數(shù)據(jù)預處理,并結(jié)合業(yè)務知識和經(jīng)驗[12]對其進行特征擴展,新的特征與客室空調(diào)故障有更好的相關(guān)性,有助于進行數(shù)據(jù)分析。最終將特征從10維擴展至16維,擴展后的特征如表2所示。
表2 擴展后的客室空調(diào)特征列表
(1)降維:對擴展后的16維特征數(shù)據(jù),利用PCA方法進行線性降維,降維結(jié)果如圖3所示,橫坐標代表主成分的序號,縱坐標代表主成分對應的標準差。由圖3可知,大部分信息在前9個主成分中捕獲,因此,選擇前9個主成分進行后續(xù)分析。
圖3 PCA降維的成分分析
(2)聚類:選擇降維后數(shù)據(jù)的前9個主成分作為輸入,利用Louvain算法進行基于圖的聚類,其中resolution參數(shù)為0.5。
(3)可視化:對于聚類后的數(shù)據(jù)進行UMAP降維,在2維空間上進行可視化展示,如圖4所示,以供專業(yè)人員進行結(jié)果分析。
圖4 動車組客室空調(diào)健康狀況降維聚類結(jié)果
對16維特征數(shù)據(jù)進行“PCA+Louvain+UMAP”降維聚類分析的結(jié)果如圖4所示,數(shù)據(jù)被聚類為12個類別,不同的顏色代表不同的類別。專業(yè)人員通過對結(jié)果的分析發(fā)現(xiàn),可將圖中的12個類別劃分為4類區(qū)域A、B、C和D,各類數(shù)據(jù)的主要特征如表3所示。
表3 各類數(shù)據(jù)對應的主導特征列表
A類數(shù)據(jù)為一級故障預警;B類數(shù)據(jù)為二級故障預警;C類數(shù)據(jù)為三級故障預警;D類數(shù)據(jù)為客室空調(diào)健康狀態(tài)下的數(shù)據(jù),可被分類為正常[12]。
根據(jù)圖4的聚類效果和結(jié)果分析,發(fā)現(xiàn)動車組客室空調(diào)健康狀況是可劃分的,并且劃分后的4類區(qū)域可反映不同程度的客室空調(diào)健康狀況,說明16維特征的選取是合理的,可作為特征工程環(huán)節(jié)的輸出。在建模分析階段可將這16維特征作為特征池,形成客室空調(diào)健康度判定算法。同時,可將A、B、C、D這4種分類的聚類結(jié)果轉(zhuǎn)換為客室空調(diào)健康度的數(shù)據(jù)標簽。標注后的數(shù)據(jù)作為模型分析系統(tǒng)的輸入,利用監(jiān)督學習的方法,形成客室空調(diào)故障診斷和預測方法。
本文概述了高鐵動車組智能運維算法研究平臺的總體架構(gòu),著重闡述了高鐵動車組智能運維數(shù)據(jù)分析系統(tǒng)的構(gòu)建,包括關(guān)鍵算法和數(shù)據(jù)處理流程。并以高鐵動車組客室空調(diào)故障的數(shù)據(jù)分析為例進行了應用研究與分析,證明了該系統(tǒng)的可用性。
下一步應進行的工作包括:(1)利用“降維—聚類”的算法框架完成塞拉門、軸承類等部件的特征工程和數(shù)據(jù)標注;(2)利用特征工程和數(shù)據(jù)標注的結(jié)果,建立有監(jiān)督的客室空調(diào)健康評估模型,實現(xiàn)客室空調(diào)故障診斷和預測。