王川 張珍文 安帥
摘 要:隨著高鐵的快速發(fā)展,人們對乘車環(huán)境的要求也越來越高。列車空調(diào)系統(tǒng)運行于列車高速振動環(huán)境下,性能極易下降且定期檢修成本巨大,高效準確的空調(diào)故障檢測尤為重要。本文用K-means聚類對空調(diào)數(shù)據(jù)進行分類,找到明顯異常的類別并與業(yè)務部門確認后找到真正的空調(diào)系統(tǒng)故障數(shù)據(jù),并對故障數(shù)據(jù)進行標記,利用CART決策樹建立空調(diào)故障檢測模型。
關鍵詞:K-means;CART;空調(diào)故障檢測
中圖分類號:U266 文獻標志碼:A
0 引言
根據(jù)鐵道部《客車空調(diào)三機檢修及運用管理規(guī)程》規(guī)定:空調(diào)機組必須定時檢修。但是定時檢修耗費大量的人力物力,因此需要對空調(diào)數(shù)據(jù)進行分析,建立空調(diào)故障檢測模型進行故障檢測,進行針對性的檢修,節(jié)約運營成本。
對于空調(diào)故障檢測,潘文海等針對廣州地鐵3號線在運營期間頻繁出現(xiàn)的客室悶熱現(xiàn)象進行故障數(shù)據(jù)分析,最終確定故障點并據(jù)此進行整改,效果顯著。羅浩在列車性能試驗臺采集到空調(diào)機組在正常及故障狀態(tài)下的數(shù)據(jù)樣本,建立幾種常見故障的判斷規(guī)則,依據(jù)故障規(guī)則判定表,利用MATLAB建立了SVM多分類器。
但是目前并沒有有效的故障檢測模型在線運行。本文針對列車運行狀態(tài)空調(diào)數(shù)據(jù),利用K-means聚類結(jié)合CART決策樹算法進行空調(diào)故障建模,并用實際數(shù)據(jù)進行驗證。
1 數(shù)據(jù)預處理
1.1 數(shù)據(jù)過濾
剔除掉NULL、異常、無效等數(shù)據(jù)。
1.2 指標篩選
目前所取數(shù)據(jù)指標較多,包括多個衍生指標,需要對指標進行相關性分析,選取與業(yè)務目標最相關的指標進行建模。
因為空調(diào)運行時,各個參數(shù)變化都與目標溫度有關,此處計算各個參數(shù)與目標溫度的相關性系數(shù),結(jié)果見表1。
前6個指標的相關性系數(shù)大于0.6,與目標溫度相關性較強。
1.3 數(shù)據(jù)標準化
溫度與壓力值量綱不同,數(shù)值相差很大,用Z-Score方法對數(shù)據(jù)進行標準化。
2 算法簡介
由于目前沒有空調(diào)故障樣本,所以用無監(jiān)督學習方法進行建模??照{(diào)運行正常與異常時,壓力值以及溫度表現(xiàn)出的規(guī)律不同,可以通過聚類發(fā)現(xiàn)空調(diào)數(shù)據(jù)內(nèi)在的模式或者空調(diào)故障類的特點。
首先對空調(diào)數(shù)據(jù)進行聚類,分析各類的聚類中心,找出異常類別,與業(yè)務部門確認故障數(shù)據(jù)并對其進行標記,然后用分類算法進行分類,建立空調(diào)故障檢測模型。
3 空調(diào)異常檢測
3.1 模型訓練
選取標準化后的某段時間的全量數(shù)據(jù),共20列車608355條記錄。
聚類效果可以通過肘部法則進行評估,肘部法則會把不同k值的成本函數(shù)值畫出來。空調(diào)數(shù)據(jù)對應的聚類模型平均畸變程度隨聚類個數(shù)k的變化趨勢圖如圖1所示。
從圖1可以看出,k值為5~6時,平均畸變程度變化最大。k超過6以后,平均畸變程度變化顯著降低,因此肘部就是k=6。因此最終選擇的模型為k=6對應的聚類模型。聚類模型的中心點見表2。
從聚類中心點可以看出,第5類的制冷系統(tǒng)2低壓壓力值明顯異常,經(jīng)與業(yè)務部門確認該類為壓力傳感器故障。
將第5類標記為1,其余類別標記為0,利用CART決策樹進行分類,通過決策樹模型結(jié)果可以看出,只要變量X[6]<=2720,就把空調(diào)歸為正常數(shù)據(jù),X[6]代表變量“制冷系統(tǒng)2低壓壓力”,由此抽象出空調(diào)故障檢測的規(guī)則:
制冷系統(tǒng)2低壓壓力>2720kPa,則報出“空調(diào)壓力異常”。
3.2 效果驗證
將模型部署到PHM系統(tǒng)中,運行一段時間后確實檢測到異常數(shù)據(jù)。與業(yè)務部門確認后,證實該數(shù)據(jù)確實為空調(diào)系統(tǒng)故障,但是是壓力傳感器故障,更換壓力傳感器,后期跟蹤發(fā)現(xiàn),該列車該車廂不再出現(xiàn)壓力異常。
4 結(jié)論與展望
本文針對空調(diào)實際數(shù)據(jù),利用K-means聚類算法找到異常類,對異常類別進行標記后,利用CART決策樹進行分類,建立空調(diào)故障檢測模型。本文建立的模型簡單易實現(xiàn),且效果良好,具有很強的實際意義。
由于沒有真實空調(diào)系統(tǒng)故障數(shù)據(jù),目前僅發(fā)現(xiàn)并建立了空調(diào)系統(tǒng)壓力傳感器故障模型,對于壓縮機故障,濾網(wǎng)臟堵等空調(diào)系統(tǒng)故障,需要對數(shù)據(jù)進一步分析,建立全面可靠的空調(diào)故障檢測模型,保證空調(diào)系統(tǒng)正常運行。
參考文獻
[1]潘文海,蘇錦華,李許磊,等.廣州地鐵3號線列車空調(diào)無制冷故障調(diào)查分析及解決[J].機車電傳動,2013(3):56-57.
[2]羅浩.列車空調(diào)機組故障檢修中SVM的應用[D].華中科技大學,2008:1-61.
[3]羅浩.列車空調(diào)機組故障檢修中SVM的應用[D].湖北:華中科技大學,2008.