田粉霞,楊世武,崔 勇,武 沛
(北京交通大學 電子信息工程學院, 北京 100044)
截至2019 年底,我國高速鐵路里程已達3.5 萬km。作為高鐵基礎設備,ZPW-2000 系列無絕緣軌道電路完成全線列車占用檢查,并向車載設備發(fā)送連續(xù)信息,其功能完整性直接影響列車安全和運行效率,其故障診斷的實時性具有重要意義。在軌道電路故障診斷方面已開展了較多研究[1-2]。調諧區(qū)作為實現(xiàn)相鄰兩軌道區(qū)段軌道電路信號的隔離,且該部分設備在軌旁1.5 m 的位置[3],受列車震動以及環(huán)境影響,極易發(fā)生故障。當調諧區(qū)設備發(fā)生故障時,相鄰兩區(qū)段的信號會發(fā)生混頻,機車可能接收到相鄰軌道區(qū)段的信號,造成錯誤解碼,從而影響列車安全運行。當列車占用區(qū)間的發(fā)送端調諧區(qū)設備故障時,列車可接收運行前方區(qū)段的軌道電路信號,最嚴重情況下可能發(fā)生列車追尾事故;當列車占用區(qū)間的接收端調諧區(qū)設備故障時,列車可接收運行后方區(qū)段的軌道電路信號,最嚴重情況下可能導致本區(qū)段及后方區(qū)段列車停車,影響行車效率。因此,調諧區(qū)設備是否正常運行對列車運行安全及效率將產生直接影響。
文獻[4-5]采用神經網絡實現(xiàn)調諧區(qū)設備的故障診斷,其特征提取方法是通過對前4 個補償電容區(qū)間內的信號進行曲線擬合,將擬合結果輸入到神經網絡實現(xiàn)故障分類,其前期特征提取過程較復雜;文獻[6]采用定性趨勢分析的方法,當噪聲較小時診斷正確率可達到96.3%,當信噪比達到40 dB 時,診斷正確率降至65.4%,其診斷結果易受噪聲的影響;文獻[7]針對小波閾值去噪可能造成直接去除故障信號中較小幅度信號的影響,通過CEEMD 方法進行軌面電壓信號的特征提取,但僅提取故障特征,需要與分類算法結合,才能實現(xiàn)故障診斷。
深度學習工具-卷積神經網絡能同時實現(xiàn)特征提取及特征分類,且分類準確率高,在語音識別、圖像處理、自然語言處理、信息抽取及故障診斷中應用廣泛[8-10]。鑒于調諧區(qū)設備故障對機車信號電壓的影響與圖像分類中邊緣特征的提取相類似,因此本文采用卷積神經網絡來實現(xiàn)調諧區(qū)設備的故障診斷,該算法可以在集中監(jiān)測設備上實現(xiàn),當設備未發(fā)生完全松斷時便可預測診斷出故障隱患,實時性及預防效果較好。
利用軌道電路地面采集的數(shù)據(jù),信號集中監(jiān)測系統(tǒng)只能實現(xiàn)部分故障的診斷。為實現(xiàn)完整的故障診斷,需進一步結合車載設備采集的數(shù)據(jù)。機車采集的數(shù)據(jù)存儲在車載列車運行監(jiān)控記錄裝置LKJ 中,通過無線通信,可將這些數(shù)據(jù)傳輸至地面設備,由地面設備完成故障診斷,車地結合故障診斷[4,11]的實現(xiàn)過程如圖1 所示。
圖1 車地結合故障診斷示意
為獲取機車信號電壓,建立分路狀態(tài)下機車信號電壓模型[12-14],如圖2 所示。
圖2 分路狀態(tài)下機車信號電壓模型
圖2 中,Vs為發(fā)送器輸出電平;x為分路點在鋼軌的位置;F(x)為發(fā)送器至分路點間設備的四端網傳輸矩陣;IR為分路電流;Rf為分路電阻;T(x)為分路點至接收端的傳輸矩陣;ZR為接收器的輸入阻抗;Zi為分路點向接收端的輸入阻抗。
機車分路電流為:
機車信號電壓為:
其中,α為接近于常數(shù)的系數(shù)。
通過仿真得到調諧區(qū)無故障時機車信號電壓,如圖3a 所示;現(xiàn)場從LKJ 中截取的波形如圖3b 所示,信號-時間關系曲線可通過采樣頻率與速度的關系轉換為信號-位置關系[6]。由圖3 可知,仿真值與現(xiàn)場數(shù)據(jù)基本一致;由于仿真模型中發(fā)送端到接收端的方向與現(xiàn)場的方向相反,因此波形的趨勢相反。
不同故障模式(BA2、SVA、BA1)下機車信號電壓如圖4 所示。仿真實驗獲取的數(shù)據(jù)中,各類故障模式的嚴重程度見表1。
圖3 機車信號電壓
圖4 不同故障類型時機車信號電壓
表1 故障模式嚴重程度
考慮到機車信號電壓補償電容故障及道砟電阻大小等因素的影響,對數(shù)據(jù)集進行擴充,以補償電容C3 及C9 故障為例說明,如圖5a 所示。不同道砟電阻對機車信號電壓的影響如圖5b 所示。
圖5 不同現(xiàn)場條件對機車信號電壓的影響
由調諧區(qū)的結構組成可知,調諧區(qū)4 種故障模式對應CNN 分類層4 個輸出神經元的輸出;激活函數(shù)輸出值為1 時,則輸入信號屬于該類故障;激活函數(shù)輸出值為0 時,激活函數(shù)不屬于該類故障。調諧區(qū)4 類故障模式對應的編碼見表2。
表2 故障模式編碼
相對于前饋神經網絡及BP 神經網絡,CNN 在輸入層后增加了卷積層及池化層,用來實現(xiàn)輸入信號的特征提取及降維。采用BP 神經網絡實現(xiàn)調諧區(qū)的故障診斷時,若直接將采集信號輸入到算法中,會導致節(jié)點數(shù)量多,算法復雜度上升,內存占用率高;若降低輸入信號的維度,則需要人為確定故障特征顯著的區(qū)域, 并通過擬合等方法確定故障特征,數(shù)據(jù)前期處理過程較為繁瑣。通過CNN 實現(xiàn)故障診斷時,卷積層可實現(xiàn)輸入信號的特征提取,并通過設置池化層參數(shù)實現(xiàn)輸入信號的降維。
試驗中區(qū)間軌道電路每隔1 m 生成一組數(shù)據(jù),卷積神經網絡單個輸入數(shù)據(jù)維度為1×1 200,輸出信號的維度為1×w;其中,w的計算公式為:
其中,m為卷積核的大小,p為補零的圈數(shù),s為卷積層的采樣步長。輸出信號值的計算公式[10]為:
yl,k,i為第l 層卷積層第k個卷積核的第i個輸出,W為第l 層卷積層的第k個卷積核的權值,xj為第l層卷積層的輸入信號,為第l 層卷積層的第k個神經元的偏置。卷積層的激活函數(shù)f常采用relu 函數(shù):
原始輸入數(shù)據(jù)經卷積層進行特征提取后,其特征向量維度較高;因此,在盡量保持原特征的條件下,通過池化層降低特征向量的維度。常用的池化層方法有平均池化、最大池化和重疊池化,本文選擇最大池化。若池化層的采樣步長為s2,池化的區(qū)間大小為k2,輸出信號的維度為1×((w+2p)/s2),則第S層池化層中輸入為第k個卷積核的輸出的第j個輸出值的計算公式為:
池化后特征向量的維度通常大于分類層輸入信號的維度。因此,池化后增加全連接層,以實現(xiàn)池化層到分類層的維度轉換。分類層通過softmax 函數(shù)實現(xiàn)輸入特征的分類,函數(shù)形式為:
其中,F(xiàn)(Xi)為輸入信號xi屬于每種故障的概率值,各元素之和為1,F(xiàn)5j為全連接層的輸出。
通過目標函數(shù)的最小化實現(xiàn)權值及偏置的優(yōu)化,目標函數(shù)為:
其中,y′i為實際標簽中的第i個值。
權值及偏置的更新過程分別為式(9)和式(10):
其中,α為學習率。為保證快速得到一個較優(yōu)的解,開始訓練時使用較大學習率,然后通過迭代逐步減小學習率,使模型在訓練后期更加穩(wěn)定;加入指數(shù)衰減學習率,其計算公式為:
其中,α0為初始學習率,取值范圍為[0,1];r為衰減系數(shù);c為當前迭代次數(shù);s為衰減速度。
鑒于輸入信號維度較高,采用兩層卷積層及兩層池化層實現(xiàn)輸入信號的特征提??;第2 池化層后連接兩層全連接層,第1 層全連接層實現(xiàn)特征向量到輸出向量間的個數(shù)轉換,第2 層全連接層用來實現(xiàn)故障分類。在模型訓練過程中,采用dropout 函數(shù)提高模型的泛化能力,防止模型出現(xiàn)過擬合,同時減少需要訓練的參數(shù),可縮短模型的訓練時間。
通過Matlab 仿真,獲取軌道電路正常情況下以及不同故障在不同故障嚴重程度條件下的數(shù)據(jù)總共2 112 條,仿真實驗中相關參數(shù)設置見表3。訓練集數(shù)據(jù)越多,模型精度越高。因此,按照訓練集:測試集=9:1的比例對模型進行訓練,訓練步驟為1 500步,初始學習率為0.001。
表3 測試參數(shù)設置
基于TensorFlow 框架實現(xiàn)CNN,仿真及訓練過程中使用的計算機處理器為Intel(R) Core(TM)i5-4200U CPU@1.60 GHz。
故障診斷中使用的數(shù)據(jù)集標簽是人為標記的,因而難免存在數(shù)據(jù)標簽錯誤的情況。當上述情況發(fā)生時,loss 值較正常值偏差較大,會對參數(shù)的學習過程產生影響,如圖6 所示。
圖6 含錯誤標簽數(shù)據(jù)的損失函數(shù)變化
numpy 中的remove 函數(shù)無法刪除二維數(shù)組中的一維數(shù)據(jù),因此采用構建錯誤標簽數(shù)據(jù)集的方法,可減小錯誤標簽數(shù)據(jù)對訓練過程的影響,實現(xiàn)流程如圖7 所示。
圖7 訓練集中錯誤標簽數(shù)據(jù)識別流程
訓練過程中加入圖7 所示的流程后,Loss 值的變化如圖8 中曲線l1 所示,波動明顯減小,消除了錯誤標簽在下一次訓練過程中對訓練過程的影響;曲線l2 為刪除上述錯誤標簽數(shù)據(jù)后的Loss 圖。由圖8 可知,兩條曲線基本一致,即可以減小錯誤數(shù)據(jù)標簽對診斷結果的影響。
圖8 去除錯誤標簽數(shù)據(jù)損失函數(shù)變化
在CNN 中,特征提取通過卷積層實現(xiàn),卷積核的個數(shù)、大小及采樣長度對診斷準確率及模型訓練時間有直接影響。因此,通過對該些參數(shù)的對比分析,選擇當前條件下最優(yōu)的參數(shù)。
3.2.1 卷積核個數(shù)對診斷結果的影響
當卷積核大小為1×2,采樣步長為1×1,不同卷積核個數(shù)時的診斷結果見表4。
表4 卷積核個數(shù)對診斷結果的影響
由表4 可知,當?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核個數(shù)分別大于8 和16 時,診斷準確率基本保持不變,訓練時間變長,即算法復雜度的繼續(xù)增加對診斷結果無正向影響;因此,第1層和第3 層的卷積核個數(shù)分別選擇為8 和16。
3.2.2 卷積核大小對采樣結果的影響
當?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核個數(shù)分別為8 和16、采樣步長為1×1 時,不同卷積核大小對應的診斷結果見表5。
表5 卷積核大小對診斷結果的影響
由表5 可知,卷積核越大,需要訓練的參數(shù)越多,模型訓練的時間越長,且卷積核越大,容易造成局部特征的損失,故障診斷準確率降低。
3.2.3 采樣步長對診斷結果的影響
當?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核分別為8 和16、卷積核大小為1×2 時,不同采樣步長對應的診斷結果見表6。
表6 采樣步長對診斷結果的影響
由式(3)可知,采樣步長對卷積層輸出信號維度的影響按比例變化;當采樣步長變長時,輸出信號的個數(shù)減少,可訓練參數(shù)的個數(shù)也減少,算法的復雜度降低,訓練時間迅速減少,但輸入信號及第1層池化層的局部特征量損失嚴重,診斷準確率降低。
通過對比分析上述參數(shù),在保證診斷準確率的條件下,為降低算法復雜度,縮短模型訓練時間,最終確定卷積層的參數(shù)為:第1 層(第1 卷積層)的卷積核個數(shù)為8,大小為1×2,采樣長度為1×2;第3層(第2 卷積層)的卷積核個數(shù)16,大小為1×2,采樣步長為1×2。對應的卷積神經網絡模型如圖9 所示。
圖9 卷積神經網絡模型
圖9 中,f1(x) 為卷積層激活函數(shù),本文采用ReLU 函數(shù);f2(x) 為池化層運算函數(shù),本文采用Max_pool 函數(shù);全連接層F5中增加Dropout 函數(shù),以防止模型在訓練過程中出現(xiàn)過擬合,神經元被選中的概率值設置為0.5;f3(x)為分類層激活函數(shù),本文中用softmax 函數(shù)。當信噪比為60 dB 時,診斷結果見表7。
表7 訓練集及測試集診斷結果
由表8 可知,當SNR=60 dB 時,測試集診斷準確率可達到98.96%。由于軌道電路讀取器(TCR,Track Circuit Receiver)通過電磁感應的方式接受軌道電路中的差模信號電流,易受不平衡牽引電流及環(huán)境噪聲的影響,因此對比分析不同信噪比條件下的診斷準確率。
由表8 可知,卷積神經網絡對噪聲具有較強的承受能力,在上述仿真實驗條件中,當噪聲由60 dB增大到40 dB 時,測試集診斷正確率下降約為1%,即在噪聲干擾條件下,測試數(shù)據(jù)仍具有較高診斷正確率。
表8 信噪比對診斷結果的影響
采用卷積神經網絡對軌道電路調諧區(qū)進行故障診斷研究,得出如下結論:
(1)在補償電容故障、不同道砟電阻的情況下仍然能識別出故障。針對現(xiàn)場不同道砟電阻及可能出現(xiàn)的補償電容故障對機車信號電壓的影響,對機車信號電壓數(shù)據(jù)集進行補充,診斷結果表明算法可以實現(xiàn)不同環(huán)境下故障模式的識別。
(2)錯誤數(shù)據(jù)標簽的處理。對算法進行訓練的數(shù)據(jù)是人為標記的,其中可能存在故障數(shù)據(jù)與標簽不一致的現(xiàn)象,對模型參數(shù)訓練及診斷準確率均會造成影響。通過建立錯誤標簽數(shù)據(jù)集,并在下一次訓練過程中剔除該數(shù)據(jù)集,可以減小錯誤標簽的影響,診斷結果表明該方法的有效性。
(3)噪聲環(huán)境下故障診斷的有效性。TCR 通過電磁感應的方式獲取軌道電路信號,會受到不同程度噪聲的影響;對不同噪聲程度下的故障進行分類,結果表明:當噪聲達到40 dB 時,診斷準確率為97.92%,即該診斷方法對噪聲具有較強的承受能力。