劉典,秦勇,楊偉君,周偉,扈海軍,楊寧,劉冰,趙鵬飛,董光磊
(1. 北京交通大學(xué) 軌道交通控制與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京,100044;2. 中國(guó)鐵道科學(xué)研究院 機(jī)車(chē)車(chē)輛研究所,北京,100081;3. 北京縱橫機(jī)電科技有限公司,北京,100094;4. 中南大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長(zhǎng)沙,410075;5. 中南大學(xué) 軌道交通安全教育部重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙,410075)
隨著數(shù)據(jù)、算力、算法、模型的發(fā)展,面向高速列車(chē)譜系的故障預(yù)測(cè)與健康管理(PHM)技術(shù)[1]涵蓋了鐵路移動(dòng)裝備結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化及流式的海量健康狀態(tài)數(shù)據(jù)。然而,目前高速列車(chē)設(shè)備狀態(tài)異常診斷大部分仍基于傳感器測(cè)量閾值組合以事后報(bào)警的形式呈現(xiàn),少部分設(shè)備的健康態(tài)勢(shì)評(píng)估也僅在短期預(yù)測(cè)具有較高置信度。對(duì)于高速運(yùn)營(yíng)列車(chē)來(lái)說(shuō),提前幾分鐘甚至幾秒收到預(yù)警信息,承運(yùn)單位難以消除設(shè)備故障造成的影響。
長(zhǎng)時(shí)間序列預(yù)測(cè)(long sequence time-series forecasting,LSTF)是一種以較高預(yù)測(cè)容量來(lái)捕捉輸出與輸入之間長(zhǎng)距離依賴(lài)關(guān)系的預(yù)測(cè)方法[2-4],已在疾病傳播[5]、經(jīng)濟(jì)金融[6]、能源電力[7-8]、自動(dòng)駕駛[9]、運(yùn)量預(yù)測(cè)[10-11]、狀態(tài)識(shí)別[12]、故障診斷[13-16]等諸多領(lǐng)域成功應(yīng)用。JORDAN[17]提出了包含單個(gè)自連接節(jié)點(diǎn)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型(recurrent neural networks,RNN),該方法在短序列任務(wù)上的表現(xiàn)效果優(yōu)異,但關(guān)聯(lián)長(zhǎng)序列反向傳播時(shí)過(guò)長(zhǎng)序列導(dǎo)致梯度消失或爆炸,預(yù)測(cè)效果較差;CHUNG等[18]在傳統(tǒng)RNN 基礎(chǔ)上提出了門(mén)控循環(huán)單元結(jié)構(gòu)(gated recurrent unit,GRU),可有效緩解梯度消失或爆炸現(xiàn)象,但仍不能完全解決梯度消失的問(wèn)題。金曉航等[19]基于轉(zhuǎn)速、溫度、功率與風(fēng)速等風(fēng)力發(fā)電特征數(shù)據(jù),采用稀疏自編碼神經(jīng)網(wǎng)絡(luò)算法對(duì)風(fēng)電機(jī)組異常狀態(tài)預(yù)警,但如能結(jié)合未來(lái)可預(yù)知?dú)庀髷?shù)據(jù)來(lái)強(qiáng)化模型,可取得更好的預(yù)測(cè)效果;谷歌團(tuán)隊(duì)開(kāi)發(fā)的BERT[20]和OpenAI 團(tuán)隊(duì)開(kāi)發(fā)的GPT-3[21],以復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)、海量參數(shù)以及強(qiáng)大算力在時(shí)序數(shù)據(jù)預(yù)測(cè)中取得了成果,在GPT-3 中有1 750億個(gè)參數(shù)、96層網(wǎng)絡(luò)與上百個(gè)GPU強(qiáng)大算力支持,但由于鐵路場(chǎng)景的算力成本和時(shí)效性約束,沒(méi)有足夠的經(jīng)濟(jì)性優(yōu)勢(shì)。
由于預(yù)知推演和工程可實(shí)踐性的難度,基于未來(lái)可預(yù)知變量的模型并未廣泛應(yīng)用。但近年來(lái)在交通領(lǐng)域基于未來(lái)可預(yù)知變量的模型已經(jīng)有了工程應(yīng)用的實(shí)例。2022 年,北京亦莊開(kāi)設(shè)了自動(dòng)駕駛示范區(qū),基于交通信號(hào)燈信息聯(lián)網(wǎng),某路口某時(shí)刻的紅綠燈狀態(tài)成為未來(lái)可預(yù)知的變量信息。導(dǎo)航軟件通過(guò)該未來(lái)可預(yù)知的信息,并結(jié)合路況向司機(jī)推薦行駛速度,最終可以通過(guò)模型計(jì)算實(shí)現(xiàn)“全程綠燈”。通過(guò)大數(shù)據(jù)、先驗(yàn)知識(shí)及物理定律來(lái)預(yù)知推演未來(lái)某時(shí)刻的某變量,可以為既有模型提供更多的可研究方向和應(yīng)用場(chǎng)景。
高速列車(chē)的運(yùn)營(yíng)故障診斷面臨預(yù)測(cè)更準(zhǔn)、響應(yīng)更快等挑戰(zhàn),本文作者以牽引變流器電機(jī)定子的超溫故障為對(duì)象,引入靜態(tài)、緩變、動(dòng)態(tài)物理量與恒定狀態(tài)量等未來(lái)可預(yù)知特征KFF(known future feature)數(shù)據(jù)進(jìn)行訓(xùn)練。通過(guò)調(diào)整長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)的輸出門(mén)、狀態(tài)更新單元及隱變量,降低預(yù)測(cè)狀態(tài)與真實(shí)狀態(tài)的物理狀態(tài)偏差和時(shí)間相位偏滯,以優(yōu)化模型的預(yù)測(cè)準(zhǔn)確度與及時(shí)性,并基于高速列車(chē)真實(shí)運(yùn)營(yíng)數(shù)據(jù)對(duì)KFF-LSTM 模型與傳統(tǒng)模型進(jìn)行了對(duì)比和分析。
神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確度與及時(shí)性指標(biāo)定義如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確度與及時(shí)性指標(biāo)定義Fig. 1 Accuracy and timeliness definition of neural network prediction
LSTM是一種反饋型時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)[22],具有長(zhǎng)短期信息記憶能力,作為一種特殊遞歸神經(jīng)網(wǎng)絡(luò),LSTM 隱藏層增加了記憶單元C與遺忘門(mén)F,在時(shí)間序列軸時(shí)間步t時(shí),記憶單元Ct可以從狀態(tài)向量中進(jìn)行讀取、寫(xiě)入或刪除的操作;輸入門(mén)使記憶單元決定是否更新單元狀態(tài);遺忘門(mén)使記憶單元可以丟棄其記憶;輸出門(mén)使單元細(xì)胞可以決定輸出信息是否可用。LSTM神經(jīng)元通過(guò)輸入門(mén)、遺忘門(mén)和輸出門(mén)的狀態(tài)組合和記憶單元操作,實(shí)現(xiàn)對(duì)長(zhǎng)序列數(shù)據(jù)的預(yù)測(cè),其原理如圖2所示。
圖2 LSTM模型原理圖Fig. 2 Schematic diagram of LSTM model
LSTM 模型的輸入?yún)?shù)為Xt、記憶層Ct-1、隱藏層St-1,設(shè)有遺忘門(mén)Ft、輸入門(mén)It、候選記憶單元為C′t、輸出門(mén)Ot,輸出參數(shù)為當(dāng)前記憶層Ct、隱藏層St和輸出Yt,其中Yt為St的一個(gè)維度,模型可表征為:
式中,σ為Sigmoid 激活函數(shù);⊙為Hadamard 乘積;tanh 為雙曲正切激活函數(shù);wF與bF分別為遺忘門(mén)權(quán)重矩陣和偏置項(xiàng);wI與bI分別為輸入門(mén)權(quán)重矩陣和偏置項(xiàng);wC與bC為候選記憶門(mén)權(quán)重矩陣和偏置項(xiàng);wX和wH分別為輸出門(mén)輸入矩陣X和隱狀態(tài)矩陣H的權(quán)重矩陣;bO為輸出門(mén)的偏置項(xiàng)。
通過(guò)在LSTM 神經(jīng)網(wǎng)絡(luò)加入未來(lái)可預(yù)知特征KFF(known future feature)進(jìn)行訓(xùn)練與優(yōu)化,形成KFF-LSTM 故障預(yù)測(cè)模型。模型中引入的未來(lái)特征包括不可預(yù)知特征數(shù)據(jù)X(u)和可預(yù)知特征數(shù)據(jù)X(p),對(duì)于高速列車(chē)時(shí)序數(shù)據(jù)集,其特征狀態(tài)包括動(dòng)態(tài)物理量、緩變/靜態(tài)物理量和恒定狀態(tài)量。
1) 動(dòng)態(tài)物理量是隨列車(chē)運(yùn)營(yíng)工況而實(shí)時(shí)動(dòng)態(tài)變化的狀態(tài)特征量。對(duì)于部分不可預(yù)知的動(dòng)態(tài)物理量,基于固定線路、固定操作指令、里程、時(shí)速等信息,以時(shí)序平移、前后狀態(tài)繼承、大數(shù)據(jù)預(yù)測(cè)等方式可轉(zhuǎn)換為未來(lái)可預(yù)知的特征值。例如根據(jù)列車(chē)運(yùn)行圖、運(yùn)行速度與里程點(diǎn)位置,列車(chē)經(jīng)過(guò)給定線路某位置的時(shí)刻是可預(yù)知的,結(jié)合天氣預(yù)報(bào)可預(yù)知該時(shí)刻、該位置通過(guò)列車(chē)的室外溫度;結(jié)合購(gòu)票檢票信息通過(guò)旅客及其行李的平均質(zhì)量可以推算出某區(qū)段的列車(chē)載運(yùn)總質(zhì)量;由于給定線路固定里程位置時(shí)接觸網(wǎng)壓比較穩(wěn)定,結(jié)合線路運(yùn)行圖以及前車(chē)通過(guò)某里程點(diǎn)的接觸網(wǎng)壓有效值預(yù)知列車(chē)到達(dá)該里程點(diǎn)的接觸網(wǎng)壓。
2) 緩變/靜態(tài)物理量是某行駛區(qū)間僅發(fā)生緩慢變化或保持不變的列車(chē)運(yùn)行物理特征量。對(duì)于固定線路同一車(chē)型的某車(chē)次列車(chē),其緩變/靜態(tài)物理量是恒定的,如轉(zhuǎn)向架空氣彈簧壓力。
3) 恒定狀態(tài)量是某行駛區(qū)間保持恒定的列車(chē)運(yùn)行狀態(tài)特征量,如軟件版本等。
對(duì)高速列車(chē)牽引變流器的電機(jī)定子溫度故障相關(guān)特征數(shù)據(jù)集,其物理量特征類(lèi)型、特征描述、數(shù)據(jù)來(lái)源與是否可預(yù)知列表如表1所示。
表1 高速列車(chē)牽引變流器電機(jī)定子溫度物理特征數(shù)據(jù)集Table 1 Physical features of high-speed train traction converter motor stator temperature
KFF-LSTM 模型算法步驟分為特征選取、預(yù)知推演、數(shù)據(jù)歸一化、特征權(quán)重分配、模型訓(xùn)練與特征預(yù)測(cè)。引入歷史已知特征與未來(lái)可知特征數(shù)據(jù)的KFF-LSTM模型原理圖如圖3所示。在特征選取階段,產(chǎn)品專(zhuān)家按照數(shù)據(jù)性質(zhì)將數(shù)據(jù)分為定類(lèi)數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)、定比數(shù)據(jù),通過(guò)行業(yè)經(jīng)驗(yàn)及先驗(yàn)知識(shí)進(jìn)行特征值選??;在預(yù)知推演階段,基于全路列車(chē)大數(shù)據(jù)、物理定律、產(chǎn)品特性,推演動(dòng)態(tài)物理量、緩變/靜態(tài)物理量在未來(lái)時(shí)刻的特征值;在數(shù)據(jù)歸一化階段,通過(guò)0均值歸一化方法避免數(shù)值大的特征對(duì)模型訓(xùn)練產(chǎn)生負(fù)面效果;在特征權(quán)重分配階段,依據(jù)模型預(yù)訓(xùn)練結(jié)果調(diào)整特征權(quán)重參數(shù)以獲得更優(yōu)的預(yù)測(cè)效果;在KFF-LSTM 模型訓(xùn)練與特征預(yù)測(cè)階段,通過(guò)引入未來(lái)可預(yù)知特征數(shù)據(jù),提高模型預(yù)測(cè)準(zhǔn)確性、降低時(shí)序偏置(滯后)步數(shù)。
圖3 KFF-LSTM模型原理圖Fig. 3 Schematic diagram of KFF-LSTM model
在KFF-LSTM 預(yù)測(cè)模型中,為生成預(yù)測(cè)值Yt和下一個(gè)時(shí)間片的完整輸入,需計(jì)算隱藏節(jié)點(diǎn)的輸出St。當(dāng)計(jì)算未來(lái)不可預(yù)知特征X(u)(Xt∈X(u))時(shí),沿用原模型表達(dá)式;當(dāng)計(jì)算未來(lái)可預(yù)知特征X(p)(Xt∈X(p))時(shí),由于下一時(shí)刻的特征值是已知的,故不需要記憶單元Ct和隱藏狀態(tài)單元St參與運(yùn)算,輸出Yt的計(jì)算公式如下:
在歷史區(qū)間可預(yù)知特征Xt(p)和不可預(yù)知特征Xt(u)皆為模型輸入,在預(yù)測(cè)區(qū)間可預(yù)知特征Xt(p)仍作為模型輸入并參與權(quán)重矩陣和偏置項(xiàng)計(jì)算。
牽引變流器作為高速列車(chē)電能轉(zhuǎn)換的關(guān)鍵部件,在列車(chē)運(yùn)行過(guò)程中會(huì)產(chǎn)生大幅熱量,而服役過(guò)程中冷卻系統(tǒng)濾網(wǎng)堵塞會(huì)導(dǎo)致變流器過(guò)熱,超溫嚴(yán)重時(shí)引發(fā)燒損等故障,影響列車(chē)正常運(yùn)營(yíng)。針對(duì)高速列車(chē)牽引變流器電機(jī)定子的超溫故障,對(duì)某型21 列車(chē)的239 個(gè)特征采樣點(diǎn)收集了10.4 萬(wàn)個(gè)數(shù)據(jù)樣本,數(shù)據(jù)集樣本包括線路號(hào)、車(chē)次號(hào)、所在車(chē)廂與功能位置等靜態(tài)物理量,閾值超限標(biāo)簽、操作狀態(tài)等緩變物理量,日期時(shí)刻、里程信息、運(yùn)行車(chē)速、定子溫度、冷卻液溫度、室外環(huán)境溫度、電機(jī)轉(zhuǎn)速/功率/電流/電壓等動(dòng)態(tài)物理量。
由于不同車(chē)型的設(shè)備與技術(shù)條件差異,其物理特征的關(guān)聯(lián)影響有所差別;不同線路的列車(chē)運(yùn)行圖與里程地理信息完全不同,無(wú)法從不同線路中獲取有效未來(lái)可預(yù)知信息,因此,對(duì)于不同車(chē)型、不同線路的列車(chē)運(yùn)行數(shù)據(jù)集采用獨(dú)立的模型參數(shù)進(jìn)行訓(xùn)練及預(yù)測(cè)。對(duì)于多源異構(gòu)數(shù)據(jù)集的預(yù)處理如下。
1) 統(tǒng)頻處理。由于各類(lèi)傳感器采樣頻率不統(tǒng)一,將所有特征狀態(tài)數(shù)據(jù)統(tǒng)頻為1/60 Hz(采樣間隔1 min),針對(duì)超統(tǒng)頻的狀態(tài)數(shù)據(jù)采用極值重抽樣降頻,針對(duì)低統(tǒng)頻的狀態(tài)數(shù)據(jù)采用線性插值升頻。
2) 數(shù)據(jù)清洗。對(duì)于整備狀態(tài)列車(chē)無(wú)運(yùn)行速度的數(shù)據(jù)樣本,由于數(shù)據(jù)價(jià)值密度低,不是溫度故障預(yù)測(cè)模型關(guān)注的狀態(tài)數(shù)據(jù),進(jìn)行直接刪除。
3) 數(shù)據(jù)填充。由于運(yùn)營(yíng)現(xiàn)場(chǎng)工況較為復(fù)雜,在數(shù)據(jù)采集、傳輸和轉(zhuǎn)儲(chǔ)過(guò)程中有部分?jǐn)?shù)據(jù)缺失,缺失數(shù)據(jù)用時(shí)域最近的上一個(gè)樣本數(shù)據(jù)填充。
4) 歸一化。牽引變流器電機(jī)定子溫度相關(guān)特征包括溫度、電壓、電流、壓強(qiáng)、質(zhì)量、長(zhǎng)度等物理量,為避免不同物理量單位換算對(duì)模型訓(xùn)練的影響,采用0均值歸一化對(duì)訓(xùn)練驗(yàn)證數(shù)據(jù)集進(jìn)行預(yù)處理使各特征均值為0、方差為1。
式中:Z為歸一化后的特征值;x和xˉ分別為當(dāng)前樣本特征值與數(shù)據(jù)集樣本平均值;N為數(shù)據(jù)集樣本數(shù)量。
5) 特征值選取。根據(jù)行業(yè)專(zhuān)家經(jīng)驗(yàn)和先驗(yàn)知識(shí),并結(jié)合基于數(shù)據(jù)驅(qū)動(dòng)的特征相關(guān)性及貢獻(xiàn)度進(jìn)行特征值選取,區(qū)分該特征是否可預(yù)知。其中,特征貢獻(xiàn)度及特征權(quán)重分配采用SHAP模型[23]分析結(jié)果為依據(jù)進(jìn)行決策,通過(guò)將輸出值歸因到每一個(gè)特征的Shapely 值來(lái)評(píng)價(jià)模型每個(gè)特征對(duì)結(jié)果的貢獻(xiàn)度。經(jīng)各特征對(duì)預(yù)測(cè)結(jié)果的正向、負(fù)向貢獻(xiàn)度分析,特征值貢獻(xiàn)度排序由高至低依次為功率類(lèi)、溫度類(lèi)、狀態(tài)類(lèi)、壓強(qiáng)類(lèi)。
基于牽引變流器電機(jī)定子溫度狀態(tài)特征數(shù)據(jù),將數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,通過(guò)訓(xùn)練集和測(cè)試集分別擬合KFF-LSTM、LSTM、GRU、RNN模型,分別以1 步、4 步、8 步、16 步為跨度進(jìn)行預(yù)測(cè)。選擇平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和R2分?jǐn)?shù)綜合評(píng)價(jià)各模型預(yù)測(cè)準(zhǔn)確度:
式中:E為平均絕對(duì)誤差;ERMS為均方根誤差;R2為R2 分?jǐn)?shù);y、與分別為真實(shí)值、預(yù)測(cè)值與真實(shí)值的平均值。其中,MAE 用于衡量預(yù)測(cè)值與真實(shí)值之間的平均絕對(duì)誤差,越小表示模型越準(zhǔn)確;RMSE用于評(píng)價(jià)回歸模型預(yù)測(cè)結(jié)果與真實(shí)值的偏離程度,其單位與數(shù)據(jù)集一致,RMSE越低表明模型越穩(wěn)定;R2 分?jǐn)?shù)是綜合評(píng)價(jià)回歸模型的指標(biāo),越接近1表示模型綜合評(píng)價(jià)越高。
在滯后性評(píng)價(jià)方面,基于TLCC算法和數(shù)據(jù)集的波峰-波谷特性,通過(guò)逐步移動(dòng)模型預(yù)測(cè)時(shí)間序列,計(jì)算預(yù)測(cè)與真實(shí)時(shí)序數(shù)據(jù)間的相關(guān)性,確定最強(qiáng)相關(guān)性所在的移動(dòng)步數(shù)為滯后步數(shù)。詳細(xì)步驟為:將各模型的預(yù)測(cè)結(jié)果向時(shí)間軸的負(fù)或正方向移動(dòng)i個(gè)時(shí)間步,再將平移后的各模型預(yù)測(cè)數(shù)據(jù)與真實(shí)值進(jìn)行比較,計(jì)算Pearson相關(guān)系數(shù)ρ,
式中,Cov(·)為兩序列協(xié)方差,σy與分別為真實(shí)值與預(yù)測(cè)值的自標(biāo)準(zhǔn)差乘積。
根據(jù)式(9)計(jì)算定位移動(dòng)i步的相關(guān)系數(shù),當(dāng)系數(shù)達(dá)到最大時(shí)定位移動(dòng)步數(shù)i為滯后步,若i<0,則預(yù)測(cè)值超前真實(shí)值i步,反之滯后i步。
通過(guò)KFF-LSTM、LSTM、GRU(深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)時(shí)間序列)與RNN模型分別對(duì)某高速列車(chē)牽引變流器電機(jī)定子溫度數(shù)據(jù)集的前70%數(shù)據(jù)進(jìn)行訓(xùn)練集數(shù)據(jù)預(yù)測(cè),對(duì)后30%數(shù)據(jù)集進(jìn)行測(cè)試集數(shù)據(jù)預(yù)測(cè),模型訓(xùn)練不會(huì)接觸到測(cè)試集中的數(shù)據(jù),實(shí)驗(yàn)結(jié)果如圖4所示,由于訓(xùn)練集中溫度的實(shí)際值參與模型訓(xùn)練,故可以通過(guò)多次迭代使預(yù)測(cè)值與訓(xùn)練值趨于一致,難以考量模型泛化性和在新數(shù)據(jù)集中的效果;測(cè)試集中溫度實(shí)際值不參與模型訓(xùn)練,結(jié)果可以驗(yàn)證模型的泛化性,更具備工程可實(shí)踐性。由圖4可見(jiàn),在訓(xùn)練集部分和測(cè)試集部分,本文方法KFF-LSTM 的預(yù)測(cè)結(jié)果曲線更貼合實(shí)際結(jié)果,即預(yù)測(cè)結(jié)果的準(zhǔn)確度和滯后性都比其他模型的更優(yōu)。
圖4 不同模型超前16步預(yù)測(cè)結(jié)果對(duì)比Fig. 4 Comparison chart of 16-step prediction results among different models
通過(guò)消融實(shí)驗(yàn),分別采用RNN、GRU、LSTM 及KFF-LSTM 模型進(jìn)行超前1 步、4 步、8步、16 步時(shí)序數(shù)據(jù)預(yù)測(cè),在訓(xùn)練集與測(cè)試集中計(jì)算并對(duì)比MAE、RMSE、R2 評(píng)價(jià)指標(biāo),同時(shí)對(duì)比不同預(yù)測(cè)區(qū)間超前步數(shù)下不同方法的偏滯步數(shù)以評(píng)價(jià)不同模型的預(yù)測(cè)及時(shí)性,結(jié)果如表2所示。從表2可見(jiàn):超前1步預(yù)測(cè)預(yù)測(cè)時(shí),本文方法預(yù)測(cè)結(jié)果在預(yù)測(cè)準(zhǔn)確性和及時(shí)性上要優(yōu)于次優(yōu)模型預(yù)測(cè)結(jié)果,但差別不大。隨著預(yù)測(cè)區(qū)間的延展,各模型預(yù)測(cè)準(zhǔn)確性和及時(shí)性的差距開(kāi)始增大,本文方法的預(yù)測(cè)結(jié)果始終優(yōu)于其他模型。
表2 各模型預(yù)測(cè)效果對(duì)比Table 2 Comparison of prediction results among different models
實(shí)驗(yàn)結(jié)果表明:
1) 預(yù)測(cè)準(zhǔn)確度評(píng)價(jià)方面,KFF-LSTM 模型在超前1~16步預(yù)測(cè)的MAE、RMSE均比RNN、GRU和LSTM 方法的低。相對(duì)于其他3 種方法,KFFLSTM 模型訓(xùn)練集的MAE 與RMSE 的最小誤差分別降低了9.4%~42.0%與4.6%~45.6%,KFF-LSTM模型測(cè)試集的MAE 與RMSE 的最小誤差分別降低了3.8%~18.0%與1.7%~10.8%;KFF-LSTM 模型預(yù)測(cè)結(jié)果的R2 分?jǐn)?shù)亦優(yōu)于其他3 種方法的R2 分?jǐn)?shù),在超前16步的訓(xùn)練集與測(cè)試集預(yù)測(cè)結(jié)果的R2分?jǐn)?shù)分別提升了4.3%與26.5%,預(yù)測(cè)的準(zhǔn)確度有較大改善。
2) 預(yù)測(cè)及時(shí)性評(píng)價(jià)方面,隨著預(yù)測(cè)區(qū)間的超前步數(shù)增加,KFF-LSTM 模型的響應(yīng)偏滯要顯著低于其他3種方法的響應(yīng)偏滯。相對(duì)于其他3種方法,KFF-LSTM模型超前4步、8步和16步預(yù)測(cè)的偏滯步數(shù)的最少偏滯步數(shù)分別降低了50%、60%與40%。
綜上可知,相比于其他預(yù)測(cè)模型,KFF-LSTM模型具有更好的數(shù)據(jù)擬合能力,無(wú)論是在訓(xùn)練集還是測(cè)試集的預(yù)測(cè)結(jié)果上均表現(xiàn)出更好的真值逼近與時(shí)間響應(yīng)性能。
1) 面向長(zhǎng)序列時(shí)間預(yù)測(cè)的準(zhǔn)確性及滯后性問(wèn)題,提出了一種KFF-LSTM 模型。該模型將未來(lái)可預(yù)知的特征數(shù)據(jù)引入模型的訓(xùn)練及預(yù)測(cè),對(duì)經(jīng)典LSTM模型架構(gòu)的輸出門(mén)、狀態(tài)更新單元及隱變量進(jìn)行調(diào)整以優(yōu)化預(yù)測(cè)準(zhǔn)確度與響應(yīng)的及時(shí)性。
2) 基于高速列車(chē)牽引變流器的實(shí)際運(yùn)營(yíng)數(shù)據(jù)進(jìn)行了KFF-LSTM、LSTM、RNN 和GRU 模型的變流器電機(jī)定子溫度預(yù)測(cè),通過(guò)消融實(shí)驗(yàn)對(duì)比,KFF-LSTM 模型在MAE、RMSE 與R2 指標(biāo)表征的準(zhǔn)確度和偏滯步數(shù)表征的響應(yīng)及時(shí)性均優(yōu)于其他3種方法的最優(yōu)結(jié)果。
3) 基于未來(lái)可預(yù)知特征的KFF-LSTM 長(zhǎng)時(shí)序數(shù)據(jù)預(yù)測(cè)模型豐富了高速列車(chē)關(guān)鍵裝備的故障診斷與預(yù)警方法,其預(yù)測(cè)結(jié)果可以作為設(shè)備健康度診斷和視情維修計(jì)劃的重要參考,下一步研究工作的重難點(diǎn)是如何將算法延伸應(yīng)用至高速列車(chē)裝備健康度定量分析及模型可解釋性拓展。