呂坦悅,陸小敏,王 健
(1.南通河海大學(xué)海洋與近海工程研究院,江蘇 南通 226300; 2.河海大學(xué)計(jì)算機(jī)與信息學(xué)院,江蘇 南京 210098)
地鐵車輛作為城市軌道交通的核心組成部分,其車輛擁有不同的配置,子系統(tǒng)部件眾多,且來自不同設(shè)備投標(biāo)人的維修工藝復(fù)雜,每輛車在使用全壽命周期中需要經(jīng)歷多個(gè)修程以保證運(yùn)行的可靠性和安全性。目前的軌道交通系統(tǒng)對地鐵主要采取計(jì)劃修和故障修相結(jié)合的方式,同時(shí)在檢修過程中依賴人工經(jīng)驗(yàn)對地鐵的部件進(jìn)行健康評估和保養(yǎng)維修,以此提升地鐵的安全系數(shù)。但是這種基于人工經(jīng)驗(yàn)的計(jì)劃修和故障修難度較大,耗時(shí)較長,成本較高,不利于提高經(jīng)濟(jì)效益。
20世紀(jì)90年代末以來,隨著信息技術(shù)突飛猛進(jìn)的發(fā)展和廣泛應(yīng)用,綜合診斷系統(tǒng)逐漸向監(jiān)控、診斷、預(yù)測和維修一體化的方向發(fā)展。1992年,Khoshgoftaar等人[1]利用自動訓(xùn)練的神經(jīng)網(wǎng)絡(luò)測定系統(tǒng)故障的變化趨勢,實(shí)現(xiàn)對健康狀態(tài)的預(yù)測;2000年,Bunks等人[2]利用隱馬爾科夫知識對直升機(jī)關(guān)鍵部件構(gòu)建模型,實(shí)現(xiàn)故障和剩余壽命的預(yù)測;2006年,Pérez-Miana等人[3]首次在狀態(tài)預(yù)測中引入貝葉斯網(wǎng)絡(luò)方法。
在上述基礎(chǔ)上,人們又利用決策樹和層次分析法對一些特定物體和現(xiàn)象進(jìn)行了預(yù)測。徐旭冉等人[4]通過決策樹算法以及大規(guī)模的訓(xùn)練數(shù)據(jù)集建立空氣質(zhì)量預(yù)測模型,其收斂速度快、精度高。司巧梅[5]提出了基于決策樹的農(nóng)業(yè)氣象災(zāi)害等級預(yù)測模型,采用決策樹C4.5分類算法,建立了農(nóng)業(yè)氣象災(zāi)害等級決策樹預(yù)測模型。馮文婧等人[6]利用層次分析法提出了航天器健康評估體系分級構(gòu)建思想,實(shí)現(xiàn)各故障模式對航天器系統(tǒng)、單機(jī)設(shè)備影響的量化和分析。蔡文嘉等人[7]采用層次分析法,選擇特征量指標(biāo),依據(jù)專家意見,構(gòu)造指標(biāo)判斷矩陣,通過計(jì)算變換將智能電能表的供貨優(yōu)先級形成評價(jià)性指標(biāo)。但這些方法只是從單方面解決問題,其魯棒性較差。
本文將同時(shí)采用決策樹[8-11]和層次分析法[12-16]對地鐵車輛整體進(jìn)行健康評估,提出利用神經(jīng)網(wǎng)絡(luò)蒸餾的軟決策樹定性地判斷地鐵車輛是否為健康狀態(tài),利用層次分析法通過專家打分和權(quán)重計(jì)算定量地評估地鐵車輛健康狀態(tài)的具體分?jǐn)?shù),從定性、定量2個(gè)角度實(shí)現(xiàn)對地鐵車輛健康狀態(tài)的宏觀評估與把控,為后期調(diào)整與制定地鐵檢修計(jì)劃做準(zhǔn)備,同時(shí)有利于地鐵檢修方式從計(jì)劃修向狀態(tài)修的轉(zhuǎn)變。
神經(jīng)網(wǎng)絡(luò)已被證明是執(zhí)行分類任務(wù)中一種非常有效的方法。當(dāng)輸入是高維數(shù)據(jù)、輸入與輸出間關(guān)系復(fù)雜,且有大量標(biāo)注訓(xùn)練樣本時(shí),神經(jīng)網(wǎng)絡(luò)的性能極其優(yōu)異。所以本文采用Frosst和Hinton[17]提出的使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)創(chuàng)建一種軟決策樹的方法。
該算法步驟為:將地鐵的部件系統(tǒng)包括PIS系統(tǒng)、轉(zhuǎn)向架系統(tǒng)、制動系統(tǒng)、車體系統(tǒng)、牽引系統(tǒng)、車門系統(tǒng)、車鉤系統(tǒng)、內(nèi)裝系統(tǒng)、空調(diào)系統(tǒng)、火警報(bào)災(zāi)系統(tǒng)、照明系統(tǒng)的健康分?jǐn)?shù),構(gòu)成向量x={x1,x2,…,xL},作為模型的輸入向量來訓(xùn)練網(wǎng)絡(luò)模型,可得到地鐵為健康或非健康的概率,公式為:
pi(x)=σ(xwi+bi)
(1)
其中,wi和bi分別為每個(gè)內(nèi)部節(jié)點(diǎn)i的權(quán)重和偏置,σ為sigmoid激活函數(shù),則每一個(gè)內(nèi)部節(jié)點(diǎn)i選擇左邊分支的概率為:1-pi(x)。因此,可以得到一個(gè)簡單的、靜態(tài)的關(guān)于地鐵狀態(tài)為健康或是非健康的輸出類k的分布,公式為:
(2)
其中,Ql表示在第l葉子節(jié)點(diǎn)的概率分布,αl表示第l葉子節(jié)點(diǎn)的學(xué)習(xí)參數(shù)。其包含內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)的具體軟決策樹簡單案例如圖1所示。
圖1 具有單個(gè)內(nèi)部節(jié)點(diǎn)和2個(gè)葉子節(jié)點(diǎn)的軟二元決策樹示意圖
本文采用交叉熵?fù)p失函數(shù)訓(xùn)練網(wǎng)絡(luò)模型,如式(3):
(3)
其中,pl(x)為根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑概率和,T為地鐵健康狀態(tài)的實(shí)際值,Ql為網(wǎng)絡(luò)模型的實(shí)際輸出值。最后,通過誤差進(jìn)行反向傳播,不斷優(yōu)化網(wǎng)絡(luò)模型。
本文使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)構(gòu)建一種軟決策樹(Soft Decision Tree)的方法,這種決策樹相比從訓(xùn)練數(shù)據(jù)中直接學(xué)習(xí)的網(wǎng)絡(luò)能夠更好地泛化。
地鐵車輛是一個(gè)復(fù)雜的機(jī)電一體化設(shè)備,其包含的子系統(tǒng)子部件眾多,為了構(gòu)建真實(shí)反應(yīng)地鐵車輛情況的層次分析模型,本文從評價(jià)指標(biāo)的完整性、獨(dú)立性、真實(shí)性入手,將地鐵車輛劃分成11個(gè)部件系統(tǒng):PIS系統(tǒng)、轉(zhuǎn)向架系統(tǒng)、制動系統(tǒng)、車體系統(tǒng)、牽引系統(tǒng)、車門系統(tǒng)、車鉤系統(tǒng)、內(nèi)裝系統(tǒng)、空調(diào)系統(tǒng)、火警報(bào)災(zāi)系統(tǒng)、照明系統(tǒng)??紤]到部分子部件數(shù)據(jù)無法收集的情況,本文沒有將層次分析模型構(gòu)建到第三層子部件,但其方法思路和兩層模型一致,下文將以地鐵-子系統(tǒng)兩層分析模型為例,進(jìn)行地鐵車輛整體情況健康狀態(tài)評價(jià)的研究。具體的地鐵車輛層次分析模型的樣式如圖2所示。
圖2 地鐵車輛層次分析模型圖
在對地鐵車輛整體情況健康評估的過程中,層次分析法依托人工經(jīng)驗(yàn),仔細(xì)分析地鐵車輛層次模型,考慮各層因素內(nèi)部之間的影響以及上下層因素的聯(lián)系,對指標(biāo)之間的重要程度設(shè)置相應(yīng)的數(shù)值,然后以此計(jì)算各指標(biāo)影響地鐵車輛整體健康狀態(tài)的權(quán)重值。
1)評估指標(biāo)專家打分。
對于地鐵車輛評估指標(biāo)[18-20]的打分,本文主要是邀請多名地鐵檢修經(jīng)驗(yàn)豐富的老員工和地鐵制造商的技術(shù)專家,由他們共同商量決議各指標(biāo)的分?jǐn)?shù),避免由一名工作人員打分的個(gè)人主觀性和考慮全面性的問題;通過將評估指標(biāo)兩兩對比,減少評分人員主觀模糊不清的情況,使評分結(jié)果更可靠、更準(zhǔn)確。由多位專家商量決議的評估指標(biāo)打分表如表1所示。
表1 評估指標(biāo)打分表
PIS轉(zhuǎn)向架制動車體牽引車門車鉤內(nèi)裝空調(diào)火警照明PIS11/71/711/511/3111/31轉(zhuǎn)向架71175757537制動71175737537車體11/71/711/511/3111/31牽引51/51/551535535車門11/71/711/511/3111/31車鉤31/41/331/3313311內(nèi)裝11/71/711/511/3111/31空調(diào)11/51/511/511/3111/31火警31/31/331/3313313照明11/71/711/511111/31
2)特征根和權(quán)重向量的計(jì)算。
(4)
3)權(quán)重一致性檢驗(yàn)。
對于判斷矩陣的各個(gè)評估指標(biāo)因素,需要計(jì)算其一致性指標(biāo),防止出現(xiàn)矛盾的現(xiàn)象,保證計(jì)算出的權(quán)重結(jié)果能夠進(jìn)行地鐵車輛的健康狀態(tài)評估。根據(jù)公式(4)計(jì)算公式(5):
(5)
其中,CI為一致性指標(biāo),RI為平均隨機(jī)一致性指數(shù)。根據(jù)得到的結(jié)果,可以看出其檢驗(yàn)結(jié)果基本符合一致性條件,所以按照“和法”計(jì)算出的評估指標(biāo)權(quán)重[23-24]可以用于后期地鐵車輛整體情況的健康狀態(tài)評估。
地鐵檢修工作人員在日常檢修中依據(jù)軌道交通集團(tuán)有限公司運(yùn)營分公司標(biāo)準(zhǔn)化委員會制定的電客車均衡修作業(yè)指導(dǎo)書進(jìn)行子系統(tǒng)部件情況記錄,其主要結(jié)果包含:健康與非健康。健康即地鐵的部件系統(tǒng)運(yùn)行正常,功能良好,不會導(dǎo)致地鐵車輛的故障;非健康意味著部件系統(tǒng)存在一些問題,需要展開相應(yīng)的維修,但此非健康情況不一定會造成地鐵停運(yùn),不需要展開緊急維修。例如內(nèi)裝系統(tǒng)中的某個(gè)座椅某個(gè)扶手出現(xiàn)損壞,并不影響地鐵車輛的正常運(yùn)行,只需要在庫內(nèi)維修中進(jìn)行部件更換,提升乘客乘坐地鐵的舒適度,但是牽引系統(tǒng)中的牽引電機(jī)出現(xiàn)問題,則地鐵車輛必須立即停運(yùn),展開故障維修。地鐵車輛部件系統(tǒng)具體的評語情況如表2所示。
表2 部件系統(tǒng)評語表
整體情況情況描述得分范圍健康運(yùn)行正常、功能良好[70,100]非健康出現(xiàn)問題、需要維修[40,70)報(bào)廢問題嚴(yán)重,需換新[0,40)
實(shí)驗(yàn)數(shù)據(jù)來自于地鐵運(yùn)營分公司的檢修數(shù)據(jù)和實(shí)際運(yùn)營數(shù)據(jù),本文對地鐵車輛部件系統(tǒng)的健康狀況和地鐵車輛實(shí)際運(yùn)營情況進(jìn)行整理;然后將11個(gè)部件系統(tǒng)的數(shù)據(jù),即PIS系統(tǒng)、轉(zhuǎn)向架系統(tǒng)、制動系統(tǒng)、車體系統(tǒng)、牽引系統(tǒng)、車門系統(tǒng)、車鉤系統(tǒng)、內(nèi)裝系統(tǒng)、空調(diào)系統(tǒng)、火警報(bào)災(zāi)系統(tǒng)、照明系統(tǒng),輸入到上文已經(jīng)建立好的決策樹模型和層次分析法模型,從定性和定量2個(gè)角度對地鐵車輛進(jìn)行健康狀態(tài)評估。定性主要包括健康和非健康2種情況,此處健康與非健康判斷標(biāo)準(zhǔn)是根據(jù)地鐵車輛當(dāng)天實(shí)際運(yùn)營中有無出現(xiàn)緊急故障,造成停運(yùn)維修的情況,如果在地鐵車輛運(yùn)行的過程中,發(fā)現(xiàn)一些小問題,例如某個(gè)車廂內(nèi)的顯示器出現(xiàn)損壞,并沒有影響地鐵車輛實(shí)際運(yùn)行,本文將這種情況定義為地鐵處于健康狀態(tài);定量是根據(jù)檢修工作人員和地鐵設(shè)備制造商專家對子部件互相重要程度的打分,計(jì)算出影響地鐵車輛健康狀態(tài)的子系統(tǒng)權(quán)重值,然后以此計(jì)算出地鐵車輛的健康狀態(tài)分?jǐn)?shù)值。其相應(yīng)的流程圖見圖3。
圖3 本文算法流程圖
1)定性分析。
本文進(jìn)行了軟決策樹模型的實(shí)驗(yàn),定性地判斷地鐵車輛是健康還是非健康,實(shí)驗(yàn)中使用數(shù)據(jù)量為1000的數(shù)據(jù)集,其中訓(xùn)練集為800,測試集為200。具體的準(zhǔn)確率的實(shí)驗(yàn)結(jié)果如表3所示。
表3 各算法實(shí)驗(yàn)結(jié)果比較
模型準(zhǔn)確率/%神經(jīng)網(wǎng)絡(luò)模型93.37決策樹模型95.48軟決策樹模型97
通過實(shí)驗(yàn),結(jié)合地鐵車輛檢修領(lǐng)域的業(yè)務(wù)知識,對于目前出現(xiàn)的實(shí)驗(yàn)結(jié)果可以看出,軟決策樹判斷效果比神經(jīng)網(wǎng)絡(luò)和決策樹都好,且準(zhǔn)確率較高。
但地鐵車輛是一個(gè)復(fù)雜的機(jī)電一體化設(shè)備,每天部件系統(tǒng)都可能發(fā)生各種各樣的新情況,之前的訓(xùn)練集庫里可能會缺失某種情況,因此訓(xùn)練集需要保持不斷更新。另外地鐵各系統(tǒng)是一個(gè)復(fù)雜的部件集合體,某個(gè)關(guān)鍵部件出現(xiàn)損壞可能會導(dǎo)致地鐵車輛停運(yùn)檢修,或某個(gè)損壞部件是重要組件但并不影響地鐵車輛運(yùn)行。正是這種情況與原因,造成部件系統(tǒng)健康狀態(tài)的復(fù)雜性,以及對地鐵車輛整體健康狀態(tài)影響的多樣性,所以接下來還需要對地鐵進(jìn)行定量分析。
2)定量分析。
在地鐵車輛整體情況的健康評估過程中,上文已經(jīng)使用決策樹模型定性地對地鐵車輛健康狀態(tài)進(jìn)行評估,但是僅僅知道地鐵是否健康是不夠的,還需關(guān)注地鐵車輛的健康程度,便于后期地鐵保養(yǎng)與檢修計(jì)劃的制定,因此本文使用層次分析法定量分析地鐵車輛的健康狀態(tài)程度,下面針對表4所示的實(shí)際案例進(jìn)行分析。
表4 地鐵及各子系統(tǒng)健康狀況表
PIS轉(zhuǎn)向架制動車體牽引車門健康健康健康健康健康健康車鉤內(nèi)裝空調(diào)火警照明實(shí)際地鐵健康非健康健康健康健康健康
表4反映地鐵及各子系統(tǒng)實(shí)際健康情況,根據(jù)層次分析法的評語設(shè)定,轉(zhuǎn)換成對應(yīng)的分?jǐn)?shù),見表5。
表5 地鐵各子系統(tǒng)健康分?jǐn)?shù)表
PIS轉(zhuǎn)向架制動車體牽引車門858585858585車鉤內(nèi)裝空調(diào)火警照明實(shí)際地鐵855585858584.0377
按照層次分析法求出的權(quán)值w和其對應(yīng)的分?jǐn)?shù)g為:w=[0.0310, 0.2557, 0.2368, 0.0310, 0.1475, 0.0310, 0.0771, 0.0310, 0.03690, 0.08670, 0.03492];g=[85, 85, 85, 85, 85, 85, 85, 55, 85, 85, 85],然后求出地鐵車輛的健康狀態(tài)分?jǐn)?shù)為:
Z=w·g=84.0377>75
(6)
其中,w為各子系統(tǒng)的權(quán)重值,g為對應(yīng)系統(tǒng)健康狀態(tài)分?jǐn)?shù),Z為地鐵車輛整體的健康狀態(tài)分?jǐn)?shù),實(shí)際計(jì)算得到地鐵健康狀態(tài)分?jǐn)?shù)為84.0377,大于75分,所以地鐵車輛處于健康狀態(tài),且健康程度為84。當(dāng)層次分析法的量化分?jǐn)?shù)所屬健康狀態(tài)類別與決策樹的定性判斷結(jié)果不同時(shí),以決策樹的定性判斷結(jié)果為準(zhǔn),因?yàn)闆Q策樹模型的訓(xùn)練依托大量實(shí)際數(shù)據(jù),而層次分析法依靠專家經(jīng)驗(yàn),從整體的角度出發(fā),以決策樹模型的定性判斷結(jié)果為準(zhǔn)更加可靠,而量化的分?jǐn)?shù)為該健康狀態(tài)類別分?jǐn)?shù)區(qū)間的最低分。
本文首先分別介紹決策樹和層次分析法算法的研究現(xiàn)狀;然后根據(jù)子系統(tǒng)和地鐵車輛健康狀態(tài)數(shù)據(jù)集構(gòu)建軟決策樹,用測試數(shù)據(jù)集驗(yàn)證2種決策樹模型對地鐵車輛健康狀態(tài)評估的準(zhǔn)確率,并根據(jù)實(shí)驗(yàn)結(jié)果即評估準(zhǔn)確率的趨勢和差異做出總結(jié)分析,實(shí)現(xiàn)對地鐵車輛健康狀態(tài)的定性判斷;其次依托實(shí)際業(yè)務(wù)領(lǐng)域建立層次分析模型,通過專家經(jīng)驗(yàn)值計(jì)算出各評估指標(biāo)權(quán)重值,同時(shí)設(shè)置好相應(yīng)的評語集和分?jǐn)?shù),依據(jù)各子系統(tǒng)的健康狀態(tài)定量求出地鐵車輛整體的健康狀態(tài)分?jǐn)?shù),從而實(shí)現(xiàn)對地鐵車輛定性、定量的健康狀態(tài)評估,有利于地鐵車輛檢修方式從計(jì)劃修到狀態(tài)修的轉(zhuǎn)變。