牛 儒,宋晗煒
(北京交通大學(xué) a.軌道交通控制與安全國家重點實驗室,b.電子信息工程學(xué)院,北京 100044)
城市軌道交通信號系統(tǒng)中,計軸是檢查、判斷軌道區(qū)段的列車占用與出清的重要設(shè)備[1].由于其安裝調(diào)試方便,不受軌面污染、隧道潮濕等環(huán)境因素影響,因此很快替代傳統(tǒng)的軌道電路廣泛應(yīng)用于CBTC系統(tǒng)以及FAO系統(tǒng)中.計軸設(shè)備故障時,聯(lián)鎖系統(tǒng)無法獲取正確的進路占用信息,出現(xiàn)“異常占用”現(xiàn)象.一般情況下,需要人工確認進路空閑、復(fù)位等一系列操作才能放行列車,造成不必要的延誤.此時如果疊加列控系統(tǒng)的其他故障(前次列車是非通信列車或待通過列車是非通信列車),則需要列車以目視模式清掃故障區(qū)段或引導(dǎo)接車,極易造成5分以上晚點,甚至交通癱瘓.而且,上述故障處置需要人工替代設(shè)備完成安全關(guān)鍵的進路占用檢查工作,引入人誤風險,增加系統(tǒng)安全隱患.因此,計軸設(shè)備的可靠工作對于高密度、小間隔的城市軌道交通的安全、高效運營至關(guān)重要.
然而,目前我國多條城軌線路故障數(shù)據(jù)顯示計軸設(shè)備故障在信號設(shè)備故障中的占比居高不下.據(jù)統(tǒng)計,南京地鐵反復(fù)出現(xiàn)計軸紫光帶,板件死機等問題,其故障占整體軌旁故障的53%.廣州、北京等地的城市軌道交通中也出現(xiàn)了類似問題.計軸故障頻發(fā)已經(jīng)成為影響信號系統(tǒng)可用性,造成運營延誤的重要問題.可見,分析計軸設(shè)備在真實工況下的故障原因,提升計軸設(shè)備可靠性是城軌信號系統(tǒng)亟待解決的問題.
可靠性分析主要包括機理模型方法和統(tǒng)計模型方法[2].機理模型方法是通過失效機理分析,來證明該失效設(shè)備的失效致因符合某種失效分布的物理背景[3].文獻[4]根據(jù)對絕緣柵雙極性型晶體管失效機理的分析結(jié)果,構(gòu)建了壽命預(yù)測模型.文獻[5]分析了結(jié)構(gòu)系統(tǒng)在靜載和疲勞載荷作用下的失效機理以及各失效模式之間的相關(guān)性,給出了在靜載和疲勞載荷作用下結(jié)構(gòu)系統(tǒng)的可靠性分析方法.文獻[6]采用故障模式及影響分析(FMEA)法,將以可靠性為中心的維修理論應(yīng)用到計軸設(shè)備維修中,確定合理的維修方式.然而,設(shè)備失效機理復(fù)雜,而且設(shè)備運行條件千差萬別、故障致因分析難以全面,真實失效分布可能與理論模型存在較大差異.統(tǒng)計模型方法是基于壽命統(tǒng)計數(shù)據(jù)的概率分布,并利用假設(shè)檢驗方法檢驗結(jié)果的可用性.文獻[7]運用統(tǒng)計分析方法對地鐵關(guān)鍵系統(tǒng)進行了可靠性分析.文獻[8]提出了一種基于極大似然法對電器產(chǎn)品的壽命失效數(shù)據(jù)進行可靠性分析.文獻[9]構(gòu)建了計軸檢測盒的可靠性框架,定量地對其進行可靠性分析.但是,此類方法的有效性依賴于統(tǒng)計數(shù)據(jù)的質(zhì)量.如果存在統(tǒng)計時間過短、數(shù)據(jù)不足或噪聲過大等問題,可能無法擬合出有效的概率分布[10].
因此,本文作者提出了一種機理模型輔助的現(xiàn)場數(shù)據(jù)統(tǒng)計模型分析方法,根據(jù)機理分析結(jié)果篩選失效分布類型,運用統(tǒng)計模型思路估計分布參數(shù),檢驗擬合優(yōu)度選擇最佳失效分布.首先對計軸的故障模式和故障機理進行分析,論證計軸設(shè)備失效可以看作隨機事件、存在統(tǒng)計規(guī)律.然后,對杭州某地鐵線路的計軸故障數(shù)據(jù)進行可靠性分析,得到最佳失效分布,并通過實際統(tǒng)計特征與預(yù)計統(tǒng)計特征的差異推斷計軸系統(tǒng)的故障原因,提出維護和設(shè)計改進建議.
計軸系統(tǒng)集傳感器,通信傳輸,故障-安全計算機等技術(shù)為一體,如圖1所示.室外部分完成對信息的感應(yīng)和采集傳輸處理;室內(nèi)部分完成軸數(shù)計算及所檢測區(qū)段的空閑與占用判別,輸出處理等.
列車從檢測區(qū)間的一端出發(fā)進入?yún)^(qū)間經(jīng)過計軸點時,運算單元對傳感器產(chǎn)生的軸信號進行處理、判別及計數(shù),軌道繼電器落下.發(fā)車端將“駛?cè)霠顟B(tài)”及“計軸數(shù)”等信息進行編碼并不斷發(fā)送給接車端.當列車駛出區(qū)間經(jīng)過接車端計軸點時,接車端對傳感器產(chǎn)生的軸信號進行處理、判別及計數(shù),接車端將“計軸數(shù)”及“駛出狀態(tài)”等信息進行編碼傳給發(fā)車端.兩端對“計軸數(shù)”及“駛?cè)搿Ⅰ偝鰻顟B(tài)”信息校核無誤后兩端軌道繼電器吸起,給出檢測區(qū)間的空閑信號.
據(jù)現(xiàn)場調(diào)研和數(shù)據(jù)分析,計軸不同組件的部分失效機理如表1所示.
表1 計軸部分失效機理
從表1中可看出計軸設(shè)備的失效機理大部分為老化、磨損等,屬于隨機失效.因為這些原因的隨機特性,硬件在何時發(fā)生隨機性失效是無法預(yù)測的,但遵循概率分布,可通過可靠性或者分析得到失效率;當然,也有一些是由人為失誤或外單位施工引起的磁頭受擾,軟件設(shè)計引起的失效,以及雷擊干擾等環(huán)境因素引起的計軸受擾,屬于系統(tǒng)性失效,不能用概率來描述系統(tǒng)故障.本文只討論隨機性失效,采用統(tǒng)計模型方法進行可靠性分析.
在失效機理分析的基礎(chǔ)上,篩選出幾種典型故障分布模型作為基本假設(shè)統(tǒng)計模型.同時對現(xiàn)場失效數(shù)據(jù)進行預(yù)處理.然后對預(yù)處理的數(shù)據(jù)進行參數(shù)估計,通過A-D和K-S擬合優(yōu)度檢驗準則確定計軸的最佳分布模型.可靠性評估流程如圖2所示.
結(jié)合常用壽命分布的應(yīng)用范圍[11],可知計軸系統(tǒng)組件相應(yīng)的壽命分布類型.磁頭受擾等由突發(fā)事件引起的失效,與工作時間的長短無關(guān),適合指數(shù)分布.設(shè)備磨損或性能衰減,一般符合正態(tài)分布.半導(dǎo)體器件產(chǎn)生的疲勞,比如計軸主機內(nèi)部元器件產(chǎn)生的疲勞,可能為對數(shù)正態(tài)分布或威布爾分布.若產(chǎn)品某一薄弱環(huán)節(jié)出現(xiàn)故障而導(dǎo)致整個產(chǎn)品失效,例如計軸傳輸通道中電纜的老化,則可能為威布爾分布.因此,可以將指數(shù)分布、正態(tài)分布、對數(shù)正態(tài)分布、威布爾分布作為假設(shè)的失效分布模型.
為了提高分布擬合的準確性,首先需要對原始故障記錄從準確性和有效性兩方面進行預(yù)處理,完成數(shù)據(jù)審核、篩選、轉(zhuǎn)化等工作.
由于目前城軌計軸故障記錄大部分是人工記錄,數(shù)據(jù)審核過程需要檢查記錄是否缺少關(guān)鍵信息(完整性)、是否存在重復(fù)多余的記錄(重復(fù)性)、是否存在筆誤(一致性).除了常規(guī)審核之外,還需要識別并剔除系統(tǒng)性故障(或稱為非隨機性故障).根據(jù)現(xiàn)場調(diào)研,導(dǎo)致計軸設(shè)備故障的系統(tǒng)性原因包括由外專業(yè)施工引起的故障,如工務(wù)小推車過計軸區(qū)段導(dǎo)致計軸磁頭受擾;環(huán)境引起的故障,比如雷擊干擾計軸磁頭;軟件故障,計軸終端工控機不能自動清理歷史計軸存儲信息等.
之后,對篩選后的數(shù)據(jù)進行轉(zhuǎn)換.對于計軸這個可修復(fù)系統(tǒng),壽命是指兩次相鄰故障之間的工作時間,即無故障工作時間.因此,將故障記錄中的故障時間點信息轉(zhuǎn)換為故障間隔時間,得到計軸的壽命數(shù)據(jù).
常見的參數(shù)估計方法有極大似然估計法、最小二乘法、貝葉斯估計等.
由于貝葉斯的參數(shù)估計需要先驗知識,即將參數(shù)視為某種已知先驗分布的隨機變量,先驗分布需要根據(jù)歷史資料和經(jīng)驗信息等確定.在對計軸的可靠性分析中沒有參數(shù)的先驗知識可用,需要對其進行經(jīng)典統(tǒng)計學(xué)的分析;最小二乘法是使估計值和觀測值之差的平方和最小,能夠最好地擬合樣本數(shù)據(jù),主要用來估計線性函數(shù)的未知參數(shù);極大似然估計是從模型中抽取該n組樣本觀測值的概率最大,即概率分布函數(shù)或似然函數(shù)最大.最大似然原理比最小二乘原理更本質(zhì)地揭示了通過樣本估計總體的內(nèi)在機理.因此本文采用極大似然法進行參數(shù)估計.
(1)
分布檢驗是通過統(tǒng)計數(shù)據(jù),推斷壽命是否服從上文初步整理分析所選定的分布,推斷的依據(jù)是擬合優(yōu)度檢驗.擬合優(yōu)度是壽命數(shù)據(jù)的分布與選定的理論分布之間符合程度的度量.其基本原理是根據(jù)樣本對總體某項或某幾項作出假設(shè),并對該假設(shè)作出接受或拒絕的判斷.本文對上述計軸壽命數(shù)據(jù)假定的四種分布類型進行檢驗,找到最佳分布模型.
常用的檢驗方法有K-S(Kolmogorov-Smirnov)檢驗和A-D (Anderson-darling)檢驗.
K-S檢驗?zāi)苤苯訉υ紨?shù)據(jù)進行檢驗,對數(shù)據(jù)的利用比較完整.K-S基本思想是將樣本觀測值的累計頻率與假設(shè)的理論頻率相比建立統(tǒng)計量.假設(shè)檢驗問題H0:樣本所在的總體分布服從原假設(shè),F(xiàn)n(x)為其經(jīng)驗分布函數(shù),提出檢驗假設(shè)的統(tǒng)計量為Dn=sup|Fn(x)-F0(x)|,根據(jù)樣本觀測值計算統(tǒng)計量D的觀測值d,對于給定的顯著性水平α和樣本量n,得到臨界值dn,α,當D≤dn,α?xí)r,接受假設(shè)H0;否則拒絕假設(shè)H0.
A-D檢驗的原理是將所收集的數(shù)據(jù)從小到大排列,得出經(jīng)驗累積分布并與目標分布的理論累積分布進行比較,得出A-D統(tǒng)計量,統(tǒng)計量越小,分布類型越擬合.A-D統(tǒng)計量的具體表達式為
(2)
采用Minitab,除了能計算出A-D檢驗的統(tǒng)計量之外,還可以計算出最小二乘法的Pearson相關(guān)系數(shù).P相關(guān)系數(shù)是x和y之間線性相關(guān)關(guān)系強度的度量
(3)
相關(guān)系數(shù)γ取值在-1和1之間,γ的值越大(越接近于1)說明分布擬合得越好.
在確定模型的分布類型后,即可確定計軸的分布函數(shù)、分布密度函數(shù)和失效率等參數(shù),進而對其可靠性進行評估.
可靠性特征量是用來評價設(shè)備可靠性的高低,是各種可靠性數(shù)量指標的總稱.常用的可靠性指標包括可靠度、失效率、平均壽命和特征壽命.
失效率是描述產(chǎn)品可靠性規(guī)律的指標之一.失效率λ(t)與分布密度f(t)、分布函數(shù)F(t)以及可靠度R(t)的關(guān)系為
(4)
失效率函數(shù)與失效分布函數(shù)一樣能夠全面描述計軸壽命T的統(tǒng)計規(guī)律,它們之間是彼此相通的,只是各自強調(diào)的側(cè)面不同.
對于可修復(fù)產(chǎn)品,平均壽命是指平均故障間隔時間(Mean Time between Failures, MTBF).
R(t)表示了產(chǎn)品在t時刻,能正常工作的概率值.但有時要知道為保證產(chǎn)品正常工作的概率要保持在某一水平R之上,產(chǎn)品可以工作的時間,即根據(jù)P{T>t}=R(t)=R,計算相應(yīng)的時間t,該時間稱為可靠壽命tR.可靠度R=e-1=0.368的可靠壽命稱為特征壽命.
以寧波地鐵某條線路中的計軸設(shè)備的故障統(tǒng)計報表為基礎(chǔ)數(shù)據(jù).該條線路開通于2015年,全長28.35 km,其中地下線22.23 km、高架線5.77 km.正線雙方向共布置計軸一百余個.
首先對計軸故障統(tǒng)計數(shù)據(jù)進行篩選,去除非隨機性故障以及明顯不合理、錯誤的數(shù)據(jù).而后,統(tǒng)計計軸的壽命.這里把計軸看成可修復(fù)設(shè)備,該線路的壽命數(shù)據(jù)是在線路運行過程中,兩次故障發(fā)生的時間數(shù)據(jù).由于隨機性失效數(shù)據(jù)中包括不同計軸設(shè)備的故障數(shù)據(jù),因此屬于不同計軸的失效時間間隔需要從起始計數(shù).得到的故障起始和故障間隔時間,如表2所示.
表2 計軸故障時間數(shù)據(jù)
將上述統(tǒng)計得到的壽命數(shù)據(jù)t按照從小到大的順序排列為t1≤t2≤…≤tn.由于失效分布函數(shù)未知,采用經(jīng)驗分布函數(shù)Fn(t)代替總體分布函數(shù)F.采用近似中位秩計算經(jīng)驗分布函數(shù).近似中位秩公式為
(5)
式中:i表示其排列的順序號;n表示故障數(shù)量.表3為其對應(yīng)的經(jīng)驗分布函數(shù)值.
表3 計軸故障時間與經(jīng)驗分布函數(shù)值
對計軸進行可靠性定量分析,需要首先給出計軸壽命分布的參數(shù)估計,進而回答計軸的可靠性指標.參數(shù)估計包括點估計和區(qū)間估計.
采用極大似然估計法對基于失效機理分析篩選得到的4種假設(shè)分布進行參數(shù)估計.結(jié)果如下:
正態(tài)分布的均值為μ=445.9,區(qū)間估計為[284.1690,607.6310];方差為σ=345.568 3,區(qū)間估計為[262.8014,504.7273].
指數(shù)分布的λ=445.9,區(qū)間估計為[300.5643,729.9951].
對數(shù)正態(tài)分布的對數(shù)均值μ=5.745 1,區(qū)間估計為[5.3046,6.1855];對數(shù)標準差σ=0.917 3,區(qū)間估計為[0.6728,1.2505].
威布爾分布的形狀參數(shù)為m=1.315 8,區(qū)間估計為[0.9279,1.8658];尺度參數(shù)η=484.685 4,區(qū)間估計為[341.0386,688.8368].
由于并不明確K-S和A-D兩種方法對計軸壽命數(shù)據(jù)分布的檢驗效果,因此采用兩種方法分別對數(shù)據(jù)進行檢驗,判斷計軸的最佳壽命分布模型.
3.3.1K-S檢驗結(jié)果
用Matlab對4種分布進行檢驗.K-S假設(shè)檢驗的命令為:[H,s,ksstat,cv] =kstest(data,cdf).H為0接受原假設(shè),H為1拒絕原假設(shè);s為原假設(shè)成立的概率;ksstat為測試統(tǒng)計量的值;CV為是否接受假設(shè)的臨界值.分析結(jié)果如表4所示.
表4 四種分布的K-S檢驗結(jié)果
可見,4種分布均可滿足K-S檢驗.除了正態(tài)分布的假設(shè)成立概率相對較低外,其他3種分布的成立概率接近.可見,對于實驗數(shù)據(jù)而言,K-S檢驗的分辨度無法滿足要求.
3.3.2 A-D檢驗結(jié)果
在Minitab軟件的基礎(chǔ)上完成A-D擬合度檢驗.A-D檢驗中的經(jīng)驗分布函數(shù)也是根據(jù)近似中位秩計算得到,如表4所示.
利用A-D檢驗法對數(shù)據(jù)進行檢驗,給出4種分布的概率圖,如圖3所示.它不是一種嚴格意義上的檢驗方法,且需要和其他檢驗方法聯(lián)合使用[3].根據(jù)變量的累積概率對應(yīng)于所指定的理論分布累積概率繪制的散點圖,用于直觀地檢測樣本數(shù)據(jù)是否符合某一概率分布.這些數(shù)據(jù)點若很好地分散在線性擬合直線的附近,則它對樣本數(shù)據(jù)服從某種分布提供了粗略的支持.從圖3可看出,對數(shù)正態(tài)分布和威布爾分布的線性擬合效果較好.
對于極大似然分布,A-D值越小分布類型越吻合;對于最小二乘法,相關(guān)系數(shù)越接近于1,分布類型越吻合.4種分布擬合結(jié)果的A-D值和相關(guān)系數(shù)如表5所示.威布爾分布和對數(shù)正態(tài)分布的A-D檢驗值和相關(guān)系數(shù)明顯優(yōu)于另外兩種,且威布爾分布的A-D值最小,相關(guān)系數(shù)最接近于1.
表5 計軸壽命分布擬合優(yōu)度
由表5可以看出威布爾分布與對數(shù)正態(tài)分布的假設(shè)檢驗結(jié)果相差不大,造成這一現(xiàn)象的原因包括兩個方面:1)威布爾分布與對數(shù)正態(tài)分布在特定時間區(qū)域內(nèi)允許有極為相似的概率密度;2)我國近幾年才開始重視故障記錄,有完整記錄的線路運營時間有限.隨著設(shè)備使用時間的增長、數(shù)據(jù)的豐富,該方法必然能夠得到更加準確的結(jié)果,對運營和設(shè)計決策給出更可信的依據(jù).
若計軸設(shè)備的壽命服從對數(shù)正態(tài)分布,其平均無故障工作時間(MTBF)為
這與威布爾分布下計軸的平均無故障時間(見3.4節(jié))屬于同一個數(shù)量級,二者相差不大.
因此,根據(jù)假設(shè)檢驗的最優(yōu)結(jié)果即威布爾分布的假設(shè)檢驗結(jié)果略優(yōu)于對數(shù)正態(tài)分布,將威布爾分布作為計軸壽命的分布類型.
由以上分析可知,計軸的壽命服從威布爾分布,由參數(shù)估計可得計軸的可靠性指標.
失效率函數(shù)為
可靠度函數(shù)為
特征壽命時間為
te-1=η=484.685 d≈1.1632×104h
該線路計軸的平均無故障時間為
θ=ηΓ(1+1/m)=484.685Γ(1+1/1.3158)=
446.58 d≈1.0718×104h
這一計算結(jié)果與城市軌道交通信號設(shè)備的可靠性指標要求,即地面設(shè)備的平均無故障時間不低于105h,有一定差距.這也很好地解釋了計軸故障成為我國多個城市軌道交通運營事故的主要致因.
計軸壽命數(shù)據(jù)的可靠性特征函數(shù)如圖4所示.它包括計軸的概率密度函數(shù)、可靠度函數(shù)、失效率函數(shù)圖等.結(jié)合威布爾函數(shù)的性質(zhì)可知,形狀參數(shù)m>1,其概率密度函數(shù)會出現(xiàn)峰值,失效率函數(shù)為遞增函數(shù).即計軸的失效率處于耗損故障階段,隨著使用時間的增長,計軸的失效率會繼續(xù)增加.
既然計軸的失效率函數(shù)不是斜坡狀的遞減函數(shù),也就不存在早期失效階段,即不會出現(xiàn)失效率初期很高然后隨著時間的推移再降低的情況.
這說明了計軸并不是因為早期失效的高失效率使得計軸的平均無故障時間低于標準要求的105h,而是由于疲勞耗損等失效導(dǎo)致計軸的可靠性低于標準要求.
1)計軸的平均無故障時間是104h數(shù)量級,這與國內(nèi)外信號系統(tǒng)的可靠性標準地面設(shè)備的平均無故障時間105h差一個數(shù)量級.而且,對其他線路計軸故障數(shù)據(jù)的分析也有相似結(jié)論.因此,差距可能來自設(shè)計和運營兩個方面.
2)設(shè)計方面,設(shè)備廠商應(yīng)注意設(shè)備運行過程數(shù)據(jù)的收集和分析,通過更換器件型號、冗余設(shè)計等方式進一步提升計軸設(shè)備的基本可靠性.
3)設(shè)備使用方面,運營單位可以對易疲勞、老化,受損嚴重的部件加強檢修力度.例如提高車輪傳感器線圈的密封性,防止因受潮導(dǎo)致電壓不穩(wěn)定等.
4)本文方法可以幫助提升計軸設(shè)備的維護管理水平.運營單位可以檢查計軸各個組件的特征參數(shù)有無異常,對比標準MTBF估計設(shè)備的剩余壽命,作為設(shè)備維護更換周期制定的依據(jù).從而避免過度頻繁維護更換帶來的浪費和穩(wěn)定性下降,以及過晚更換造成的運營影響.