孟建軍,趙文濤
(1.蘭州交通大學(xué)機(jī)電技術(shù)研究所,甘肅 蘭州 730070;2.甘肅省物流及運(yùn)輸裝備信息化工程技術(shù)研究中心,甘肅 蘭州 730070;3.甘肅省物流與運(yùn)輸裝備行業(yè)技術(shù)中心,甘肅 蘭州 730070)
電流互感器在動(dòng)車組上廣泛應(yīng)用于牽引傳動(dòng)系統(tǒng)與繼電保護(hù)系統(tǒng)中。目前動(dòng)車組上使用的均為電磁式電流互感器[1],其高可靠性在帶給動(dòng)車組安全穩(wěn)定運(yùn)營(yíng)的同時(shí),也意味著對(duì)其進(jìn)行可靠性研究時(shí)會(huì)存在難以采集故障數(shù)據(jù)樣本的問題。
隨著技術(shù)的發(fā)展以及對(duì)可靠性重視程度的不斷提高,各類產(chǎn)品的故障率也隨之降低,采集到的故障數(shù)據(jù)數(shù)量少且分布不均勻、不平衡,“大數(shù)據(jù),小樣本”的情況普遍存在[2]。而傳統(tǒng)的基于大樣本數(shù)據(jù)的可靠性研究方法雖已相對(duì)成熟,分析結(jié)果相對(duì)準(zhǔn)確,但傳統(tǒng)方法并不適用于目前的小樣本數(shù)據(jù)現(xiàn)狀,對(duì)于小樣本數(shù)據(jù)的產(chǎn)品進(jìn)行可靠性研究是近年來(lái)亟待解決的問題,申桂香等[3]采取極大似然法(MLE)對(duì)典型的高可靠性產(chǎn)品數(shù)控機(jī)床進(jìn)行二參數(shù)Weibull分布參數(shù)估算,并與傳統(tǒng)可靠性建模方法進(jìn)行了對(duì)比,證實(shí)了其對(duì)于小樣本數(shù)據(jù)的優(yōu)越性;張立敏等[4]針對(duì)采集到的少量故障數(shù)據(jù),結(jié)合 Bayes理論與粒子群優(yōu)化算法PSO進(jìn)行了威布爾分布模型參數(shù)的估算,鑒于Bayes理論中的先驗(yàn)知識(shí)存在較大的主觀因素,會(huì)對(duì)估算結(jié)果造成一定的影響。綜上所述,傳統(tǒng)的可靠性分析是一種統(tǒng)計(jì)分析,是建立在大樣本數(shù)據(jù)之上的研究方法,若對(duì)小樣本數(shù)據(jù)的產(chǎn)品依舊使用傳統(tǒng)的可靠性分析方法往往會(huì)產(chǎn)生極大的誤差,使得計(jì)算結(jié)果不準(zhǔn)確。而虛擬樣本生成技術(shù)無(wú)需先驗(yàn)知識(shí),通過提高小樣本故障數(shù)據(jù)的預(yù)測(cè)泛化能力以及減少“過擬合”的情況來(lái)建立較為精確的故障分布模型[5]。1992年,美國(guó)的Tomaso和Thomas Vetter等人[6]首次提出了虛擬樣本的概念隨后人們將其應(yīng)用于可靠性領(lǐng)域發(fā)現(xiàn)虛擬樣本可以有效地對(duì)小樣本數(shù)據(jù)進(jìn)行擴(kuò)充進(jìn)而得到精確的模型。故本文提出了一種能夠在缺失相關(guān)先驗(yàn)知識(shí)的前提下,準(zhǔn)確地在小樣本數(shù)據(jù)條件下對(duì)動(dòng)車組電流互感器的可靠性與安全性進(jìn)行評(píng)估分析的方法,能夠?yàn)轭愃朴陔娏骰ジ衅鞯母呖煽啃援a(chǎn)品的可靠性研究提供更有價(jià)值的參考。
本文以動(dòng)車組電流互感器為研究對(duì)象建立相關(guān)故障樹,并對(duì)每一個(gè)底事件采集到的小樣本故障數(shù)據(jù),引入支持向量機(jī)(SVM)結(jié)合中位秩與johnson算法來(lái)進(jìn)行樣本擴(kuò)充。利用最小二乘法對(duì)威布爾分布參數(shù)進(jìn)行估計(jì),結(jié)合算例通過蒙特卡洛仿真來(lái)對(duì)動(dòng)車組電流互感器進(jìn)行可靠性研究。
目前高速列車上安裝有多個(gè)電流互感器,均為直通式電流互感器,其中一個(gè)用于測(cè)量動(dòng)車組的電流,同時(shí)連接到每一個(gè)主斷路器中;兩個(gè)用于監(jiān)測(cè)主變壓器,其中位于主變壓器上段車頂?shù)碾娏骰ジ衅鳒y(cè)量牽引單元的線電流,而用于測(cè)量牽引單元回流電流的回流電流互感器位于主變壓器下端安裝在主變壓器中。電磁式電流互感器雖然相較于電子式電流互感器有著如誤差較大等問題,但其應(yīng)用范圍與可靠性是電子式電流互感器無(wú)法比擬的[7],因此目前高速鐵路網(wǎng)依然普遍使用電磁式電流互感器。動(dòng)車組電流互感器作為牽引傳動(dòng)系統(tǒng)與繼電保護(hù)系統(tǒng)中的核心器件,向來(lái)是維修方案與優(yōu)化設(shè)計(jì)的重點(diǎn)元件,然而其作為高可靠性產(chǎn)品,能夠收集到的故障數(shù)據(jù)較少、來(lái)源復(fù)雜、分布不均勻不平衡,是典型的非線性小樣本故障數(shù)據(jù)。
動(dòng)車組電流互感器內(nèi)部結(jié)構(gòu)可分為鐵芯、繞組、分接開關(guān)三部分,首先確定電流互感器故障為頂事件,分別對(duì)其內(nèi)部元件的故障機(jī)理進(jìn)行研究,如動(dòng)車組電流互感器使用的鐵芯類型為開口鐵芯,長(zhǎng)期工作暴露在空氣中會(huì)導(dǎo)致其發(fā)生銹蝕,鐵芯質(zhì)量下降,交合處氣隙增大,鐵芯磁導(dǎo)率下降進(jìn)而增大線路誤差導(dǎo)致差動(dòng)保護(hù)誤動(dòng)[8];絕緣對(duì)于電流互感器而言是極為重要的,無(wú)論是鐵芯內(nèi)部、一次與二次繞組內(nèi)部、鐵芯與繞組之間還是外殼與內(nèi)部結(jié)構(gòu)之間都需要做好絕緣,其損失或破壞會(huì)對(duì)電流互感器產(chǎn)生極大的影響及安全隱患,最終導(dǎo)致其失效等[9]。根據(jù)各元件故障機(jī)理,繪制故障樹,其中圖1為主故障樹,圖2為主故障樹下的三個(gè)子故障樹。其中圖2(c)為B子樹的補(bǔ)充子樹。
圖1 電流互感器主故障樹
圖2 電流互感器子故障樹
鑒于試驗(yàn)條件以及試驗(yàn)時(shí)間的限制,無(wú)法保障每一個(gè)觀測(cè)樣本都能得到完整的失效數(shù)據(jù),或因在觀測(cè)還未開始選定的觀測(cè)樣本便已經(jīng)投入使用的左截尾數(shù)據(jù),或因某個(gè)與實(shí)驗(yàn)無(wú)關(guān)的外在因素影響觀測(cè)樣本還未發(fā)生故障便需要更換的刪除樣品,或因觀測(cè)時(shí)間限制直到觀測(cè)結(jié)束樣本都沒有失效的右截尾數(shù)據(jù)[10]。在采集到的小樣本數(shù)據(jù)中總會(huì)存在多種截尾數(shù)據(jù),目前雖有部分方法如貝葉斯最大似然估計(jì)[11]等能夠在一定程度上對(duì)截尾數(shù)據(jù)進(jìn)行分析,但由于接受條件的設(shè)定具有較大的主觀因素,仍會(huì)帶來(lái)一定的誤差影響結(jié)果的準(zhǔn)確。故本文在原樣本數(shù)據(jù)數(shù)量較少的情況下再次剔除截尾故障數(shù)據(jù),僅采用少量的完整樣本數(shù)據(jù)進(jìn)行可靠性研究。
在較為普遍的現(xiàn)實(shí)問題中,很少會(huì)見到線性的回歸問題樣本集,因此引入在解決非線性小樣本學(xué)習(xí)的回歸問題中非常突出的SVM來(lái)實(shí)現(xiàn)對(duì)樣本的擴(kuò)容。其實(shí)在解決非線性的回歸問題時(shí),往往希望能夠使用線性回歸問題的方法來(lái)解決,即非線性變換的方式,在SVM中,一般通過將訓(xùn)練樣本從原始的維數(shù)有限的空間中通過一個(gè)非線性映射Φ(x)映射到一個(gè)更高維的特征空間中,即可將非線性問題轉(zhuǎn)變?yōu)榫€性問題來(lái)構(gòu)造線性最優(yōu)超平面。
在SVM的回歸問題中首先定義一個(gè)訓(xùn)練樣本數(shù)據(jù)集
S={(xi,yi),i=1,2,……,m}
(1)
其中xi∈Rn表示第i個(gè)完整失效數(shù)據(jù)樣本,yi∈R表示第i個(gè)數(shù)據(jù)樣本的目標(biāo)值,m是樣本的數(shù)量。算法的最終目的是為了進(jìn)行可靠性的研究,故樣本數(shù)據(jù)的目標(biāo)值采用估計(jì)可靠度來(lái)代替。利用johnson算法結(jié)合中位秩,對(duì)于包含有右截尾故障數(shù)據(jù)以及完整故障數(shù)據(jù),定義收集到了n個(gè)完整故障數(shù)據(jù)以及右截尾故障數(shù)據(jù),以升序的方式排列編號(hào)為1-n記為j;其中包含(n-m)個(gè)右截尾數(shù)據(jù),完整的失效數(shù)據(jù)則為m個(gè),同樣升序排列編號(hào)為1-m記為i;則第i個(gè)完整失效樣本數(shù)據(jù)的可靠性估計(jì)數(shù)據(jù)為
(2)
支持向量機(jī)的回歸問題不同于分類問題,回歸問題的目標(biāo)是將訓(xùn)練集中的所有樣本點(diǎn)盡量擬合到一個(gè)線性模型中,故需要找到一個(gè)能夠表示y與x之間依賴關(guān)系的函數(shù),而樣本中的點(diǎn)與函數(shù)之間必然存在一定的距離誤差,若采用均方誤差表示過于苛刻,故定義一個(gè)損失函數(shù)err(xi,yi),只要各個(gè)樣本點(diǎn)的損失不大于常數(shù)ε,則認(rèn)為該樣本點(diǎn)沒有損失。
(3)
其中f(x)=ωTxi+b=0,ω∈Rn,b∈R為定義的一個(gè)超平面,若|yi-f(xi)|≤ε,則認(rèn)為該超平面是尋找的線性估計(jì)模型。
故目標(biāo)函數(shù)可以表示為
(4)
(5)
其中C為引入的松弛因子權(quán)重,權(quán)重的大小表明了模型對(duì)樣本誤差大小的容忍程度,即C的值越小,過渡帶越寬,C的值越大,過渡帶越窄。這也使得支持向量機(jī)具備更強(qiáng)的泛化性。
而在非線性的回歸問題中,非線性映射Φ(x)的加入使得超平面函數(shù)變?yōu)?/p>
f(x)=ωTφ(xi)+b
(6)
相應(yīng)的目標(biāo)函數(shù)變?yōu)?/p>
(7)
K(xi,xj)=φ(xi)Tφ(xj)
(8)
核函數(shù)的選擇主要是基于樣本數(shù)據(jù)的不同而選擇不同的參數(shù),比較常用的核函數(shù)包括:
用于線性可分情況下的線性核函數(shù)
(9)
適用于正交歸一化數(shù)據(jù)的多項(xiàng)式核函數(shù)
(10)
廣泛用于深度學(xué)習(xí)以及機(jī)器學(xué)習(xí)中的Simoid核函數(shù)
(11)
而本文使用的是局部性較強(qiáng)的高斯核,對(duì)于小樣本數(shù)據(jù)以及將其映射到更高維空間的適應(yīng)性較強(qiáng),且參數(shù)較少計(jì)算簡(jiǎn)便。形式為
(12)
對(duì)樣本進(jìn)行回歸訓(xùn)練,為保證較高的準(zhǔn)確性需要尋得支持向量機(jī)的最優(yōu)參數(shù),在小樣本數(shù)據(jù)的條件下,使用網(wǎng)格法以及交叉驗(yàn)證法對(duì)松弛因子權(quán)重C以及高斯核函數(shù)中的寬度系數(shù)R進(jìn)行搜索尋優(yōu)。
設(shè)置極大的上下界,確保最優(yōu)參數(shù)大概率存在上下界內(nèi),令
C∈[Cmin,Cmax],R∈[Rmin,Rmax]
(13)
尋優(yōu)步長(zhǎng)分別為Cs,Rs
對(duì)每一組參數(shù)(Ci,Ri)進(jìn)行訓(xùn)練,結(jié)合交叉驗(yàn)證法得到各個(gè)樣本點(diǎn)與最優(yōu)超平面距離的均方根誤差,其中誤差最小的一組可以認(rèn)為是最優(yōu)參數(shù),若誤差相同,為了使得所建的模型泛化能力最大化,選取松弛因子權(quán)重較小的一組。
建立代表著故障數(shù)據(jù)與經(jīng)驗(yàn)可靠度邏輯關(guān)系的函數(shù)后便可對(duì)少量的數(shù)據(jù)樣本進(jìn)行擴(kuò)容,進(jìn)而對(duì)故障發(fā)生概率分布參數(shù)進(jìn)行較為準(zhǔn)確的估計(jì)。
樣本擴(kuò)容后將有效地提高故障分布參數(shù)的估算準(zhǔn)確性。對(duì)于故障發(fā)生概率分布,由于威布爾分布能夠更準(zhǔn)確地描述出在工程系統(tǒng)中常見的“浴盆曲線”失效分布,是目前應(yīng)用最為廣泛的分布函數(shù)之一[12],故本文以二參數(shù)威布爾分布為例,對(duì)經(jīng)過擴(kuò)容后的樣本數(shù)據(jù)采用最小二乘法進(jìn)行參數(shù)估計(jì)。
二參數(shù)威布爾分布的可靠度函數(shù)為
(14)
反函數(shù)為
(15)
為了更方便直觀一些可以定義H(t)=-ln(R(t))使得原式變?yōu)?/p>
(16)
(17)
將式(2)求得的結(jié)果代入式(17)中即可求得參數(shù)的估計(jì)值。
由于電流互感器在動(dòng)車組上運(yùn)行的時(shí)間較長(zhǎng),因條件限制難以取得近幾年投入使用的新設(shè)備運(yùn)維數(shù)據(jù),故認(rèn)為動(dòng)車組在大修后使得電流互感器恢復(fù)至原始狀態(tài)。收集某動(dòng)車段在2016年后凡是進(jìn)行過二級(jí)大修之后近兩年的動(dòng)車組運(yùn)維數(shù)據(jù),共得到60組符合要求的動(dòng)車運(yùn)維數(shù)據(jù),結(jié)合網(wǎng)上信息以及檢修師傅的經(jīng)驗(yàn)判斷,舍棄了部分明顯不符合常理的故障數(shù)據(jù),將故障數(shù)據(jù)進(jìn)行整理并根據(jù)式(2)計(jì)算各個(gè)完整失效樣本對(duì)應(yīng)的估計(jì)可靠度作為訓(xùn)練樣本。
因篇幅的限制僅將底事件64外部短路的樣本數(shù)據(jù)及其估計(jì)可靠度計(jì)算結(jié)果用表1展示。
表1 底事件64外部短路樣本數(shù)據(jù)及其估計(jì)可靠度
在近兩年的運(yùn)維數(shù)據(jù)中,在剔除了部分大概率因記錄員誤操作而記錄的數(shù)據(jù)后,共得到關(guān)于底事件64外部短路相關(guān)的完整故障數(shù)據(jù)17次,右截尾故障數(shù)據(jù)48次。共得到故障數(shù)據(jù)65次,其中有5次故障是已經(jīng)發(fā)生過該故障并在維修后再次發(fā)生,故原始訓(xùn)練樣本數(shù)目為17。得到支持向量機(jī)的訓(xùn)練樣本后,進(jìn)行松弛因子權(quán)重C以及高斯核函數(shù)中的寬度系數(shù)R的參數(shù)尋優(yōu),在網(wǎng)格搜索法中設(shè)定搜索的上下界、步長(zhǎng)以及求得的參數(shù)結(jié)果如表2所示。
表2 底事件64外部短路相關(guān)參數(shù)計(jì)算結(jié)果
利用支持向量機(jī)對(duì)樣本數(shù)據(jù)進(jìn)行擴(kuò)容20倍,得到共200個(gè)新樣本數(shù)據(jù),為直觀地對(duì)樣本數(shù)據(jù)進(jìn)行顯示,將非線性的威布爾二參數(shù)通過參數(shù)變換將問題轉(zhuǎn)換為線性問題,令
(18)
使得函數(shù)變?yōu)閥=ax+b,原樣本數(shù)據(jù)與擴(kuò)容后得到的新樣本及其估計(jì)可靠度如圖3所示。
圖3 樣本點(diǎn)示意圖
將擴(kuò)容后的樣本根據(jù)式(1)計(jì)算其估計(jì)可靠度,并帶入式(2)中進(jìn)行威布爾分布參數(shù)的估計(jì),結(jié)果為α=1.56,β=19357.6
仿照上述過程對(duì)所有底事件發(fā)生概率分布函數(shù)進(jìn)行參數(shù)估計(jì)后,結(jié)果如表3所示。
表3 所有底事件參數(shù)估計(jì)值
為體現(xiàn)出本文提出的支持向量機(jī)擴(kuò)容后擬合算法的優(yōu)越性,與傳統(tǒng)的最小二乘法[13]進(jìn)行對(duì)比。以上文所舉的例子底事件64外部短路為例,計(jì)算所得參數(shù)的對(duì)比結(jié)果如表4所示。
表4 不同方法參數(shù)結(jié)果
而兩種方法計(jì)算所得的估計(jì)可靠度隨時(shí)間變化的曲線擬合結(jié)果如圖4所示。
圖4 方法對(duì)比示意圖
通過對(duì)比可知基于小樣本數(shù)據(jù)的傳統(tǒng)最小二乘法已難以獲得準(zhǔn)確的參數(shù)估計(jì)值,且抗野值能力較弱,擬合不足,而本文所提支持向量機(jī)方法能夠很好的估計(jì)參數(shù)結(jié)果且更符合工程實(shí)際,從圖6中可以明顯看出支持向量機(jī)方法能夠大大減小野值對(duì)曲線擬合結(jié)果的影響,具有較高的優(yōu)越性。
得到了底事件發(fā)生概率分布的參數(shù)估計(jì)值后,采用反函數(shù)隨機(jī)數(shù)抽取法來(lái)對(duì)發(fā)生故障的時(shí)間進(jìn)行抽樣,本文所設(shè)定的二參數(shù)威布爾分布的抽取公式為
(19)
其中r為在電腦上產(chǎn)生的[0,1]上均勻分布的隨機(jī)數(shù)。
將動(dòng)車組電流互感器故障樹轉(zhuǎn)化為布爾運(yùn)算函數(shù)
T=x1+x2+x3+x4+x5+……+x70+x71
(20)
其中輸入為底事件是否發(fā)生,輸出為頂事件是否發(fā)生。
每次抽樣將各個(gè)底事件發(fā)生的時(shí)間作為該函數(shù)的輸入,將頂事件發(fā)生的時(shí)間作為輸出并進(jìn)行記錄,同時(shí)記錄引起系統(tǒng)失效的底事件編號(hào)。重復(fù)以上步驟直到抽樣次數(shù)達(dá)到設(shè)定值10000次,將仿真結(jié)果進(jìn)行曲線擬合,結(jié)果如圖5所示。
圖5 電流互感器故障分布函數(shù)模擬曲線
得到動(dòng)車組電流互感器系統(tǒng)故障概率分布函數(shù)為
(21)
統(tǒng)計(jì)引起系統(tǒng)失效的底事件編號(hào)及其出現(xiàn)次數(shù),計(jì)算其模式重要度
(22)
其中N1i為底事件i引起系統(tǒng)失效的次數(shù)。N2為系統(tǒng)失效總次數(shù)。計(jì)算結(jié)果如表5所示。
表5 底事件重要度
由表5數(shù)據(jù)可知,底事件編號(hào)為1鐵芯銹蝕、18鐵芯振動(dòng)、20繞組絕緣老化、41繞組運(yùn)行劣化、49繞組端部絕緣不良、64分解開關(guān)觸頭外部短路、65過負(fù)荷、79負(fù)荷不平衡、85分接開關(guān)觸頭壓力不足九項(xiàng)底事件重要度相對(duì)較高,故可以認(rèn)為上述事件為動(dòng)車組電流互感器的薄弱環(huán)節(jié),需要在維修保養(yǎng)過程中重點(diǎn)關(guān)注。
本文以動(dòng)車組電流互感器為研究對(duì)象,建立相關(guān)故障樹模型,基于其小樣本數(shù)據(jù),利用支持向量機(jī)進(jìn)行了樣本擴(kuò)容,采用最小二乘法利用擴(kuò)容后的樣本得到了各個(gè)底事件發(fā)生概率的威布爾分布參數(shù)估計(jì)值,且通過與傳統(tǒng)最小二乘法進(jìn)行了對(duì)比,驗(yàn)證了本文所提方法在小樣本數(shù)據(jù)條件下的優(yōu)越性。使用蒙特卡洛仿真得到了動(dòng)車組電流互感器的系統(tǒng)失效概率分布函數(shù)以及各個(gè)底事件的模式重要度,發(fā)現(xiàn)鐵芯銹蝕、振動(dòng),繞組絕緣老化、運(yùn)行劣化、端部絕緣不良,分接開關(guān)觸頭外部短路、壓力不足等九項(xiàng)問題重要度相對(duì)較高,為動(dòng)車組電流互感器的薄弱環(huán)節(jié),為制訂相關(guān)維修策略提供了有效地參考,為類似于電流互感器的高可靠性小樣本數(shù)據(jù)產(chǎn)品的可靠性研究提供了參考。