侯學理, 李 凱, 車 力, 馬曉聰, 侯旭鵬
(1.中國人民解放軍95579部隊,四川 成都 611531; 2.空裝駐西安地區(qū)第九軍代室,陜西 西安 710002;3.中國人民解放軍61213部隊,山西 臨汾 041000)
直升機因其具有優(yōu)越的垂直起降、靈活的機動性等特點在軍事和民用都有廣泛的應用,而且伴隨我國低空領域對民用的開放,將迎來直升機發(fā)展的黃金時代。同時,其安全性能也越來受到人們的關注。
直升機的三大關鍵部件為:動力系統(tǒng)、傳動系統(tǒng)和操縱系統(tǒng)。直升機動力系統(tǒng)一般采取雙發(fā)或者輔助設備,操縱系統(tǒng)采用液壓、機械等兩套以上的系統(tǒng)補充。而傳動系統(tǒng)需要保證傳遞效率和傳遞方向,一般采取單向傳遞,無可用替代系統(tǒng)。所以在直升機三大系統(tǒng)中傳動系統(tǒng)安全余度最小。直升機傳動系統(tǒng)示意圖如圖1所示。
圖1 直升機傳動系統(tǒng)示意圖
直升機傳動系統(tǒng)的作用是將發(fā)動機輸出的功率按照一定的比例傳遞給旋翼和尾槳,并按各自的需求降低轉速帶動其旋轉,使直升機起飛和平衡。一旦傳動系統(tǒng)被破壞(特別是尾傳動軸)或出現(xiàn)故障,動力將無法傳遞到尾槳,直升機將無法航行。傳動系統(tǒng)的性能直接影響直升機的總體性能,關系到直升機的飛行安全和穩(wěn)定[1]。美國空軍后勤保障部門就直升機的維護數(shù)據(jù)表明,在直升機機械故障引發(fā)的飛行事故中,由傳動系統(tǒng)和動力系統(tǒng)造成的事故占比高達68%,維修費用也占到了總維修費用的58%[2]。貢慧等[3]、張娟等[4]對2016年以前的世界直升機發(fā)生的事故原因、事故機型、主要事故系統(tǒng)進行了統(tǒng)計分析,發(fā)現(xiàn)傳動(動力)系統(tǒng)是引發(fā)直升機事故的一大誘因,占所有直升機飛行事故的15.9%。這也從另一方面說明傳動系統(tǒng)是直升機的核心關鍵部件之一,其可靠性水平在很大程度上決定了直升機的安全性。
然而目前我國的直升機傳動系統(tǒng)的研究,特別是傳動軸的研究,還都停留在對信號分析的研究方面,如湖南大學研發(fā)了直升機傳動系統(tǒng)故障診斷軟件;南昌航空大學對傳動系統(tǒng)振動信號分析進行故障研究,空軍工程大學、國防科技大學等院校也都在研究直升機傳動系統(tǒng)故障,但這些故障診斷方法基本上都是基于傳統(tǒng)的信號分析,不僅需要大量的信號分析專業(yè)領域的專家還需要有經驗豐富的故障診斷專家,在實際工程中很難實現(xiàn),而且實現(xiàn)后需要依靠人來進行判斷。
目前人工智能和數(shù)據(jù)挖掘技術均已成熟,這就使用新技術解決傳統(tǒng)問題成為可能。而且最主要的原因是數(shù)據(jù)挖掘技術更多的是依賴于數(shù)據(jù)最原始的信息,減少了過程中對人的依賴和人為因素。同時,未來的航空業(yè)將向數(shù)字航空、智能航空發(fā)展,原來的方法將很難適應未來的數(shù)字航空、智能航空。
目前國外的大多數(shù)戰(zhàn)斗機均已安裝了健康管理系統(tǒng)(PHM),在直升機上也使用了健康與使用監(jiān)控系統(tǒng)HUMS(Health and Usage Monitoring System),我國也在進行該項研究,這些研究絕大部分都依賴于數(shù)據(jù)分析或者數(shù)據(jù)挖掘技術。數(shù)據(jù)挖掘前期必須要對數(shù)據(jù)進行處理,例如數(shù)據(jù)降維、數(shù)據(jù)清洗等。只有前期數(shù)據(jù)處理得好,后期數(shù)據(jù)分析才能準確。目前國內幾所高校均在研究用數(shù)據(jù)處理的方法進行故障診斷,但是將數(shù)據(jù)挖掘技術用在直升機傳動軸上的健康管理研究還處于起步階段。
本文提出了一種改進后的相似性聚類(Affinity Propagation,AP)方法并應用于傳動軸上的故障特征提取。通過實驗驗證該方法可以進行故障特征提取和分類。并與成分分析法(Principal Component Analysis,PCA)對比,改進后的相似性聚類方法優(yōu)于成分分析法。
相似性傳播聚類算法[5]是通過在原始數(shù)據(jù)集中識別最具有代表性的子集來進行數(shù)據(jù)分類的無監(jiān)督學習算法[6]。相似性聚類的核心思想利用數(shù)據(jù)信息之間相互不斷的傳遞,最終得到一個能夠描述這個數(shù)據(jù)集合的中心子集,從而使得每個數(shù)據(jù)點歸于一類,最終將數(shù)據(jù)集分為幾個部分[7]。
設輸入X1,X2,…,Xn為n個d維實數(shù)向量樣本Xi={xi1,xi2,…,xid},i=1,2,…,n,則d為數(shù)據(jù)樣本Xi的特征維度數(shù),則樣本數(shù)據(jù)集可以表示為X=[X1,X2,…,Xn]T,即
(1)
輸出為通過最后的聚類得到的表示點與點之間的關系矩陣ci,j(i,j=1,2,…,n)。
① 若ci,j=1,判定點xj為點xi的中心;
② 若ci,j=0,判定點xj不是點xi的中心。
相似性傳播算法目標要使數(shù)據(jù)和它的中心點之間的相似性最大,即中心點能表示該數(shù)據(jù)集合的某一特征。通過最大和算法理論算法[8]求解ci,j,使xj成為xi中心的可能性最大,具體算法如下。
為了求解ci,j,必須將所有局部函數(shù)聯(lián)合起來,建立一個全局目標函數(shù),這樣解出來的結果才是全局最優(yōu)解。
設目標函數(shù)S(c1,1,c1,2,…,cn,n),為了滿足算法實際需求,求解S(cij)還需幾個修真目標函數(shù)。
(2)
式中,Ii(cij)和Ej(cij)為約束函數(shù),用于修正目標函數(shù)S(cij)。
(3)
Ej(c1j,c2j,…,cNj)=
(4)
式(2)表示當ci,j=1時,點xi是屬于點以xj為中心的集合。式子(3)、式(4)表示每一個數(shù)據(jù)點只能屬于一個中心點集合。利用最大和信息更新原則,推出圖2所示的相似性傳播聚類算法示意圖來計算ci,j。
圖2 相似性傳播聚類算法示意圖
利用最大和原則:
(5)
此外,在計算ci,j時包括s(i,j)在內的5個信息需要通過不斷的迭代更新。
βi,j=s(i,j)+αi,j
(6)
(7)
(8)
(9)
式中,ρi,j為責任信息,傳遞是從點xi到點xj的信息,表示點xj作為點xi的集合的中心點的合適程度;αi,j為可用信息,表示xj在已經從其他數(shù)據(jù)點上獲得可用信息的前提下,作為xi中心的可能性的大?。沪耰,j和ηi,j為計算過程中間變量。計算數(shù)次迭代之后,求解使得ρi,j+αi,j最大和所對應的ci,j矩陣。在實際應用這個算法的時候,很多時候只需要輸入表示數(shù)據(jù)之間距離的相似矩陣s(i,j)。
傳統(tǒng)研究表征距離的函數(shù)有歐氏距離、曼哈頓距離、明可夫斯基距離、切比雪夫距離等?,F(xiàn)在又有學者提出了改進的表征距離的Hsim(X,Y)、Close(X,Y)[9],以及改進的高維數(shù)據(jù)相似性度量函數(shù)Esim(X,Y)[10]。這些改進的函數(shù)使相似性傳播聚類的降維能力有了很大的提高。而本文研究的直升機傳動系統(tǒng)的數(shù)據(jù)維度并不是很高,而且需要較快的時間計算能力,所以選擇負歐式距離。
s(i,j)=-‖xj-xi‖2
(10)
式(10)選取某時刻某兩個特征向量之間的歐氏距離平方和。其優(yōu)點是放大了數(shù)據(jù)之間大的差異,但缺點是對數(shù)據(jù)之間細小的差異不明顯,這就使得兩個數(shù)據(jù)之間差別大的時候分類很清楚,數(shù)據(jù)差異小的時候分類不理想,甚至可能導致分不清楚。特別是中心點的選取可能效果更差。
為了解決這個弊端,提出一種加權的歐式距離:
(11)
式中,αjt為每個特征的權重用于衡量Xi在t時刻這個數(shù)據(jù)在整個測量數(shù)據(jù)序列中的影響程度,目的是使得AP聚類的聚類效果更好。αit的具體求解如下:
(12)
(13)
(14)
式(11)中αit為給每一個測量數(shù)據(jù)的每一個維度都進行了標記,表示在第t個的i維的重要程度的大小,從而使數(shù)據(jù)緯度之間的差異變大,將會使重要的維度在整個維度序列中表現(xiàn)出來,在算法上將比較清楚地表征出其所代表的特征與其他的值的差異,使聚類原始數(shù)據(jù)的差異性變大,但又不會失去數(shù)據(jù)的本來特性。
式(11)能表示出每個數(shù)據(jù)的每個特征的重要程度,重要的特征αit大,能在整個數(shù)據(jù)維度里面更加凸顯,所以理論上可以使分類效果更好。
目前,先進直升機對重要的關鍵系統(tǒng)都做了監(jiān)控。通過采集來的信號記錄和顯示設備運行情況,應用最多的是時域信號,時域信號是監(jiān)測設備直接測量到的信號,包含的信息量大且易于觀察和理解[11]。但應用數(shù)據(jù)挖掘的方法來處理、識別直升機傳動系統(tǒng)的故障時,需要對采集到的信號進行重新定義[12]。對于時域信號分析而言,常用的特征有最大值、最小值、有效值、均值、均方值、方差、標準差、峰值、峰-峰值[13]等一批有量綱的指標。具體如表1所示。
表1 故障特征定義表
上述這些有量綱的指標一般受工況、負載、環(huán)境、轉速等外界條件的變化影響較大,給工程應用和研究增加了難度。但可以通過它們演變出一些無量綱指標,如峭度(Kurtosis,K)、偏斜度(Skewness,S)、波形指標(Shape Factor,SF)、脈沖指標(Impulse Factor,IF)、峰值指標(Crest Factor,CF)和裕度指標(Clearance Factor,CLF)[14]等,以及在時頻域分析中頻率峰值均值比和頻域均方根等一些參數(shù)指標。這些都是從某一方面來描述傳動軸的特性[15]。這些指標的具體公式和含義在其他文獻中有詳細的描述這里不再贅述。
這些時域的有量綱的特征和無量綱的特征以及頻域、時頻域都可以作為故障數(shù)據(jù)的特征,均可以參與故障特征的提取,而且時域、頻域、時頻域是可以相互轉化和進行分析的。本文為了簡化計算量并說明該方法有效性選取了時域的特征進行分析。
通過前面的介紹可知,改進后的AP算法可以更好地描述數(shù)據(jù)之間的差異,能使數(shù)據(jù)之間的不同特點表現(xiàn)得更加明顯。故這種改進后的方法可以判別更加細微的差異,故該方法對直升機傳動軸故障早期的相似故障有很好的判別能力。應用改進后的AP算法進行傳動軸故障特征選擇,具體如下。
改進AP算法故障特征選擇流程圖如圖3所示。
圖3 改進AP算法故障特征選擇流程圖
① 首先對采集到的原始信號進行整理,使其成為一個信號序列Xt={X1,X2,…,XT},T為信號序列的長度。
② 根據(jù)前面第2節(jié)定義的有量綱和無量綱的多個特征,將每一個特征作為一個維度對原始信號序列Xd進行維度計算。設信號序列Xd計算的維度為d=1,2,…,D,D為維度長度,則可將信號序列表示為Xd={X1d,X2d,…,XTd}。
③ 為了便于相似性聚類算法計算,將X進行轉置得到信號的轉置特征序列Xt={X1t,X2t,…,XDt},d=1,2,…,D,t=1,2,…,T,則輸入序列變?yōu)?/p>
(15)
⑤ 計算歐式距離:計算特征序列XDT中每個數(shù)據(jù)點Xdi與特征序列XDT中對應的數(shù)據(jù)點Xjt之間加權后的歐式距離s(i,j)′dt。
(16)
⑥ 將式(16)代入式(2)、式(3)、式(4)中,計算出每個特征的歸屬類,從而找出哪些特征是所有數(shù)據(jù)點的特征中心,并刪除冗余的特征數(shù)據(jù)。
故障的特征提取是故障診斷的關鍵步驟,該步驟直接影響后面的故障診斷。在實際的故障診斷問題中,首先利用表1中的有量綱指標以及其他的無量綱指標和頻域上的特征指標,分別計算出來數(shù)據(jù)點的特征,這些均值、均方值、有效值、方差、標準差、峰值、峰-峰值、峭度、偏斜度、波形指標、脈沖指標、峰值指標、裕度指標、頻率峰值均值比、頻域均方根等都是描述這個故障的不同方面,對于算法來講都可以看成數(shù)據(jù)的維度。
研究的目標是將原始數(shù)據(jù)中最能表現(xiàn)故障特性的特征提取出來,為后面數(shù)據(jù)分類問題做好準備。
為了驗證該方法在特征提取中的有效性,利用模擬傳動軸實驗臺進行實驗數(shù)據(jù)的采集。模擬傳動軸實驗臺如圖4所示。
圖4 模擬傳動軸實驗臺
在實驗臺上設置電機轉速為480 r/s,頻率為520 Hz,采集轉動穩(wěn)定后20 s的數(shù)據(jù)點,并在第10 s左右的時候,輕敲傳動軸,傳動軸受到突然沖擊。模擬直升機受到突變載荷時傳動系統(tǒng)受到的沖擊,如武器襲擊、風切變等。模擬傳動系統(tǒng)突變沖擊數(shù)據(jù)圖如圖5所示。
圖5 模擬傳動系統(tǒng)突變沖擊數(shù)據(jù)圖
可以明顯看出數(shù)據(jù)在受到沖擊載荷時被分成了3個部分。
將采集到的數(shù)據(jù)通過第3節(jié)介紹的步驟計算出故障特征,然后將數(shù)據(jù)分別導入近主成分分析法(PCA)、傳統(tǒng)AP算法、改進后AP算法,得到的特征選擇圖如圖6~圖8所示。
圖6 實驗數(shù)據(jù)PCA特征選擇圖
圖7 傳統(tǒng)AP聚類算法特征選擇圖
圖8 改進AP聚類算法特征選擇圖
通過上面特征選擇結果圖來看,PCA選擇的結果將數(shù)據(jù)分成了兩類,將瞬間沖擊數(shù)據(jù)(第2類數(shù)據(jù))和沖擊前數(shù)據(jù)(第1類數(shù)據(jù))、沖擊后數(shù)據(jù)(第3類數(shù)據(jù))分開了,但是并未將數(shù)據(jù)1和數(shù)據(jù)3分開,不能把數(shù)據(jù)里的細小差異區(qū)分出來。傳統(tǒng)的AP算法將數(shù)據(jù)分成了3個部分,這數(shù)據(jù)均被分離,效果也比較好,但是在對第1類數(shù)據(jù)和第3類數(shù)據(jù)進行細微差異的分辨時有部分數(shù)據(jù)分辨不清,第1類數(shù)據(jù)和第3類數(shù)據(jù)出現(xiàn)了重合,這對于故障診斷可能埋下診斷不清或者診斷不準確的隱患。而改進后的AP算法,將3類數(shù)據(jù)分離得很清楚,特別是對第1類數(shù)據(jù)和第3類數(shù)據(jù)有很好的分辨率,同時將第1類數(shù)據(jù)和第3類數(shù)據(jù)投影到同一面上,并將第2類數(shù)據(jù)也統(tǒng)一投影在一個面上,這說明對于一些相差比較大的數(shù)據(jù)改進后的AP算法也有較好的聚類效果。
本文提出了針對直升機傳動系統(tǒng)故障特征提取的相似性傳播聚類方法,對直升機傳動軸進行了故障特征定義,理論推導和實驗驗證表明該方法對故障點特征具有良好的選擇性。針對傳統(tǒng)AP算法在分辨數(shù)據(jù)差異方面的不足,提出了一種度量特征重要度的加權AP算法,并將其應用于傳動軸的故障特征選擇上,實驗結果表明,該算法分辨效果有了很大的提高,解決了傳統(tǒng)AP算法對傳動軸故障早期和細微故障的分辨率不高的問題。