郭翠娟,龔楚云,榮 鋒,宋雅琪
(天津工業(yè)大學電子與信息工程學院,天津300387)
基于熵權法的實時振動信號存儲管理技術
郭翠娟,龔楚云,榮 鋒,宋雅琪
(天津工業(yè)大學電子與信息工程學院,天津300387)
針對實時振動信號的存儲問題,提出一種基于熵權法的實時振動信號存儲管理模式.根據振動信號的波動特點,將采集到的信號波形從時域和頻域2個方面分別計算出相關的指標參數,并采用熵權法對各參數進行加權計算,按照加權結果對各段波形進行排序,從理論角度對比甄選出含有有用信息較多的振動信號波形,舍棄較為無用的波形信號,從而節(jié)省數據庫存儲空間,方便后續(xù)信號的存儲,而且使得有用波形可以完整攜帶并保存與機械運行狀態(tài)相關的信號.
振動信號;大數據;熵權法;數據存儲
對旋轉機械的振動信號進行監(jiān)測與處理有助于實時了解設備的運行狀態(tài)[1].采集的振動信號通常被實時存儲到數據庫系統(tǒng)中,便于后續(xù)的分析處理.當前,國內外主流的工業(yè)實時數據庫產品一般都提供了歷史數據存儲功能,能較長時間地保存?zhèn)浞莠F(xiàn)場所采集到的數據[2].由于機械需要長期運行,隨著采集時間的增加,采集點增加,采集時間周期又較短,因此要保存的振動信號的數據量也隨之不斷增大,而數據庫容量有限,如果將這些數據直接存儲,不僅會占用大量的系統(tǒng)存儲空間,無法滿足長時間存儲的需求,降低數據庫的實時性,而且數據庫的安全性和穩(wěn)定性也會受到影響,數據的傳輸、查詢將變得十分困難[3].
針對海量信息存儲問題,傳統(tǒng)的解決方案大多采用網絡存儲,然而網絡存儲需要專用服務器和專用磁盤陣列,成本昂貴,并且磁盤運行壽命有限,故障率高[4].而對數據庫進行邏輯劃分,即將數據分布到不同的服務器中進行存儲,需要在數據增加時重新進行劃分,進而要求修改程序并丟棄模型的獨立性[5].對關系數據進行非規(guī)范化處理增加了數據的冗余,雖然有利于數據分布到多個節(jié)點上進行并行操作,卻沒能節(jié)省數據庫容量.目前常用的數據壓縮技術即對數據進行壓縮再存儲,可以提供較高的壓縮率,因此歷史數據占用的硬盤空間少,在存儲及調用歷史數據時對硬盤的讀寫減少,能夠在保持數據庫高實時性等特點的同時,盡可能地提高數據庫的容量,從而節(jié)省了系統(tǒng)資源[6].數據壓縮技術主要有有損壓縮算法和無損壓縮算法兩種.有損算法依據數據的特征,通常采用了特殊舍點算法,該種算法會帶來不可恢復的損失與誤差,變換后數據變得很平滑,高值和低值被濾掉,也就不能準確地由波形信息推測出設備運行狀態(tài).而無損算法更不能從根本上解決數據庫容量有限的問題.由此觀之,在大數據背景下,信號處理的瓶頸已由“信號采集量太少”轉移到“如何對海量信號數據進行高速有效處理”[7].
本文提出一種振動信號存儲管理模式.根據振動信號的波動特點,計算所采集的信號在時域與頻域中的相關指標參數,對這些參數按照熵權法[8]賦予權值進行加權計算,再將所采集的信號按照加權結果進行排序,對比甄選出含有有用信息較多的振動信號,節(jié)省數據庫存儲空間.
信號是信息的載體,選擇適當的信號處理方法對信號進行處理,有利于后續(xù)的狀態(tài)監(jiān)測以及故障診斷工作的開展.通常,振動信號時域特征參數有振幅、周期、相位等,頻域特征則主要包含在頻率、能量信息中.采集板卡采集到振動信號之后,時域連續(xù)信號經過采樣成為離散信號,上位機通過以太網接收離散振動信號,保存在數據庫中.通過對離散信號進行分析處理,結合機械工作原理,可以對設備運行狀態(tài)做出粗略的判斷,為狀態(tài)維修提供維修策略.
1.1 信號的時域指標參數計算
中心頻率在信號的時域中描述幅值隨時間的變化關系稱作幅值域分析.幅值域分析是信號處理中最常用的信號分析方法.信號的幅值域參數主要包括峰峰值、峰值、均值、有效值、方差、峭度指標等:
(1)峰峰值,主要用來描述振動的幅值,即機械振動的位移量,由波形上最高點與最低點之差表示,計算公式為:
(2)峰值,是指波形上與零線最大的偏移量,振動信號的加速度值常用峰值描述.根據經驗,一般在檢測剝落、裂紋、壓痕、凹坑等原因造成的沖擊性振動時,峰值會急劇增大,計算公式為:
(3)均值,用來描述信號的平均水平,也稱數學期望或一次矩,反映了信號變化的中心趨勢,計算公式為:
(4)有效值,即信號的均方根值,可以描述振動的強烈程度,計算公式為:
(5)方差,反映了信號繞均值的波動程度,也是反映信號的離散程度,計算公式為:
(6)峭度指標,可以敏感捕捉信號中的沖擊成分,是描述波形尖峰度的指標,計算公式為:
峭度指標的計算公式中分子為x的4次方,而分母是一個平均量,這就必然導致分子的增加快于分母,若峭度指標的值上升很快,說明故障已出現(xiàn),從而大大提高故障診斷準確度.
利用時域指標來分析振動信號,優(yōu)點是直觀、便于理解和直接計算,但只能做定性分析.從理論上講,對信號來說,時域分析對時間的分辨率是無窮的,但對頻率的分辨率為零;而頻域分析對頻率的分辨率是無窮的,但對時間的分辨率為零.因此,還需要結合信號的頻域分析,才能更準確地評估出信號所包含有用信息量的多少,才能更有利于正確評估信號的有用價值.
1.2 信號的頻域指標參數計算
頻域和時域表明了動態(tài)信號的2個觀察面,即這2種觀察信號方法以不同的角度揭示了信號的物理特征,而傅里葉變換建立起它們之間的聯(lián)系.
傅里葉變換可以看作是時間函數在頻率域上的表示.由傅里葉變換給出的頻率域包含的信息和原函數時間域內所包含的完全相同,不同的僅是信息的表示形式.根據振動信號采集已采樣成為離散點存儲在數據庫的實際情況,本文選擇更適合的離散傅里葉變換(DFT)來做離散信號的頻域分析.DFT的表達方式如下:
式中:DFS[*]表示離散傅里葉正變換;IDFS[*]表示離散傅里葉逆變換.利用傅里葉變換,可以得到幅度譜.在時間計算時,可以使用快速傅里葉變換(FFT),以減少運算量.
另外,功率譜也是一個常用的頻域指標.功率譜反映了隨機信號各頻率成份功率能量的分布情況.當機械設備發(fā)生故障時,會在某些特征頻率附近出現(xiàn)明顯的峰值,功率譜反映了各頻率成分能量的分布關系,更容易得到峰值所對應的頻率,與設備特征頻率進行對比分析,有助于對設備進行故障診斷.對于連續(xù)信號來說,當采樣長度為T0時,其功率譜密度為:
當采樣間隔為T、采樣點為N時,T0=NT,由連續(xù)傅里葉變換和離散傅里葉變換關系得:
便可以得到離散功率譜密度表達式:
通過以上公式,可以將信號的使用價值大小定量化,方便作為后續(xù)排序的依據.
對振動信號分析中各指標參數的關心程度通常不盡相同,對于在監(jiān)測機械運轉與檢測機械故障方面更能直觀、方便和準確地提供信息的參數則應該多給予關心.本文方法的基本思想是:對于已經計算出來的各參數,對應地給予一組非負數權值ωi(i=1~n),然后將各指標參數計算值乘以相應的加權系數,求和,得到振動信號各項指標的加權結果.基于多指標與客觀性考慮,本文選用熵權法進行權值的確定[9].
熵是信息論中的一個概念,熵權法的基本思路是根據指標變異性的大小來確定客觀權重,在多指標綜合評定方面幾乎不受主觀因素干擾,很有優(yōu)勢[10].一般來說,若某個指標的信息熵越小,表明指標值的變異程度越大,提供的信息量越多,在綜合評價中所能起到的作用也越大,其權重也就越大.相反,某個指標的信息熵越大,表明指標值的變異程度越小,提供的信息量越少,在綜合評價中所起到的作用越小,其權重也就越小[11-12].
利用熵權法,結合實際情況,本文所提出的振動信號指標參數加權計算過程如下:
(1)根據實際情況需要,將每一天的波形數據分為n組進行檢測,即確定n個對象;
(2)計算出n組波形的時域以及頻域各指標參數值,共有m項指標.從而得到矩陣:
(3)對指標參數矩陣進行標準化處理得到新的矩陣:
式中:rij為第i個對象在第j個評價指標上的標準值.其標準化計算公式為:
公式(14)適用于指標數值越大越好的情況下,公式(15)則適用于指標數值越小越好的情況.
(4)計算第j項指標的熵:
(5)計算各指標權重:
(6)根據各指標的熵與權值,便可以得到最終的加權結果Vi:
以上便是利用熵權法對振動信號的各項指標進行加權計算的全部過程.根據得到的加權結果Vi,便可以對抽取出來的波形信號信息量進行排序,從而刪除包含信息量最少的信號,保留富含信息量的信號,方便后續(xù)的信號分析處理.
振動信號存儲在數據庫中之后,根據實驗需要,可以先抽取5組數據,按照上述方法進行計算.
本次實驗利用振動信號采集系統(tǒng)分別采集5組波形,其中前4組分別為正常運行的波形產生的參數,第5組為故障波形產生的參數.正常振動時產生的波形以及故障時產生的波形分別如圖1和圖2所示.
圖1 正常振動波形圖Fig.1 Normal vibration signal
圖2 振動故障波形圖Fig2Vibration signal with bugs
根據前邊所述過程,計算結果如表1所示.
表1 5組振動波形各項指標計算結果Tab.1 Indexes of five vibration signals
對數據進行標準化后,得到結果如表2所示.
表2 5組振動波形各項指標計算標準化后結果Tab.2 Indexes of five vibration signals after standardization
根據信息熵的計算公式,得到各指標信息熵如表3所示.
表3 各項指標信息熵表Tab.3 Entropy weight of each index
根據得到的各指標信息熵,計算出各指標權重如表4所示.
表4 各指標權重Tab.4 Weight of each index
根據計算出的指標權重,5組波形加權結果如表5所示.
表5 5組波形評定結果Tab.5 Result of five wave caculate
根據最終的加權結果,可知第2組波形變化較為平緩,相應時段機械運轉并無太大異常,所以并不需要對這一時段產生的波形做進一步地分析來得知機械是否故障,因此可以舍棄,節(jié)省數據庫的存儲空間.
針對實時振動信號采集系統(tǒng)的數據庫存儲容量有限,數據不能長期穩(wěn)定且安全地存儲在數據庫中,而壓縮數據又不能完整還原波形信號的問題,提出一種新的振動信號存儲管理模式,將采集到的振動信號波形從時域與頻域2個方面分別計算出相關的波形指標參數,將計算得到的參數按照關心程度賦予權值,進行加權計算,便可以對各段波形按照權值進行排序,從理論角度對比甄選出含有有用信息較多的振動信號波形,繼續(xù)保存在數據庫中,舍棄較為無用的波形信號.這樣不但節(jié)省了數據庫存儲空間,而且使得有用波形可以完整攜帶并保存與機械運行狀態(tài)相關的信號.
本文提出的基于熵權法的實時振動信號存儲管理模式,是基于實驗室已有的硬件振動設備平臺,研究平臺上位機系統(tǒng)如何能應對硬件系統(tǒng)采集的大量振動信號數據而創(chuàng)新得出的一種大數據管理模式.由于該數據管理模式是基于信號特征參數計算得出的,而模擬和數字信號都有著諸如峰峰值、均值、有效值、方差和功率譜等相同的特征參量,因此理論上看似可以推廣應用到其他信號如語音、視頻、圖像等信號的存儲.但實際上,并不是所有信號都適用這一方法.因為在設備監(jiān)測領域,一旦設備發(fā)生故障,設備故障部位產生的振動信號會發(fā)生突變,其各方面特征參量也有別于正常運作時產生的振動信號,因此通過算法計算,很容易找到突變信號而了解到故障所在.但語音、視頻和圖像信息的獲取目的卻與設備監(jiān)測不同,或許并不是為了監(jiān)測故障,而是為了進行圖像或者語音信號的處理,那么按照本文方法并不能得出加權值大的信號就有利于信號處理的結論.非同一目的,不能混淆,這也是本文所提出的基于熵權法的實時振動信號存儲管理模式的局限之處,還需作進一步研究.
[1]彭暢.旋轉機械軸承振動信號分析方法研究[D].重慶:重慶大學,2014.
[2]賴達波.某齒輪箱故障振動信號特征提取及分析技術研究[D].成都:電子科技大學,2013.
[3]徐國風.實時數據庫關鍵技術研究[D].西安:西安建筑科技大學,2006.
[4]吳劍強.流程工業(yè)實時數據庫系統(tǒng)研究與開發(fā)[D].杭州:浙江大學,2004.
[5]欒振華.工業(yè)實時數據庫的應用設計及數據處理研究[D].杭州:浙江大學,2008.
[6]HOURANI B,SALIM R.A performance analysis framework for the design of DSP systems.North Carolina State University,2008(4):100-104.
[7]朱林.基于特征加權與特征選擇的數據挖掘算法研究[D].上海:上海交通大學,2013.
[8]劉志,李軍華,胡克澤,等.熵權法在企業(yè)績效綜合評價中的應用[J].石油化工管理干部學院學報,2008,4(10):63-69.
[9]王昆,宋海洲.三種客觀權重賦權法的比較分析[J].經濟技術與管理研究,2003(6):48-50.
[10]章穗,張梅,遲國泰.基于熵權法的科學技術評價模型及其實證研究[J].管理學報,2010,7(1):34-41.
[11]高孝偉.熵權法在教學評優(yōu)中的應用研究[J].中國地質教育,2008(4):100-104.
[12]俞立平,武夷山.學術期刊客觀賦權評價新方法:指標難度賦權法[J].現(xiàn)代圖書情報技術,2011,27(4):64-70.
[13]MENDAL Jery M.Tutorial on higher-order statistics spectra in signal processing and system theory:theoretial results and some applications[J].Proe IEEE,1991,49(3):278-305.
[14]PORTNOFF M R.Time-frequency representation of digital signals and system based on short time Fourier analysis[J]. IEEE Trans on ASSP,1980,28:55-69.
[15]MALLAT S.Singularity deteetion and processing with wavelet [J].IEEE Trans Information Theory,1992,38(2):617-693.
[16]MALLAT S G.A theory for multisolution signal decomposition:The wavelet representation[J].IEEE Transaetion on Pattern Analysis and Maehine Intelligence,1989,11(3):674-693.
Storage management method of real-time vibration signal based on entropy weight technology
GUO Cui-juan,GONG Chu-yun,RONG Feng,SONG Ya-qi
(School of Electronics and Information Engineering,Tianjin Polytechnic University,Tianjin 300387,China)
Aiming at the stored problem of the real-time vibration signal,a storage management method of real-time vibration signal was presented based on entropy weight technology.The parameters of signal were calculated from timedomain and frequency-domain respectively,and each part of signal was evaluated with different weight valued parameters,then these signals were ordered,the useful signals with higher weighed result were kept and less useful signals with lower weighed results were deleted.This method can not only save the storage space of database for subsequent signals,but also store useful signals completely with useful information of machinery's states.
vibration signal;big data;entropy weight;data storage
TB535;TP311
A
1671-024X(2015)06-0067-05
10.3969/j.issn.1671-024x.2015.06.014
2015-07-07
國家自然科學基金資助項目(61405144)
郭翠娟(1975—),女,博士,副教授,主要研究方向為現(xiàn)代通信網絡.E-mail:guocuijuan@tjpu.edu.cn