王莉娜,姜相奪,蘆玉華
基于時(shí)變自回歸模型的非平穩(wěn)數(shù)據(jù)預(yù)測(cè)方法研究
王莉娜,姜相奪,蘆玉華
針對(duì)現(xiàn)有的自回歸(Autoregressive, AR)模型對(duì)非平穩(wěn)數(shù)據(jù)預(yù)測(cè)效果不佳的問題,提出了基于時(shí)變自回歸(Time-Varying Autoregressive, TVAR)模型的時(shí)序預(yù)測(cè)方法。針對(duì)某型國(guó)產(chǎn)飛機(jī)發(fā)動(dòng)機(jī)的低壓轉(zhuǎn)速信號(hào),使用TVAR模型分別進(jìn)行點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),并與AR模型的點(diǎn)預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。研究結(jié)果表明,TVAR模型能夠很好地反映非平穩(wěn)數(shù)據(jù)的變化趨勢(shì)。在給定置信水平下,TVAR預(yù)測(cè)區(qū)間能夠包含真實(shí)數(shù)據(jù),因此TVAR模型在時(shí)序預(yù)測(cè)中具有更好的預(yù)測(cè)效果。
時(shí)間序列;時(shí)變自回歸模型;預(yù)測(cè)
近年來(lái),隨著微機(jī)、航空、航天、電子、通信金融等領(lǐng)域的發(fā)展,時(shí)間序列預(yù)測(cè)變得越來(lái)越重要,是當(dāng)前科學(xué)研究的熱點(diǎn)之一。目前,我國(guó)學(xué)者已將時(shí)間序列法中的回歸分析法、分解分析法應(yīng)用于故障率預(yù)測(cè),然而回歸分析法需要首先識(shí)別目前產(chǎn)品所處階段,分解分析法則需要大量數(shù)據(jù)支撐,不適用于數(shù)據(jù)量少的情況,這兩種方法都存在一定的局限性。時(shí)間序列法中的ARMA(Autoregressive Moving Average)模型能較好地解決上述問題,無(wú)須識(shí)別產(chǎn)品所處階段,所需數(shù)據(jù)量少,且預(yù)測(cè)精度較高,便于在線性最小方差意義下進(jìn)行最佳預(yù)報(bào)和控制。研究人員已經(jīng)將ARMA模型應(yīng)用于故障數(shù)預(yù)測(cè)、設(shè)備缺陷數(shù)預(yù)測(cè)[1][2]。
ARMA模型的兩種特殊情況是AR模型、MA模型等。其中,由于AR模型的結(jié)構(gòu)相對(duì)簡(jiǎn)單,在某種意義上,AR模型和MA模型及ARMA模型可以相互轉(zhuǎn)化,因此AR模型的應(yīng)用范圍最廣。AR模型的系數(shù)是常數(shù),不能隨著信號(hào)的變化而不斷調(diào)整,適用于平穩(wěn)信號(hào),對(duì)非平穩(wěn)信號(hào)的適用性較差。
TVAR模型是將AR模型的常系數(shù)ai展開為一組基時(shí)間函數(shù)的線性組合,模型系數(shù)能夠動(dòng)態(tài)調(diào)整,可以更好地描述信號(hào)的變化,已經(jīng)在模態(tài)識(shí)別[3],語(yǔ)音分析[4]及故障診斷[5]等方面成功應(yīng)用。
本文針對(duì)TVAR模型在非平穩(wěn)信號(hào)處理方面的優(yōu)勢(shì),提出了基于TVAR模型的非平穩(wěn)數(shù)據(jù)預(yù)測(cè)方法。
1.1 AR預(yù)測(cè)模型簡(jiǎn)介
AR模型是一種特殊的隨機(jī)線性時(shí)不變(LTI)系統(tǒng)離散時(shí)間模型。該模型的輸出序列y(n)可以看作是白噪聲e(n)通過有理濾波器得到。對(duì)于長(zhǎng)度為N的時(shí)間序列y(n),其AR模型具有如下形式:
其中,y(n)為第n時(shí)刻的采樣值,ai為AR模型的系數(shù),p為模型的階數(shù),e(n)為模型的殘差。
假設(shè)要對(duì)長(zhǎng)度為N的時(shí)間序列y(n)作k步預(yù)測(cè),設(shè)第n時(shí)刻的預(yù)測(cè)值用y?(n)表示,則第N+k時(shí)刻的預(yù)測(cè)數(shù)據(jù)有如下形式如公式(2):
1.2 TVAR預(yù)測(cè)模型
(1)點(diǎn)預(yù)測(cè)
TVAR模型是將AR模型的常系數(shù)ai展開為一組基時(shí)間函數(shù)的線性組合,因此該模型能夠根據(jù)信號(hào)的變化而不斷地調(diào)整模型的系數(shù),從而能夠更好地描述信號(hào)的變化,即對(duì)于長(zhǎng)度為N的時(shí)間序列y(n),TVAR模型用差分方程形式表示如公式(3)、(4):
其中,y(n)為第n時(shí)刻的采樣值,ai(n)為時(shí)變系數(shù),p為模型的階數(shù),e(n)為模型的殘差,aij為基時(shí)間函數(shù)的加權(quán)系數(shù),gj(n)為基時(shí)間函數(shù),m為基展開的維數(shù)。
假設(shè)要對(duì)長(zhǎng)度為N的時(shí)間序列y(n)作k步預(yù)測(cè),即使用有限個(gè)歷史數(shù)據(jù)y(1),y(2),…,y(N)對(duì)第N+k時(shí)刻的數(shù)據(jù)y(N+k)作預(yù)測(cè),設(shè)第n時(shí)刻的預(yù)測(cè)值用y?(n)表示,則第N+k 時(shí)刻的預(yù)測(cè)數(shù)據(jù)有如下形式如公式(5):
其中,當(dāng)i≥k時(shí),y?(N+k?i )=y(N+k?i )。
使用文獻(xiàn)[7]所用的前后向估計(jì)相結(jié)合的方法估算出系數(shù)aij以后,便可使用公式(4)計(jì)算出a?i(N+k)的值,之后利用公式(5)便可計(jì)算出第N+k時(shí)刻的預(yù)測(cè)值y?(N+k)。
在參數(shù)的點(diǎn)估計(jì)中,當(dāng)θ?=θ?(X1,X2,…,Xn)是未知參數(shù)θ的一個(gè)估計(jì)量時(shí),對(duì)于一組樣本值(x1,x2,…,xn)就得到θ的一個(gè)估計(jì)值θ?=θ?(x1,x2,…,xn)。點(diǎn)估計(jì)就是取θ≈θ?,這使得我們對(duì)θ的值有了一個(gè)明確的數(shù)量概念。但是,點(diǎn)估計(jì)值θ?僅僅是未知參數(shù)θ的一個(gè)近似值,這種近似值的精確程度或誤差范圍都沒有給出,這是點(diǎn)估計(jì)的缺陷,而區(qū)間估計(jì)則正好在一定程度上彌補(bǔ)了點(diǎn)估計(jì)的這個(gè)缺陷[8]。
y(N+k)的第k步預(yù)測(cè)由式(5)給出,則第k步預(yù)測(cè)的方差由公式(6)給出:
其中如公式(7):
當(dāng)i>p時(shí),ai(n)=0,σ2為前N時(shí)刻的方差。
于是y(N+k)的置信水平為1?α的置信區(qū)間如公式(8):
公式(6)至公式(8)的具體推導(dǎo)過程參見文獻(xiàn)[9]。
為了探討TVAR算法的預(yù)測(cè)效果,本文選用某型國(guó)產(chǎn)飛機(jī)發(fā)動(dòng)機(jī)所采集到的左發(fā)低壓轉(zhuǎn)速NL為預(yù)測(cè)對(duì)象。選取其中的528個(gè)數(shù)據(jù)點(diǎn),前508個(gè)數(shù)據(jù)點(diǎn)作為歷史數(shù)據(jù),后20個(gè)數(shù)據(jù)點(diǎn)為待預(yù)測(cè)數(shù)據(jù)。模型階數(shù)的選取采用AIC預(yù)報(bào)準(zhǔn)則[10],TVAR模型選用DCT基時(shí)間函數(shù)(Discrete Cosine Transform)[11],基展開維數(shù)為12。
為了更清楚地查看AR模型與TVAR模型的預(yù)測(cè)效果,將真實(shí)值與預(yù)測(cè)值作圖比較。真實(shí)的528個(gè)數(shù)據(jù)點(diǎn)的波形圖,如圖1所示:
圖1 低壓轉(zhuǎn)速時(shí)間序列
由圖1可知,所選取的508個(gè)歷史數(shù)據(jù)變化比較大,尤其是在第160個(gè)數(shù)據(jù)點(diǎn)和第420個(gè)數(shù)據(jù)點(diǎn)時(shí),數(shù)據(jù)下降得比較劇烈,而所需預(yù)測(cè)的最后20個(gè)數(shù)據(jù)點(diǎn)已經(jīng)趨于平緩。AR模型的預(yù)測(cè)結(jié)果,如圖2所示:
(a) Yule-Walker算法
(b)最小二乘與Burg算法圖2 AR模型預(yù)測(cè)
AR系數(shù)估計(jì)方法包括Yule-Walker算法,最小二乘算法和Burg算法。為了有一個(gè)更清晰的比較,將Yule-Walker算法單獨(dú)作圖,如圖2(a)所示,從圖中可以看出,使用Yule-Walker算法所預(yù)測(cè)的數(shù)據(jù)與真實(shí)值存在較大誤差,且圍繞真實(shí)值上下波動(dòng),并不能體現(xiàn)出后20個(gè)點(diǎn)的變化趨勢(shì)。圖2(b)為使用Burg算法與最小二乘方法預(yù)測(cè)的結(jié)果。從圖中可以看出,最小二乘方法與Burg算法所預(yù)測(cè)的數(shù)據(jù)有相似的預(yù)測(cè)結(jié)果和相同的變化趨勢(shì),二者的預(yù)測(cè)值均圍繞著真實(shí)值上下波動(dòng),但是預(yù)測(cè)的數(shù)據(jù)逐漸發(fā)散,預(yù)測(cè)誤差越來(lái)越大。由此可見,使用Yule-Walker算法,最小二乘算法和Burg算法等3種方法進(jìn)行AR模型的系數(shù)估計(jì),所預(yù)測(cè)的數(shù)據(jù)并不能很好地反映真實(shí)數(shù)據(jù)的變化趨勢(shì),且預(yù)測(cè)誤差逐漸增加。
為使用TVAR模型所得到的預(yù)測(cè)結(jié)果如圖3所示:
圖3 TVAR模型預(yù)測(cè)
從圖中可以看出,TVAR模型的預(yù)測(cè)數(shù)據(jù)與真實(shí)的低壓轉(zhuǎn)速之間的差別很小,雖然隨著預(yù)測(cè)步長(zhǎng)的增加,預(yù)測(cè)的誤差逐漸增大,但是該模型基本能夠較好地反映真實(shí)數(shù)據(jù)的變化趨勢(shì),且預(yù)測(cè)誤差也在允許的范圍以內(nèi)。
為了研究預(yù)測(cè)值的估計(jì)精度與誤差范圍,對(duì)第3節(jié)的發(fā)動(dòng)機(jī)低壓轉(zhuǎn)速進(jìn)行區(qū)間估計(jì)。選取α=0.10,即置信水平為90%,查看正態(tài)分布表可知,此時(shí),利用公式(6)至公式(8)計(jì)算第k步預(yù)測(cè)的真實(shí)值y(N+k)的置信區(qū)間,TVAR模型區(qū)間估計(jì)的結(jié)果,如圖4所示:
圖4 TVAR模型區(qū)間估計(jì)
從圖4可以看出,所預(yù)測(cè)的20個(gè)真實(shí)值全都落在預(yù)測(cè)區(qū)間中,然而,隨著預(yù)測(cè)步長(zhǎng)的增加,預(yù)測(cè)的區(qū)間半徑逐漸增大,這是因?yàn)橛捎诶鄯e誤差的存在,預(yù)測(cè)值與真實(shí)值的差距越來(lái)越大,為了保證預(yù)測(cè)結(jié)果的可靠性,必然得增加預(yù)測(cè)區(qū)間的長(zhǎng)度,因而預(yù)測(cè)的精確度有所降低。
由此可見,對(duì)于區(qū)間預(yù)測(cè)來(lái)說(shuō),預(yù)測(cè)的可靠度與精確度是相互制約的。在實(shí)際應(yīng)用中,常采用一種折中的方案,在使得置信度達(dá)到一定要求的前提下,尋找精確度盡可能高的區(qū)間估計(jì)。實(shí)際上,對(duì)于本例來(lái)說(shuō),由于所預(yù)測(cè)的發(fā)動(dòng)機(jī)低壓轉(zhuǎn)速不可能為負(fù)值,所以從第3個(gè)預(yù)測(cè)點(diǎn)開始,預(yù)測(cè)下限就已經(jīng)不具有物理意義了。
本文主要研究了TVAR模型在時(shí)序預(yù)測(cè)方面的應(yīng)用。針對(duì)比較常見的預(yù)測(cè)類型——點(diǎn)預(yù)測(cè)與區(qū)間預(yù)測(cè),分別推導(dǎo)了TVAR預(yù)測(cè)模型的公式。通過對(duì)某型國(guó)產(chǎn)飛機(jī)在某次飛行中的發(fā)動(dòng)機(jī)低壓轉(zhuǎn)速的一段數(shù)據(jù),使用TVAR模型與AR模型進(jìn)行步長(zhǎng)為20的點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),結(jié)果表明,對(duì)于變化比較大的數(shù)據(jù),AR模型并不能很好地跟蹤信號(hào)的變化趨勢(shì),甚至?xí)霈F(xiàn)非常大的預(yù)測(cè)誤差。而TVAR模型的能夠很好地反映真實(shí)數(shù)據(jù)的變化趨勢(shì),且預(yù)測(cè)誤差也在允許的范圍以內(nèi)。在給定置信水平下,TVAR預(yù)測(cè)區(qū)間能夠包含真實(shí)的數(shù)據(jù),因此具有更好的預(yù)測(cè)效果。
[1] 李瑞瑩,康銳.基于ARMA模型的故障率預(yù)測(cè)方法研究[J].系統(tǒng)工程與電子技術(shù),2008,30(8):1588-1591
[2] 王治華,傅惠民. 廣義時(shí)變ARMA序列預(yù)測(cè)方法[J]. 航空動(dòng)力學(xué)報(bào),2005,20(5):713-717
[3] 續(xù)秀忠,張志宜,華宏星等.應(yīng)用時(shí)變參數(shù)建模方法辨識(shí)時(shí)變模態(tài)參數(shù)[J].航空學(xué)報(bào),2003,24(3):230-233
[4] 朱志宇. 基于高斯粒子濾波器和TVAR模型的語(yǔ)音增強(qiáng)技術(shù)[J].儀器儀表學(xué)報(bào),2008,29(9):1903-1907
[5] 熊國(guó)良,張龍,陳慧.TVAR在非平穩(wěn)工況轉(zhuǎn)子故障診斷中的應(yīng)用[J].振動(dòng)、測(cè)試與診斷,2007,27(2):108-111
[6] Petre Stoica, Randolph Moses著,吳仁彪,韓萍,馮青,等譯.現(xiàn)代信號(hào)譜分析[M].北京,電子工業(yè)出版社,2007
[7] 蘆玉華 ,王仲生,姜洪開.基于改進(jìn)時(shí)變自回歸模型的滾動(dòng)軸承故障診斷 [J]. 振動(dòng)與沖擊,2011,30(12):74-77,107
[8] 徐偉,趙選民,師義民,等. 概率論與數(shù)理統(tǒng)計(jì)[M]. 西安,西北工業(yè)大學(xué)出版社,2005
[9] 王永民,何幼樺,忻莉莉,等. 時(shí)變自回歸模型系數(shù)的估計(jì)及預(yù)測(cè)[J]. 應(yīng)用數(shù)學(xué)與計(jì)算數(shù)學(xué)學(xué)報(bào),2007,21(2): 35-41
[10] 楊俊嶺,張長(zhǎng)隆,萬(wàn)建偉. 基于信息量準(zhǔn)則的AR模型相關(guān)高斯雜波模擬[J]. 航天電子對(duì)抗,2006,22(2):45-48
[11] Kie B.Eom. Analysis of Acoustic Signatures from Moving Vehicles Using Time-Varying Autoregressive models [J]. Multidimensional System and Signal Processing, 1999,10: 357-378
Prediction Research of Non-stationary Data Based on Time-Varying Autoregressive Model
Wang Lina, Jiang Xiangduo, Lu Yuhua
(Experimental Center of Shaanxi Fast Group Company Institute, Xi’an 710119, China)
As the AR(Autoregressive) model has poor prediction effect on non-stationary data, a Time-Varying Autoregressive model is established for timing prediction. Point and interval predictions of the TVAR Model are conducted based on NL data of an aero-engine, and are compared to point prediction of the AR model. The result shows that the TVAR model can reflect the real trend of the data, and the prediction errors are in the allowable range. At a given confidence level, the TVAR prediction interval contains real data, so the TVAR model has better prediction results in the timing projections.
Time Series; Time-Varying Autoregressive Model; Prediction
TP391
A
2014.05.27)
王莉娜(1983-),女,陜西法士特汽車傳動(dòng)研究院,工程師,碩士,研究方向:機(jī)械設(shè)備故障診斷分析,西安,710119
姜相奪(1983-),男,陜西法士特汽車傳動(dòng)研究院,工程師,學(xué)士,研究方向:機(jī)械設(shè)備故障診斷分析,西安,710119
蘆玉華(1986-),男,西安華為技術(shù)有限公司,工程師,碩士,研究方向:云計(jì)算虛擬化容災(zāi),西安,710075
1007-757X(2014)08-0034-03