王 濤,李艾華,高運(yùn)廣,蔡艷平,王旭平
(第二炮兵工程大學(xué) 機(jī)電工程系,西安 710025)
由于表征機(jī)械設(shè)備運(yùn)行狀態(tài)的振動信號特征量呈現(xiàn)出較強(qiáng)的非線性、非平穩(wěn)特點(diǎn)[1],因此基于振動信號的機(jī)械設(shè)備狀態(tài)預(yù)測是一個典型的非線性時間序列預(yù)測問題。目前,常用的非線性預(yù)測模型主要有:時序模型、灰色模型以及人工神經(jīng)網(wǎng)絡(luò)模型,以上方法在小樣本學(xué)習(xí)方面均存在缺陷。支持向量回歸(Support Vector Regression,SVR)繼承了支持向量機(jī)在小樣本學(xué)習(xí)方面的優(yōu)點(diǎn)[2],因而被廣泛應(yīng)用于復(fù)雜時間序列的回歸與預(yù)測。但要想得到滿意的預(yù)測精度,既與SVR的輸入特征有關(guān),還與SVR模型參數(shù)的選取緊密相關(guān)。
在將支持向量回歸機(jī)應(yīng)用于機(jī)械設(shè)備狀態(tài)預(yù)測時,特征選擇是一項至關(guān)重要的工作。目前,常用的方法是人為確定訓(xùn)練SVR預(yù)測器的輸入和輸出矩陣,采用均方根誤差、均方誤差或者相對誤差對模型的逼近能力和預(yù)測效果進(jìn)行評估[3-—5]。這種方法的不足之處是訓(xùn)練數(shù)據(jù)的選取缺乏理論指導(dǎo),一旦選定就只能通過預(yù)測值與真實(shí)值之間的誤差來反復(fù)修正模型,直到得到滿意的預(yù)測精度,導(dǎo)致訓(xùn)練時間長,容易產(chǎn)生過擬合現(xiàn)象。
另外,當(dāng)核函數(shù)確定后,支持向量回歸機(jī)的性能優(yōu)劣取決于懲罰因子C、不敏感系數(shù)ε以及核參數(shù)σ(本文默認(rèn)采用高斯核函數(shù))的選擇。常用的SVR參數(shù)選擇方法有經(jīng)驗(yàn)法、格搜索結(jié)合交叉驗(yàn)證法。前一種方法太主觀,后一種方法很費(fèi)時,并且總體上其選擇參數(shù)的方法還是盲目的,不能實(shí)現(xiàn)參數(shù)的全局統(tǒng)一調(diào)節(jié),只能一個一個的調(diào)節(jié)。目前,已有很多學(xué)者將智能優(yōu)化算法應(yīng)用于SVR模型選擇之中。文獻(xiàn)[6]組合格搜索和10重交叉驗(yàn)證法對SVR模型參數(shù)進(jìn)行優(yōu)化選擇;文獻(xiàn)[7]分別采用進(jìn)化編程方法和粒子波算法優(yōu)化SVR模型參數(shù);文獻(xiàn)[8]提出一種采用改進(jìn)協(xié)方差矩陣的進(jìn)化策略優(yōu)化SVR模型參數(shù);文獻(xiàn)[9,10]分別應(yīng)用免疫算法和差分進(jìn)化算法優(yōu)化SVR模型參數(shù);文獻(xiàn)[11]采用遺傳算法優(yōu)化SVR模型參數(shù)。其中,遺傳算法作為一種通用的智能全局優(yōu)化算法,采用它優(yōu)化SVR模型參數(shù),不僅能保證尋優(yōu)結(jié)果的全局特征,而且克服了人工反復(fù)“試湊”的主觀性。
鑒于此,本文采用相空間重構(gòu)技術(shù)自適應(yīng)選取SVR輸入特征,采用自適應(yīng)遺傳算法同步優(yōu)化SVR模型參數(shù),在此基礎(chǔ)上構(gòu)建了一種基于相空間重構(gòu)與遺傳優(yōu)化SVR的預(yù)測模型,并將其應(yīng)用于某煉油廠煙機(jī)狀態(tài)預(yù)測。
為了避免訓(xùn)練數(shù)據(jù)選取的盲目性,提高模型學(xué)習(xí)效率,本文將相空間重構(gòu)技術(shù)引入到機(jī)械設(shè)備狀態(tài)預(yù)測中,通過將一維振動信號時間序列轉(zhuǎn)化成矩陣形式,以相點(diǎn)作為輸入特征訓(xùn)練SVR預(yù)測器,實(shí)現(xiàn)了輸入特征的自適應(yīng)選取。
對于時間序列{xi,i=1,2,...,n},n為序列的長度。根據(jù)Takens提出的嵌入定理[12],重構(gòu)相空間為{xi,xi+τ,...,xi+(m-1)τ},i=1,2,...,M。式中xi為相空間的點(diǎn);m為嵌入維數(shù);τ為延遲時間;M為重構(gòu)相空間中相點(diǎn)的個數(shù),M=n-(m-1)τ,相空間的吸引子矩陣為
相空間重構(gòu)技術(shù)的核心在于選擇合適的嵌入維數(shù)m和延遲時間τ。目前,選取延遲時間τ的方法主要有自相關(guān)函數(shù)法、最小互信息法、平均位移法等。其中,自相關(guān)函數(shù)法在實(shí)際中應(yīng)用較多,但自相關(guān)函數(shù)法僅能提取時間序列間的線性相關(guān)性,且很難應(yīng)用于高維混沌系統(tǒng),因此不適用于機(jī)械設(shè)備狀態(tài)的非線性時間序列預(yù)測問題。最小互信息法[13]克服了自相關(guān)法的缺點(diǎn),包含了時間序列的非線性特性,其計算結(jié)果明顯優(yōu)于自相關(guān)法,并取互信息函數(shù)的第一個極小值點(diǎn)作為優(yōu)化的延遲時間τ。因此,本文選擇最小互信息法確定最佳延遲時間τ。選擇最小嵌入維數(shù)m的常用方法主要有關(guān)聯(lián)指數(shù)飽和法、奇異值分解(SVD)法、虛假鄰域法等。其中,以虛假鄰域法應(yīng)用最為廣泛,但虛假鄰域法在有噪聲存在時效果往往較差。為了克服這一缺點(diǎn),CAO Liang-yue于1997年提出了一種基于虛假鄰域法的改進(jìn)方法,稱之為CAO方法[14]。本文選擇CAO方法確定最小嵌入維數(shù)m。需要注意的是,在使用CAO方法確定嵌入維數(shù)m前,需要預(yù)先確定最佳延遲時間τ。
當(dāng)采用ε-SVR算法構(gòu)造預(yù)測模型時,通過控制C和ε兩個參數(shù),可以控制支持向量機(jī)的推廣能力。其中,不敏感參數(shù)ε控制SVR模型的復(fù)雜程度。增大ε值則支持向量數(shù)目減少,導(dǎo)致預(yù)測模型過于簡單,學(xué)習(xí)精度不夠,造成欠擬合;減小ε值則支持向量數(shù)目增多,回歸精度提高,但可能導(dǎo)致SVR模型過于復(fù)雜,且訓(xùn)練時間也會增加,得不到好的推廣能力,造成過擬合。懲罰因子C控制SVR模型的魯棒性。參數(shù)C在結(jié)構(gòu)風(fēng)險和樣本誤差之間作出折中,以便使SVR模型有較好的推廣能力。C取值大則學(xué)習(xí)精度相應(yīng)提高,但模型的泛化能力變差。C取值小則對樣本數(shù)據(jù)的懲罰小,可能導(dǎo)致訓(xùn)練誤差變大。此外,C值影響SVR模型對異常點(diǎn)的敏感度,選擇合適的參數(shù)C可在一定程度上抗干擾,從而保證模型的穩(wěn)定性。當(dāng)訓(xùn)練SVR模型時,如果采用高斯核函數(shù),則核參數(shù)σ會對模型的預(yù)測準(zhǔn)確程度產(chǎn)生很大影響。核參數(shù)σ太小,估計的回歸曲線會較為粗糙,易出現(xiàn)“過擬合”;σ太大,則回歸曲線較為光滑,易出現(xiàn)“欠擬合”??傊?,σ取值太大或太小都會使SVR模型的泛化性能變差。
為了克服人工選擇參數(shù)存在盲目性和隨意性的問題,本文采用自適應(yīng)遺傳算法優(yōu)化SVR模型參數(shù),實(shí)現(xiàn)了模型參數(shù)自動尋優(yōu)。由于相對誤差(MAPE)比較客觀地體現(xiàn)了預(yù)測誤差與真實(shí)值的大小,因此本文采用MAPE指標(biāo)作為SVR模型預(yù)測性能的評價指標(biāo),遺傳算法的適應(yīng)度函數(shù)定義為
基于自適應(yīng)遺傳算法的SVR參數(shù)優(yōu)化步驟如下:
Step1:迭代次數(shù)t=0;
Step2:隨機(jī)選擇實(shí)數(shù)編碼的初始種群P(t);
Step3:針對P(t)中的個體訓(xùn)練SVR,計算個體適應(yīng)度函數(shù)值f(t);
Step4:若種群中最優(yōu)個體所對應(yīng)的適應(yīng)度函數(shù)值滿足要求或達(dá)到設(shè)定的迭代次數(shù),則轉(zhuǎn)到Step7;
Step5:t+1;
Step6:應(yīng)用選擇、交叉以及變異算子產(chǎn)生新的種群,之后轉(zhuǎn)到Step3;
Step7:給出最佳的C、ε以及σ參數(shù),并在訓(xùn)練數(shù)據(jù)集上訓(xùn)練最佳回歸模型。
本文所提方法的具體過程描述如下:
(1)將反映機(jī)械設(shè)備狀態(tài)的原始振動數(shù)據(jù)或經(jīng)過特征提取后的特征樣本構(gòu)造成一個單變量時間序列{x1,x2,...xn},然后采用相空間重構(gòu)技術(shù)將時序數(shù)據(jù)轉(zhuǎn)換為矢量數(shù)據(jù),確定延遲時間τ和嵌入維數(shù)m。
(2) 取 {xn}為 預(yù) 測 目 標(biāo) 值 ,將{xn-1,xn-2,xn-3,xn-m}作為相關(guān)量,建立輸入xn={xn-1,xn-2,xn-3,xn-m}與輸出yn={xn}之間的映射關(guān)系:Rm→R,構(gòu)造用于支持向量回歸機(jī)的學(xué)習(xí)樣本為
(3)采用自適應(yīng)遺傳算法對組合參數(shù)(C,σ,ε)進(jìn)行優(yōu)化,并基于優(yōu)化參數(shù)訓(xùn)練SVR回歸模型為
得到第n+1點(diǎn)的預(yù)測模型為
(4)一般,第p步預(yù)測模型為
xn和分別表示第n個數(shù)據(jù)的實(shí)際值和預(yù)測值。
某煉油廠重油催化裂化裝置(簡稱重催)由煙機(jī)、風(fēng)機(jī)、齒輪箱和電機(jī)四個部分組成,機(jī)組的結(jié)構(gòu)簡圖如圖1所示。該機(jī)組是煉油廠的重點(diǎn)設(shè)備之一,其運(yùn)行安全可靠性對提高煉油廠的經(jīng)濟(jì)效益具有十分重要的意義。因此,對該機(jī)組的運(yùn)行狀態(tài)趨勢進(jìn)行預(yù)測十分必要。
圖1 某機(jī)組結(jié)構(gòu)及傳感器布置圖
為了監(jiān)測和評估該機(jī)組的運(yùn)行狀態(tài),分別在煙機(jī)和風(fēng)機(jī)兩端軸瓦處安裝了電渦流傳感器,連續(xù)獲取各軸瓦處軸的振動位移信號。從這些信號中,每隔一小時提取一個振動位移值,組成一個單變量時間序列,對這個時間序列的預(yù)測就是對該機(jī)組在某個位置振動狀態(tài)的預(yù)測。在這個序列里選取120個點(diǎn)(5天的數(shù)據(jù))作為回歸訓(xùn)練樣本,建立回歸和預(yù)測模型,如圖2所示。
基于本文所提方法建立預(yù)測模型之前,需要對時間序列進(jìn)行相空間重構(gòu)。首先采用最小互信息法計算得到延遲時間τ=1,然后采用CAO方法計算得到最小嵌入維數(shù)m=7,如圖3所示,E1用于確定最小嵌入維數(shù)m,E2用于判定時間序列是否為確定性序列。
圖2 某機(jī)組振動位移值原始信號
圖3 采用CAO方法計算最小嵌入維數(shù)
將120個數(shù)據(jù)分成兩部分,其中前96個數(shù)據(jù)用來訓(xùn)練模型及優(yōu)化模型參數(shù),剩余24個數(shù)據(jù)用來驗(yàn)證模型的有效性。利用自適應(yīng)遺傳算法優(yōu)化模型參數(shù)(C,σ,ε),其中優(yōu)化算法的參數(shù)設(shè)置如表1所示,進(jìn)化過程及迭代結(jié)果如圖4所示。
經(jīng)自適應(yīng)遺傳算法優(yōu)化搜索得到懲罰因子C的值為160.692 8,高斯核參數(shù)σ的值為4.529 5,不敏感參數(shù)ε的值為0.006 5,對應(yīng)的最佳適應(yīng)度值為0.999 6。
為了驗(yàn)證本文所提基于相空間重構(gòu)和遺傳優(yōu)化SVR預(yù)測模型的有效性,使用上述優(yōu)化得到的參數(shù)值對機(jī)組振動時序前96個數(shù)據(jù)點(diǎn)進(jìn)行擬合。同時,為了與標(biāo)準(zhǔn)SVR模型比較,人工設(shè)定參數(shù)C=100,高斯核參數(shù)σ=9,不敏感參數(shù)ε=0.007,訓(xùn)練標(biāo)準(zhǔn)SVR模型。遺傳優(yōu)化SVR模型和標(biāo)準(zhǔn)SVR模型對機(jī)組振動時序的回歸結(jié)果如圖5所示,圖中黑點(diǎn)表示實(shí)際振動序列點(diǎn),紅色實(shí)線表示遺傳優(yōu)化SVR模型對振動時序的回歸曲線,黑色點(diǎn)劃線表示標(biāo)準(zhǔn)SVR模型對振動時序的回歸曲線。
圖4 優(yōu)化過程及結(jié)果
圖5 遺傳優(yōu)化SVR回歸結(jié)果
從圖5可以看出,兩種模型的回歸曲線與實(shí)際曲線非常吻合,回歸誤差小,回歸精度高。兩種模型對振動時序的回歸誤差如表2所示。
分別采用單步預(yù)測和多步預(yù)測方法對以上兩種模型的性能進(jìn)行研究。在單步預(yù)測時,每次預(yù)測都以待預(yù)測點(diǎn)附近的一些樣本值作為訓(xùn)練集,將測試點(diǎn)輸入訓(xùn)練好的回歸模型中,對下一時間點(diǎn)進(jìn)行預(yù)測。在多步預(yù)測時,直接將前一次模型預(yù)測值作為下一時刻預(yù)測的輸入向量元素,對下一時間點(diǎn)進(jìn)行預(yù)測。
用剩余的24個數(shù)據(jù)點(diǎn)對模型的預(yù)測能力進(jìn)行檢驗(yàn),遺傳優(yōu)化SVR模型和標(biāo)準(zhǔn)SVR模型對上述振動時序的單步預(yù)測和24步預(yù)測結(jié)果分別如圖6和圖7所示,兩種模型對振動時序的單步預(yù)測誤差和24步預(yù)測誤差分別如表3和表4所示。
表1 自適應(yīng)遺傳算法參數(shù)設(shè)置表
表2 兩種預(yù)測模型的回歸誤差
圖6 單步預(yù)測結(jié)果
圖7 24步預(yù)測結(jié)果
由上述實(shí)驗(yàn)結(jié)果可知,無論是單步還是24步預(yù)測,遺傳優(yōu)化SVR模型的預(yù)測精度都要比標(biāo)準(zhǔn)SVR模型的預(yù)測精度高。同時,遺傳優(yōu)化SVR模型的單步和24步預(yù)測精度都比較理想,而標(biāo)準(zhǔn)SVR雖有較好的單步預(yù)測效果,但多步預(yù)測能力明顯低于遺傳優(yōu)化SVR模型,這說明本文所提預(yù)測方法對該重油催化裂化裝置狀態(tài)預(yù)測是非常有效的。
表3 兩種預(yù)測模型的單步誤差
針對機(jī)械設(shè)備振動信號序列的非線性、非平穩(wěn)性特點(diǎn),本文構(gòu)建了基于相空間重構(gòu)與支持向量回歸機(jī)的預(yù)測模型,并采用自適應(yīng)遺傳算法對模型參數(shù)進(jìn)行優(yōu)化。實(shí)驗(yàn)表明,所提方法預(yù)測精度高,推廣能力好,為解決機(jī)械設(shè)備狀態(tài)預(yù)測問題提供了一種新思路。本文主要結(jié)論如下:
(1)為了避免輸入SVR的信息不足或冗余,通過相空間重構(gòu)法自適應(yīng)選取特征,以相點(diǎn)作為輸入特征訓(xùn)練SVR預(yù)測器,有效避免了數(shù)據(jù)選取的盲目性,提高了模型的學(xué)習(xí)效率;
(2)為了克服人工選擇參數(shù)存在盲目性和隨意性的問題,采用自適應(yīng)遺傳算法優(yōu)化SVR模型,使模型參數(shù)由人工優(yōu)選變?yōu)樽詣訉?yōu),有效提高了預(yù)測模型的泛化推廣能力和訓(xùn)練速度;
(3)某煉油廠煙機(jī)狀態(tài)預(yù)測結(jié)果表明,無論單步還是多步預(yù)測,遺傳優(yōu)化SVR模型的預(yù)測效果均優(yōu)于標(biāo)準(zhǔn)的SVR預(yù)測模型。
[1]YANG Bo-suk,Widodo Achmad.Support vector machine for machine fault diagnosis and prognosis[J].Journal of System Design and Dynamic s,2008,2(1):12-23.
[2]Vapnik V N.Statistical learning theory[M].New York:John Wiley & Sons,1998:10-40.
[3]侯澍曼,李友榮,劉光臨.基于支持向量機(jī)的設(shè)備振動信號趨勢預(yù)測[J].湖北工業(yè)大學(xué)學(xué)報,2006,21(3):12-17.
[4]王紅軍,張建民,徐小力.基于支持向量機(jī)的機(jī)械系統(tǒng)狀態(tài)組合預(yù)測模型研究[J].振動工程學(xué)報,2006,19(2):242-245.
[5]楊曉紅,楊曉靜,朱霄珣.小波變換的支持向量回歸機(jī)振動數(shù)據(jù)短期預(yù)測[J].汽輪機(jī)技術(shù),2011,53(1):77-80.
[6]Venkat R.Nadadoor,Hector De la Hoz Siegler,Sirish L Shah,William C Mc Caffrey,Amos Ben-Zvi.Online sensor for monitoring a microalgal bioreactor system using support vector regression[J].Chemometricss and Intelligent Laboratory Systems,2012(110):38-48.
[7]Sancho Salcedo-Sanz,Emilio G.Ortiz-García,ángel M.Pérez-Bellido,Antonio Portilla-Figueras,Luis Prieto.Short term wind speed prediction based on evolutionary support vector regression algorithms[J].Expert Systems with Applications,2011(38):4052-4057.
[8]HOU Shu-min,LI You-rong.Short-term fault prediction based on support vector machines with parameter optimization by evolution strategy[J].Expert Systems with Applications2009(36):12383-12391.
[9]聶建元,余曉鴻.免疫支持向量機(jī)在故障測距中的應(yīng)用[J].華中電力,2011,24(3):94-98.
[10]陳 濤.基于差分進(jìn)化算法的支持向量回歸機(jī)參數(shù)優(yōu)化[J].計算機(jī)仿真,2011,28(6):198-201.
[11]HUANG Ji,BO Yu-cheng,WANG Hui-yuan.Electromechanical equipment state forecasting based on genetic algorithm-support vector regression[J].Exxppeerrtt Systems with Applications2011(38):8399-8402.
[12]Takens F.Detecting strange attractor in turbulence[J].Lecture Notes in Mathematic s,1981,898(2):361-38l.
[13]Fraser A M,Swinney H L.Independent coordinates for strange attractors from mutual information[J].Physs RReevv A,1986,33(2):1134-l140.
[14]CAO Liangyue,Mee A,Judd K.Dynamics from multivariate time series[J].Physiiccaa DD,1998,121(1-2):75-88