陸杰,覃書林,徐寧輝
(南寧勘察測(cè)繪地理信息院,廣西 南寧 530001)
隨著國(guó)家經(jīng)濟(jì)快速發(fā)展,變形預(yù)測(cè)已成為工程和自然災(zāi)害防災(zāi)減災(zāi)最直接、最重要的方法之一。定期對(duì)變形體進(jìn)行監(jiān)測(cè),收集變形數(shù)據(jù),分析變形規(guī)律,建立更為準(zhǔn)確的變形預(yù)測(cè)模型,對(duì)保證人民生命財(cái)產(chǎn)安全具有重要的意義。針對(duì)這一問(wèn)題,國(guó)內(nèi)外許多學(xué)者已提出了多種方法,如時(shí)間序列模型、灰色模型、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)以及各種組合方法等[1~3]。然而,受多種因素共同作用的結(jié)果,滑坡或建筑物往往呈現(xiàn)出較強(qiáng)的非線性和隨機(jī)性,給模型預(yù)測(cè)帶來(lái)了難度,且每一種方法都存在自身的局限性,沒有一種方法能夠完全適應(yīng)各種情況下的預(yù)測(cè)和分析。支持向量機(jī)[4](Support Vector Machines,SVM)作為一種新的人工智能學(xué)習(xí)方法,在解決小樣本、非線性及高維模式識(shí)別等領(lǐng)域具有許多特有的優(yōu)勢(shì),已在變形預(yù)測(cè)中得到廣泛應(yīng)用。因此,針對(duì)各單一預(yù)測(cè)模型存在的缺陷,許多學(xué)者展開了多模型融合預(yù)測(cè)的研究,取得了較好的結(jié)果[5~8]。然而,組合模型的思路往往局限于從原始變形序列本身探討變形預(yù)測(cè)問(wèn)題,通過(guò)對(duì)預(yù)測(cè)殘差修正或各預(yù)測(cè)值組合加權(quán)方法實(shí)現(xiàn)變形的預(yù)測(cè)。這樣的組合思路并沒有從變形體自身的變形特點(diǎn)出發(fā),忽略了變形體隱含的特征信息,不利于預(yù)測(cè)模型的推廣和預(yù)測(cè)精度的提高。
基于上述研究,本文從時(shí)頻挖掘出發(fā),提出基于小波分析的灰色支持向量機(jī)變形預(yù)測(cè)新算法。算法主要研究如何從復(fù)雜的原始變形序列中提取出不同頻率的特征信息,并針對(duì)各分量的特點(diǎn),建立更為合適的灰色支持向量機(jī)預(yù)測(cè)模型。同時(shí),考慮到SVM模型的參數(shù)優(yōu)化問(wèn)題,采用網(wǎng)格搜索法[9]進(jìn)行尋優(yōu),該方法用于小樣本數(shù)據(jù)預(yù)測(cè)時(shí)比遺傳算法、混沌優(yōu)化算法較有優(yōu)勢(shì)。經(jīng)兩個(gè)算例,并與灰色模型、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對(duì)比分析,驗(yàn)證新算法的可行性和有效性。
小波分析是現(xiàn)代分析方法中的一種強(qiáng)有力的工具,小波分析的核心內(nèi)容為小波變換,傅里葉變換是小波變換的數(shù)學(xué)基礎(chǔ)。小波變換的概念是在1983年由法國(guó)地球物理學(xué)家J.Morlet在分析處理地球物理勘探資料時(shí)提出來(lái)的,具有多尺度分析的功能。由于變形序列是通過(guò)實(shí)際觀測(cè)得到的離散數(shù)據(jù),用小波變換進(jìn)行預(yù)處理,可以有效提取數(shù)據(jù)的特征信息。本文采用Daubechies小波對(duì)變形監(jiān)測(cè)數(shù)據(jù)序列進(jìn)行分解。其原理參考文獻(xiàn)[10]。
(1)灰色模型
灰色系統(tǒng)分析方法建模可以做到所需序列信息少,不用知道原始數(shù)據(jù)分布的先驗(yàn)特征,可以通過(guò)有限次的生成便可將雜亂無(wú)規(guī)律的序列轉(zhuǎn)化為有規(guī)則、規(guī)律性較強(qiáng)的序列,建立生成序列和時(shí)間的關(guān)系函數(shù)模型。其方法和原理參考文獻(xiàn)[11]。
(2)SVM模型
其模型如下[4,9]:
設(shè)一組樣本訓(xùn)練集為{(xi,yi)|i=1,2,…,l|},其中xi∈Rn,yi∈R,xi為n維輸入向量,yi為輸出向量。將樣本通過(guò)非線性映射函數(shù)運(yùn)算,從原空間映射到高位特征空間上,在高維特征空間中構(gòu)造最優(yōu)決策函數(shù)。
f(x)=WTφ(x)+b
(1)
式中,f(x)為估計(jì)函數(shù),WT為權(quán)值向量,W∈Rn;φ(x)為核函數(shù),φ(x)∈Rn;b偏置量,b∈R。W、b為待定系數(shù)。
引入結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù),在優(yōu)化問(wèn)題的實(shí)現(xiàn)過(guò)程中,估計(jì)函數(shù)會(huì)被不敏感損失函數(shù)轉(zhuǎn)化,而不敏感函數(shù)ε可以表示為:
(2)
上述函數(shù)轉(zhuǎn)化的過(guò)程中,應(yīng)滿足下面的約束條件:
(3)
為實(shí)現(xiàn)二次規(guī)劃求解,利用對(duì)偶理論對(duì)其進(jìn)行轉(zhuǎn)化,則對(duì)偶式可表示為:
(4)
式中,拉格朗日乘子用a、a*表示;函數(shù)乘積用Q表示。
可將約束條件表示為:
Qij=K(xi,yj)=φ(xi)Tφ(xy)
(5)
式中,K(xi,yj)指的是支持向量機(jī)的核函數(shù)。
經(jīng)過(guò)上述運(yùn)算可將SVM的預(yù)測(cè)模型表示為:
(6)
由于SVM的性能很大程度上取決于核函數(shù)K(xi,yj)、核參數(shù)δ和正則化參數(shù)γ的選取。因此,選定能較好地反映模型復(fù)雜程度的徑向基核函數(shù)作為SVM的核函數(shù),采用網(wǎng)格搜索法進(jìn)行最優(yōu)參數(shù)的選取。
本文采用db6小波對(duì)變形序列進(jìn)行分解。根據(jù)已有的文獻(xiàn)和資料,小波分解往往采用3層~5層較為適合。因此,本文將變形序列分解為4層,得到低頻余量a3和高中頻分量d1、d2、d3。設(shè)監(jiān)測(cè)序列有n期,選取各分量和余量的前m期序列建立訓(xùn)練樣本,后(n-m)期作為預(yù)測(cè)結(jié)果測(cè)試。由于d1、d2和d3分量往往具有一定的非線性和隨機(jī)性,低頻余量a3體現(xiàn)出趨勢(shì)項(xiàng)的變化,因此,本文選取能夠較好解決非線性問(wèn)題的支持向量機(jī)模型和對(duì)線性問(wèn)題具有較好預(yù)測(cè)能力的灰色模型進(jìn)行預(yù)測(cè),具體流程如圖1所示。
圖1 模型預(yù)測(cè)流程
選取某滑坡9號(hào)監(jiān)測(cè)點(diǎn)46期拉裂變形觀測(cè)數(shù)據(jù)進(jìn)行分析[12],其垂直位移變形如圖2所示。
圖2 滑坡垂直位移序列
由圖2可看出,滑坡位移變形總體呈現(xiàn)下降趨勢(shì),隨機(jī)變化性較強(qiáng),呈現(xiàn)非線性變化趨勢(shì),變形的最小值為 2.3 mm,最大值為 24.8 mm。直接采用傳統(tǒng)的模型進(jìn)行預(yù)測(cè),不利于準(zhǔn)確把握變形的規(guī)律。
因此,本文選取db6小波對(duì)原始序列進(jìn)行4層分解,分解結(jié)果如圖3所示。
從圖3可看出,經(jīng)小波分解得到的各分量能夠更好地反映原序列的局部特征和變化趨勢(shì),具有較低的非線性和非平穩(wěn)性特征。對(duì)比發(fā)現(xiàn),d1、d2、d3分量明顯趨于平穩(wěn),且頻率依次降低,其中,d1預(yù)測(cè)分量表現(xiàn)了變形序列中的隨機(jī)性,而d2、d3預(yù)測(cè)分量則反映序列中一定的周期性。余量a3屬于低頻部分,代表了變形序列中隨時(shí)間變化的趨勢(shì)。可見,經(jīng)小波分解后各分量變化曲線比原變形序列曲線更光滑、更平穩(wěn),有利于下一步的建模預(yù)測(cè)和分析工作開展。
圖3 小波分解結(jié)果
為驗(yàn)證本文算法的可行性、有效性和優(yōu)越性,建立4種方案進(jìn)行分析比較:方案1—灰色GM(1,1)模型;方案2—BP神經(jīng)網(wǎng)絡(luò)模型;方案3—支持向量機(jī)模型;方案4—本文算法。以前36期作為訓(xùn)練樣本,后10期作為測(cè)試樣本。其中,方案1~3直接采用原始數(shù)據(jù)建模,方案4采用經(jīng)小波分解重構(gòu)后的各分量建模,即支持向量機(jī)模型對(duì)d系列分量進(jìn)行訓(xùn)練和預(yù)測(cè),灰色模型對(duì)a3余量進(jìn)行訓(xùn)練和預(yù)測(cè)。為了加快SVM的收斂速度和降低建模誤差,將d系列分量歸一化到[-1,1]區(qū)間,經(jīng)模型預(yù)測(cè)后再還原到原始區(qū)間。對(duì)于支持向量機(jī)模型的參數(shù)選取,利用網(wǎng)格搜索法對(duì)懲罰參數(shù)c和核參數(shù)g進(jìn)行尋優(yōu),設(shè)置δ和γ的選擇范圍和參數(shù)步長(zhǎng)分別為:δ∈[2-8,28],γ∈[2-8,28];粗選步長(zhǎng)為1,精選步長(zhǎng)為0.5。
4種方案的預(yù)測(cè)結(jié)果對(duì)比如表1所示,圖4反映了各模型的預(yù)測(cè)殘差結(jié)果。
各模型預(yù)測(cè)結(jié)果對(duì)比表 表1
圖4 各模型預(yù)測(cè)殘差對(duì)比
由表1和圖4可見:方案1對(duì)非線性變化的變形序列預(yù)測(cè)極不穩(wěn)定,預(yù)測(cè)值呈線性變化,大部分預(yù)測(cè)值和實(shí)際值相差較大,最大、最小殘差值分別為 5.370 mm、0.180 mm。方案2的預(yù)測(cè)結(jié)果優(yōu)于灰色模型,但容易出現(xiàn)極大和極小值,最大殘差值為 2.610 mm,最小殘差值則為 -0.010 mm,總體預(yù)測(cè)結(jié)果依然不穩(wěn)定。而方案3和本文算法對(duì)原始序列的預(yù)測(cè)結(jié)果都比較好,相對(duì)來(lái)說(shuō)本文算法預(yù)測(cè)結(jié)果最好,殘差曲線變化較為平緩,殘差最大值為 0.292 mm,最小殘差值僅為 0.004 mm。
為了進(jìn)一步驗(yàn)證本文算法對(duì)突發(fā)變形預(yù)測(cè)的性能,以某大壩的0+119壩段具有代表性的DC01監(jiān)測(cè)點(diǎn)垂直位移量[13],如圖5示。該變形序列共21期,監(jiān)測(cè)時(shí)間從1996年7月開始,一直持續(xù)到1997年1月,觀測(cè)頻率為每個(gè)月3次。
由圖5可以看出,大壩變形極其不穩(wěn)定,具有較強(qiáng)的非線性變化趨勢(shì),前10期總體表現(xiàn)出有一定周期性的下降態(tài)勢(shì),后11期則總體表現(xiàn)出強(qiáng)隨機(jī)性的上升態(tài)勢(shì),18期~21期更是持續(xù)急劇上升,且變形的最小值為 42.18 mm,最大值為 60.68 mm??梢娫摯髩巫冃坞S機(jī)變化性較強(qiáng),采用傳統(tǒng)的預(yù)測(cè)算法,很難得到較好的預(yù)測(cè)值數(shù)據(jù)。
圖5 大壩變形垂直位移序列
同算例1,選取db6小波對(duì)大壩變形原始序列進(jìn)行分解,分解結(jié)果如圖6所示。分別選取1期~16期數(shù)據(jù)作為訓(xùn)練樣本,17期~21期數(shù)據(jù)作為測(cè)試樣本,建模方法和算例1一樣。各模型預(yù)測(cè)結(jié)果如表2所示,圖7給出了各模型的預(yù)測(cè)殘差曲線圖。
圖6 小波分解結(jié)果
各模型計(jì)算結(jié)果對(duì)比 表2
圖7 各模型預(yù)測(cè)殘差對(duì)比
由表2和圖7可見,灰色模型和BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果極不穩(wěn)定。在變形序列急劇變化的情況下,灰色模型的預(yù)測(cè)結(jié)果極不穩(wěn)定,出現(xiàn)失真現(xiàn)象,特別是21期的預(yù)測(cè)結(jié)果已遠(yuǎn)遠(yuǎn)偏離監(jiān)測(cè)值,無(wú)法找到變形規(guī)律;BP神經(jīng)網(wǎng)絡(luò)模型在監(jiān)測(cè)值急劇上升階段也出現(xiàn)了極大、極小值的情況;支持向量機(jī)模型的部分預(yù)測(cè)結(jié)果也不夠穩(wěn)定,預(yù)測(cè)的誤差曲線呈線性遞增。而本文算法的預(yù)測(cè)殘差曲線較為平緩,殘差最大值僅為 -0.300 mm,最小值為 -0.013 mm,預(yù)測(cè)精度遠(yuǎn)優(yōu)于其他模型。
為了進(jìn)一步綜合評(píng)定本文算法的性能,采用均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)兩項(xiàng)精度指標(biāo)進(jìn)行評(píng)定,如表3所示。
各模型計(jì)算結(jié)果對(duì)比 表3
由表3可知,灰色模型的預(yù)測(cè)精度最低,其次是BP神經(jīng)網(wǎng)絡(luò)模型,單一的支持向量機(jī)模型和本文模型的預(yù)測(cè)精度都表現(xiàn)出較好的預(yù)測(cè)精度,而本文算法的預(yù)測(cè)精度相較支持向量機(jī)有了進(jìn)一步提高,均方根誤差分別為 0.184 mm和 0.165 mm,平均絕對(duì)誤差分別僅為 0.173 mm和 0.139 mm。可見,基于本文算法在一定程度上保證了較好的局部預(yù)測(cè)值和較優(yōu)的全局預(yù)測(cè)精度。
本文將小波分析、灰色模型和支持向量機(jī)相結(jié)合引入到變形預(yù)測(cè)中,經(jīng)理論和算例表明:①采用小波原理能有效分離出變形中隱含的非線性、隨機(jī)性和趨向性特征信息,優(yōu)化了原始信號(hào),更好地反映變形的局部特征和變化趨勢(shì)。②采用支持向量機(jī)和灰色原理相結(jié)合建立各分量預(yù)測(cè)模型,在一定程度上避免了灰色模型存在的理論缺陷,充分發(fā)揮了人工智能的優(yōu)勢(shì),進(jìn)一步提高了預(yù)測(cè)精度??紤]到僅從單一的變形序列本身建立多尺度預(yù)測(cè)模型,對(duì)于各種環(huán)境條件下的變形預(yù)測(cè)問(wèn)題需要進(jìn)一步的驗(yàn)證,如何將各特征信息與各影響因素相結(jié)合建立多尺度預(yù)測(cè)模型將是下一步研究的內(nèi)容。