劉小珊 (湖北文理學院數(shù)學與計算機科學學院,湖北 襄陽 441053 中國地質(zhì)大學(武漢)數(shù)學與物理學院,湖北 武漢 430074)
羅文強,李飛翱 (中國地質(zhì)大學(武漢)數(shù)學與物理學院,湖北 武漢 430074)
王成勇 (湖北文理學院數(shù)學與計算機科學學院,湖北 襄陽 441053)
基于SVR的滑坡位移研究
劉小珊 (湖北文理學院數(shù)學與計算機科學學院,湖北 襄陽 441053 中國地質(zhì)大學(武漢)數(shù)學與物理學院,湖北 武漢 430074)
羅文強,李飛翱 (中國地質(zhì)大學(武漢)數(shù)學與物理學院,湖北 武漢 430074)
王成勇 (湖北文理學院數(shù)學與計算機科學學院,湖北 襄陽 441053)
滑坡位移具有非線性特征,針對單變量的時間序列,首先引入相空間重構(gòu)理論,將其擴展到多維的相空間中。再結(jié)合數(shù)據(jù)挖掘中的機器學習算法——支持向量回歸算法(SVR)建立預(yù)測模型,并對李家灣滑坡的水平位移進行預(yù)測。試驗結(jié)果表明,該模型具有非常高的精度(均控制在94%以上),可以充分的應(yīng)用于滑坡災(zāi)害的預(yù)測和預(yù)報。
滑坡水平位移;相空間重構(gòu);支持向量回歸;預(yù)測
滑坡是一個極其復(fù)雜的非線性動態(tài)系統(tǒng),內(nèi)部受巖土體屬性的控制,外部受庫水位變動、大氣降雨、地震、人工加載等多種因素的影響。正是這種內(nèi)外因素相互作用的復(fù)雜性和難以預(yù)見性,使得滑坡的變形表現(xiàn)出非常復(fù)雜的演化特征。
目前,基于時間序列的分析方法是滑坡位移預(yù)測工作中相對集中的一個發(fā)展方向。傳統(tǒng)的預(yù)測方法是直接從單變量的時間序列出發(fā),建立預(yù)測模型,分析它的時間演變規(guī)律[1-2]。但由于時序數(shù)列是許多因子相互作用的綜合反映,蘊含了參與整個運動過程中全部變量的信息,所以單變量的時序數(shù)列無法充分的將序列中的信息顯露出來。針對這一問題,筆者首先引入了相空間重構(gòu)理論,將單變量的數(shù)據(jù)擴展到多維的相空間中去,從而獲得更多的數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。然后,應(yīng)用支持向量回歸算法(Suppert Vector Regression,SVR)[3]對重構(gòu)后的數(shù)據(jù)進行建模,并在此基礎(chǔ)上對滑坡的水平位移進行預(yù)測。
1.1相空間重構(gòu)
為了從時間序列中提取更多的有用信息, Packard等提出用時間序列重構(gòu)相空間的2種方法:導(dǎo)數(shù)重構(gòu)法和坐標延遲重構(gòu)法[4]。Takens等提出嵌入定理:對于無限長、無噪聲的d維混沌吸引子的標量時間序列{x(n)},只要維數(shù)m≥2d+1,總可以在拓撲不變的意義上找到一個m維的嵌入相空間[5]。嵌入定理保證了可以從一維混沌時間序列{x(i),i=1,2,3,…,n}中重構(gòu)一個與原動力系統(tǒng)在拓撲意義下等價的相空間:
X(i)={x(i),x(i+τ),…,x(i+(m-1)τ)}
(1)
式中,i=1,2,…,n-(m-1)τ,n為時序長度;m為嵌入維數(shù);τ為延遲時間。
1.2支持向量回歸算法
支持向量機是一種基于統(tǒng)計學習理論的機器學習算法,其建立在VC維(Vapnik-Chervonenkis Dimension)理論和結(jié)構(gòu)風險最小化原理(Structural Risk Minimization,SRM)基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性和學習能力之間尋求最佳折中。
非線性SVR算法基本思想如下:對于給定的n個樣本數(shù)據(jù){xn,yn},其中xn∈Rm的m維向量,yn∈R為相應(yīng)的輸出變量,引入非線性映射φ,將樣本空間映射入一個高維(以至于無窮維)的特征空間H(Hilbert空間),從而使在樣本空間中的高度非線性問題在特征空間中可以進行線性回歸。其具體的實現(xiàn)是通過核函數(shù)K(xi,xi)=φ(xi)·φ(xj)來實現(xiàn)的?;貧w函數(shù)表達式如下:
f(x)=(W,φ(xn))+bφ:Rm→HW∈Rm
(2)
與其他回歸分析方法相比,SVR引入了ε-不敏感誤差函數(shù)和最優(yōu)回歸平面(見圖1),此時所有樣本點到所求超平面的距離都小于ε,這樣尋求最優(yōu)回歸超平面的問題則轉(zhuǎn)化為求解如下一個二次凸規(guī)劃問題:
(3)
圖1 回歸超平面圖示
但實際問題中往往是有噪音干擾的,不可能將所有的樣本點都落在ε管道中,即便有時能夠達到,隨著ε的減小,也會有個別樣本點“溢出”。為處理函數(shù)f在ε精度不能估計的數(shù)據(jù),引入松弛變量ξi,則修改上式的目標函數(shù)和約束條件,有偏離的點的最優(yōu)回歸超平面歸結(jié)為一個新的二次凸規(guī)劃問題[3]:
(4)
(5)
引入拉格拉日函數(shù)和對偶變量:
(6)
(7)
(8)
式中,核函數(shù)K(xi,xj)為滿足Mercer條件的任意對稱函數(shù)。由于SVR只考慮高維特征空間的點積運算K(xi,xi)=φ(xi)·φ(xj),而不是直接使用非線性映射φ,這樣就免去了因為函數(shù)φ的未知而無法計算W的表達式。常見的核函數(shù)有多項式函數(shù)K(xi,xj)=[(xixj)+1]q;高斯徑向基函數(shù)(RBF)K(xi,xj)=exp{-|xi-xj|2/2σ2};Sigmoid函數(shù)tanh[v(xixj)+c]等[3,6]。
2.1數(shù)據(jù)準備與相空間重構(gòu)
選取李家灣滑坡的變形監(jiān)測資料[7],該資料顯示滑坡的前部、中部、后部監(jiān)測點的變形分別受不同的因素影響,如降雨量、庫水位、孔隙水等。為研究不同影響因素作用下的滑坡變形預(yù)測模型,選取李家灣滑坡主剖面上3個地表位移監(jiān)測點BD7-35、BD7-36、BD7-37作為研究對象,截取2007-08-08至2009-07-13之間的25組監(jiān)測數(shù)據(jù)作為樣本,其中以2007-08-08至2009-02-13之間的20組監(jiān)測數(shù)據(jù)作為訓(xùn)練樣本,2009-03-13至2009-07-13之間的5組監(jiān)測數(shù)據(jù)作為測試樣本。
2.2SVR預(yù)測模型
數(shù)據(jù)預(yù)處理之后就可以建立基于支持向量回歸算法的預(yù)測模型。筆者選擇高斯徑向基函數(shù)為核函數(shù),其函數(shù)回歸模型可以表示如下[8]:
代入重構(gòu)后的數(shù)據(jù)可以得到第n+1點的預(yù)測值:
將所得的n+1點的預(yù)測值加入訓(xùn)練樣本,再代入SVR預(yù)測模型,即可求出第n+2點的預(yù)測值。如此遞推,每預(yù)測一步后,將增加的預(yù)測值添加到訓(xùn)練樣本中,同時保持總的訓(xùn)練樣本數(shù)不變,便可得到n+t時刻的預(yù)測值:
2.3預(yù)測結(jié)果分析
將推導(dǎo)的預(yù)測模型應(yīng)用于李家灣滑坡的預(yù)測?;缕拭娣謩e為BD7-35、BD7-36、BD7-37水平位移監(jiān)測點的預(yù)測值和原始值的比較如圖2所示,精度分析如表1所示。從圖2中可以看出,對于這3個分別受不同影響因素作用下的滑坡剖面,其水平位移預(yù)測值的走勢與工程實測值的走勢基本一致,沒有出現(xiàn)異常值,效果良好。從表1中可以看出,對于這3個滑坡剖面水平位移預(yù)測值的精度都在94%以上,最高達到99.6%,已經(jīng)非常逼近實測值。并且從圖2和表1都可以看出,越往后,預(yù)測效果越好。
表1 預(yù)測精度
圖2 原始值與預(yù)測值的比較
將相空間重構(gòu)理論與支持向量回歸算法相結(jié)合,建立了滑坡水平位移的預(yù)測模型,并應(yīng)用于李家灣滑坡位移的預(yù)測。從工程實例中可以看出,這2種理論的結(jié)合對滑坡水平位移的預(yù)測具有較高的精度,使用該方法可以無需知道巖土結(jié)構(gòu)中的力學過程和機制,對于小樣本、非線性的實際問題可以直接挖掘出時序中各數(shù)據(jù)的關(guān)聯(lián)關(guān)系,進而進行有效的預(yù)測。
[1]張德成,徐則民.滑坡位移的時序分析[J].地球與環(huán)境,2011,39(2):224-230.
[2]鄭加柱,郭斐.變形監(jiān)測數(shù)據(jù)的時間序列分析[J].森林工程,2008,24(4):50-53.
[3]陳永義,熊秋芬.支持向量機方法應(yīng)用教程[M].北京:氣象出版社,2011.
[4]Packard N H,Crutchfield J P,Farmer J D,et al.Geometry from a time series[J].Physical Review Letters,1980,45(9):712-716.
[5]Takens F.Detecting strange attractors in turbulence.In:Dynamical Systerms and Turbulence[M].Berlin:Springer-Verlag, 1981:366-381.
[6]王定成.支持向量機預(yù)測與控制[M].北京:氣象出版社,2009.12.
[7]程江濤.庫水變動誘發(fā)水庫滑坡變形演化機理及預(yù)測研究[D].武漢:中國地質(zhì)大學(武漢),2011.
[8]董輝,傅鶴林,冷伍明.支持向量機的時間序列回歸與預(yù)測[J].系統(tǒng)仿真學報,2006,18(7):1785-1788.
2012-11-27
國家重點基礎(chǔ)研究發(fā)展計劃資助“973”計劃(2011CB710605)。
劉小珊(1989-),女,碩士生,現(xiàn)主要從事工程概率方面的研究工作。
P642.22;TP391
A
1673-1409(2013)04-0076-03
[編輯] 洪云飛