陳 曦,高雅萍,涂 銳
(1.成都理工大學地球科學學院,四川 成都 610059;2.中國科學院國家授時中心,陜西 西安 710600)
滑坡監(jiān)測得到的地表位移數據經過科學處理和有效預測,可以得到滑坡體未來一段時間內的位移趨勢變化,這對滑坡災害防災減災方案的制訂有重要的數據決策支持作用,對于滑坡災害的預報預警具有非常重要的意義。
目前,運用較多的預測模型有統(tǒng)計機器學習模型、灰色模型、回歸模型、時間序列模型等[1,4],其中神經網絡模型、灰色模型、自回歸模型等在滑坡位移預測中應用較多[2];數據序列的分解方法有小波分解、EMD、EEMD、VMD等[1,3,5-6];許多學者將數據分解方法和預測模型進行組合預測,預測精度相對提高。宋麗偉[5]對位移序列進行經驗模態(tài)分解和模態(tài)重構,利用LSTM模型組合預測,為“階梯狀”滑坡位移的預測提供了一種可行的思路。鄢濤等[6]利用極限學習機(ELM)對大壩變形的EEMD不同分解分量引入影響因子分別預測并疊加,預測精度有所提高。但這些預測模型都需要較多的累積觀測數據進行樣本學習,在實際監(jiān)測過程中當影響因子監(jiān)測數據積累不足或者影響因子數據誤差較大與位移相關性較少時,位移預測就會比較困難,預測精度較低,需要應用對單位移序列擬合預測效果較好的模型,使滑坡位移預測結果有較高的精度。吳棟等[7]對比研究了LSTM 和SVM對VMD分量位移的組合預測發(fā)現LSTM更能有效地預測滑坡位移變化的本質規(guī)律。簡文彬等[8]、楊大明[9]利用門限自回歸模型進行了地基沉降預測。針對這樣的問題,選擇了應用較廣泛的經驗模態(tài)分解(Empirical Mode Decomposition,EMD)分解方法和對非線性非穩(wěn)態(tài)序列預測效果較好的門限自回歸模型(Threshold Auto Regressive,TAR)[10-12],以組合的形式預測滑坡位移變化。門限自回歸模型[13]是在自回歸 (AR) 模型的基礎上增加了門限區(qū)間約束條件,是對一類非線性的時間序列進行局部線性逼近的非線性時間序列模型。
本文以三峽庫區(qū)秭歸縣白水河滑坡為例,首先利用經驗模態(tài)分解方法將GPS滑坡地表監(jiān)測水平累計位移分解為不同頻率位移分量,然后利用門限自回歸模型對各位移分解序列進行獨立預測,最后模態(tài)疊加得到最終預測位移序列。選取MAE、MRE、RMSE和擬合優(yōu)度4種精度指標來準確評價組合模型的精度,通過與BP(Back Propagation)神經網絡模型、長短時間記憶網絡模型的單一或組合模型對比驗證其準確性,為滑坡的位移預測提供一種新的方法。
經驗模態(tài)分解(Empirical Mode Decomposition,簡稱EMD)以數據序列的時變特征為基礎,可將序列中存在的各種具有一定周期性規(guī)律的不同變化頻率的分量分離單獨存在。
對于滑坡位移數值序列,由于各種因素的影響,實測數據會存在各種模式的波動變化,也就是由若干個不同頻率的數值波形序列所混合構成的,是不同變化頻率數值序列的復合非線性數據,EMD分解的目的就是為了分解出其中的位移本征模函數,將復雜位移序列分化為多個近似單一頻率的位移序列形式。
EMD分解方法:在原位移序列極值點基礎上用三次樣條曲線擬合形成上下包絡線,計算上下包絡均值作為第一個位移序列分離分量,將原位移序列減去該分量,得到1個新的位移序列。新序列若還存在局部極值,說明還不是1個無波動趨勢序列,需要繼續(xù)進行擬合分解,使用上述方法得到第一個分量后,用原始序列減去該分量,作為新的數據序列,可以得到所有剩余分量,以此類推,直至完成經驗模態(tài)分解得到趨勢變化序列。
門限自回歸(Threshold Auto Regressive,TAR)模型對于存在較規(guī)律波動變化的時間序列預測效果較好。由于門限的分割,該模型對數據序列可以分段處理,詳細描述序列的變化情況。
自回歸(Auto Regressive,TAR)模型是分析數據內部相關關系的方法,假設存在觀測時序{xt},則定義p階自回歸模型,簡稱AR(p):
xt=φ0+φ1xt-1+…+φpxt-p+εt
(1)
式中,φp不為0,{φp}為自回歸系數序列;εt為零均值白噪聲序列。
φ0+φ1+…+φp<1對于平穩(wěn)的自回歸模型,其自相關系數滿足如下遞推關系:
ρk=φ1ρk-1+φ2ρk-2+…+φpρk-p
(2)
(3)
AR模型的參數估計采用最小二乘估計,估計自回歸系數序列{φp},建立各參數矩陣,Y為AR模型預測矩陣,X為AR模型樣本矩陣,φ為AR模型自回歸系數矩陣,ε為零均值白噪聲序列:
(4)
線性方程組為:
Y=Xφ+ε
(5)
自回歸系數最小二乘估計為:
φ=(XTX)-1XT(Y-ε)
(6)
誤差方差的最小二乘估計為:
(7)
AR模型的定階采用貝葉斯信息準則:
(8)
其中,N表示樣本序列長度,σ2表示樣本殘差的方差,使得BIC達到最小值的p即為該準則下的最優(yōu) AR 模型的階數。
TAR模型是分段的AR模型,通過在觀測時序{xi}的取值范圍內引入k-1個門限值ri(i=1,2,…,n-1),將該整個時間序列分成n個門限區(qū)間,可用r0,rn分別表示上界和下界,并根據延遲步數d按{xi-d}值的大小分配到不同的門限區(qū)間內,再對區(qū)間內的xi采用不同階數的自回歸模型(AR模型),從而形成時間序列的非線性分段動態(tài)詳細描述,其模型形式見式(9):
(9)
(10)
首先利用經驗模態(tài)分解方法對GPS滑坡監(jiān)測地表位移數據進行序列分解,得到不同變化頻率的位移序列,對各變形分量獨立采用門限自回歸模型進行預測,避免各分量誤差相互影響,最后將所有形變分量模態(tài)疊加得到最終滑坡地表位移數值預測序列。其優(yōu)勢是利用門限自回歸模型的對復雜非線性數據序列預測效果較好的特點,結合EMD分解算法的只用依據序列自身時間特征的特點,極大地提高了滑坡形變監(jiān)測單位移序列的精度。該文組合預測模型數據處理步驟見圖1。
圖1 組合模型預測分析步驟
所采用的滑坡位移預測模型的精度評價指標包括平均絕對誤差(Mean Absolute Error,MAE)、均方誤差(Root Mean Square Error,RMSE)、平均相對誤差(Mean Relative Error,MRE)、擬合優(yōu)度R2,計算式為:
(11)
(12)
(13)
(14)
以三峽庫區(qū)秭歸縣白水河滑坡GPS地表位移監(jiān)測數據為例,滑坡體呈階梯狀向長江展布,為堆積層滑坡,坡體屬順向坡。滑坡體共布設11個GPS監(jiān)測點,選擇滑坡體中下部監(jiān)測點ZG118和滑坡體北東部監(jiān)測點DX-02對滑坡體不同位置形變位移進行預測描述,數據來源于國家冰川凍土沙漠科學數據中心 (http://www.ncdc.ac.cn)。
ZG118監(jiān)測點為從2006年12月至2012年12月,共73期GPS地表位移觀測數據。為提高單序列位移的預測精度,首先利用EMD對GPS監(jiān)測點水平位移序列進行模態(tài)分解,迭代次數設置為200次,得到5個不同變化頻率的IMF分量和一個殘差分量,殘差分量作為粗差剔除。各IMF分量見圖2。
a)IMF1
將73期滑坡位移數據中的1—50期作為訓練樣本,51—73期數據作為預測檢驗值。建立門限自回歸預測模型,門限區(qū)間個數取2,最大門限延遲量設置為5,自回歸最大階數為5,默認最小AIC值為1E+10,便于后續(xù)優(yōu)化AIC值獲得最優(yōu)多維參數。按樣本的30%~70%分位區(qū)間以1%進度搜索最優(yōu)門限值。每組分量預測步長為一步,預測后數據更新,再進行下一步預測,實現模型的動態(tài)更新和預測。
為驗證所建立組合預測模型的精度,分別建立EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型、TAR模型、LSTM模型對該滑坡位移序列進行預測,組合模型EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型[14-15]的預測方法為分別利用TAR模型、LSTM模型、BPNN模型預測每個IMF分量,最后時序合成得到實際滑坡預測位移序列,各模型的預測結果見圖3。
圖3 各模型預測結果曲線序列
由圖3可看出,單一TAR模型的預測效果比LSTM和BPNN更好,LSTM和BPNN單一模型會隨著時間推移預測誤差變大。相對于單一TAR模型和其他組合模型,組合EMD-TAR模型與原始位移序列擬合度較高,擬合優(yōu)度最高,較為符合原始位移的變化趨勢。為了準確評價模型的整體預測精度,對比計算幾種預測模型的精度評價指標,結果表明,所建立的EMD-TAR預測模型在MAE、RMSE、MRE和擬合優(yōu)度上均大幅提高。各模型精度評價值見表1。
表1 各模型精度評價
為更好地驗證所建立預測模型的精度和可靠性,選取滑坡體另一監(jiān)測點進行預測實驗,DX-02監(jiān)測點為從2006年12月至2010年8月,共45期GPS地表位移觀測數據,1—32期作為訓練樣本,33—45期數據作為預測檢驗值。EMD模態(tài)分解迭代次數設置為2 000次,得到5個不同變化頻率的IMF分量和一個殘差分量,殘差分量作為粗差剔除。各IMF分量見圖4。所建立門限自回歸預測模型中門限區(qū)間個數設置為2,最大門限延遲量設置為5,自回歸最大階數為5,默認最小AIC值為1E+10。考慮到分量頻率的變化因素,其中IMF1按樣本的30%~70%分位區(qū)間以1%進度搜索最優(yōu)門限值,IMF2-4按樣本的30%~50%分位區(qū)間以1%進度搜索最優(yōu)門限值。每組分量預測步長為一步,預測后數據更新,再進行下一步預測,實現模型的動態(tài)更新和預測。
a)IMF1
同樣,以此監(jiān)測數據為例,分別建立EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型、TAR模型、LSTM模型對該滑坡位移序列進行預測,組合模型EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型的預測方法為分別利用TAR模型、LSTM模型、BPNN模型預測每個IMF分量,最后時序合成得到實際滑坡預測位移序列,各模型的預測結果見圖5。
圖5 各模型預測結果曲線序列
由圖5可看出,組合EMD-TAR模型與原始位移序列擬合程度最高,最符合原始位移的變化趨勢。參考分析2個算例的各模型預測結果曲線圖,樣本數據量和預測時間的變化對組合EMD-TAR模型影響較小,模型預測較穩(wěn)定。在算例一中EMD-TAR、EMD-LSTM模型預測結果誤差較小而在算例二中EMD-TAR、LSTM模型預測結果誤差較小,樣本數據量變化對LSTM及其組合模型的預測精度產生了影響,算例二較算例一數據量減少,EMD分解后的不同頻率分量變少,算例二滑坡位移的整體變化趨勢較算例一小,所以在算例二中,對未分解的滑坡位移進行預測的LSTM模型的預測效果相比EMD-LSTM模型更好,綜合分析得到EMD-TAR在預測精度和穩(wěn)定性上更優(yōu)。
為了準確評價模型的整體預測精度,計算幾種預測模型的精度評價指標,結果表明,該文所建立的EMD-TAR預測模型在MAE、RMSE、MRE和擬合優(yōu)度上均大幅提高。各模型精度評價值見表2。
表2 各模型精度評價
基于EMD算法和TAR模型構建了EMD-TAR滑坡位移預測模型,針對的是在實際監(jiān)測過程中當影響因子監(jiān)測數據積累不足或者影響因子數據誤差較大與位移相關性較少的情況,利用EMD算法將非穩(wěn)態(tài)的GPS監(jiān)測滑坡位移序列分解為在時間尺度上具有不同變化頻率的多個分量,對AR模型進行門限改進得到TAR模型,結合TAR模型對非線性波動數據序列預測效果較好的優(yōu)勢,對滑坡位移序列進行分解、預測、再疊加得到精度較高的預測結果。經過白水河滑坡實例數據的試驗驗證,該組合模型相比于單一TAR模型、LSTM和BPNN模型及其組合模型預測精度更高,為滑坡位移的預測提供了一種新方法。但該模型在滑坡環(huán)境影響下監(jiān)測數據積累不足或影響因子關聯(lián)較小時對位移的預測具有一定的局限性,后續(xù)可與其他顧及影響因子的模型進行組合預測研究。