(江西理工大學(xué)建筑與測繪工程學(xué)院 江西 贛州 341000)
針對地鐵深基坑工程事故頻發(fā)給社會造成人員傷亡和財政損失的現(xiàn)象[1],對深基坑開挖過程中的變形做出準(zhǔn)確的預(yù)測和及時的預(yù)警是亟待解決的問題。
常見的深基坑變形預(yù)測的方法有回歸分析法,小波分析法,灰色模型,指數(shù)平滑法,時間序列法等。各種模型有著它的優(yōu)勢和局限性,灰色模型能通過小樣本數(shù)據(jù)對變形系統(tǒng)對規(guī)律進(jìn)行預(yù)測,但缺點在于對非線性數(shù)據(jù)樣本預(yù)測效果差;遞歸神經(jīng)網(wǎng)絡(luò)在時間序列的應(yīng)用廣泛,長短記憶時(LSTM)神經(jīng)網(wǎng)絡(luò)是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò),其在基于時間序列的非線性數(shù)據(jù)具有特殊的優(yōu)勢,但對樣本數(shù)據(jù)量的要求比較高。Jordan在1986年提出了遞歸神經(jīng)網(wǎng)絡(luò)框架,Elman在1990年提出了Elman遞歸神經(jīng)網(wǎng)絡(luò)。正是這種網(wǎng)絡(luò)結(jié)構(gòu)的循環(huán)設(shè)計,在每次向歷史傳播的過程中都會產(chǎn)生一個梯度,當(dāng)傳播次數(shù)遞增時,梯度也會出現(xiàn)消失或爆炸等問題。1997年,Hochreiter和Schmidhuber為解決循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中梯度消失的問題,提出了長短時記憶單元(Long Short Term Memory,LSTM);2005年,Graves提出使用完全的后向傳播方式訓(xùn)練LSTM模型,使得LSTM的實現(xiàn)過程更加可靠。2014年,Chung提出了簡化版本的LSTM,GRU(Gated Recurrent Unit)。GRU單元只有兩個門,重置門(reset gate)和更新門(update gate)。從2014年以來,LSTM神經(jīng)網(wǎng)絡(luò)已經(jīng)成為RNN的研究熱點,在很多行業(yè)都有廣泛的應(yīng)用。2015年孫瑞奇將LSTM網(wǎng)絡(luò)模型應(yīng)用在股票數(shù)據(jù)的預(yù)測上,結(jié)果表明該網(wǎng)絡(luò)模型適用于股票預(yù)測。2016年,左玲云,張晴晴將其應(yīng)用在語音識別上,也取得了不錯的效果。
文中在python的語言環(huán)境建立了改進(jìn)的LSTM預(yù)測模型,具體步驟如下:
1.在開始訓(xùn)練之前,首先是對數(shù)據(jù)進(jìn)行預(yù)處理,使其是沿時間序列的;
2.優(yōu)先修正隨機(jī)數(shù)種子,以確保結(jié)果是可重復(fù)的;
3.導(dǎo)入數(shù)據(jù),然后將數(shù)據(jù)轉(zhuǎn)化為浮點型,并且進(jìn)行標(biāo)準(zhǔn)化處理,一般用Scikit-Learning庫的MinMaxScaler預(yù)處理類來規(guī)范數(shù)據(jù)集;
4.將數(shù)據(jù)模型分割為訓(xùn)練模型和測試模型,對于時間序列數(shù)據(jù),值的順序很重要。將訓(xùn)練數(shù)據(jù)集分離成測試數(shù)據(jù)和預(yù)測數(shù)據(jù),其中80%作為測試數(shù)據(jù),剩下的20%用作預(yù)測數(shù)據(jù);
5.定義一個函數(shù)來創(chuàng)建一個新的數(shù)據(jù)集,函數(shù)有兩個參數(shù):DataSet(利用DataSet的NumPy數(shù)組)和look_back(上一時間段數(shù)據(jù)作為輸入變量預(yù)測下一個時間段的時間步驟數(shù)),一般默認(rèn)為1;此默認(rèn)設(shè)置將創(chuàng)建一個數(shù)據(jù)集,其中X是指定日期的相對高程,Y是下一次的相對高程;
6.重塑數(shù)據(jù)結(jié)構(gòu),利用Numpy可以將準(zhǔn)備好的訓(xùn)練數(shù)據(jù)和測試輸入數(shù)據(jù)轉(zhuǎn)換成預(yù)期的結(jié)構(gòu);
7.設(shè)計LSTM網(wǎng)絡(luò),其中輸入層為1,隱含層為4,輸出層為1,同時將Sigmoid函數(shù)用于LSTM塊,取迭代次數(shù)為1000,批量為1。
BP神經(jīng)網(wǎng)絡(luò)和SVM預(yù)測模型具有較強(qiáng)的泛化能力,非線性捕捉能力等特點。文中分別選用適用于變形監(jiān)測的BP預(yù)測模型和SVM預(yù)測模型對185期沉降樣本數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練樣本為168期數(shù)據(jù),預(yù)測數(shù)據(jù)為17期數(shù)據(jù)。并與改進(jìn)的LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行對比。
三種預(yù)測模型的精度評定見表1:
表1 三種預(yù)測模型精度對比(單位:mm)
由表1可知,三種預(yù)測模型整體預(yù)測精度最好的是改進(jìn)的LSTM預(yù)測模型,較BP預(yù)測模型其RMSE值精度提高了13.3%,MAE值精度提高了12.5%;較SVM預(yù)測模型其MAE值精度提高了23.3%,RMSE值精度提高了32.8%。改進(jìn)的LSTM模型結(jié)合了LSTM預(yù)測模型對時間序列的非線性樣本數(shù)據(jù)預(yù)測的優(yōu)勢性,對一定量的深基坑變形監(jiān)測數(shù)據(jù)進(jìn)行有效的預(yù)測。
文中提出改進(jìn)的LSTM模型應(yīng)用于地鐵深基坑變形監(jiān)測中,文中將組合模型與BP模型和SVM模型對比,結(jié)果表明組合模型預(yù)測效果更好,RMSE值精度分別提高了13.3%和32.8%,具有一定的實際應(yīng)用價值。