張振威, 黃曉彬, 陳何峰, 趙 程*
(1.同濟(jì)大學(xué) 巖土與地下工程教育部重點(diǎn)實(shí)驗(yàn)室, 上海 200092;2.同濟(jì)大學(xué) 地下建筑與工程系, 上海 200092; 3.同濟(jì)大學(xué) 建筑設(shè)計(jì)研究院, 上海 200092)
隨著我國經(jīng)濟(jì)高速發(fā)展,地下隧道越來越多地出現(xiàn)在城市交通中,但由于城市復(fù)雜的地表地下環(huán)境,隧道的變形受到許多因素影響,把握隧道整體沉降值的變化趨勢可以確保隧道施工安全及正常運(yùn)營,因此工程中對(duì)隧道沉降進(jìn)行預(yù)測具有重要意義[1]。
沉降預(yù)測模型總體上可以分為三大類:靜態(tài)預(yù)測模型、動(dòng)態(tài)預(yù)測模型及組合預(yù)測模型。靜態(tài)預(yù)測模型有雙曲線函數(shù)模型、修正雙曲線法、Logistic模型、Weibull模型等[2-3]。動(dòng)態(tài)預(yù)測模型如灰色模型、神經(jīng)網(wǎng)絡(luò)算法等,其最大優(yōu)點(diǎn)在于可以根據(jù)沉降觀測數(shù)據(jù)的變化趨勢不斷調(diào)整。使用動(dòng)態(tài)模型可以使預(yù)測更加合理化,如劉勇健[4]使用人工神經(jīng)網(wǎng)絡(luò)預(yù)測公路地基沉降;王鑫等[5-7]使用加入記憶單元的LSTM神經(jīng)網(wǎng)絡(luò)在不同領(lǐng)域進(jìn)行工程應(yīng)用,用以解決時(shí)間序列的梯度爆炸問題。為進(jìn)一步發(fā)揮各預(yù)測模型的長處,提高預(yù)測精度,同時(shí)彌補(bǔ)單一模型短板,可以構(gòu)建組合預(yù)測模型,以達(dá)到更精確的預(yù)測效果,如傅湘萍使用粒子群算法優(yōu)化BP網(wǎng)絡(luò)預(yù)測地鐵結(jié)構(gòu)變形[8],趙楠結(jié)合LSTM與SVM對(duì)隧道圍巖位移進(jìn)行預(yù)測[9],舒濤將灰色模型與LSTM組合對(duì)旋轉(zhuǎn)機(jī)械軸承壽命進(jìn)行預(yù)測[10]。目前對(duì)隧道沉降的預(yù)測以靜態(tài)預(yù)測為主,精度存在較大提升空間。本文將結(jié)合灰色模型GM(2,1)與長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,簡稱LSTM),依據(jù)某隧道工程長期監(jiān)測數(shù)據(jù)對(duì)隧道沉降進(jìn)行預(yù)測。
LSTM即長短時(shí)記憶神經(jīng)網(wǎng)絡(luò),是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(Recurnent Neural Network簡稱RNN),能有效解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題,特別適用于長時(shí)間序列的學(xué)習(xí),在解決長序依賴問題時(shí)具有較高效率與普適性,為問題解決帶來更多可能性[11-12]。區(qū)別于常規(guī)RNN算法,LSTM在算法中加入了記憶單元(cell)用于判斷信息有用與否。模型訓(xùn)練中,可通過模型的訓(xùn)練損失和測試損失大小判斷模型的擬合情況。
灰色預(yù)測原理是遵循系統(tǒng)既定發(fā)展規(guī)律,建立一般性的灰色微分方程,通過數(shù)據(jù)擬合的方法確定方程系數(shù),最終得到完整的灰色模型方程用于系統(tǒng)長期發(fā)展的預(yù)測?;疑P瓦m用于短序列的數(shù)據(jù)擬合,可以通過簡單的信息得到長期的動(dòng)態(tài)特性[13]。當(dāng)目標(biāo)沉降具有單調(diào)遞增性、有界性并呈現(xiàn)S形曲線時(shí),可認(rèn)為符合飽和的S形曲線,宜采用GM(2,1)預(yù)測模型[14]。
模型融合常見的定權(quán)準(zhǔn)則是基于預(yù)測誤差平方和最小的組合模型權(quán)系數(shù)確定準(zhǔn)則,計(jì)算簡便,運(yùn)用廣泛,但其缺點(diǎn)在于當(dāng)均方根誤差最小與其他條件不能同時(shí)滿足時(shí),無法得到多種精度要求下的最優(yōu)方案。因此需要使用多目標(biāo)的優(yōu)化方法去確定組合模型最佳的權(quán)值分配情況[15]。
NSGA-Ⅱ算法,即帶有精英保留策略的快速非支配多目標(biāo)遺傳算法,也叫做基于Pareto最優(yōu)解的非劣分層遺傳算法,相比基礎(chǔ)NSGA算法采用了更好的記帳策略,減少了算法運(yùn)行的整體時(shí)間[16]。算法采用密度估計(jì)算子與擁擠度評(píng)判每個(gè)個(gè)體的非劣級(jí)別,從而快速進(jìn)行非劣排序,保持種群多樣性,使其計(jì)算復(fù)雜度有所降低。算法還引入精英策略用于避免最佳個(gè)體的丟失,提高了算法的運(yùn)算速度和魯棒性[17-19]。
單一精度標(biāo)準(zhǔn)存在局限性,因此模型精度的評(píng)價(jià)項(xiàng)選取平均絕對(duì)誤差MAE,平均相對(duì)誤差MRE,均方根誤差RMSE共三個(gè)指標(biāo)進(jìn)行精度評(píng)價(jià);為體現(xiàn)沉降預(yù)測的整體性,加入后驗(yàn)差比值C,小誤差概率p表征單個(gè)數(shù)據(jù)與整體數(shù)據(jù)的關(guān)聯(lián)度,灰色模型增加灰色關(guān)聯(lián)度ε0用來檢驗(yàn)精度,其計(jì)算方法如下:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
式中:式(1)—式(3)可以衡量預(yù)測值與真實(shí)值之間的偏差;式(4)—式(8)用于檢驗(yàn)灰色模型精度(表1)。
表1 灰色模型精度評(píng)定標(biāo)準(zhǔn)
LSTM模型在處理沉降數(shù)據(jù)時(shí),需要將長期的沉降數(shù)據(jù)處理為時(shí)間序列作為學(xué)習(xí)樣本,本文取該時(shí)刻前三個(gè)時(shí)間點(diǎn)沉降值作為特征值,每四個(gè)時(shí)間節(jié)點(diǎn)的數(shù)據(jù)作為一組特征值與輸出值,以整個(gè)數(shù)據(jù)源前70%的沉降值作為訓(xùn)練集,預(yù)測后30%的沉降數(shù)據(jù),并與實(shí)測沉降進(jìn)行比較。對(duì)于灰色模型,采取同樣的劃分規(guī)則,擬合時(shí)只使用訓(xùn)練集部分的數(shù)據(jù)。對(duì)于同一組數(shù)據(jù),分別建立長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型與灰色預(yù)測模型,對(duì)未來一段時(shí)間的沉降值作出預(yù)測。其中,長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型采用Python語言,基于TensorFlow的Keras庫中的LSTM模塊,以及Scikit-Learn中的預(yù)處理模塊進(jìn)行建模;灰色預(yù)測模型使用MATLAB計(jì)算。
2.1.1 數(shù)據(jù)預(yù)處理
LSTM神經(jīng)網(wǎng)絡(luò)需要使用時(shí)間間隔一致的時(shí)間序列數(shù)據(jù),因此需要預(yù)先對(duì)數(shù)據(jù)做插值處理。時(shí)間序列中,取最后30%作為測試集,剩余數(shù)據(jù)作為訓(xùn)練集。對(duì)于灰色模型,同樣只取上述訓(xùn)練集數(shù)據(jù)用于擬合,得到擬合結(jié)果后帶入計(jì)算得到后續(xù)預(yù)測值。在進(jìn)行訓(xùn)練前,需要先將時(shí)間序列數(shù)據(jù)進(jìn)行歸一化與正則化處理,消除數(shù)據(jù)噪聲,避免模型過擬合,同時(shí)增加模型的敏感性。
2.1.2 模型驗(yàn)證及參數(shù)調(diào)優(yōu)
LSTM模型中通過定義time steps參數(shù)對(duì)時(shí)間序列進(jìn)行處理,即使用目標(biāo)序列之前若干項(xiàng)序列值作為其特征值。LSTM模型總共有7個(gè)參數(shù),其中輸入特征維數(shù)與time steps有關(guān),初始time steps設(shè)置為3,即認(rèn)為某個(gè)預(yù)測是與之前三個(gè)歷史數(shù)據(jù)有關(guān)。輸入層數(shù)與輸出層數(shù)均為1。激活函數(shù)使用sigmoid函數(shù)。模型迭代次數(shù)為100次,隱藏層數(shù)為1,擁有16個(gè)隱藏節(jié)點(diǎn)。Batch size設(shè)為1,即隨機(jī)訓(xùn)練。設(shè)置損失函數(shù)為均方誤差即平方損失,對(duì)偏離實(shí)測值更多的預(yù)測結(jié)果做出更嚴(yán)重的懲罰。通過分析模型每個(gè)運(yùn)算周期損失的歷史數(shù)據(jù)可以判斷模型是否存在欠擬合或過擬合現(xiàn)象,對(duì)相關(guān)參數(shù)進(jìn)行修改調(diào)整?;疑A(yù)測使用常規(guī)方法進(jìn)行求解。
為結(jié)合長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)與灰色模型的優(yōu)勢,需要構(gòu)建神經(jīng)網(wǎng)絡(luò)與灰色模型的組合模型,并基于快速非支配遺傳算法確定組合模型中各項(xiàng)權(quán)重系數(shù)。
使用1.3中遺傳算法計(jì)算組合模型權(quán)值,定義兩個(gè)適應(yīng)度函數(shù)分別為:
(9)
(10)
f1、f2分別代表預(yù)測前最后一個(gè)訓(xùn)練階段預(yù)測沉降值的均方根誤差與后驗(yàn)差比值,優(yōu)化目標(biāo)為得到使組合模型預(yù)測值的均方根誤差與后驗(yàn)差比值最小的權(quán)值分配方案。在本算法中,使用競標(biāo)賽法進(jìn)行種群選擇,使用實(shí)數(shù)編碼的交叉操作模擬二進(jìn)制種群交叉,使用多項(xiàng)式變異法實(shí)現(xiàn)種群變異。
本文使用上述模型對(duì)某工程中一堆山下穿隧道的長期沉降數(shù)據(jù)進(jìn)行預(yù)測。該工程規(guī)劃有圍繞山體的外環(huán)、中環(huán)、內(nèi)環(huán)3條環(huán)路。中環(huán)路和內(nèi)環(huán)路穿越山體部分采用隧道設(shè)計(jì)。該人工山需要在地面進(jìn)行大量堆土堆石,從而在地面形成極大的大面積堆載,對(duì)其下隧道的長期沉降可能有較大影響。因此采用科學(xué)的方法預(yù)測隧道及周圍場地的將來沉降,對(duì)預(yù)防重大安全事故發(fā)生具有重要的工程意義。
分別在內(nèi)環(huán)隧道、中環(huán)隧道、外環(huán)路、堆山場地四處選擇四個(gè)測點(diǎn),提取測點(diǎn)連續(xù)兩年的沉降監(jiān)測數(shù)據(jù)作為模型的訓(xùn)練樣本,形成時(shí)間序列數(shù)據(jù)。針對(duì)這四組時(shí)間數(shù)據(jù)分別建立長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型、灰色預(yù)測模型以及組合模型,對(duì)未來一段時(shí)間的沉降值作出預(yù)測。
使用兩種方法得到預(yù)測結(jié)果后,使用1.4中的精度評(píng)價(jià)準(zhǔn)則進(jìn)行模型效果預(yù)測評(píng)價(jià),并與傳統(tǒng)靜態(tài)預(yù)測方法進(jìn)行對(duì)比,結(jié)果見表2—表5。
表2 內(nèi)環(huán)測點(diǎn)沉降預(yù)測精度評(píng)價(jià)
表3 中環(huán)測點(diǎn)沉降預(yù)測精度評(píng)價(jià)
表4 外環(huán)測點(diǎn)沉降預(yù)測精度評(píng)價(jià)
表5 堆山場地測點(diǎn)沉降預(yù)測精度評(píng)價(jià)
兩種動(dòng)態(tài)模型預(yù)測值與沉降實(shí)測值之間的差距如圖1所示,并與傳統(tǒng)靜態(tài)模型預(yù)測結(jié)果進(jìn)行對(duì)比。
圖1 各模型沉降預(yù)測曲線比較Fig.1 Comparison of settlement prediction curves of various models
誤差方面,兩種動(dòng)態(tài)預(yù)測方法均表現(xiàn)出較高的精度,四個(gè)測點(diǎn)的RMSE保持在2.7以下,明顯小于其他靜態(tài)算法,但存在較大的C值,整體性表現(xiàn)稍差,在中環(huán)09測點(diǎn)表現(xiàn)尤為明顯。對(duì)走勢的預(yù)測方面,在內(nèi)環(huán)01測點(diǎn),LSTM模型與灰色模型都呈現(xiàn)出較好的預(yù)測效果;在中環(huán)09測點(diǎn)與場地01測點(diǎn),LSTM預(yù)測結(jié)果出現(xiàn)了滯后,導(dǎo)致其誤差較大;灰色模型誤差相對(duì)較小,但其沉降走勢與實(shí)際情況不符;在外環(huán)06測點(diǎn),沉降發(fā)生了較為劇烈的波動(dòng),可能是測量中復(fù)雜因素的影響下導(dǎo)致實(shí)測值噪聲較大,因此灰色模型面對(duì)短時(shí)間內(nèi)復(fù)雜變化的數(shù)據(jù)預(yù)測效果較差,而LSTM模型則比較好地模擬了沉降的波動(dòng)情況。
兩種動(dòng)態(tài)模型較靜態(tài)預(yù)測模型均有更高精度。以均方根誤差為例,LSTM模型在四個(gè)測點(diǎn)上的預(yù)測精度相比雙曲線模型提高了56.5%、64.9%、75.2%、48.1%;相比logistics模型分別提高了74.3%、77.0%、54.9%、74.1%;相比weibull模型分別提高了70.7%、0.02%、55.8%、23.0%。GM(2,1)灰色模型的在四個(gè)測點(diǎn)上的預(yù)測精度相比雙曲線模型分別提高了58.0%、68.8%、60.0%、47.8%;相比logistics模型分別提高了75.2%、79.5%、27.1%、74.0%;相比weibull模型分別提高了71.6%、11.2%、28.6%、23.7%。
結(jié)果表明,對(duì)于復(fù)雜的沉降數(shù)據(jù),長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型與灰色模型兩種動(dòng)態(tài)預(yù)測模型在精度與穩(wěn)定方面均優(yōu)于傳統(tǒng)靜態(tài)預(yù)測模型,具有較好的預(yù)測效果。但兩種動(dòng)態(tài)模型在面對(duì)不同測點(diǎn)數(shù)據(jù)時(shí)則各有優(yōu)劣?;疑P驼w性更強(qiáng),擬合圖線規(guī)律明顯,在面對(duì)趨勢較為單一的數(shù)據(jù)時(shí)表現(xiàn)更好;而對(duì)于波動(dòng)明顯、走勢更多變的數(shù)據(jù),LSTM模型表現(xiàn)更優(yōu)。
對(duì)組合模型進(jìn)行參數(shù)調(diào)優(yōu),最終將種群數(shù)量設(shè)為300,進(jìn)化代數(shù)設(shè)為100代,交叉概率設(shè)為0.9,變異概率設(shè)為0.5,模擬二進(jìn)制交叉參數(shù)設(shè)為2,變異參數(shù)設(shè)為5,競標(biāo)賽算法中候選者數(shù)量設(shè)為2。將預(yù)測沉降分為兩組,一組用于權(quán)重計(jì)算,另一組用于預(yù)測。
通過2.2中遺傳算法的計(jì)算,得到四組數(shù)據(jù)的權(quán)重系數(shù)如表6所示:
表6 各監(jiān)測點(diǎn)數(shù)據(jù)組合模型權(quán)重值
w1,w2進(jìn)行加權(quán)后可計(jì)算出組合模型的預(yù)測值。使用組合模型在四個(gè)測點(diǎn)進(jìn)行預(yù)測,結(jié)果大部分?jǐn)?shù)據(jù)點(diǎn)的誤差小于3%,部分?jǐn)?shù)據(jù)點(diǎn)誤差小于1%,可見組合模型在面對(duì)不同形式的沉降時(shí)均能發(fā)揮較好的預(yù)測效果,具有較高的預(yù)測精度。
對(duì)比單一模型預(yù)測結(jié)果,組合模型在保證精度的同時(shí),能較好模擬沉降走勢。圖2為組合模型與兩種獨(dú)立模型預(yù)測效果的對(duì)比。
圖2 組合模型與單一模型沉降預(yù)測曲線比較Fig.2 Comparison of settlement prediction curves between combined model and single model
圖7對(duì)比了組合模型與單一模型的預(yù)測精度在內(nèi)環(huán)01測點(diǎn),與LSTM模型與灰色模型相比,組合模型達(dá)到了更高的精度,在走勢上與單預(yù)測模型保持一致。在中環(huán)09測點(diǎn)與場地01測點(diǎn),組合模型在保持預(yù)測精度的情況下,較好地模擬了沉降的發(fā)展趨勢,相比于灰色預(yù)測模型更加貼近實(shí)測值;在外環(huán)06測點(diǎn),面對(duì)較大噪聲的數(shù)據(jù),組合模型表現(xiàn)不如單獨(dú)的LSTM模型。
表7 組合模型各測點(diǎn)沉降預(yù)測精度
本文依據(jù)某隧道工程的沉降監(jiān)測數(shù)據(jù),以長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)為主,輔以灰色模型對(duì)其沉降發(fā)展進(jìn)行了預(yù)測,并基于快速非支配多目標(biāo)優(yōu)化遺傳算法搭建了兩者的組合模型,取得了較好的預(yù)測效果,得到以下結(jié)論:
1)長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型在進(jìn)行沉降預(yù)測時(shí),可保證較高的預(yù)測精度,較好地模擬沉降發(fā)展趨勢。相比于靜態(tài)沉降預(yù)測模型,LSTM預(yù)測精度可提高20%~70%不等;面對(duì)長周期的預(yù)測時(shí), LSTM以節(jié)點(diǎn)前最近序列為特征值進(jìn)行訓(xùn)練,對(duì)沉降細(xì)微變化較為敏感,同時(shí)由于該算法較好地解決了梯度消失與爆炸問題,能夠在長期內(nèi)保持較好的魯棒性?;疑P湍艿玫酵瑯宇A(yù)測精度,優(yōu)勢在于能夠依據(jù)少量數(shù)據(jù)提煉整體走勢,但其對(duì)信息的利用率較低,在預(yù)測波動(dòng)數(shù)據(jù)時(shí)表現(xiàn)比LSTM稍差。
2)使用快速非支配多目標(biāo)優(yōu)化遺傳算法進(jìn)行組合模型的權(quán)值分配可以較快地得到兩種精度標(biāo)準(zhǔn)下的最優(yōu)定權(quán)方案,結(jié)合兩種模型的優(yōu)勢,得到較精確的預(yù)測效果。面對(duì)平緩沉降數(shù)據(jù),組合模型能夠很好地貼近實(shí)測值,并保證比單一模型更高的精度。但面對(duì)噪聲較大數(shù)據(jù)時(shí),組合模型破壞了同種預(yù)測方法中數(shù)據(jù)的一致性,導(dǎo)致其預(yù)測結(jié)果的后驗(yàn)差比值遠(yuǎn)大于獨(dú)立模型,整體性表現(xiàn)較差。