歐 斌,吳邦彬,袁 杰,李淑芳
(1.云南農業(yè)大學水利學院,云南 昆明 650201; 2.南昌工程學院,江西 南昌 330099;3.浙江中水工程技術有限公司,浙江 杭州 310000)
混凝土壩作為調節(jié)水資源時空優(yōu)化分布、促進國民經濟發(fā)展的主要基礎設施之一[1-2],其在運行期不僅長期承受靜水荷載、溫度荷載等循環(huán)荷載的作用,還面臨著特大洪水、地震等突發(fā)性自然災害以及戰(zhàn)爭、恐怖襲擊等多重風險威脅,運行環(huán)境異常復雜[3-5]。為實時掌握大壩的運行性態(tài),在大壩建設時期就埋設了諸多監(jiān)測儀器用以監(jiān)測水位、溫度等環(huán)境變量與變形、滲流、應力、應變等結構響應[5]。變形作為最直觀可靠的反映混凝土壩綜合運行性能的重要監(jiān)測量,結合大壩原型監(jiān)測資料構建大壩變形與其影響因子之間的數(shù)學模型是大壩安全監(jiān)控領域研究的重點[6-10],也是有效評估大壩運行安全、預測其未來運行行為的重要科學手段。
根據(jù)變形及其影響因子間的數(shù)學關系構建的大壩變形預測統(tǒng)計模型因具有函數(shù)形式簡單、計算高效等優(yōu)點,在大壩安全監(jiān)控領域得到了廣泛應用[11-13]。逐步回歸、多元回歸等回歸分析方法是實際工程領域最常用的變形預測模型建模方法,然而回歸方法不能有效解決影響因子間的多重共線性問題,導致模型預測精度不佳[12,14]。伴隨計算機技術的發(fā)展,支持向量機(SVM)[9,15-16]、相關向量機(RVM)[17-18]、極限學習機(ELM)[19-20]、人工神經網(wǎng)絡(ANN)[21]等多種機器學習算法被廣泛應用于變形預測模型,顯著提升了監(jiān)控模型的精度。然而神經網(wǎng)絡模型存在過擬合、易陷入局部極值等缺陷。SVM雖一定程度上克服了神經網(wǎng)絡模型的缺陷,但其也存在著模型超參數(shù)難以選取等不足[18,22-23]。近年來,隨著深度學習技術的發(fā)展,循環(huán)神經網(wǎng)絡(RNN)的優(yōu)勢變體長短期記憶網(wǎng)絡(long short-term memory, LSTM)在交通、電力等非平穩(wěn)時間序列預測中取得了廣泛應用,并表現(xiàn)出優(yōu)越的長期與短期預測性能[24-26],然而其在大壩變形預測中的應用研究[27-29]目前還不是很多。LSTM通過巧妙引入細胞狀態(tài)(cell state)與門控(gate)概念,有效解決了傳統(tǒng)神經網(wǎng)絡模型存在的梯度爆炸與梯度消失的通病,并可以合理考量時序樣本中前期信息的影響,在合理預測大壩變形中具有顯著優(yōu)勢[30]。本文在簡述LSTM基本原理的基礎上,提出了一種基于LSTM網(wǎng)絡的混凝土壩變形預測模型,并結合工程實例對預測模型進行了檢驗。
根據(jù)壩工原理可知,壩體任一點的變形由水壓、溫度與時效變形3部分組成[31-33],如式(1)所示。其中,水壓變形δH與溫度變形δT分別是靜水荷載與溫度荷載循環(huán)作用下引發(fā)的可逆變形,對于重力壩,δH可按式(2)計算;對于拱壩,δH可按式(3)計算;對于水化熱已完全散發(fā)的混凝土壩,壩體混凝土溫度隨季節(jié)變化而變化,故δT常采用諧波函數(shù)加以計算,如式(4)所示。時效變形δθ是筑壩材料性能老化與結構損傷等導致大壩安全裕度降低的時變不可逆變形,可由式(5)計算。
δ=α0+δH+δT+δθ
(1)
(2)
(3)
(4)
δθ=c1(θt-θ0)+c2(lnθt-lnθ0)
(5)
式中:α0為常數(shù);αi為回歸系數(shù);Ht、H0分別為監(jiān)測日與建模序列初始日的上游水深;t、t0分別為監(jiān)測日與建模序列初始日距始測日的累計天數(shù);θt=t/100,θ0=t0/100。
LSTM是一種特殊的RNN,其通過引入細胞狀態(tài)和門控概念,有效解決了傳統(tǒng)RNN所存在的梯度爆炸、梯度消失與長期依賴問題,具有出色的時序預測性能[27,30]。LSTM單元結構主要由細胞狀態(tài)、遺忘門、輸入門和輸出門組成[34-35],如圖1所示。細胞狀態(tài)也稱為記憶單元,其類似于傳送帶,為信息的傳遞提供通道。細胞狀態(tài)的更新由遺忘門、輸入門與輸出門協(xié)同控制。
圖1 RNN與LSTM單元結構
遺忘門以一定的概率決定是否保留上一時刻的細胞狀態(tài)以及選擇所需保留的信息比重,其讀取上一時刻的隱藏層輸出ht-1和當前時刻的輸入xt,通過一個sigmoid激活函數(shù)得到遺忘門的輸出ft
ft=σ(Wf·(ht-1,xt)+bf)
(6)
式中:Wf為遺忘門的權重矩陣;bf為偏置項;σ為sigmoid激活函數(shù),σ(x)=1/(1-e-x);遺忘門的輸出ft控制對上一時刻細胞狀態(tài)信息的遺忘程度,其取值范圍為[0,1],當ft=1時表示完全保留,當ft=0則表示完全遺忘。
it=σ(Wi·(ht-1,xt)+bi)
(7)
(8)
式中:Wi、Wc分別為sigmoid層和tanh層的權重矩陣;bi、bc分別為sigmoid層和tanh層的偏置項;tanh為雙曲正切函數(shù),tanhx=(1-e-x)/(1+e-x)。
基于遺忘門和輸入門對上一時刻細胞狀態(tài)和當前時刻輸入的信息的選擇,細胞狀態(tài)可更新為
Ct=ftCt-1+itat
(9)
輸出門從當前細胞狀態(tài)中提取有效信息用以產生新的隱藏層。首先,通過sigmoid函數(shù)決定當前細胞狀態(tài)中的輸出部分,然后通過tanh函數(shù)對當前細胞狀態(tài)加以處理,最后生成新的隱含層ht:
ht=ottanhCt
(10)
其中ot=σ(Wo·(ht-1,xt)+bo)
式中:Wo為輸出門的權重矩陣;bo為偏置項。
綜上可知,LSTM當前時刻的隱藏層輸出ht和細胞狀態(tài)Ct由上一時刻的隱藏層輸出ht-1、細胞狀態(tài)Ct-1與當前時刻的輸入xt協(xié)同決定。
在利用LSTM構建回歸預測模型時,隱藏層的數(shù)量對模型的訓練精度和效率有著顯著影響。理論上講,雖LSTM模型的擬合精度會隨著隱藏層層數(shù)的增加而提高,但過多的隱藏層會導致模型的訓練效率降低,甚至造成模型的擬合與預測精度降低。相關研究指出,具有兩個隱藏層的LSTM模型即可較好地學習并訓練大壩變形與其影響因子間復雜的非線性關系[36],故本文采用具有2個LSTM隱藏層的網(wǎng)絡結構。同時,網(wǎng)絡訓練中采用dropout技術以避免過擬合,即模型訓練效果良好而預測性能欠佳的問題,并利用批處理技術用以提升模型的訓練效率[27]。
我國福建省某混凝土重力壩工程為I等樞紐工程,該壩最大壩高113.0 m,壩頂高程179.0 m。該工程內部布置了3組正、倒垂線監(jiān)測儀器用以觀測該壩壩體與壩頂?shù)乃阶冃?,布置方案如圖2所示,圖中PL1~PL7為正垂監(jiān)測點,IP1~IP3為倒垂監(jiān)測點。
圖2 大壩變形監(jiān)測布置方案(單位:m)
以2006年1月1日至2008年12月31日正垂PL5測點自動化監(jiān)測得到的左岸擋水壩段壩頂水平變形為例,對所提建模方法進行詳細描述,其中,監(jiān)測序列中后2個月的測值用以預測以檢驗模型的預測能力。監(jiān)測時段內庫水位與測點水平變形如圖3所示,其中負值代表向上游方向變形。由圖3可知,隨著庫水位的上升,左岸擋水壩段壩頂向下游方向的水平變形增大;反之,壩頂向上游方向的水平變形增大,其變形行為符合大壩變形的一般規(guī)律。
圖3 庫水位與壩頂水平變形過程線
圖4 PL5測點預測結果
為驗證模型的適用性,同時采用上述4種方法對相同監(jiān)測時段正垂PL2測點監(jiān)測的壩體水平變形加以建模預測,預測結果及模型殘差如圖5所示。此外,為量化對比4種模型的預測精度,表1給出了PL5與PL2測點各模型建模與預測的平均絕對誤差(mean absolute error, MAE)、均方誤差(mean square error, MSE)與均方根誤差(root mean square error, RMSE)。
圖5 PL2測點預測結果
測點預測模型MAE/mmMSE/mm2RMSE/mm建模段預測段建模段預測段建模段預測段PL5PL2MLR0.4750.7410.3550.7160.5960.846SR0.4750.7650.3560.7610.5960.872ANN0.2910.3100.1370.1300.3710.361LSTM0.1460.1970.040.0630.1990.251MLR0.3450.2750.3450.2750.4450.281SR0.3280.2230.3280.2230.4240.252ANN0.1610.2020.0560.0610.2360.244LSTM0.1180.0820.0320.0170.1780.085
根據(jù)圖4與圖5中2個測點水平變形的預測結果可知,基于SR、MLR、ANN與LSTM 4種算法構建的預測模型的建模與預測結果與實測變形測值變化過程基本一致。相比而言,基于LSTM的預測模型比基于SR、MLR、ANN 3種方法的預測模型的建模與預測結果更為接近實測變形,同時其模型殘差無明顯的變化規(guī)律且其變化范圍顯著較小。由此可知,基于LSTM的預測模型可更好地學習并訓練大壩變形與其影響因子間復雜的非線性函數(shù)關系,所建變形預測模型的精度更優(yōu)。此外,由表1中的統(tǒng)計指標可知,基于LSTM所建的兩個測點的預測模型在建模與預測段的MAE、MSE與RMSE均相對較小且各自接近,說明所建模型不存在過擬合現(xiàn)象,并進一步表明了所建模型具有出色的建模與預測性能。
a.以LSTM網(wǎng)絡為基礎構建的混凝土壩變形預測模型具有良好的非線性信息挖掘能力,可有效地挖掘大壩變形及其影響因子間復雜的非線性函數(shù)關系,具有出色的建模與預測精度,證明了LSTM網(wǎng)絡在大壩變形預報中的可行性和有效性。
b.某混凝土壩實測變形資料建模分析表明,相比于回歸模型,基于LSTM網(wǎng)絡所建的變形預測模型的預測性能更優(yōu),為高精度預測大壩變形提供了一種新技術。且該方法簡便高效,加以修改可推廣應用于大壩其他監(jiān)測效應量的預測分析中。