王曉玲,李 克,張宗亮,余紅玲,孔令學(xué),陳文龍
(1.天津大學(xué) 水利工程仿真與安全國家重點實驗室,天津 300072;2.中國電建集團昆明勘測設(shè)計研究院有限公司,云南 昆明 650051)
大壩滲流安全監(jiān)測是保證大壩安全穩(wěn)定運行的重要手段,滲壓實時監(jiān)測數(shù)據(jù)是大壩運行性態(tài)的直接表征[1-2]。目前常用的大壩滲壓預(yù)測模型主要注重滲壓效應(yīng)量和影響因子之間的非線性映射關(guān)系,缺乏對滲壓效應(yīng)量內(nèi)在影響機制的挖掘。因此,建立精確的滲壓預(yù)測模型并且探究滲壓變化的內(nèi)在原因,對于深入研究大壩滲流安全狀態(tài)具有重要的理論和現(xiàn)實意義。
近年來,隨著人工智能技術(shù)的不斷發(fā)展,越來越多的機器學(xué)習(xí)模型應(yīng)用到大壩滲流預(yù)測模型的研究中[3-4]。例如,Chen 等[5]建立了基于最小二乘支持向量機的大壩滲流預(yù)警模型。Qiu 等[6]利用小波神經(jīng)網(wǎng)絡(luò)和最大熵原理對某土石壩在暴雨影響下的滲流狀態(tài)進行了研究。Roushangar 等[7]建立了基于小波互信息和高斯過程回歸的組合模型來預(yù)測土石壩的滲流流量值。Fernando 等[8]將回歸樹模型應(yīng)用到大壩異常檢測中去??婇L健等[9]、Zhang 等[10]和黃振東[11]針對傳統(tǒng)的統(tǒng)計模型難以反映大壩滲流與影響因子之間的非線性關(guān)系的缺點,將反向傳播神經(jīng)網(wǎng)絡(luò)應(yīng)用于滲流預(yù)測模型,提高了模型的非線性映射能力。Chen 等[12]提出了基于核極限學(xué)習(xí)機滲流預(yù)測的數(shù)據(jù)挖掘與監(jiān)測框架。馮春燕等[13]建立了卡爾曼濾波回歸模型對測壓管水位進行預(yù)測。Li 等[14]等基于灰色聚類分析方法對用于大壩健康監(jiān)測。
上述研究在大壩滲流安全監(jiān)控中發(fā)揮了重要的作用。隨著人工智能的快速發(fā)展,將深度學(xué)習(xí)模型應(yīng)用于大壩監(jiān)測領(lǐng)域已成為研究熱點[15-16]。與傳統(tǒng)的機器學(xué)習(xí)方法相比,深度學(xué)習(xí)模型可對滲流監(jiān)測數(shù)據(jù)進行深度挖掘,能得到更加準(zhǔn)確的預(yù)測結(jié)果。在時序預(yù)測研究中,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)是一種常用的深度學(xué)習(xí)模型。然而,RNN 存在梯度消失和爆炸的問題,導(dǎo)致對長時間序列數(shù)據(jù)的預(yù)測精度不足[17]。LSTM 的提出解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的缺陷,它在RNN 的隱含層中引入“門”的概念來增強模型的長期記憶能力,可以有效避免時間序列中長期依賴的問題[18]。與其他神經(jīng)網(wǎng)絡(luò)模型一樣,LSTM 具有眾多超參數(shù)且難以通過人為選擇確定最優(yōu)超參數(shù)。此外,不同的超參數(shù)對模型的擬合優(yōu)度、收斂速度等都存在較大的差異性。蟻獅優(yōu)化算法(Ant Lion Optimizer,ALO)因其具有調(diào)節(jié)參數(shù)少、收斂速度快、魯棒性高等特點,在工程領(lǐng)域應(yīng)用廣泛[19-20]。因此,本文采用ALO 算法對LSTM 的參數(shù)進行自動尋優(yōu)。
在大壩服役期間,壩體滲流壓力受到上下游水位、溫度、降雨以及壩體材料的時變特性等多種變量的耦合影響[2]。由于LSTM 為黑箱模型,故其對壩體滲流壓力與影響因子之間的可解釋性不高[21-22]。注意力機制是從人類視覺研究中衍生出來的智能算法,通過在關(guān)鍵信息上分配注意力權(quán)重來突出重要的特征信息[23]。本文在滲壓預(yù)測模型中引入一種特征注意力機制以增強模型對各個影響因子的可解釋性。值得注意的是,當(dāng)影響因子維數(shù)較多時,會存在多重共線性,不僅會造成信息的冗余[5,24],還會影響注意力機制進行特征學(xué)習(xí)時的準(zhǔn)確性。因此,在滲壓預(yù)測研究中需要對影響因子進行降維處理以消除其多重共線性。常用的降維方法有皮爾遜相關(guān)分析法、主成分分析(Principal Component Analysis,PCA)、逐步回歸、關(guān)聯(lián)度分析方法等[25-26]。其中,PCA 方法是一種通過線性空間變換將多個輸入向量進行降維的統(tǒng)計分析方法,其降維效果顯著,故本文選擇PCA 方法來對各影響因子數(shù)據(jù)進行降維處理。
綜上所述,為深入探究滲壓效應(yīng)量變化的內(nèi)在影響機制,本文提出了一種耦合ALO-LSTM 和特征注意力機制的土石壩滲壓預(yù)測模型。首先,為了消除影響因子之間的多重共線性,采用PCA 方法對影響因子進行降維;其次,由于滲壓監(jiān)測數(shù)據(jù)為時間序列數(shù)據(jù),為挖掘其在時間維度上的關(guān)聯(lián)性,構(gòu)建基于LSTM 的土石壩滲壓預(yù)測模型,并采用ALO 算法對LSTM 模型的超參數(shù)進行自動尋優(yōu);最后,采用特征注意力機制量化各個影響因子對滲流壓力的影響程度以增強模型的可解釋性。
2.1 ALO-LSTM 模型與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)借助其循環(huán)模塊可以幫助模型記憶歷史信息,這樣網(wǎng)絡(luò)可以更好地挖掘滲壓輸入變量和其影響因子中的時間信息。LSTM 模型是對傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的一種改進,它通過將門控制函數(shù)引入狀態(tài)動力學(xué),解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)中常見的梯度消失和爆炸問題[27]。LSTM 模型先通過遺忘門從記憶單元細胞中篩選滲壓輸入變量;其中重要信息的存儲由輸入門來確定;最后通過輸出門來輸出滲壓變量。LSTM 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖如圖1 所示。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
LSTM 結(jié)構(gòu)單元內(nèi)部的遺忘門、輸入門和輸出門的建模流程如下:
(1)遺忘門控制從前一刻的記憶細胞中可以積累多少滲壓監(jiān)測數(shù)據(jù)到當(dāng)前時刻的記憶細胞中,表達式如下式:
(2)輸入門將LSTM 的當(dāng)前記憶和長期記憶結(jié)合起來,形成一個新的單元狀態(tài)用來挖掘滲壓監(jiān)測數(shù)據(jù)中的時序特征:
當(dāng)前時刻單元Ct的狀態(tài)如下式所示:
(3)LSTM 的最終輸出由輸出門和單元狀態(tài)決定:
式(1)至式(6)中:ht-1和ht分別為上一時刻單元的輸出和當(dāng)前細胞的輸出;ft、it、、Ct、ot分別為遺忘門、輸入門、當(dāng)前時刻初始細胞狀態(tài)、當(dāng)前時刻細胞狀態(tài)以及輸出門的值;σ為Sigmoid 函數(shù);W和b分別為相應(yīng)的權(quán)重系數(shù)和偏置項。
由于LSTM 的超參數(shù)眾多,超參數(shù)的選取影響到模型的精度,因此需要合理選擇這些超參數(shù)。蟻獅優(yōu)化算法(Ant Lion Optimizer,ALO)是2015年澳大利亞學(xué)者Mirjalili Seyedali 受蟻獅捕食行為關(guān)系的啟發(fā)而提出的一種新型群智能優(yōu)化算法。相關(guān)研究表明蟻獅優(yōu)化算法具有比遺傳算法(Genetic Algorithm,GA)、花朵授粉算法(Flower Pollination Algorithm,F(xiàn)PA)和蝙蝠算法(Bat Algorithm,BA)等算法更優(yōu)的尋優(yōu)精度和更快的收斂速度[28]。
ALO 算法具體的操作流程如下:
(1)螞蟻隨機游走。在自然界,螞蟻通過隨機游走的方式來尋找食物,如式(7)所示:
式中:cumsum為累積和;t為螞蟻在隨機游走時的位置;n為最大迭代次數(shù);r(t)為螞蟻在游走過程中產(chǎn)生的隨機數(shù),可由下式生成:
(2)螞蟻游走范圍。蟻獅構(gòu)造的陷阱會影響螞蟻的隨機行走,其數(shù)學(xué)模型表示如下:
式中:Antlionjt為蟻獅在第t次迭代時第j只的位置;d it為所有輸入向量在第i個螞蟻中的最大值;c it為所有輸入向量在第i個螞蟻中的最小值;d t為所有輸入向量在第t次迭代時的最大值;ct為所有輸入向量在第t次迭代時的最小值。
(3)螞蟻掉落陷阱
式中I為比率。
(4)蟻獅重構(gòu)陷阱。為了使捕捉新螞蟻的機會增加,蟻獅需要通過改變自己的位置來適應(yīng)被捕食螞蟻所在的位置,由下式表示:
式中Ant it為第i只螞蟻在第t次迭代時的位置。
(5)精英化蟻獅。在每一次迭代的過程中,適應(yīng)度最好的蟻獅所在的位置會被留下來當(dāng)做精英蟻獅,精英蟻獅在迭代過程中能影響螞蟻的位置。可根據(jù)下式得到螞蟻的位置:
式中:R At是在第t次迭代中根據(jù)輪盤賭機制選擇蟻獅的隨機游走策略;R Et是第t次迭代中圍繞精英蟻獅的隨機游走策略。
ALO 算法具有調(diào)節(jié)參數(shù)少、收斂速度快、魯棒性高等特點,該算法采用隨機游走以及輪盤賭方式等策略可有效避免陷入局部最優(yōu)等問題。本文使用ALO 算法優(yōu)化LSTM 模型超參數(shù),可以快速找到最優(yōu)超參數(shù)的組合,避免手動調(diào)參帶來的不便,提高模型訓(xùn)練效率。
2.2 特征注意力機制特征注意力機制作為一種增強局部特征學(xué)習(xí)的思想,它不是一種固定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[29]。引入特征注意力機制目的在于通過調(diào)整注意力權(quán)重,從輸入向量的大量信息中快速提取有效信息。由于特征注意力機制能夠自適應(yīng)地集中于特征的有效部分,因此被廣泛應(yīng)用于圖像分類[30]、神經(jīng)機器翻譯[29,31]、時間序列預(yù)測[32]等研究領(lǐng)域。本文中引入特征注意力量化滲壓效應(yīng)量與各輸入變量之間的關(guān)聯(lián)關(guān)系。特征注意力機制的表達式如下:
式中:Wa為注意機制的權(quán)值矩陣,表示需要強調(diào)的信息;et為第一次加權(quán)計算結(jié)果;b為注意力機制的偏置項;[X1,X2,…,XT]為輸入項;at為輸入項得到的最終權(quán)重。
對于滲壓預(yù)測模型,通常的手段是選用高精度的機器學(xué)習(xí)或深度學(xué)習(xí)模型進行預(yù)測,但是卻忽略了哪些影響因素對滲壓效應(yīng)量的影響程度最大。本文所提的滲壓預(yù)測模型引入特征注意力機制計算隱含層單元狀態(tài)的特征權(quán)重,根據(jù)權(quán)重分配原則計算不同單元狀態(tài)的特征權(quán)重參數(shù)來表征滲壓效應(yīng)量與各個影響因子之間的相關(guān)關(guān)系,并通過softmax 函數(shù)得到和為1 的權(quán)重分布矩陣。
2.3 耦合ALO-LSTM 和特征注意力機制的土石壩滲壓預(yù)測模型建模流程本文所提模型的建模流程如圖2 所示,主要包括以下4 個步驟:
圖2 耦合ALO-LSTM 和特征注意力機制的土石壩滲壓預(yù)測模型建模流程
(1)將獲取的滲壓監(jiān)測數(shù)據(jù)和環(huán)境量監(jiān)測數(shù)據(jù)進行異常數(shù)值檢測、缺失值插補和歸一化處理;
(2)對輸入變量進行降維處理,并劃分訓(xùn)練集和測試集;
(3)通過LSTM 網(wǎng)絡(luò)構(gòu)建預(yù)測模型,其中輸入層和輸出層的神經(jīng)元數(shù)量使用ALO 優(yōu)化算法來自動尋優(yōu);
(4)通過特征注意力機制對輸入變量賦予不同的權(quán)重量化滲壓與影響因子的關(guān)聯(lián)關(guān)系,并將輸出向量進行反歸一化處理獲得滲壓最終預(yù)測結(jié)果。
本研究選用瀾滄江下游某礫石土心墻堆石壩工程的滲壓計監(jiān)測數(shù)據(jù)為研究對象,該工程壩頂高程821.5 m,建基面高程為560 m,具有防洪、發(fā)電等綜合效益。在本文中,選取滲壓計DB-C-P-01 處監(jiān)測點建立預(yù)測模型進行分析,建模序列選取2014年7月15日至2018年7月31日,取值頻率為天。
圖3 表示該處測點在該時間段中滲壓觀測值,以及對應(yīng)的上游水位、降雨量的歷時過程線。
圖3 滲壓觀測時間歷程
3.1 初始輸入變量選擇大壩滲壓水頭主要受上下游水位、溫度、降雨以及壩體材料的時變特性等影響。大壩滲壓效應(yīng)量表示如下:
式中δ、δH、δT、δp、δθ分別為滲壓效應(yīng)量、水位分量、溫度分量、降雨分量和時效分量。
(1)水庫水位變化對壩體滲流影響較大,并有一定的滯后效應(yīng),其中等效水位可按照平均水位的方法計算,以表示滲流的滯后效應(yīng)[2,33]。水位分量可表示如下:
式中:hu為當(dāng)天的上游水位,m;為前1 ~3 天上游水位均值,m;為前4 ~7 天上游水位均值,m;hd為當(dāng)天的下游水位,m。
(2)溫度分量是指基巖和大壩壩體的溫度變化從而引起的滲流變化。壩體和基巖的溫度隨大氣溫度呈周期性變化,一般采用周期函數(shù)表示。本文中選擇多周期諧波函數(shù)作為溫度的表征因子,如下式所示:
式中:i=1,2;t為從起始日到實測日的累計天數(shù),d。
(3)降雨分量也是影響大壩滲流的一個主要因素,其對滲壓水頭的影響機制較為復(fù)雜。一部分由降雨入滲直接影響;一部分降雨直接形成地表徑流匯入河道使庫水位升高從而影響滲壓的變化[34]。本文中采用主成分分析方法進行降維避免了降雨分量和水位分量之間的相互影響,所以這里的降雨分量主要集中在降雨入滲的影響上。降雨分量可由下式表示:
式中:p為當(dāng)天的降雨量, mm;為前1 ~3 天降雨量均值, mm;為前4 ~7 天降雨量均值, mm。
(4)時間分量是一個不可逆的分量,隨著時間的推移,它以不可逆的方向發(fā)展。主要反映了壩體材料蠕變、壩基巖石蠕變、巖體節(jié)理裂縫、軟弱結(jié)構(gòu)對滲壓的影響。一般情況下,時間分量的變化在開始時變化劇烈,在后期逐漸趨于穩(wěn)定。時效分量的一般變化規(guī)律可以用下式表示[2,35]:
式中θ為模型起始日至實測日的天數(shù)除以100。
綜上所述確定土石壩滲壓預(yù)測模型的初始影響變量為:
3.2 主成分降維PCA 通過空間變換將一組含有相關(guān)性的數(shù)據(jù)重構(gòu)成n個幾乎線性不相關(guān)的向量,可以解決大壩滲流預(yù)測中由于輸入向量維數(shù)過多而存在的多重共線性問題,進而提高模型的預(yù)測精度。對3.1 節(jié)提到的影響因子進行降維處理,得到如表1所示的方差累積貢獻率。方差累計貢獻率達到85%以上就可以認(rèn)為所得到的主成分可以解釋原始影響因子的大部分信息。
表1 方差累積貢獻率
經(jīng)PCA 計算得到表1的方差累積貢獻率,從表1可以看出前五個主成分的累積方差達到了87%,因此通過計算將原始數(shù)據(jù)為11 維的向量重構(gòu)成5 個主成分,即消除了多重共線性又大大降低了輸入向量的維度。表2為各主成分分量的得分系數(shù)矩陣。
表2 主成分分量得分系數(shù)表
3.3 ALO-LSTM 和特征注意力機制算法的土石壩滲壓預(yù)測
3.3.1 模型參數(shù)和預(yù)測性能指標(biāo)確定 首先LSTM 本身的參數(shù)有輸入層神經(jīng)元個數(shù)L1、輸出層神經(jīng)元個數(shù)L2、學(xué)習(xí)率ε、最大批數(shù)E、時間步長T,這些參數(shù)對模型的精度有重要的影響。其中ALO 算法對兩層的神經(jīng)元個數(shù)L1和L2進行自動參數(shù)尋優(yōu),其中ALO 算法種群規(guī)模設(shè)為50,最大迭代次數(shù)設(shè)為100,另外學(xué)習(xí)率設(shè)為0.01,時間步長設(shè)為6,最大批數(shù)設(shè)為32。
在本文中,引入平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對誤差(MAE)來反映模型的預(yù)測效果,以上三個指標(biāo)參數(shù)越小,表明模型的預(yù)測效果越好:
式中:n為樣本個數(shù);Ai為監(jiān)測值;Fi為預(yù)測值。
3.3.2 大壩滲壓預(yù)測結(jié)果和影響機制分析 運用本文模型對壩體滲壓計DB-C-P-01 處監(jiān)測點進行預(yù)測,模型擬定測試集為2017年9月18日至2018年7月31日,預(yù)測結(jié)果如圖4 所示。
從圖4 中可以看出,預(yù)測值與實測值的擬合程度較高,其R2達到了0.98 以上。進一步地,測試集的預(yù)測性能指標(biāo)MAPE、RMSE和MAE分別為0.28%、0.022 m、0.17 m。由此可見,本文所提模型的精度較高。
圖4 測點DB-C-P-01 實測值與預(yù)測值關(guān)系圖
通過特征注意力機制可以得到各個輸入向量即主成分分量的影響程度占比,結(jié)果如圖5 所示。
從圖5 可以看出,F(xiàn)1占比最大,為41.1%,F(xiàn)2占比最小,為6.31%。主成分分量是通過原始影響變量的線性變換得到的,所以可以通過主成分得分系數(shù)矩陣進行歸一化計算得到各個分量的貢獻率。各影響分量的權(quán)重如圖6 所示。
圖5 各主成分權(quán)重計算結(jié)果
從圖6 中可以看出,該測點的滲壓水位分量影響較大,占比達到47.9%,其次是降雨分量,占比達到33.5%。溫度分量和時效分量對壩體滲壓水位的影響程度較小,比重都在10%以下。
圖6 各個影響分量的權(quán)重
為驗證本文所提模型的優(yōu)越性,本文選擇BP 神經(jīng)網(wǎng)絡(luò)、LSTM 、LSTM-Attention 與本文所提模型進行對比分析。圖7 顯示了上述4 個模型在DB-C-P-01 測點的預(yù)測結(jié)果。從圖7 中可以看出,本文所提模型預(yù)測結(jié)果更接近滲壓實測值。相比于其他三種基于LSTM 的預(yù)測模型,BP 神經(jīng)網(wǎng)絡(luò)的擬合精度較差,說明LSTM 算法更能挖掘滲壓監(jiān)測數(shù)據(jù)的時序信息。LSTM 模型在2018年4月到7月期間的精度要劣于其他模型,這是由于LSTM 模型本身為深度學(xué)習(xí)模型需要大量數(shù)據(jù)支持,當(dāng)數(shù)據(jù)量過少時會出現(xiàn)模型過擬合的現(xiàn)象。LSTM-Attention 和本文模型的穩(wěn)定性較高,由此可以看出加入注意力機制可以加強對局部特征信息的挖掘。
圖7 4 種模型的預(yù)測結(jié)果對比
圖8 所示的是4 種模型的預(yù)測性能指標(biāo)統(tǒng)計結(jié)果。從圖8 可以看出,本文提出的模型具有更高的預(yù)測精度,RMSE、MAE、MAPE值分別為0.28%、0.022 m、0.17 m。相比于LSTM-Attention、LSTM和BP 三種模型,其RMSE分別提高62.67%、91.36%和93.32%;MAE分別提高64.52%、91.06%和94.57%;MAPE分別提高62.5%、91.05%和94.69%。
圖8 4 種模型的預(yù)測性能指標(biāo)
大壩滲壓預(yù)測對大壩安全管控具有重要意義。本文綜合考慮大壩滲壓效應(yīng)量存在的時序特性和多因子影響特性,構(gòu)建了耦合ALO-LSTM 和特征注意力機制的土石壩滲壓預(yù)測模型,得到了如下成果:
(1)針對目前輸入向量構(gòu)建復(fù)雜,且存在嚴(yán)重的多重共線性,采用PCA 算法對影響因子進行降維,將原始11 維輸入向量重構(gòu)成5 維向量,從而消除了原始輸入向量中存在的多重共線性。
(2)提出了耦合ALO-LSTM 和特征注意力機制的預(yù)測模型,通過ALO 算法對LSTM 的超參數(shù)進行優(yōu)化有效解決了人工調(diào)參困難的問題,并通過特征注意力機制計算各個主成分分量的權(quán)重,增強了模型對輸入向量的可解釋性。
(3)以西南某土石壩為案例研究,預(yù)測結(jié)果顯示滲壓測點的水位分量占比最大,降雨分量次之,符合工程實際。對比分析表明,本文所提模型相比于LSTM-Attention、LSTM、BP 神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測精度,其RMSE、MAE、MAPE值分別為0.28%、0.022 m 和0.17 m。