侯回位,鄭東健,劉永濤,黃寒冰
(河海大學(xué)水利水電學(xué)院,江蘇 南京 210098)
變形是壩體結(jié)構(gòu)受到多種環(huán)境荷載的作用以及自身材料性能的影響而不可避免發(fā)生的物理偏移,能夠最直接可靠地反映混凝土壩的工作性態(tài),是衡量壩體結(jié)構(gòu)安全的重要指標(biāo)[1-3]。因此,有必要根據(jù)混凝土壩變形監(jiān)測資料建立精準(zhǔn)、高效的預(yù)測模型,及時有效地掌握壩體結(jié)構(gòu)的變形狀態(tài),預(yù)測未來的變形趨勢,為工程長期預(yù)報和安全決策提供依據(jù)[4]。
常用于混凝土壩變形監(jiān)控的模型有統(tǒng)計模型、確定性模型和混合模型[5]等,其中統(tǒng)計模型[6]因其函數(shù)表達式簡單,模型結(jié)構(gòu)易識別的特點被廣泛地應(yīng)用于混凝土壩安全監(jiān)控領(lǐng)域中。然而,傳統(tǒng)的統(tǒng)計模型對復(fù)雜的非線性關(guān)系考慮不足,對多重共線性問題不敏感[7],其預(yù)測精度較差且缺乏相應(yīng)的外延預(yù)報能力。近年來,隨著人工智能算法的迅速發(fā)展,神經(jīng)網(wǎng)絡(luò)、支持向量機[8]等機器學(xué)習(xí)算法也被運用到混凝土壩的變形預(yù)報工作中。賈強強等[9]利用基于小生境技術(shù)改進的思維進化算法來加快BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值的搜索,以避免陷入局部最優(yōu);錢秋培等[10]將支持向量機和粒子群算法相結(jié)合,建立的預(yù)測模型能很好地考慮多種環(huán)境因素的非線性相關(guān),具有不錯的預(yù)測精度。這些機器學(xué)習(xí)算法雖然在提升模型預(yù)測精度上有所提高,但由于混凝土壩變形的時間序列非平穩(wěn)、非線性特點,也存在著不足,首先BP、SVM模型均屬于靜態(tài)的前饋非循環(huán)模型,對隨時間動態(tài)變化的混凝土壩變形監(jiān)測序列預(yù)測的能力有所欠缺,未能考慮時序信息在時間維度上的關(guān)聯(lián)性,而長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[11-13]是一種深度神經(jīng)網(wǎng)絡(luò)模型,能夠平衡數(shù)據(jù)的時序性與非線性關(guān)系,考慮時序信息重要程度的變化,適合對動態(tài)非線性的時間序列進行擬合預(yù)測;其次混凝土壩變形序列的非平穩(wěn)性對于模型的構(gòu)建及其泛化能力的強弱有著較大影響,上述模型均未把變形序列的非平穩(wěn)性納入考慮,而EEMD作為一種非平穩(wěn)數(shù)據(jù)處理方法[14],能夠根據(jù)其本身的特性,將其分解成多個平穩(wěn)的數(shù)據(jù)序列。
基于此,本文利用EEMD來把非平穩(wěn)的混凝土壩變形序列分解為多個平穩(wěn)的子序列,同時考慮到各子序列之間的相關(guān)性,采用樣本熵理論[15-17]對各子序列進行重構(gòu)處理,并選用基于記憶架構(gòu)的LSTM來保證模型的預(yù)測能力,構(gòu)建一種EEMD-SE-LSTM組合模型應(yīng)用于混凝土壩的變形預(yù)報中,并以某混凝土拱壩實測數(shù)據(jù)進行算例分析。
經(jīng)驗?zāi)B(tài)分解(EMD)是一種自適應(yīng)信號時頻處理方法,特別適合非平穩(wěn)信號的分析處理。EMD可以將原始信號分解成一系列本征模態(tài)分量IMF,但得到的IMF分量通常會出現(xiàn)尺度混合現(xiàn)象,這會造成IMF分量的不精確,而集成經(jīng)驗?zāi)B(tài)分解(EEMD)通過往原始信號加入白噪聲很好地避開了EMD分解時的尺度混合問題[18],由于零均值噪聲的特性,噪聲經(jīng)過多次的平均計算后會相互抵消,這樣集成均值的計算結(jié)果就可以直接視作最終結(jié)果,其基本原理如下。
a.將N個等長白噪聲信號wi(t)加入原始信號X(t),即
Xi(t)=X(t)+wi(t)
(1)
b.對新信號Xi(t)進行EMD分解,得到各階IMF分量:
(2)
c.利用白噪聲頻譜均值為零的特點,將上述各分量求均值得到最終的分解結(jié)果如下:
(3)
(4)
式中:Xi(t)為第i次加入白噪聲后的信號;wi(t)為第i次加入的白噪聲;Cij(t)為第i次加入白噪聲后分解出的第j個IMF分量;Ri(t)為第i次加入白噪聲后分解得到的殘余分量;m為每次分解得到的IMF分量個數(shù);Cj(t)為集成平均后的第j個IMF分量;R(t)為最終殘余分量。
將原始變形序列經(jīng)EEMD分解成若干個IMF分量后,為了能減小模型的計算量,考慮各IMF分量間的相關(guān)性,挖掘出同類序列的特征,引入樣本熵的概念,對這些IMF分量采用樣本熵估值后重構(gòu)。樣本熵作為一種時間序列復(fù)雜性的度量方法,其目的是檢測時間序列中新的子序列產(chǎn)生概率。現(xiàn)假設(shè)一長度為L的時間序列x={x1,x2,…,xL},按序號組成一組維數(shù)為m的向量序列{Xm,1,Xm,2,…,Xm,L-m+1},其中Xm,i={xi,xi+1,…,xi+m-1},這些向量表示從第i點開始的m個連續(xù)的x的值;定義向量Xm,i與Xm,j之間的距離d[Xm,i,Xm,j]為兩者對應(yīng)元素中最大差值的絕對值;對于給定的Xm,i,統(tǒng)計Xm,i與Xm,j之間距離小于或等于容限r(nóng)的j(1≤j≤L-m,j≠i)的數(shù)目,并記作Bi。對于1≤i≤L-m,定義
(5)
(6)
再把維數(shù)增加到m+1,重復(fù)上面的步驟得到:
(7)
式中Ai為向量Xi與Xj在m+1維時滿足容限要求的總個數(shù)。
同理,定義兩序列在匹配m+1個點的概率Am(r)的計算式:
(8)
因此,樣本熵定義如下:
(9)
當(dāng)L為有限值時,用下式來估計:
(10)
式中:m為維數(shù),常取值為1或2;r表示相似度閾值,通常取原始序列的10%~25%的標(biāo)準(zhǔn)差。本文選取的維數(shù)是m=2,以原始序列標(biāo)準(zhǔn)差的20%作為容限r(nóng)的取值。
對經(jīng)樣本熵重構(gòu)后的分量建立LSTM模型,充分考慮歷史有效信息的影響,以提高變形預(yù)測的精度。
LSTM模型是一種特殊的遞歸循環(huán)神經(jīng)網(wǎng)絡(luò)模型,通過引入“門”的機制,采用記憶單元來代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)隱含層的神經(jīng)單元,用于解決梯度消失或爆炸問題,從而使得網(wǎng)絡(luò)可以學(xué)習(xí)長期依賴信息。其記憶單元結(jié)構(gòu)如圖1所示,核心思想是引入細胞狀態(tài)的連接,然后使用遺忘門、輸入門和輸出門等結(jié)構(gòu)來控制細胞狀態(tài),實現(xiàn)信息的添加或刪除。
圖1 LSTM記憶單元結(jié)構(gòu)
遺忘門的作用是控制細胞狀態(tài)中信息的取舍:
ft=σ(Wfxt+Ufht-1+bf)
(11)
輸入門的作用是更新細胞狀態(tài)中的信息:
it=σ(Wixt+Uiht-1+bi)
(12)
(13)
輸出門控制著哪些信息需要輸出:
ot=σ(Woxt+Uoht-1+bo)
(14)
(15)
ht=ottanhCt
(16)
式中:ft、it、ot分別為遺忘門、輸入門與輸出門;Wf、Uf為遺忘門的權(quán)重系數(shù);Wi、Wc、Ui、Uc為輸入門的權(quán)重系數(shù);Wo、Uo為輸出門的權(quán)重系數(shù);bf為遺忘門的偏置系數(shù);bi、bc為輸入門的偏置系數(shù);bo為輸出門的偏置系數(shù);Ct、ht分別為t時刻細胞狀態(tài)和隱藏單元狀態(tài),σ為sigmoid激活函數(shù),取值范圍為[0,1];tanh為雙曲正切激活函數(shù),取值范圍為[-1,1]。
結(jié)合各方法的優(yōu)勢,構(gòu)建EEMD-SE-LSTM混凝土壩變形預(yù)測模型,從更加全面的角度來提高混凝土壩的變形預(yù)測精度,其流程如下:
步驟1利用EEMD把混凝土壩的原始變形序列X(t)分解為多個平穩(wěn)的子序列。
X(t)=X1(t)+X2(t)+…+Xk(t)+R(t)
(17)
式中k為分解出的子序列個數(shù)。
步驟2計算各子序列、余量R以及原始序列X(t)的樣本熵,當(dāng)分量樣本熵大于原始序列樣本熵時,對其不作處理,當(dāng)分量小于原始序列樣本熵時,對其進行合并,得到重構(gòu)后的分量。
X(t)=C1(t)+C2(t)+…+Cp(t)
(18)
步驟3確定各重構(gòu)分量的時間階數(shù),即用當(dāng)前時刻前多少期的歷史數(shù)據(jù)來作為網(wǎng)絡(luò)模型的輸入來進行訓(xùn)練與預(yù)測。
(19)
式中p為重構(gòu)后的子序列個數(shù)。
選取均方根誤差(RMSE)和平均絕對誤差(MAE)作為模型預(yù)測效果的評判標(biāo)準(zhǔn)。
以某混凝土拱壩為例,由于該壩岸坡壩段基礎(chǔ)周圍的地質(zhì)條件比較差,有必要對該處測點進行監(jiān)控以分析對壩體變形的影響,故選取岸坡壩段某正垂測點的壩體變形監(jiān)測資料作為樣本來進行建模分析,分析時段取為2013年5月1日至2019年4月30日。原始數(shù)據(jù)采樣的間距為1 d,但由于實際觀測過程中會存在一些數(shù)據(jù)的缺失,無法形成連續(xù)的逐日序列,現(xiàn)將取樣的時間分辨率調(diào)整為5 d。對每個5 d的數(shù)據(jù)取平均值,第一個5 d為2013年5月1—6日,依次往下,構(gòu)成序列。
針對原始數(shù)據(jù)的非平穩(wěn)特性,用EEMD對數(shù)據(jù)進行特征分解,分解時加入白噪聲組數(shù)為300組,噪聲誤差為0.2,分解結(jié)果如圖2所示??梢钥闯觯夹蛄斜环纸獬闪?個本征模態(tài)分量和1個殘余分量,各個尺度的特征被很好地從原始序列中分解出來。
圖2 EEMD分解出的分量
計算各分量以及原始序列的樣本熵值,依照樣本熵值對各分量進行重構(gòu),各序列樣本熵值得到X1~X7樣本熵值分別為1.790、0.976、0.566、0.304、0.065、0.035和0.031,原始序列樣本熵值為0.268。前4個分量的熵值均大于原始序列的熵值,所以不對其進行合并;后4個分量的熵值小于原始序列熵值且復(fù)雜度差異也很小,對其進行重構(gòu)合并,重構(gòu)后的分量見圖3。
圖3 樣本熵重構(gòu)后的分量
時間階數(shù)的選擇會直接影響到模型的預(yù)測結(jié)果,當(dāng)其過大時,會增加計算量,過小又會導(dǎo)致信息重合。基于此,利用相關(guān)研究成果[19-23],分析各分量序列的相關(guān)性,計算其自相關(guān)系數(shù),當(dāng)相關(guān)系數(shù)大于0.8時,認為具有較強的關(guān)聯(lián),再根據(jù)具有強相關(guān)性時的滯后期數(shù)來確定時間階數(shù)。經(jīng)計算,時間階數(shù)確定為2。
對每個重構(gòu)分量建立LSTM預(yù)測模型,由于時間階數(shù)確定為2,因此以第1、2組的歷史變形量作為輸入,來預(yù)測第3組的變形,然后以第2、3組的變形來預(yù)測第4組的變形,依次對后續(xù)變形值進行預(yù)測。
為驗證EEMD-SE-LSTM模型在混凝土壩變形預(yù)測中的有效性和優(yōu)越性,將其預(yù)測效果與EMD-LSTM、LSTM、SVM等模型進行對比。
a.通過改變訓(xùn)練集的長度來分析各模型對時間序列的整體感知力,模型的預(yù)測結(jié)果見表1。隨著訓(xùn)練集長度的增加,EEMD-SE-LSTM與LSTM模型的預(yù)測精度越來越高,這說明模型具有良好的時間序列感知力,能夠從較長的訓(xùn)練集中提取更多的有效信息以提高預(yù)測精度,但LSTM模型有滯后效應(yīng),導(dǎo)致預(yù)測誤差都比較大。而EMD-LSTM與SVM模型的預(yù)測精度在訓(xùn)練集長度占比小于80%時都有一定程度的提高,但在長度占比達90%時,精度卻有所下降,說明兩模型的時間序列感知力存在局限性。在同一訓(xùn)練集長度下,EEMD-SE-LSTM模型的預(yù)測精度最高,驗證了其在混凝土壩變形預(yù)測中的優(yōu)越性。
b.為更直觀體現(xiàn)模型的預(yù)測效果,以訓(xùn)練集長度占比為70%的情況為例進行分析。從圖4看出,SVM模型的預(yù)測效果較差,可能是SVM模型不能很好地挖掘時序在時間維度上的關(guān)聯(lián)性;LSTM模型的預(yù)測出現(xiàn)滯后現(xiàn)象,雖然擬合曲線貼近實測曲線,但可信度較低;EMD使得LSTM的滯后效應(yīng)減弱,但其分解時尺度混合的影響降低了模型的預(yù)測精度;EEMD作為EMD的改進,降低了尺度混合對分解的影響,提高了模型的預(yù)測精度。
圖4 各模型預(yù)測結(jié)果
圖5是各模型預(yù)測殘差對比,可以看出EEMD-SE-LSTM模型的預(yù)測殘差相較于其他模型基本在±0.5 mm范圍波動,這表明EEMD-SE-LSTM模型預(yù)測的精確性和平穩(wěn)性都更高。由表2可知,EEMD-SE-LSTM模型的RMSE與MAE相較于其他模型都有顯著地減小,其中RMSE分別降低了15.87%、44.79%與55.08%,MAE分別降低了11.32%、40.51%與54.81%,這表明EEMD-SE-LSTM模型很
圖5 各模型預(yù)測殘差對比
模型RMSE/mmMAE/mmEEMD-SE-LSTM0.530.47EMD-LSTM0.630.53LSTM0.960.79SVM1.181.04
好地提高了變形預(yù)測的精度。
a.通過橫向比較,EEMD-SE-LSTM模型能夠更好地擬合混凝土壩變形監(jiān)測序列,充分考慮變形序列在時間上的關(guān)聯(lián)性,預(yù)測精度高,魯棒性強。
b.通過縱向比較,EEMD-SE-LSTM模型有效地減弱了LSTM模型的滯后效應(yīng),這使得模型的預(yù)測具有更高的可信度及可靠性,同時EMD分解時的尺度混合問題也得到了解決,明顯地提高了預(yù)測精度,從而在大壩管理上的應(yīng)用及可操作性更強。
c.通過不同訓(xùn)練集長度下模型預(yù)測效果的比較,EEMD-SE-LSTM模型能從更長的訓(xùn)練集中提取更多的有效信息以達到更好的預(yù)測效果,具備不錯的時序感知能力。
d.由于變形受多種因素共同作用,單一考慮歷史效應(yīng)量的影響有所欠缺,在后續(xù)研究中,還需考慮水位、溫度等其他環(huán)境量的影響。