胡德秀,屈旭東,楊 杰,程 琳,常 夢
(1.西安理工大學(xué) 水利水電學(xué)院,陜西 西安 710048; 2.中國水電建設(shè)集團十五工程局有限公司,陜西 西安 710016)
水利工程在其服役過程中不僅要承受各種動、靜循環(huán)荷載及各種突發(fā)性災(zāi)害的作用,還要承受來自惡劣環(huán)境的侵蝕與腐蝕,導(dǎo)致結(jié)構(gòu)服役期間局部和整體安全性能隨著時間推移而逐步衰退,因此及時準確地了解各水工建筑物的工作性態(tài)以確保其安全極為重要[1]。依據(jù)水利工程原型監(jiān)測資料,應(yīng)用統(tǒng)計數(shù)學(xué)、工程力學(xué)、信息科學(xué)等方法建立安全監(jiān)控模型對影響水利工程的各因素(特別是時效分量)進行物理解釋,定量分析評價和饋控水利工程的安全狀況,揭示建筑物的異常服役性態(tài),是保障工程安全的重要手段[2]。
目前,具有代表性的大壩變形安全監(jiān)測資料分析模型主要有4種:統(tǒng)計模型、確定性模型、混合模型及組合模型,其中統(tǒng)計模型和確定性模型為技術(shù)支撐主體[3]。
統(tǒng)計模型[4-7]是指以概率論和數(shù)理統(tǒng)計理論為技術(shù)支撐對監(jiān)測數(shù)據(jù)進行建模分析,建立荷載集與荷載效應(yīng)集之間的關(guān)系的表達式。其中最常用的是靜水壓力分量-溫度周期分量-時間分量(hydrostatic-seasonal-time,HST)方法,但其只考慮了靜水荷載的可逆效應(yīng)、溫度周期荷載的可逆效應(yīng)和時效不可逆效應(yīng)。統(tǒng)計模型的缺點主要表現(xiàn)在:①對大壩的工作性態(tài)不能從力學(xué)概念上加以本質(zhì)解釋;②統(tǒng)計模型基于各變量相互獨立的假設(shè)條件,未考慮因子之間的相關(guān)性,可能會導(dǎo)致分離變量失真;③模型不能反映變量之間的非線性關(guān)系。
確定性模型[8-11]采用有限元法計算荷載(如水壓、溫度等)作用下大壩和壩基的效應(yīng)場(如位移、應(yīng)力場、滲流場等),然后與實測值進行優(yōu)化擬合,以求得調(diào)整參數(shù)(因為大壩與壩基的平均物理力學(xué)參數(shù)、滲流參數(shù)及邊界條件等的不確定性),從而建立基于物理力學(xué)本質(zhì)的表達式。確定性模型的缺點主要表現(xiàn)在:①大壩及壩基材料參數(shù)的不確定性;②邊界條件設(shè)置的不確切性;③模型簡化的不精確性。
混合模型[12-14]采用有限元法計算水壓分量,其他分量采用統(tǒng)計模型,然后與實測值進行優(yōu)化擬合。混合模型雖然從力學(xué)概念出發(fā),提高了模型計算精度,但同時也繼承了統(tǒng)計模型和確定性模型的固有缺陷和假設(shè)。
組合模型[15-16]通過整合各子模型的應(yīng)用條件、構(gòu)模機理和出發(fā)點等多種有用信息,將多個單一模型進行非線性優(yōu)化組合,達到對映射關(guān)系更加合理和全面的刻畫,有效地提高擬合和預(yù)測精度,建立性能更佳的監(jiān)控模型。組合模型的缺點主要表現(xiàn)在:①線性組合模型應(yīng)對非線性問題時有可能得到不符合實際的負權(quán)重;②組合函數(shù)構(gòu)造十分困難。
近年來,隨著大壩安全監(jiān)控、計算機、大數(shù)據(jù)、人工智能等理論與技術(shù)的發(fā)展,越來越多的數(shù)據(jù)挖掘方法被應(yīng)用到水利工程安全監(jiān)控建模中來,涌現(xiàn)出了許多智能算法監(jiān)控模型[17-20],在解決監(jiān)控模型因子不確定性和非線性問題、預(yù)測精度及泛化性等方面表現(xiàn)出了特有的優(yōu)勢。
針對以往監(jiān)控模型預(yù)測精度低、魯棒性差及泛化能力弱的不足,鑒于智能算法優(yōu)越的數(shù)據(jù)處理能力,本文引入機器學(xué)習淺層結(jié)構(gòu)算法中的極限學(xué)習機(extreme learning machine,ELM)方法以解決大壩變形監(jiān)測數(shù)據(jù)存在的因子不確定性和非線性問題。同時,針對傳統(tǒng)監(jiān)控模型抗粗差能力差等問題,引入穩(wěn)健估計理論,建立了基于穩(wěn)健估計極限學(xué)習機(M-ELM)的大壩變形安全監(jiān)控模型,強化了模型的魯棒性,提高了模型的預(yù)測精度及泛化性,更加接近真實地反映大壩的工作性態(tài)。
ELM是一種新型單隱含層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習算法[21]。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習算法(如BP算法)需要人為設(shè)置大量網(wǎng)絡(luò)訓(xùn)練參數(shù)(權(quán)值、偏置及學(xué)習率等指標),并且很容易產(chǎn)生迭代次數(shù)過多、學(xué)習時間長及局部最優(yōu)解等問題。相對于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習算法,ELM在算法執(zhí)行過程中不需要調(diào)整網(wǎng)絡(luò)的輸入權(quán)值和偏置,只需要進行隱含層節(jié)點數(shù)的設(shè)置,并且產(chǎn)生唯一的最優(yōu)解,在保證網(wǎng)絡(luò)具有良好泛化性的同時,極大地提高了學(xué)習速度,廣泛地被用于各種數(shù)據(jù)處理中[22-23]。圖1為ELM網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)
為了在因子比較和評價的指標處理中去除數(shù)據(jù)的量綱限制,將數(shù)據(jù)進行標準化(無量綱化)處理,以便于不同單位或量級的指標能夠進行比較和加權(quán)。對于n個經(jīng)標準化處理的數(shù)據(jù)樣本(xi,yi),其中xi=(xi1,xi1,…,xip)T為自變量樣本,yi=(yi1,yi1,…,yik)T為因變量樣本,對采用l個隱含層節(jié)點的單隱含層神經(jīng)網(wǎng)絡(luò),設(shè)權(quán)值為ωi,偏置為bi,其描述可以表示為以下方程組形式:
Hp×lβl×k=yp×k
(1)
傳統(tǒng)極限學(xué)習機隱含層節(jié)點輸出權(quán)重采用最小二乘法進行計算,構(gòu)建的損失函數(shù)為
(2)
(3)
式中:Η+為Η的Moore-Penrose廣義逆。
傳統(tǒng)的ELM算法的輸出權(quán)重的計算采用經(jīng)典的最小二乘法,當網(wǎng)絡(luò)隱含層輸出數(shù)據(jù)誤差服從正態(tài)分布情況時,最小二乘估計具有最優(yōu)統(tǒng)計性質(zhì),但實際情況往往不是這樣,其對于粗差的抵抗性特別差,當輸出數(shù)據(jù)存在多重共線性或粗差時就會對參數(shù)的估值產(chǎn)生較大的影響,計算結(jié)果也會產(chǎn)生嚴重的偏差,甚至得出錯誤的結(jié)論,嚴重影響網(wǎng)絡(luò)訓(xùn)練的精度。同時,隱含層參數(shù)的選取均采用隨機生成的方法,致使每一次訓(xùn)練和測試結(jié)果存在一定的隨機性,對于網(wǎng)絡(luò)的穩(wěn)定性產(chǎn)生不利的影響。因此從網(wǎng)絡(luò)學(xué)習的精度和穩(wěn)健性方面考慮,ELM算法仍有兩個需要解決的固有缺陷:隱含層參數(shù)的隨機選取會造成ELM網(wǎng)絡(luò)訓(xùn)練結(jié)果有較大的不穩(wěn)定性;如果訓(xùn)練數(shù)據(jù)存在共線性或粗差干擾,輸出層權(quán)值的最小二乘法估計結(jié)果會很差[25]。
水利樞紐工程中往往建有各類型的大壩、溢洪道、隧洞等建筑物,建筑物的安全是其擋水、泄水、放水等功能發(fā)揮的關(guān)鍵。為此,通過監(jiān)測各種水工建筑物變形、滲流、應(yīng)力等安全項目,實時監(jiān)測工程安全。如何利用實測數(shù)據(jù)進行建模擬合預(yù)測分析是實現(xiàn)水利工程安全監(jiān)控的核心基礎(chǔ)。
(4)
式中:ρ為影響函數(shù);N為樣本總數(shù)。當損失函數(shù)Q′取最小值時可得出隱含層權(quán)值的最優(yōu)解。
(5)
則可以將式(4)轉(zhuǎn)化為
(6)
(7)
(8)
法方程矩陣表達式為
XTWXβ=XTWy
(9)
故穩(wěn)健估計極限學(xué)習機的計算結(jié)果為
(10)
M-ELM大壩變形安全監(jiān)控模型建模流程見圖2,建模步驟具體如下:
a. 選取實測監(jiān)測資料作為模型訓(xùn)練樣本和測試樣本,將所有數(shù)據(jù)進行標準化,并將標準化樣本數(shù)據(jù)輸入到監(jiān)控模型。
b. 通過試驗確定隱含層節(jié)點個數(shù),并隨機選取網(wǎng)絡(luò)參數(shù)wi、bi,選擇某一無限可微函數(shù)(如S形函數(shù)、正弦函數(shù)和復(fù)合函數(shù)等)作為隱含層神經(jīng)元激活函數(shù),計算隱含層節(jié)點輸出矩陣H。
c. 根據(jù)計算的隱含層節(jié)點輸出矩陣H,利用穩(wěn)健估計理論計算隱含層節(jié)點輸出權(quán)重βi,并進行輸出節(jié)點值的計算,即為監(jiān)控模型的擬合值,同時進行訓(xùn)練樣本均方差的計算,即為訓(xùn)練誤差。
d. 根據(jù)訓(xùn)練樣本訓(xùn)練出的隱含層節(jié)點輸出權(quán)重進行測試樣本的預(yù)測值計算,即為監(jiān)控模型的預(yù)測值,同時計算出預(yù)測值與測試樣本之間的均方差,即為測試誤差或預(yù)測誤差。
圖2 M-ELM大壩變形安全監(jiān)控模型建模流程
以某水利樞紐工程監(jiān)測數(shù)據(jù)為例進行M-ELM大壩變形安全監(jiān)控模型的應(yīng)用研究。該工程大壩為壤土心墻土石壩,最大壩高101.8 m,壩頂長度297.36 m。大壩采用5個縱斷面共30個測點監(jiān)測大壩的水平位移。選取該大壩高程為691 m的馬道旁D7測點2010年1月至2014年5月共178個樣本的監(jiān)測資料,主要包括該測點水平位移(向左岸為正,向右岸為負)、水庫大壩上下游水位及壩址區(qū)溫度等。
由于土石壩工作性態(tài)異常復(fù)雜,影響其變形的因素有壩型、剖面尺寸、筑壩材料、施工程序及質(zhì)量、壩基的地形、水庫水位的變化情況等。因此本文在土石壩變形監(jiān)測量的統(tǒng)計模型選擇中,選取水位因子、溫度因子及時效因子作為模型主要影響因素,構(gòu)建如下土石壩水平位移的統(tǒng)計模型:
(11)
式中:b0為常數(shù)項;a1i、a2i分別為上、下游因子回歸系數(shù);b1、b1i、b2i為溫度因子回歸系數(shù);c1、c2為時效因子回歸系數(shù);Hu為上游水位,mm;Hd為下游水位,mm;Hu0、Hd0分別為始測日所對應(yīng)的上、下游水位,mm;T為氣溫,℃;t為始測日至監(jiān)測日的累計時間,d;θ為相對于始測日的累計時間除以100。
為驗證M-ELM大壩變形安全監(jiān)控模型在解決大壩變形監(jiān)測數(shù)據(jù)的因子不確定性、非線性及抗粗差性等方面的優(yōu)越性,以該水利工程大壩變形原型監(jiān)測資料為基礎(chǔ),分別進行傳統(tǒng)最小二乘法OLS(ordinary least squares)、人工神經(jīng)網(wǎng)絡(luò)ANN(artificial neural network)及穩(wěn)健估計極限學(xué)習機M-ELM監(jiān)控模型的建立和擬合預(yù)測對比分析。
3.2.1OLS、ANN監(jiān)控模型和分析結(jié)果
采用傳統(tǒng)最小二乘法和人工神經(jīng)網(wǎng)絡(luò)方法進行回歸計算所得出的模型擬合及殘差效果示例見圖3和圖4。從圖3和圖4可以看出,OLS、ANN監(jiān)控模型在處理含有異常值的原始數(shù)據(jù)時,在異常值附近,擬合曲線雖然具有較好的擬合效果,但基本包含了全部異常值的影響,致使擬合曲線發(fā)生跳躍,出現(xiàn)追逐異常值的現(xiàn)象。同時,ANN監(jiān)控模型在圖中表現(xiàn)出了其固有的過擬合缺陷,因此兩種模型的抗粗差能力弱的弊端致使建立的大壩變形監(jiān)控模型難以進行實際應(yīng)用,極大地降低模型預(yù)測能力甚至得出錯誤的結(jié)果。
圖3 OLS監(jiān)控模型擬合及殘差效果
圖4 ANN監(jiān)控模型擬合及殘差效果
3.2.2M-ELM監(jiān)控模型分析結(jié)果
采用M-ELM算法建立大壩變形監(jiān)控模型時,根據(jù)訓(xùn)練結(jié)果的均方差進行網(wǎng)絡(luò)隱含層節(jié)點數(shù)的選取,以確保網(wǎng)絡(luò)訓(xùn)練結(jié)果的誤差最小,并得到最優(yōu)的網(wǎng)絡(luò)參數(shù)。模型訓(xùn)練過程中擬合值與實測值均方差與隱含層節(jié)點數(shù)的關(guān)系見圖5,當隱含層節(jié)點數(shù)取15時,訓(xùn)練結(jié)果的均方差達到最小值0.370 9,因此在本次訓(xùn)練中選取隱含層節(jié)點數(shù)為15。同樣以D7監(jiān)測點為例,M-ELM大壩變形監(jiān)控模型分析結(jié)果見圖6。從圖6可以得出:①M-ELM模型很好的抵抗了異常點對模型計算參數(shù)的影響,在異常點處不會產(chǎn)生追逐現(xiàn)象,并且具有很好的擬合效果;②擬合殘差在異常值處表現(xiàn)出了明顯的波動現(xiàn)象,具有良好的異常值識別能力。綜合以上兩點可以得出,采用M-ELM算法建立的安全監(jiān)控模型不僅具有較高的擬合精度,同時也具有極強的粗差抵抗能力。
圖5 模型訓(xùn)練誤差與隱含層節(jié)點數(shù)的關(guān)系
圖6 M-ELM監(jiān)控模型擬合及殘差效果
3.2.3模型性能對比分析
選取該大壩相同測點2014年6月1號至2014年12月11號之間共20個樣本作為兩種模型的測試樣本,以反映模型預(yù)測精度的均方誤差MSE和平均絕對百分誤差MAPE及反映模型魯棒性的中位數(shù)絕對偏差MAD進行模型預(yù)測效果評價:
(12)
(13)
(14)
3種大壩變形監(jiān)控模型預(yù)測結(jié)果對比如表1和圖7所示(圖表中將2014年7月11日異常值22.378 mm修正為21.072 mm,預(yù)測值指標計算采用修正值)。
表1 OLS、ANN、M-ELM監(jiān)控模型預(yù)測效果對比
圖7 3種模型預(yù)測值與實測值對比
從表1及圖7可知,M-ELM監(jiān)控模型預(yù)測的均方誤差為0.145 57、中位數(shù)絕對偏差為0.161 42、平均絕對百分誤差為1.368 33,模型精度明顯優(yōu)于OLS和ANN監(jiān)控模型;在異常監(jiān)測值處M-ELM監(jiān)控模型預(yù)測結(jié)果表現(xiàn)出了明顯的魯棒性和泛化性,對于監(jiān)測數(shù)據(jù)中的粗差具有很強的抗干擾能力,預(yù)測值具有良好的實際參考價值,而OLS和ANN監(jiān)控模型卻表現(xiàn)出了明顯的波動現(xiàn)象。
a. 針對水利工程監(jiān)測數(shù)據(jù)存在的非線性、多重共線性及傳統(tǒng)最小二乘法抗粗差能力差等問題,將穩(wěn)健估計理論引入極限學(xué)習機模型中,建立的基于穩(wěn)健估計極限學(xué)習機的大壩變形監(jiān)控模型避免了過學(xué)習現(xiàn)象,具有較高的擬合和預(yù)測精度,并且同時兼有強魯棒性和泛化性,其在監(jiān)測數(shù)據(jù)擬合預(yù)報分析方面具有良好的實用價值。
b. 基于穩(wěn)健估計極限學(xué)習機的大壩變形安全監(jiān)控模型仍舊屬于靜態(tài)預(yù)報模型,而且屬于智能算法中的淺層結(jié)構(gòu),在挖掘信息的內(nèi)部特征來反映結(jié)構(gòu)的真實性態(tài)方面還存在一定的缺陷。
c. 隨著特大型水利工程建設(shè)的發(fā)展,將在線動態(tài)學(xué)習與之結(jié)合,建立大壩安全實時監(jiān)測系統(tǒng),實現(xiàn)監(jiān)測自動化是水利工程安全監(jiān)控的發(fā)展趨勢,這些對于監(jiān)測數(shù)據(jù)處理的時效性和準確性提出了更高的要求,因此仍需進一步深度挖掘水利工程安全監(jiān)測數(shù)據(jù)中的內(nèi)部特征,了解其真實的運行性態(tài)。