許澤坤,陳 雋
(同濟(jì)大學(xué)土木工程學(xué)院,上海 200092)
一方面,過(guò)去幾十年內(nèi)發(fā)生的一系列地震災(zāi)害表明,有必要對(duì)建筑進(jìn)行基于性能的抗震設(shè)計(jì),以更好地滿足不同的抗震需求[1]。為此,需要進(jìn)行不同等級(jí)的建筑物彈塑性地震響應(yīng)時(shí)程分析[2]。然而,由于其高昂的計(jì)算成本,很難快速完成大量不同地震動(dòng)作用下單體建筑的非線性地震響應(yīng)分析。在基于蒙特卡洛模擬[3]或增量動(dòng)力分析[4]的結(jié)構(gòu)性能評(píng)估中,這一矛盾尤其突出。
另一方面,隨著城市系統(tǒng)安全概念的普及,防災(zāi)減災(zāi)研究正由建筑單體擴(kuò)展至城市建筑群,城市區(qū)域抗震分析越來(lái)越受到關(guān)注。如何快速預(yù)測(cè)城市建筑群的地震響應(yīng)成為首要技術(shù)難題[5 ? 6],當(dāng)前的城市震災(zāi)模擬依然以簡(jiǎn)化模型與靜力分析為主[7],尚難實(shí)現(xiàn)可比擬單體結(jié)構(gòu)的高精度實(shí)時(shí)計(jì)算。采用超級(jí)計(jì)算機(jī)是一種可能的解決方案[8 ? 10],但其普及性現(xiàn)階段仍受限于計(jì)算資源的開(kāi)放程度。因此,發(fā)展適用于邊緣計(jì)算場(chǎng)景的結(jié)構(gòu)非線性地震響應(yīng)新型計(jì)算方法是值得深入研究的問(wèn)題。
隨著硬件性能的快速提升與深度學(xué)習(xí)技術(shù)的普及,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)為結(jié)構(gòu)非線性地震響應(yīng)計(jì)算問(wèn)題帶來(lái)了全新的可能。例如,ANN作為方程的隱式表達(dá),通過(guò)發(fā)展通用的函數(shù)逼近方法,可實(shí)現(xiàn)不同非線性微分方程的求解[11 ? 12]。目前,通常采用具有少量隱層的多層感知器(multilayer perceptron, MLP),比較適用于具有簡(jiǎn)單約束的低維非線性求解[13]。對(duì)于具有物理背景、工程約束的求解問(wèn)題,已有研究使用長(zhǎng)短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)來(lái)解決Navier–Stokes方程以及高維數(shù)據(jù)中的流體模擬[14 ? 16]。其他相關(guān)工作包括通過(guò)強(qiáng)化學(xué)習(xí)降低量子多體問(wèn)題的復(fù)雜性[17];構(gòu)造特定損失函數(shù)的全連接神經(jīng)網(wǎng)絡(luò)也被用于求解波動(dòng)方程問(wèn)題[18]等。
以上工作表明了ANN求解微分方程的可行性,但用于地震作用下的結(jié)構(gòu)動(dòng)力方程求解依然存在相當(dāng)?shù)奶魬?zhàn)。一方面,結(jié)構(gòu)的恢復(fù)力特性使其在往復(fù)荷載下表現(xiàn)出復(fù)雜的非線性行為,簡(jiǎn)單架構(gòu)的MLP難以捕捉到準(zhǔn)確的滯回特征。另一方面,建筑結(jié)構(gòu)作為復(fù)雜多自由度系統(tǒng)具有大量物理參數(shù),很難建立完整的神經(jīng)網(wǎng)絡(luò)映射模型以逼近其精確解。因此,結(jié)合分析目標(biāo)先固定部分物理參數(shù)(如層數(shù)、層高、恢復(fù)力特性等),轉(zhuǎn)而尋求結(jié)構(gòu)響應(yīng)的ANN近似解是一種更加經(jīng)濟(jì)的做法。沿著這一思路,Lagaros等[19]設(shè)計(jì)了傳統(tǒng)非線性分析與MLP相結(jié)合的時(shí)程預(yù)測(cè)方案,由于使用人工地震波進(jìn)行訓(xùn)練,最終的預(yù)測(cè)效果不甚理想。Kim等[20]借助CNN提取滯回特征,建立了從激勵(lì)與滯回曲線到結(jié)構(gòu)峰值響應(yīng)預(yù)測(cè)的復(fù)合神經(jīng)網(wǎng)絡(luò)模型,模型基于單自由度體系建立,需要大量數(shù)值計(jì)算結(jié)果作為訓(xùn)練集,目前尚未應(yīng)用于復(fù)雜結(jié)構(gòu)。Zhang等[21 ? 22]先后使用LSTM網(wǎng)絡(luò)與CNN建立了結(jié)構(gòu)地震響應(yīng)時(shí)程的預(yù)測(cè)模型,在給定數(shù)據(jù)上進(jìn)行,取得了良好的響應(yīng)預(yù)測(cè)效果。該模型對(duì)地震動(dòng)數(shù)據(jù)集進(jìn)行了下采樣和低通濾波的預(yù)處理,影響了對(duì)響應(yīng)時(shí)程高頻成分的預(yù)測(cè)。此外,上述模型采用固定的超參數(shù)與輸入序列長(zhǎng)度,沒(méi)有給出不同工況下的參數(shù)選取原則,給未知地震動(dòng)下的應(yīng)用帶來(lái)了困難。
顯然,有必要提出一種新的神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)對(duì)任意長(zhǎng)度結(jié)構(gòu)響應(yīng)時(shí)程的計(jì)算,并盡可能放松對(duì)訓(xùn)練數(shù)據(jù)集的預(yù)處理要求。同時(shí),新模型應(yīng)該對(duì)不同地震動(dòng)和結(jié)構(gòu)具有良好的泛化能力,并具有相對(duì)較少的調(diào)試參數(shù)以方便應(yīng)用?;谏鲜稣J(rèn)識(shí)并受前述學(xué)者工作的啟發(fā),本文基于LSTM網(wǎng)絡(luò)提出了一種數(shù)據(jù)驅(qū)動(dòng)的結(jié)構(gòu)非線性地震響應(yīng)預(yù)測(cè)方法,替代傳統(tǒng)數(shù)值積分求解方法以滿足不同計(jì)算場(chǎng)景需求。模型采用了新的滑動(dòng)時(shí)間窗思路進(jìn)行遞推預(yù)測(cè),以模擬結(jié)構(gòu)動(dòng)力方程的積分求解過(guò)程。利用模型對(duì)兩個(gè)框架結(jié)構(gòu)的地震響應(yīng)預(yù)測(cè)結(jié)果,分別從地震動(dòng)頻譜、地震動(dòng)幅值、結(jié)構(gòu)模型等方面進(jìn)行了泛化能力分析,驗(yàn)證了模型的適用性與準(zhǔn)確性。
LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)的一種變體,由Hochreiter等[23]在1997年首次提出,最初用于處理RNN訓(xùn)練中的梯度消失以及數(shù)據(jù)的長(zhǎng)期依賴問(wèn)題[24]。相比基本的RNN,LSTM單元包含了3個(gè)門(mén)(gate)結(jié)構(gòu):輸入門(mén)、輸出門(mén)和遺忘門(mén),用以調(diào)節(jié)單元內(nèi)部的信息流。LSTM被廣泛用于語(yǔ)音識(shí)別[25]、手寫(xiě)識(shí)別[26]等方面,成為最成功的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之一。
針對(duì)本研究目的,LSTM網(wǎng)絡(luò)采用了堆疊式結(jié)構(gòu):順序連接3個(gè)單向LSTM層和1個(gè)全連接層(記為FC層),如表1所示。每個(gè)LSTM層均包含200個(gè)神經(jīng)元且使用雙曲正切激活函數(shù)。
表1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Table 1 LSTM network structure
模型的輸入數(shù)據(jù)包括時(shí)間窗口內(nèi)的地震動(dòng)時(shí)程和結(jié)構(gòu)響應(yīng)時(shí)程。本文將輸入地震動(dòng)時(shí)程記為A=[a1,a2,a3,···,an]T∈Rn,其中,n表示輸入時(shí)間序列的長(zhǎng)度,即滑動(dòng)窗口大小。將輸入的結(jié)構(gòu)響應(yīng)時(shí)程記為D=[d1,d2,d3,···,dn]T∈Rn×f,其中,f為結(jié)構(gòu)響應(yīng)的預(yù)測(cè)點(diǎn)數(shù)量(例如結(jié)構(gòu)層數(shù))。由此,輸入數(shù)據(jù)可以表示為一個(gè)n×(f+1)維數(shù)組,記為X=[A,D]∈Rn×(f+1)。
輸出數(shù)據(jù)為結(jié)構(gòu)在當(dāng)前遞推步的響應(yīng),與輸入相似,可表示為一個(gè)多維數(shù)組D∈Rm×f,其中,m表示輸出時(shí)間序列的長(zhǎng)度。本文中為了保證預(yù)測(cè)精度,每次僅預(yù)測(cè)單位時(shí)間的結(jié)構(gòu)響應(yīng),即m=1。然而當(dāng),任務(wù)較為簡(jiǎn)單(如線性響應(yīng)預(yù)測(cè))時(shí),可以令m>1以提高執(zhí)行效率。
訓(xùn)練中,對(duì)kernel權(quán)重執(zhí)行Xavier均勻分布初始化,對(duì)門(mén)權(quán)重執(zhí)行正交初始化。使用了Adam優(yōu)化器與均方誤差損失函數(shù)。為了防止出現(xiàn)過(guò)擬合,加入了L2 正則化,參數(shù)λ=0.01。在學(xué)習(xí)率的選擇上,雖然Adam優(yōu)化器被認(rèn)為具有自適應(yīng)梯度特性,但在實(shí)際使用中發(fā)現(xiàn)使用衰減的學(xué)習(xí)率可獲得更好的效果[27]。本文對(duì)學(xué)習(xí)率執(zhí)行按倒數(shù)衰減,以保證訓(xùn)練過(guò)程在后期趨于穩(wěn)定,學(xué)習(xí)率衰減曲線如圖1所示。本文模型的訓(xùn)練基于Tensorflow機(jī)器學(xué)習(xí)平臺(tái),并在搭載有Intel(R)Core(TM) i5-8600 CPU @ 3.10 GHz和NVIDIA GeForce GTX 1070Ti GPU的個(gè)人計(jì)算機(jī)上完成。
圖1 學(xué)習(xí)率衰減曲線Fig.1 Learning rate decay curve
現(xiàn)有結(jié)構(gòu)地震響應(yīng)預(yù)測(cè)的研究思路多為建立完整地震動(dòng)輸入到響應(yīng)時(shí)程的映射模型。此方式需要固定輸入、輸出的時(shí)間序列長(zhǎng)度,且可能導(dǎo)致數(shù)據(jù)量與模型的矛盾:為了提高模型對(duì)不同地震動(dòng)的泛化能力和預(yù)測(cè)精度,需要增加神經(jīng)元數(shù)量和輸入序列長(zhǎng)度,但有限的訓(xùn)練數(shù)據(jù)可導(dǎo)致復(fù)雜網(wǎng)絡(luò)難以訓(xùn)練或出現(xiàn)嚴(yán)重的過(guò)擬合問(wèn)題。受到傳統(tǒng)數(shù)值積分求解方法與其他領(lǐng)域工作[28 ? 29]的啟發(fā),本文使用滑動(dòng)時(shí)間窗的預(yù)測(cè)方式實(shí)現(xiàn)如下目的:
1) 對(duì)于整條時(shí)程,添加時(shí)間窗的LSTM神經(jīng)網(wǎng)絡(luò)關(guān)注時(shí)程的局部特征,適合非線性響應(yīng)預(yù)測(cè)的需求,并且與傳統(tǒng)方法類似的遞推形式有助于形成具有更強(qiáng)精確性與可解釋性的神經(jīng)網(wǎng)絡(luò)。
2) 對(duì)于單步運(yùn)算,LSTM網(wǎng)絡(luò)考慮了序列中不同輸入間的關(guān)聯(lián)性,可以僅通過(guò)有限的響應(yīng)時(shí)程學(xué)習(xí)到物理現(xiàn)象在高維空間內(nèi)的隱含特征表達(dá)。
如果將LSTM網(wǎng)絡(luò)的映射關(guān)系記為函數(shù)ft,并將從第i個(gè)采樣點(diǎn)開(kāi)始的序列長(zhǎng)度為n的輸入數(shù)據(jù)記為Xi=[xi,xi+1,xi+2,···,xi+n?1]T,那么存在關(guān)系:
或
假設(shè)n=3,圖2展示了滑動(dòng)時(shí)間窗的預(yù)測(cè)流程。在完成當(dāng)前時(shí)間窗 [i,i+n?1]內(nèi)的數(shù)據(jù)預(yù)測(cè)后,將第i+n個(gè)采樣點(diǎn)的輸出響應(yīng)作為已知,繼續(xù)完成時(shí)間窗 [i+1,i+n] 內(nèi)的數(shù)據(jù)預(yù)測(cè)。注意到i=1時(shí),可以通過(guò)預(yù)測(cè)得到的最早的響應(yīng)為Dn+1,即前n位響應(yīng)數(shù)據(jù)需要作為已知條件提供。因此在時(shí)程信號(hào)前進(jìn)行窗口長(zhǎng)度的零填充操作,以實(shí)現(xiàn)完整的時(shí)程預(yù)測(cè),這一點(diǎn)類似于數(shù)值積分方法的遞推起步問(wèn)題。
圖2 滑動(dòng)時(shí)間窗的預(yù)測(cè)流程Fig.2 Forecasting process with sliding time window
與傳統(tǒng)方法相比,LSTM一方面僅對(duì)少量目標(biāo)節(jié)點(diǎn)的響應(yīng)參數(shù)進(jìn)行更新計(jì)算,省略了多自由度系統(tǒng)中大量無(wú)用參數(shù)的求解過(guò)程,以換取更低的計(jì)算量和計(jì)算時(shí)間,同時(shí)神經(jīng)網(wǎng)絡(luò)天然的并行性使大批量地震動(dòng)響應(yīng)的同步預(yù)測(cè)成為可能。另一方面,輸入中擴(kuò)展的時(shí)間序列可以被視為潛在物理信息(速度、滯回狀態(tài)等)的容器,LSTM通過(guò)學(xué)習(xí)到的權(quán)重參數(shù)對(duì)其進(jìn)行高維空間中的提取,因此LSTM是對(duì)積分過(guò)程的魯棒性隱式建模。但也因?yàn)檫@一性質(zhì),經(jīng)過(guò)訓(xùn)練的LSTM模型只能描述單一結(jié)構(gòu)的物理特性,無(wú)法應(yīng)用在其他結(jié)構(gòu)上。
綜上,LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的運(yùn)行流程如圖3所示。左側(cè)區(qū)域表示了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,右側(cè)區(qū)域表示了基于滑動(dòng)時(shí)間窗的遞推預(yù)測(cè)過(guò)程。
圖3 LSTM模型的響應(yīng)預(yù)測(cè)流程圖Fig.3 Flowchart of response prediction of LSTM model
對(duì)前述模型預(yù)測(cè)效果的評(píng)價(jià),不同文獻(xiàn)采用了不同的指標(biāo),包括MAE、MSE、Pearson相關(guān)系數(shù)、決定系數(shù)等有量綱指標(biāo)和無(wú)量綱指標(biāo)兩類。本節(jié)分析上述指標(biāo)用于結(jié)構(gòu)響應(yīng)擬合效果評(píng)價(jià)時(shí)的不足,進(jìn)而提出針對(duì)性的改進(jìn)指標(biāo)。
有量綱指標(biāo)通常包括MAE、MSE、RMSE等。平均絕對(duì)誤差MAE (mean absolute error)定義見(jiàn)下式:
均方誤差MSE (mean squared error)及均方根誤差RMSE (root mean square error)的定義分別如下:
顯然,有量綱指標(biāo)的數(shù)值大小及其含義與目標(biāo)變量的物理單位有關(guān)。當(dāng)指標(biāo)與目標(biāo)變量的單位一致時(shí),可以直觀地反映誤差的大小,但對(duì)于不同的地震數(shù)據(jù)集或響應(yīng)預(yù)測(cè)值,有量綱指標(biāo)難以進(jìn)行橫向比較。
無(wú)量綱指標(biāo)通常包括Pearson相關(guān)系數(shù)和決定系數(shù)。Pearson相關(guān)系數(shù)是用于衡量變量間線性相關(guān)程度的指標(biāo),取值范圍[?1, 1]。
決定系數(shù)(coefficient of determination)通常記為R2,取值范圍[0, 1]。決定系數(shù)可用于非線性擬合,它衡量了因變量受自變量的解釋程度。R2值越接近1,擬合回歸效果越好。
由于其歸一化特點(diǎn),無(wú)量綱指標(biāo)更適合用于比較模型在不同數(shù)據(jù)集或問(wèn)題上的優(yōu)劣。
將上述指標(biāo)用于結(jié)構(gòu)響應(yīng)預(yù)測(cè)效果評(píng)估時(shí),每個(gè)時(shí)程點(diǎn)的預(yù)測(cè)誤差具有相等的累加權(quán)重,而實(shí)際上峰值響應(yīng)的預(yù)測(cè)精度更具價(jià)值[30]。在現(xiàn)有的規(guī)范方法中,也常常把最大層間位移角等作為主要的控制指標(biāo)。此外,無(wú)量綱指標(biāo)Pearson相關(guān)系數(shù)與R2對(duì)相位過(guò)于敏感,數(shù)個(gè)采樣點(diǎn)的相位差就可能造成數(shù)值的大幅變化。
針對(duì)上述問(wèn)題,對(duì)常用的指標(biāo)進(jìn)行了改進(jìn)以適用于響應(yīng)預(yù)測(cè)效果的評(píng)價(jià)。以MSE為例,將調(diào)整后的指標(biāo)記為加權(quán)均方誤差WMSE (weighted mean squared error),其算數(shù)平方根記為加權(quán)均方根誤差WRMSE (weighted root mean square error),即:
式中:w(i)為第i個(gè)采樣點(diǎn)處的權(quán)重; |y|max為|y(i)|在整條時(shí)程上的最大值。
此外,使用峰值百分誤差以評(píng)價(jià)預(yù)測(cè)模型在峰值點(diǎn)處的誤差水平,計(jì)算方式如下:
某10層辦公樓采用鋼筋混凝土剪切型框架結(jié)構(gòu),依據(jù)現(xiàn)行國(guó)家規(guī)范規(guī)程設(shè)計(jì)(圖4),抗震設(shè)防烈度為7度,設(shè)計(jì)基本地震加速度值為0.10g。
圖4 10層框架結(jié)構(gòu)示意圖Fig.4 Schematic diagram of a 10-story frame structure
考慮到多自由度模型較好的非線性特性表示能力與較高的計(jì)算效率[31],將質(zhì)量凝聚在各樓層建立結(jié)構(gòu)的串聯(lián)10自由度非線性模型。采用Takeda三線性恢復(fù)力曲線以準(zhǔn)確地表示結(jié)構(gòu)的層間行為[32 ? 33]。結(jié)構(gòu)與恢復(fù)力模型參數(shù)如表2所示,一階自振周期為0.7533 s。
表2 10層框架結(jié)構(gòu)參數(shù)與恢復(fù)力模型Table 2 Parameters and restoring force model of a 10-story frame structure
從太平洋地震工程研究中心(Pacific Earthquake Engineering Research Center, PEER)[34]選取了c類場(chǎng)地的57條地震動(dòng)加速度時(shí)程(不區(qū)分方向)并進(jìn)行基線修正,采樣間隔均為0.01 s。將27條東日本地震動(dòng)作為訓(xùn)練數(shù)據(jù),30條不同地區(qū)的地震動(dòng)作為測(cè)試數(shù)據(jù),詳細(xì)信息如表3所示。值得注意的是,為了驗(yàn)證LSTM的泛化能力,保留了不同地區(qū)地震動(dòng)間的頻譜差異。
表3 地震動(dòng)數(shù)據(jù)集Table 3 Earthquake ground motion dataset
在本例中,滑動(dòng)窗口大小設(shè)置為50,所有地震動(dòng)被調(diào)幅為2.5 m/s2以保證相近的非線性程度。采用數(shù)值積分法計(jì)算結(jié)構(gòu)在每條地震動(dòng)作用下的非線性動(dòng)力響應(yīng),輸出1層、5層、9層的位移時(shí)程,并對(duì)結(jié)果進(jìn)行間隔為0.07 s的下采樣。經(jīng)過(guò)時(shí)間窗劃分,訓(xùn)練集包含114 291條數(shù)據(jù),測(cè)試集包含15 629條數(shù)據(jù)。
建立結(jié)構(gòu)對(duì)應(yīng)的LSTM神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程包含1500次迭代,每次迭代訓(xùn)練100個(gè)小批量,每個(gè)批量大小為256,均方誤差損失函數(shù)的變化趨勢(shì)如圖5所示。迭代1302次時(shí),測(cè)試集損失達(dá)到最低,此時(shí)執(zhí)行早停操作。利用訓(xùn)練好的LSTM模型對(duì)測(cè)試集中的結(jié)構(gòu)響應(yīng)進(jìn)行預(yù)測(cè)。
圖5 損失函數(shù)變化趨勢(shì)Fig.5 Tendency of loss function
圖6 例1中4條地震動(dòng)響應(yīng)時(shí)程的預(yù)測(cè)結(jié)果Fig.6 Four prediction results of the seismic response time history in Example 1
神經(jīng)網(wǎng)絡(luò)方法由于數(shù)據(jù)驅(qū)動(dòng)的特點(diǎn),其直接信息來(lái)源為結(jié)構(gòu)響應(yīng),而非傳統(tǒng)求解方法的地震動(dòng)與結(jié)構(gòu)特性。因此LSTM對(duì)結(jié)構(gòu)響應(yīng)時(shí)程自身的特性更加敏感,并對(duì)結(jié)構(gòu)特性等因素具有內(nèi)在的泛化能力。響應(yīng)的時(shí)頻域表現(xiàn)是響應(yīng)時(shí)程的關(guān)鍵特性,因此有必要使用具有不同主周期的結(jié)構(gòu)響應(yīng)驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)能力。
對(duì)于某6層剪切型框架辦公樓,其抗震設(shè)防標(biāo)準(zhǔn)與3.1節(jié)相同,將質(zhì)量凝聚在各樓層建立結(jié)構(gòu)的串聯(lián)6自由度非線性模型。該模型使用了不同的恢復(fù)力特性曲線,其結(jié)構(gòu)與恢復(fù)力模型參數(shù)如表4所示,一階自振周期為0.4794 s。與3.1節(jié)相比,使用了相同的地震動(dòng)時(shí)程生成訓(xùn)練集與測(cè)試集,但將滑動(dòng)窗口大小設(shè)置為100,幅值調(diào)整為4 m/s2,采樣間隔為0.05 s。經(jīng)過(guò)時(shí)間窗劃分,訓(xùn)練集包含159 246條數(shù)據(jù),測(cè)試集包含21 014條數(shù)據(jù)。建立結(jié)構(gòu)對(duì)應(yīng)的LSTM神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程包含2385次迭代,其他參數(shù)與3.1節(jié)相同。
表4 6層框架結(jié)構(gòu)參數(shù)與恢復(fù)力模型Table 4 Parameters and restoring force model of a 6-story frame structure
圖7 例2中4條地震動(dòng)響應(yīng)時(shí)程的預(yù)測(cè)結(jié)果Fig.7 Four prediction results of the seismic response time history in Example 2
前述研究表明了LSTM方法預(yù)測(cè)結(jié)構(gòu)非線性地震響應(yīng)的可行性。在實(shí)際應(yīng)用中,應(yīng)通過(guò)調(diào)節(jié)窗口大小與數(shù)據(jù)集采樣間隔來(lái)調(diào)控輸入模型的信息量以獲得最優(yōu)的預(yù)測(cè)效果。其中,窗口大小控制了信息長(zhǎng)度,以適應(yīng)不同的地震動(dòng)幅值;采樣間隔控制了信息密度,以適應(yīng)不同的建筑結(jié)構(gòu)。本節(jié)對(duì)上述關(guān)系進(jìn)行了詳細(xì)的討論,并給出了相應(yīng)的參數(shù)選取原則。
窗口大小是LSTM神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)階段的唯一可調(diào)整參數(shù)。窗口大小表示模型在遞推預(yù)測(cè)中的輸入時(shí)間序列長(zhǎng)度,對(duì)預(yù)測(cè)結(jié)果具有顯著影響。直觀地分析,更小的窗口會(huì)因?yàn)楦嗟挠?xùn)練數(shù)據(jù)和更快的訓(xùn)練速度而提高訓(xùn)練效率,但模型更難從短時(shí)間序列中提取到有效信息,降低了預(yù)測(cè)的準(zhǔn)確度。更大的窗口會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)減少和訓(xùn)練速度降低,且同樣會(huì)降低預(yù)測(cè)的準(zhǔn)確度。
訓(xùn)練中還發(fā)現(xiàn),當(dāng)窗口大小超過(guò)一定的容忍范圍后,預(yù)測(cè)誤差會(huì)隨遞推次數(shù)增加而累計(jì),導(dǎo)致預(yù)測(cè)結(jié)果的發(fā)散,如圖8所示。發(fā)散現(xiàn)象常常出現(xiàn)在響應(yīng)幅值較小處,可能與輸入序列的約束減弱有關(guān)。因此,需要選取合適的窗口大小以實(shí)現(xiàn)訓(xùn)練效率和準(zhǔn)確度的平衡。經(jīng)過(guò)反復(fù)嘗試,發(fā)現(xiàn)窗口大小在(50,100)范圍內(nèi)可以取得相對(duì)合理的結(jié)果,且具體數(shù)值可依據(jù)輸入地震動(dòng)的峰值加速度(PGA)與結(jié)構(gòu)抗震設(shè)防烈度的關(guān)系來(lái)選取。
圖8 某地震動(dòng)時(shí)程出現(xiàn)的發(fā)散現(xiàn)象Fig.8 The divergence of a certain earthquake time history
為了對(duì)此建議范圍進(jìn)行驗(yàn)證,訓(xùn)練了例1結(jié)構(gòu)的8個(gè)具有不同訓(xùn)練集和窗口大小的LSTM神經(jīng)網(wǎng)絡(luò)模型。命名方式記為M{訓(xùn)練集編號(hào)}-{窗口大小},如M1-50代表使用train1訓(xùn)練集,窗口大小為50的模型。
訓(xùn)練集與測(cè)試集的選取與第3節(jié)相同,但對(duì)地震動(dòng)進(jìn)行了不同等級(jí)的峰值加速度調(diào)幅以模擬不同的非線性水平。對(duì)于本文使用的7度抗震設(shè)防結(jié)構(gòu),第一組訓(xùn)練集調(diào)幅為2.5 m /s2,模擬高于設(shè)防烈度的罕遇地震烈度(8度,0.20g)水平,記為train1。第二組訓(xùn)練集調(diào)幅為4 m/s2,模擬遠(yuǎn)高于設(shè)防烈度的極罕遇地震烈度(9度,0.40g)水平,記為train2。相應(yīng)的,兩組測(cè)試集分別記為test1、test2。
表5記錄了所有模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果,指標(biāo)數(shù)值取為測(cè)試集地震動(dòng)預(yù)測(cè)結(jié)果的均值。
由表5可以看出:
表5 窗口大小取值分析的模型評(píng)價(jià)結(jié)果Table 5 Model evaluation results of window size analysis
1) 對(duì)同一組目標(biāo)地震動(dòng),PGA決定了最優(yōu)預(yù)測(cè)精度:更小的PGA對(duì)應(yīng)更好的預(yù)測(cè)結(jié)果。相同條件下,M1模型的評(píng)價(jià)指標(biāo)均優(yōu)于M2模型。這是因?yàn)橐环矫骐S著PGA提高,響應(yīng)的非線性發(fā)展更加充分,進(jìn)入屈服段的歷程也隨之增加,神經(jīng)網(wǎng)絡(luò)更難以學(xué)習(xí)更復(fù)雜的滯回關(guān)系。另一方面,神經(jīng)網(wǎng)絡(luò)難以捕捉到時(shí)程后半段出現(xiàn)的塑性(殘余)位移量,從而引起WRMSE指標(biāo)的增加。盡管如此,在M2-100模型上,加權(quán)決定系數(shù)指標(biāo)依然保持在0.7以上,且后半段的彈性位移量得到了精確的還原,反映出良好的整體擬合能力。
2) 對(duì)同一結(jié)構(gòu),各層的預(yù)測(cè)精度相似,具有相近的評(píng)價(jià)指標(biāo)。此外觀察到有量綱指標(biāo)WRMSE會(huì)隨層數(shù)增加而增大,這是由各層位移幅值的量級(jí)不同決定的。
3) 窗口大小取值(50,100)較為合理。M1模型在窗口大小取25、125時(shí)的評(píng)價(jià)指標(biāo)明顯劣于建議范圍內(nèi)的指標(biāo)。通過(guò)觀察時(shí)程可以發(fā)現(xiàn),M1-125模型的誤差主要來(lái)源于時(shí)程整體的欠擬合,M1-25模型的誤差則主要來(lái)源于時(shí)程后半段的發(fā)散現(xiàn)象,這與上文的分析相符。
4) 模型的最適窗口大小與PGA和結(jié)構(gòu)抗震設(shè)防烈度的關(guān)系有關(guān):PGA滿足高于設(shè)防烈度的罕遇地震烈度水平時(shí),窗口大小應(yīng)選取50附近的較小值;PGA滿足高于設(shè)防烈度的極罕遇地震烈度水平時(shí),窗口大小應(yīng)選取100附近的較大值。M1模型對(duì)應(yīng)于罕遇地震烈度,最適窗口大小為50。M2模型對(duì)應(yīng)于極罕遇地震烈度,最適窗口大小為100。這是由于在更大的PGA下,結(jié)構(gòu)更容易處于屈服后的強(qiáng)化階段,響應(yīng)的主頻率更低,波形更長(zhǎng)。而神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)是輸入形狀特征與物理機(jī)制共同作用的結(jié)果,因此需要增加窗口大小以獲取足夠的輸入信息。
現(xiàn)代地震動(dòng)觀測(cè)儀器的采樣間隔一般低于0.01 s,因此一條完整的地震動(dòng)時(shí)程可能包含幾千到數(shù)萬(wàn)個(gè)采樣點(diǎn)。對(duì)于LSTM神經(jīng)網(wǎng)絡(luò),使用原始時(shí)間間隔的地震動(dòng)記錄進(jìn)行訓(xùn)練意味著巨大的參數(shù)量與計(jì)算成本。因此為了盡可能地減少訓(xùn)練時(shí)間,提高輸入序列中的“信息密度”,需要對(duì)地震動(dòng)及其響應(yīng)時(shí)程進(jìn)行下采樣。
對(duì)于不同結(jié)構(gòu)的響應(yīng)時(shí)程預(yù)測(cè),應(yīng)采用不同的下采樣間隔。采樣間隔 Δt的選取需要滿足以下兩個(gè)原則:1) 減少下采樣造成的峰值響應(yīng)損失,即采樣間隔小值優(yōu)先;2) 采樣間隔應(yīng)與建筑結(jié)構(gòu)自身特性有關(guān),即結(jié)構(gòu)的自振周期越大,響應(yīng)振動(dòng)的波長(zhǎng)越大,需要的采樣間隔越大。采樣間隔Δt的選取可表示為:
式中,T1表示結(jié)構(gòu)的基本周期。
為了驗(yàn)證其合理性,對(duì)兩個(gè)結(jié)構(gòu)在不同數(shù)據(jù)集下的結(jié)構(gòu)響應(yīng)時(shí)程進(jìn)行了傅里葉變換并計(jì)算其平均主周期,結(jié)果如表6所示。觀察發(fā)現(xiàn)地震動(dòng)幅值與結(jié)構(gòu)特性均對(duì)響應(yīng)時(shí)程的波長(zhǎng)具有明顯影響。對(duì)于地震動(dòng)數(shù)據(jù)集,隨著PGA增大,響應(yīng)時(shí)程主周期(或波長(zhǎng))小幅增加,這與4.1節(jié)的分析相符。對(duì)于結(jié)構(gòu)特性,結(jié)構(gòu)基本周期與線性響應(yīng)時(shí)程主周期基本相同,由此可以證明結(jié)構(gòu)的基本周期可以作為響應(yīng)時(shí)程采樣間隔的控制因素。第3節(jié)中兩個(gè)框架結(jié)構(gòu)的基本周期分別為0.7533 s、0.4794 s,相應(yīng)的采樣間隔分別為0.07 s、0.05 s,滿足式(13)且與小值優(yōu)先的原則相符。
表6 不同地震動(dòng)與結(jié)構(gòu)的響應(yīng)主周期Table 6 Response main period under different ground motions and structures
結(jié)構(gòu)的地震響應(yīng)主要受到結(jié)構(gòu)自身動(dòng)力特性與地震動(dòng)特性兩個(gè)因素影響[35 ? 36]。為驗(yàn)證LSTM網(wǎng)絡(luò)模型在不同工況下的泛化能力,本節(jié)設(shè)計(jì)了例1、例2結(jié)構(gòu)下使用不同訓(xùn)練集、測(cè)試集的對(duì)比試驗(yàn),并給出了不同指標(biāo)下的評(píng)價(jià)結(jié)果。
5.1.1 地震動(dòng)頻譜特性
地震動(dòng)頻譜特性顯示了不同頻率分量的強(qiáng)度的分布,反映了地震動(dòng)的動(dòng)力特征。對(duì)于不同頻譜特性的地震動(dòng),其響應(yīng)預(yù)測(cè)性能可能也會(huì)有所不同。選取了4.1節(jié)中的M1-50模型進(jìn)行測(cè)試,并依據(jù)評(píng)價(jià)指標(biāo)WRMSE和加權(quán)決定系數(shù)對(duì)30條測(cè)試集地震動(dòng)的預(yù)測(cè)結(jié)果進(jìn)行了匯總,如圖9所示(左圖為按指標(biāo)數(shù)值升序排序后的分布,右圖直方圖分布)。
圖9 M1-50模型的測(cè)試集預(yù)測(cè)結(jié)果分布Fig.9 Distribution of prediction results of the test set of the M1-50 model
在30條測(cè)試集地震動(dòng)中,WRMSE指標(biāo)最低的3條地震動(dòng)編號(hào)為25、17、0,最高的3條地震動(dòng)編號(hào)為18、16、15,對(duì)應(yīng)地震動(dòng)的傅里葉幅值譜與加速度時(shí)程如圖10所示。
圖10 代表性地震動(dòng)的傅里葉幅值譜與加速度時(shí)程Fig.10 Fourier amplitude spectrum and acceleration time history of representative ground motions
對(duì)兩組結(jié)果進(jìn)行對(duì)比:在頻域上,第一組地震動(dòng)相比第二組具有較少的低頻(低于1 Hz)成分,呈現(xiàn)出典型的地震動(dòng)頻譜分布特征。在時(shí)域上,第二組地震動(dòng)由于幅值與頻率變化表現(xiàn)出的非線性更加明顯。此外,發(fā)現(xiàn)訓(xùn)練集地震動(dòng)的頻譜特征與第一組地震動(dòng)更為吻合,由此可以從數(shù)據(jù)不平衡分布的角度解釋不同地震動(dòng)間預(yù)測(cè)性能的差異,同時(shí)可以認(rèn)為:
2) 頻譜分布對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果有重要影響。整體而言,訓(xùn)練與測(cè)試地震動(dòng)頻譜分布的差異反映在訓(xùn)練數(shù)據(jù)分布的不平衡上。非典型頻譜分布地震動(dòng)樣本遠(yuǎn)遠(yuǎn)少于典型樣本,難以被神經(jīng)網(wǎng)絡(luò)充分學(xué)習(xí),從而造成預(yù)測(cè)結(jié)果準(zhǔn)確性偏低。
3) 低頻段頻譜分布是最為明顯的影響因素。具體而言,低頻段幅值越高,地震動(dòng)在時(shí)程上越容易出現(xiàn)造成局部幅值偏移的低頻波,增加了非線性變化的復(fù)雜程度和預(yù)測(cè)難度。?
圖11 濾波前后16號(hào)地震動(dòng)預(yù)測(cè)結(jié)果對(duì)比Fig.11 Comparison of prediction results of No. 16 ground motion before and after filtering
5.1.2 地震動(dòng)幅值
在模型的實(shí)際應(yīng)用中,預(yù)測(cè)目標(biāo)地震動(dòng)可能并不局限于同一PGA,而是根據(jù)抗震設(shè)防等級(jí)進(jìn)行不同程度的調(diào)幅,因此需要考慮模型在非目標(biāo)峰值地震動(dòng)上的預(yù)測(cè)性能。
訓(xùn)練集與測(cè)試集的選取與第3節(jié)相同,但對(duì)地震動(dòng)進(jìn)行了不同等級(jí)的峰值加速度調(diào)幅。第一組訓(xùn)練集調(diào)幅為2.5 m/s2,記為train1。第二組訓(xùn)練集調(diào)幅為4 m /s2,記為train2。將前兩組訓(xùn)練集合并得到復(fù)合訓(xùn)練集,記為train3。同理,調(diào)幅得到了測(cè)試集test1、test2。
表7記錄了4個(gè)LSTM神經(jīng)網(wǎng)絡(luò)模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果。采用的指標(biāo)包括WRMSE、Pearson相關(guān)系數(shù)、R2w和峰值百分誤差,指標(biāo)數(shù)值取為測(cè)試集所有地震動(dòng)結(jié)果的均值。
表7 地震動(dòng)泛化能力分析的模型評(píng)價(jià)結(jié)果Table 7 Model evaluation results of earthquake generalization ability analysis
由表7可以看出:
1) LSTM神經(jīng)網(wǎng)絡(luò)對(duì)地震動(dòng)幅值的變異具有良好的泛化能力。當(dāng)窗口大小合適時(shí),對(duì)非目標(biāo)峰值地震動(dòng)進(jìn)行預(yù)測(cè)仍然可以得到相對(duì)優(yōu)秀的結(jié)果,如M1-100在test2上仍然具有0.7707的加權(quán)決定系數(shù),優(yōu)于M2-100。這可能是由于train2訓(xùn)練集中的響應(yīng)具有更大的塑性位移,干擾了模型對(duì)滯回特征的學(xué)習(xí)。
2) 目標(biāo)地震動(dòng)峰值水平較高時(shí),使用不同幅值的復(fù)合訓(xùn)練集可以得到更優(yōu)秀的模型。M3-100相比M2-100在test2的各個(gè)指標(biāo)上都得到了一 定程度的提高,尤其是WRMSE和峰值百分誤差分別為0.0126 m、11.31%,達(dá)到了所有模型中的最優(yōu)水平。這是因?yàn)閺?fù)合訓(xùn)練集增加了數(shù)據(jù)量,減少了訓(xùn)練中的過(guò)擬合,使訓(xùn)練損失得以下降至更低。
3) 通常情況下,可以考慮使用峰值水平較低的訓(xùn)練集進(jìn)行訓(xùn)練。一方面,低峰值水平響應(yīng)的塑性位移通常更小,即誤差干擾更小,模型更容易學(xué)習(xí)到結(jié)構(gòu)的滯回特性。另一方面,調(diào)試和訓(xùn)練時(shí)間相比復(fù)合訓(xùn)練集更短,易于應(yīng)用。
為驗(yàn)證LSTM網(wǎng)絡(luò)模型在不同結(jié)構(gòu)上的預(yù)測(cè)能力與規(guī)律,基于第3節(jié)中的6層框架結(jié)構(gòu)設(shè)計(jì)了單獨(dú)的模型對(duì)比試驗(yàn)。表8記錄了所有模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果。
表8 結(jié)構(gòu)模型泛化能力分析的模型評(píng)價(jià)結(jié)果Table 8 Model evaluation results of structural model generalization ability analysis
由表8可知,6層框架結(jié)構(gòu)預(yù)測(cè)結(jié)果與2.2節(jié)、2.3節(jié)中的結(jié)論完全相符,但整體準(zhǔn)確度更高。這是由于使用了較小采樣間隔,數(shù)據(jù)集具有更低的采樣損失。
本文提出了一種使用滑動(dòng)時(shí)間窗的非線性結(jié)構(gòu)地震響應(yīng)的LSTM預(yù)測(cè)模型,并在框架結(jié)構(gòu)上進(jìn)行了驗(yàn)證,給出了面向?qū)嶋H應(yīng)用的超參數(shù)選取原則。研究結(jié)果表明:
(1) LSTM可以準(zhǔn)確預(yù)測(cè)地震作用下框架結(jié)構(gòu)的非線性結(jié)構(gòu)響應(yīng),引入滑動(dòng)時(shí)間窗遞推預(yù)測(cè),解決了此前研究中地震動(dòng)時(shí)程必須固定長(zhǎng)度以及數(shù)據(jù)集必須預(yù)處理的問(wèn)題。由于神經(jīng)網(wǎng)絡(luò)算法適合分布式云部署的特點(diǎn),該方法更加適用于城市地震響應(yīng)快速模擬等傳統(tǒng)方法受限的邊緣計(jì)算場(chǎng)景。
(2) 預(yù)測(cè)模型具有良好的泛化能力,對(duì)于變化的地震動(dòng)幅值、地震動(dòng)頻譜與結(jié)構(gòu),均可以獲得較高的準(zhǔn)確度。
(3) 預(yù)測(cè)模型具有簡(jiǎn)單通用的結(jié)構(gòu)。根據(jù)需求,僅改變窗口大小參數(shù)便可適用于不同數(shù)據(jù)集,極大地降低了調(diào)試計(jì)算成本。