非線性結(jié)構(gòu)地震響應(yīng)的神經(jīng)網(wǎng)絡(luò)算法

2021-09-23 10:41許澤坤

工程力學(xué) 2021年9期

許澤坤，陳雋

(同濟(jì)大學(xué)土木工程學(xué)院，上海 200092)

一方面，過(guò)去幾十年內(nèi)發(fā)生的一系列地震災(zāi)害表明，有必要對(duì)建筑進(jìn)行基于性能的抗震設(shè)計(jì)，以更好地滿足不同的抗震需求[1]。為此，需要進(jìn)行不同等級(jí)的建筑物彈塑性地震響應(yīng)時(shí)程分析[2]。然而，由于其高昂的計(jì)算成本，很難快速完成大量不同地震動(dòng)作用下單體建筑的非線性地震響應(yīng)分析。在基于蒙特卡洛模擬[3]或增量動(dòng)力分析[4]的結(jié)構(gòu)性能評(píng)估中，這一矛盾尤其突出。

另一方面，隨著城市系統(tǒng)安全概念的普及，防災(zāi)減災(zāi)研究正由建筑單體擴(kuò)展至城市建筑群，城市區(qū)域抗震分析越來(lái)越受到關(guān)注。如何快速預(yù)測(cè)城市建筑群的地震響應(yīng)成為首要技術(shù)難題[5 ? 6]，當(dāng)前的城市震災(zāi)模擬依然以簡(jiǎn)化模型與靜力分析為主[7]，尚難實(shí)現(xiàn)可比擬單體結(jié)構(gòu)的高精度實(shí)時(shí)計(jì)算。采用超級(jí)計(jì)算機(jī)是一種可能的解決方案[8 ? 10]，但其普及性現(xiàn)階段仍受限于計(jì)算資源的開(kāi)放程度。因此，發(fā)展適用于邊緣計(jì)算場(chǎng)景的結(jié)構(gòu)非線性地震響應(yīng)新型計(jì)算方法是值得深入研究的問(wèn)題。

隨著硬件性能的快速提升與深度學(xué)習(xí)技術(shù)的普及，人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)為結(jié)構(gòu)非線性地震響應(yīng)計(jì)算問(wèn)題帶來(lái)了全新的可能。例如，ANN作為方程的隱式表達(dá)，通過(guò)發(fā)展通用的函數(shù)逼近方法，可實(shí)現(xiàn)不同非線性微分方程的求解[11 ? 12]。目前，通常采用具有少量隱層的多層感知器(multilayer perceptron, MLP)，比較適用于具有簡(jiǎn)單約束的低維非線性求解[13]。對(duì)于具有物理背景、工程約束的求解問(wèn)題，已有研究使用長(zhǎng)短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)來(lái)解決Navier–Stokes方程以及高維數(shù)據(jù)中的流體模擬[14 ? 16]。其他相關(guān)工作包括通過(guò)強(qiáng)化學(xué)習(xí)降低量子多體問(wèn)題的復(fù)雜性[17]；構(gòu)造特定損失函數(shù)的全連接神經(jīng)網(wǎng)絡(luò)也被用于求解波動(dòng)方程問(wèn)題[18]等。

以上工作表明了ANN求解微分方程的可行性，但用于地震作用下的結(jié)構(gòu)動(dòng)力方程求解依然存在相當(dāng)?shù)奶魬?zhàn)。一方面，結(jié)構(gòu)的恢復(fù)力特性使其在往復(fù)荷載下表現(xiàn)出復(fù)雜的非線性行為，簡(jiǎn)單架構(gòu)的MLP難以捕捉到準(zhǔn)確的滯回特征。另一方面，建筑結(jié)構(gòu)作為復(fù)雜多自由度系統(tǒng)具有大量物理參數(shù)，很難建立完整的神經(jīng)網(wǎng)絡(luò)映射模型以逼近其精確解。因此，結(jié)合分析目標(biāo)先固定部分物理參數(shù)(如層數(shù)、層高、恢復(fù)力特性等)，轉(zhuǎn)而尋求結(jié)構(gòu)響應(yīng)的ANN近似解是一種更加經(jīng)濟(jì)的做法。沿著這一思路，Lagaros等[19]設(shè)計(jì)了傳統(tǒng)非線性分析與MLP相結(jié)合的時(shí)程預(yù)測(cè)方案，由于使用人工地震波進(jìn)行訓(xùn)練，最終的預(yù)測(cè)效果不甚理想。Kim等[20]借助CNN提取滯回特征，建立了從激勵(lì)與滯回曲線到結(jié)構(gòu)峰值響應(yīng)預(yù)測(cè)的復(fù)合神經(jīng)網(wǎng)絡(luò)模型，模型基于單自由度體系建立，需要大量數(shù)值計(jì)算結(jié)果作為訓(xùn)練集，目前尚未應(yīng)用于復(fù)雜結(jié)構(gòu)。Zhang等[21 ? 22]先后使用LSTM網(wǎng)絡(luò)與CNN建立了結(jié)構(gòu)地震響應(yīng)時(shí)程的預(yù)測(cè)模型，在給定數(shù)據(jù)上進(jìn)行，取得了良好的響應(yīng)預(yù)測(cè)效果。該模型對(duì)地震動(dòng)數(shù)據(jù)集進(jìn)行了下采樣和低通濾波的預(yù)處理，影響了對(duì)響應(yīng)時(shí)程高頻成分的預(yù)測(cè)。此外，上述模型采用固定的超參數(shù)與輸入序列長(zhǎng)度，沒(méi)有給出不同工況下的參數(shù)選取原則，給未知地震動(dòng)下的應(yīng)用帶來(lái)了困難。

顯然，有必要提出一種新的神經(jīng)網(wǎng)絡(luò)模型，實(shí)現(xiàn)對(duì)任意長(zhǎng)度結(jié)構(gòu)響應(yīng)時(shí)程的計(jì)算，并盡可能放松對(duì)訓(xùn)練數(shù)據(jù)集的預(yù)處理要求。同時(shí)，新模型應(yīng)該對(duì)不同地震動(dòng)和結(jié)構(gòu)具有良好的泛化能力，并具有相對(duì)較少的調(diào)試參數(shù)以方便應(yīng)用?；谏鲜稣J(rèn)識(shí)并受前述學(xué)者工作的啟發(fā)，本文基于LSTM網(wǎng)絡(luò)提出了一種數(shù)據(jù)驅(qū)動(dòng)的結(jié)構(gòu)非線性地震響應(yīng)預(yù)測(cè)方法，替代傳統(tǒng)數(shù)值積分求解方法以滿足不同計(jì)算場(chǎng)景需求。模型采用了新的滑動(dòng)時(shí)間窗思路進(jìn)行遞推預(yù)測(cè)，以模擬結(jié)構(gòu)動(dòng)力方程的積分求解過(guò)程。利用模型對(duì)兩個(gè)框架結(jié)構(gòu)的地震響應(yīng)預(yù)測(cè)結(jié)果，分別從地震動(dòng)頻譜、地震動(dòng)幅值、結(jié)構(gòu)模型等方面進(jìn)行了泛化能力分析，驗(yàn)證了模型的適用性與準(zhǔn)確性。

1 LSTM模型

LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)的一種變體，由Hochreiter等[23]在1997年首次提出，最初用于處理RNN訓(xùn)練中的梯度消失以及數(shù)據(jù)的長(zhǎng)期依賴問(wèn)題[24]。相比基本的RNN，LSTM單元包含了3個(gè)門(mén)(gate)結(jié)構(gòu)：輸入門(mén)、輸出門(mén)和遺忘門(mén)，用以調(diào)節(jié)單元內(nèi)部的信息流。LSTM被廣泛用于語(yǔ)音識(shí)別[25]、手寫(xiě)識(shí)別[26]等方面，成為最成功的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之一。

1.1 網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)

針對(duì)本研究目的，LSTM網(wǎng)絡(luò)采用了堆疊式結(jié)構(gòu)：順序連接3個(gè)單向LSTM層和1個(gè)全連接層(記為FC層)，如表1所示。每個(gè)LSTM層均包含200個(gè)神經(jīng)元且使用雙曲正切激活函數(shù)。

表1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Table 1 LSTM network structure

模型的輸入數(shù)據(jù)包括時(shí)間窗口內(nèi)的地震動(dòng)時(shí)程和結(jié)構(gòu)響應(yīng)時(shí)程。本文將輸入地震動(dòng)時(shí)程記為A=[a1,a2,a3,···,an]T∈Rn，其中，n表示輸入時(shí)間序列的長(zhǎng)度，即滑動(dòng)窗口大小。將輸入的結(jié)構(gòu)響應(yīng)時(shí)程記為D=[d1,d2,d3,···,dn]T∈Rn×f，其中，f為結(jié)構(gòu)響應(yīng)的預(yù)測(cè)點(diǎn)數(shù)量(例如結(jié)構(gòu)層數(shù))。由此，輸入數(shù)據(jù)可以表示為一個(gè)n×(f+1)維數(shù)組，記為X=[A,D]∈Rn×(f+1)。

輸出數(shù)據(jù)為結(jié)構(gòu)在當(dāng)前遞推步的響應(yīng)，與輸入相似，可表示為一個(gè)多維數(shù)組D∈Rm×f，其中，m表示輸出時(shí)間序列的長(zhǎng)度。本文中為了保證預(yù)測(cè)精度，每次僅預(yù)測(cè)單位時(shí)間的結(jié)構(gòu)響應(yīng)，即m=1。然而當(dāng)，任務(wù)較為簡(jiǎn)單(如線性響應(yīng)預(yù)測(cè))時(shí)，可以令m>1以提高執(zhí)行效率。

訓(xùn)練中，對(duì)kernel權(quán)重執(zhí)行Xavier均勻分布初始化，對(duì)門(mén)權(quán)重執(zhí)行正交初始化。使用了Adam優(yōu)化器與均方誤差損失函數(shù)。為了防止出現(xiàn)過(guò)擬合，加入了L2 正則化，參數(shù)λ=0.01。在學(xué)習(xí)率的選擇上，雖然Adam優(yōu)化器被認(rèn)為具有自適應(yīng)梯度特性，但在實(shí)際使用中發(fā)現(xiàn)使用衰減的學(xué)習(xí)率可獲得更好的效果[27]。本文對(duì)學(xué)習(xí)率執(zhí)行按倒數(shù)衰減，以保證訓(xùn)練過(guò)程在后期趨于穩(wěn)定，學(xué)習(xí)率衰減曲線如圖1所示。本文模型的訓(xùn)練基于Tensorflow機(jī)器學(xué)習(xí)平臺(tái)，并在搭載有Intel(R)Core(TM) i5-8600 CPU @ 3.10 GHz和NVIDIA GeForce GTX 1070Ti GPU的個(gè)人計(jì)算機(jī)上完成。

圖1 學(xué)習(xí)率衰減曲線Fig.1 Learning rate decay curve

1.2 滑動(dòng)時(shí)間窗

現(xiàn)有結(jié)構(gòu)地震響應(yīng)預(yù)測(cè)的研究思路多為建立完整地震動(dòng)輸入到響應(yīng)時(shí)程的映射模型。此方式需要固定輸入、輸出的時(shí)間序列長(zhǎng)度，且可能導(dǎo)致數(shù)據(jù)量與模型的矛盾：為了提高模型對(duì)不同地震動(dòng)的泛化能力和預(yù)測(cè)精度，需要增加神經(jīng)元數(shù)量和輸入序列長(zhǎng)度，但有限的訓(xùn)練數(shù)據(jù)可導(dǎo)致復(fù)雜網(wǎng)絡(luò)難以訓(xùn)練或出現(xiàn)嚴(yán)重的過(guò)擬合問(wèn)題。受到傳統(tǒng)數(shù)值積分求解方法與其他領(lǐng)域工作[28 ? 29]的啟發(fā)，本文使用滑動(dòng)時(shí)間窗的預(yù)測(cè)方式實(shí)現(xiàn)如下目的：

1) 對(duì)于整條時(shí)程，添加時(shí)間窗的LSTM神經(jīng)網(wǎng)絡(luò)關(guān)注時(shí)程的局部特征，適合非線性響應(yīng)預(yù)測(cè)的需求，并且與傳統(tǒng)方法類似的遞推形式有助于形成具有更強(qiáng)精確性與可解釋性的神經(jīng)網(wǎng)絡(luò)。

2) 對(duì)于單步運(yùn)算，LSTM網(wǎng)絡(luò)考慮了序列中不同輸入間的關(guān)聯(lián)性，可以僅通過(guò)有限的響應(yīng)時(shí)程學(xué)習(xí)到物理現(xiàn)象在高維空間內(nèi)的隱含特征表達(dá)。

如果將LSTM網(wǎng)絡(luò)的映射關(guān)系記為函數(shù)ft，并將從第i個(gè)采樣點(diǎn)開(kāi)始的序列長(zhǎng)度為n的輸入數(shù)據(jù)記為Xi=[xi,xi+1,xi+2,···,xi+n?1]T，那么存在關(guān)系：

或

假設(shè)n=3，圖2展示了滑動(dòng)時(shí)間窗的預(yù)測(cè)流程。在完成當(dāng)前時(shí)間窗 [i,i+n?1]內(nèi)的數(shù)據(jù)預(yù)測(cè)后，將第i+n個(gè)采樣點(diǎn)的輸出響應(yīng)作為已知，繼續(xù)完成時(shí)間窗 [i+1,i+n] 內(nèi)的數(shù)據(jù)預(yù)測(cè)。注意到i=1時(shí)，可以通過(guò)預(yù)測(cè)得到的最早的響應(yīng)為Dn+1，即前n位響應(yīng)數(shù)據(jù)需要作為已知條件提供。因此在時(shí)程信號(hào)前進(jìn)行窗口長(zhǎng)度的零填充操作，以實(shí)現(xiàn)完整的時(shí)程預(yù)測(cè)，這一點(diǎn)類似于數(shù)值積分方法的遞推起步問(wèn)題。

圖2 滑動(dòng)時(shí)間窗的預(yù)測(cè)流程Fig.2 Forecasting process with sliding time window

與傳統(tǒng)方法相比，LSTM一方面僅對(duì)少量目標(biāo)節(jié)點(diǎn)的響應(yīng)參數(shù)進(jìn)行更新計(jì)算，省略了多自由度系統(tǒng)中大量無(wú)用參數(shù)的求解過(guò)程，以換取更低的計(jì)算量和計(jì)算時(shí)間，同時(shí)神經(jīng)網(wǎng)絡(luò)天然的并行性使大批量地震動(dòng)響應(yīng)的同步預(yù)測(cè)成為可能。另一方面，輸入中擴(kuò)展的時(shí)間序列可以被視為潛在物理信息(速度、滯回狀態(tài)等)的容器，LSTM通過(guò)學(xué)習(xí)到的權(quán)重參數(shù)對(duì)其進(jìn)行高維空間中的提取，因此LSTM是對(duì)積分過(guò)程的魯棒性隱式建模。但也因?yàn)檫@一性質(zhì)，經(jīng)過(guò)訓(xùn)練的LSTM模型只能描述單一結(jié)構(gòu)的物理特性，無(wú)法應(yīng)用在其他結(jié)構(gòu)上。

綜上，LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的運(yùn)行流程如圖3所示。左側(cè)區(qū)域表示了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程，右側(cè)區(qū)域表示了基于滑動(dòng)時(shí)間窗的遞推預(yù)測(cè)過(guò)程。

圖3 LSTM模型的響應(yīng)預(yù)測(cè)流程圖Fig.3 Flowchart of response prediction of LSTM model

2 評(píng)價(jià)指標(biāo)

對(duì)前述模型預(yù)測(cè)效果的評(píng)價(jià)，不同文獻(xiàn)采用了不同的指標(biāo)，包括MAE、MSE、Pearson相關(guān)系數(shù)、決定系數(shù)等有量綱指標(biāo)和無(wú)量綱指標(biāo)兩類。本節(jié)分析上述指標(biāo)用于結(jié)構(gòu)響應(yīng)擬合效果評(píng)價(jià)時(shí)的不足，進(jìn)而提出針對(duì)性的改進(jìn)指標(biāo)。

2.1 有量綱指標(biāo)

有量綱指標(biāo)通常包括MAE、MSE、RMSE等。平均絕對(duì)誤差MAE (mean absolute error)定義見(jiàn)下式：

均方誤差MSE (mean squared error)及均方根誤差RMSE (root mean square error)的定義分別如下：

顯然，有量綱指標(biāo)的數(shù)值大小及其含義與目標(biāo)變量的物理單位有關(guān)。當(dāng)指標(biāo)與目標(biāo)變量的單位一致時(shí)，可以直觀地反映誤差的大小，但對(duì)于不同的地震數(shù)據(jù)集或響應(yīng)預(yù)測(cè)值，有量綱指標(biāo)難以進(jìn)行橫向比較。

2.2 無(wú)量綱指標(biāo)

無(wú)量綱指標(biāo)通常包括Pearson相關(guān)系數(shù)和決定系數(shù)。Pearson相關(guān)系數(shù)是用于衡量變量間線性相關(guān)程度的指標(biāo)，取值范圍[?1, 1]。

決定系數(shù)(coefficient of determination)通常記為R2，取值范圍[0, 1]。決定系數(shù)可用于非線性擬合，它衡量了因變量受自變量的解釋程度。R2值越接近1，擬合回歸效果越好。

由于其歸一化特點(diǎn)，無(wú)量綱指標(biāo)更適合用于比較模型在不同數(shù)據(jù)集或問(wèn)題上的優(yōu)劣。

2.3 改進(jìn)指標(biāo)

將上述指標(biāo)用于結(jié)構(gòu)響應(yīng)預(yù)測(cè)效果評(píng)估時(shí)，每個(gè)時(shí)程點(diǎn)的預(yù)測(cè)誤差具有相等的累加權(quán)重，而實(shí)際上峰值響應(yīng)的預(yù)測(cè)精度更具價(jià)值[30]。在現(xiàn)有的規(guī)范方法中，也常常把最大層間位移角等作為主要的控制指標(biāo)。此外，無(wú)量綱指標(biāo)Pearson相關(guān)系數(shù)與R2對(duì)相位過(guò)于敏感，數(shù)個(gè)采樣點(diǎn)的相位差就可能造成數(shù)值的大幅變化。

針對(duì)上述問(wèn)題，對(duì)常用的指標(biāo)進(jìn)行了改進(jìn)以適用于響應(yīng)預(yù)測(cè)效果的評(píng)價(jià)。以MSE為例，將調(diào)整后的指標(biāo)記為加權(quán)均方誤差WMSE (weighted mean squared error)，其算數(shù)平方根記為加權(quán)均方根誤差WRMSE (weighted root mean square error)，即：

式中：w(i)為第i個(gè)采樣點(diǎn)處的權(quán)重； |y|max為|y(i)|在整條時(shí)程上的最大值。

此外，使用峰值百分誤差以評(píng)價(jià)預(yù)測(cè)模型在峰值點(diǎn)處的誤差水平，計(jì)算方式如下：

3 模型使用的案例分析

3.1 例1. 10層框架結(jié)構(gòu)

某10層辦公樓采用鋼筋混凝土剪切型框架結(jié)構(gòu)，依據(jù)現(xiàn)行國(guó)家規(guī)范規(guī)程設(shè)計(jì)(圖4)，抗震設(shè)防烈度為7度，設(shè)計(jì)基本地震加速度值為0.10g。

圖4 10層框架結(jié)構(gòu)示意圖Fig.4 Schematic diagram of a 10-story frame structure

考慮到多自由度模型較好的非線性特性表示能力與較高的計(jì)算效率[31]，將質(zhì)量凝聚在各樓層建立結(jié)構(gòu)的串聯(lián)10自由度非線性模型。采用Takeda三線性恢復(fù)力曲線以準(zhǔn)確地表示結(jié)構(gòu)的層間行為[32 ? 33]。結(jié)構(gòu)與恢復(fù)力模型參數(shù)如表2所示，一階自振周期為0.7533 s。

表2 10層框架結(jié)構(gòu)參數(shù)與恢復(fù)力模型Table 2 Parameters and restoring force model of a 10-story frame structure

從太平洋地震工程研究中心(Pacific Earthquake Engineering Research Center, PEER)[34]選取了c類場(chǎng)地的57條地震動(dòng)加速度時(shí)程(不區(qū)分方向)并進(jìn)行基線修正，采樣間隔均為0.01 s。將27條東日本地震動(dòng)作為訓(xùn)練數(shù)據(jù)，30條不同地區(qū)的地震動(dòng)作為測(cè)試數(shù)據(jù)，詳細(xì)信息如表3所示。值得注意的是，為了驗(yàn)證LSTM的泛化能力，保留了不同地區(qū)地震動(dòng)間的頻譜差異。

表3 地震動(dòng)數(shù)據(jù)集Table 3 Earthquake ground motion dataset

在本例中，滑動(dòng)窗口大小設(shè)置為50，所有地震動(dòng)被調(diào)幅為2.5 m/s2以保證相近的非線性程度。采用數(shù)值積分法計(jì)算結(jié)構(gòu)在每條地震動(dòng)作用下的非線性動(dòng)力響應(yīng)，輸出1層、5層、9層的位移時(shí)程，并對(duì)結(jié)果進(jìn)行間隔為0.07 s的下采樣。經(jīng)過(guò)時(shí)間窗劃分，訓(xùn)練集包含114 291條數(shù)據(jù)，測(cè)試集包含15 629條數(shù)據(jù)。

建立結(jié)構(gòu)對(duì)應(yīng)的LSTM神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程包含1500次迭代，每次迭代訓(xùn)練100個(gè)小批量，每個(gè)批量大小為256，均方誤差損失函數(shù)的變化趨勢(shì)如圖5所示。迭代1302次時(shí)，測(cè)試集損失達(dá)到最低，此時(shí)執(zhí)行早停操作。利用訓(xùn)練好的LSTM模型對(duì)測(cè)試集中的結(jié)構(gòu)響應(yīng)進(jìn)行預(yù)測(cè)。

圖5 損失函數(shù)變化趨勢(shì)Fig.5 Tendency of loss function

圖6 例1中4條地震動(dòng)響應(yīng)時(shí)程的預(yù)測(cè)結(jié)果Fig.6 Four prediction results of the seismic response time history in Example 1

3.2 例2. 6層框架結(jié)構(gòu)

神經(jīng)網(wǎng)絡(luò)方法由于數(shù)據(jù)驅(qū)動(dòng)的特點(diǎn)，其直接信息來(lái)源為結(jié)構(gòu)響應(yīng)，而非傳統(tǒng)求解方法的地震動(dòng)與結(jié)構(gòu)特性。因此LSTM對(duì)結(jié)構(gòu)響應(yīng)時(shí)程自身的特性更加敏感，并對(duì)結(jié)構(gòu)特性等因素具有內(nèi)在的泛化能力。響應(yīng)的時(shí)頻域表現(xiàn)是響應(yīng)時(shí)程的關(guān)鍵特性，因此有必要使用具有不同主周期的結(jié)構(gòu)響應(yīng)驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)能力。

對(duì)于某6層剪切型框架辦公樓，其抗震設(shè)防標(biāo)準(zhǔn)與3.1節(jié)相同，將質(zhì)量凝聚在各樓層建立結(jié)構(gòu)的串聯(lián)6自由度非線性模型。該模型使用了不同的恢復(fù)力特性曲線，其結(jié)構(gòu)與恢復(fù)力模型參數(shù)如表4所示，一階自振周期為0.4794 s。與3.1節(jié)相比，使用了相同的地震動(dòng)時(shí)程生成訓(xùn)練集與測(cè)試集，但將滑動(dòng)窗口大小設(shè)置為100，幅值調(diào)整為4 m/s2，采樣間隔為0.05 s。經(jīng)過(guò)時(shí)間窗劃分，訓(xùn)練集包含159 246條數(shù)據(jù)，測(cè)試集包含21 014條數(shù)據(jù)。建立結(jié)構(gòu)對(duì)應(yīng)的LSTM神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程包含2385次迭代，其他參數(shù)與3.1節(jié)相同。

表4 6層框架結(jié)構(gòu)參數(shù)與恢復(fù)力模型Table 4 Parameters and restoring force model of a 6-story frame structure

圖7 例2中4條地震動(dòng)響應(yīng)時(shí)程的預(yù)測(cè)結(jié)果Fig.7 Four prediction results of the seismic response time history in Example 2

4 模型參數(shù)選取原則

前述研究表明了LSTM方法預(yù)測(cè)結(jié)構(gòu)非線性地震響應(yīng)的可行性。在實(shí)際應(yīng)用中，應(yīng)通過(guò)調(diào)節(jié)窗口大小與數(shù)據(jù)集采樣間隔來(lái)調(diào)控輸入模型的信息量以獲得最優(yōu)的預(yù)測(cè)效果。其中，窗口大小控制了信息長(zhǎng)度，以適應(yīng)不同的地震動(dòng)幅值；采樣間隔控制了信息密度，以適應(yīng)不同的建筑結(jié)構(gòu)。本節(jié)對(duì)上述關(guān)系進(jìn)行了詳細(xì)的討論，并給出了相應(yīng)的參數(shù)選取原則。

4.1 窗口大小的選取

窗口大小是LSTM神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)階段的唯一可調(diào)整參數(shù)。窗口大小表示模型在遞推預(yù)測(cè)中的輸入時(shí)間序列長(zhǎng)度，對(duì)預(yù)測(cè)結(jié)果具有顯著影響。直觀地分析，更小的窗口會(huì)因?yàn)楦嗟挠?xùn)練數(shù)據(jù)和更快的訓(xùn)練速度而提高訓(xùn)練效率，但模型更難從短時(shí)間序列中提取到有效信息，降低了預(yù)測(cè)的準(zhǔn)確度。更大的窗口會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)減少和訓(xùn)練速度降低，且同樣會(huì)降低預(yù)測(cè)的準(zhǔn)確度。

訓(xùn)練中還發(fā)現(xiàn)，當(dāng)窗口大小超過(guò)一定的容忍范圍后，預(yù)測(cè)誤差會(huì)隨遞推次數(shù)增加而累計(jì)，導(dǎo)致預(yù)測(cè)結(jié)果的發(fā)散，如圖8所示。發(fā)散現(xiàn)象常常出現(xiàn)在響應(yīng)幅值較小處，可能與輸入序列的約束減弱有關(guān)。因此，需要選取合適的窗口大小以實(shí)現(xiàn)訓(xùn)練效率和準(zhǔn)確度的平衡。經(jīng)過(guò)反復(fù)嘗試，發(fā)現(xiàn)窗口大小在(50，100)范圍內(nèi)可以取得相對(duì)合理的結(jié)果，且具體數(shù)值可依據(jù)輸入地震動(dòng)的峰值加速度(PGA)與結(jié)構(gòu)抗震設(shè)防烈度的關(guān)系來(lái)選取。

圖8 某地震動(dòng)時(shí)程出現(xiàn)的發(fā)散現(xiàn)象Fig.8 The divergence of a certain earthquake time history

為了對(duì)此建議范圍進(jìn)行驗(yàn)證，訓(xùn)練了例1結(jié)構(gòu)的8個(gè)具有不同訓(xùn)練集和窗口大小的LSTM神經(jīng)網(wǎng)絡(luò)模型。命名方式記為M{訓(xùn)練集編號(hào)}-{窗口大小}，如M1-50代表使用train1訓(xùn)練集，窗口大小為50的模型。

訓(xùn)練集與測(cè)試集的選取與第3節(jié)相同，但對(duì)地震動(dòng)進(jìn)行了不同等級(jí)的峰值加速度調(diào)幅以模擬不同的非線性水平。對(duì)于本文使用的7度抗震設(shè)防結(jié)構(gòu)，第一組訓(xùn)練集調(diào)幅為2.5 m /s2，模擬高于設(shè)防烈度的罕遇地震烈度(8度，0.20g)水平，記為train1。第二組訓(xùn)練集調(diào)幅為4 m/s2，模擬遠(yuǎn)高于設(shè)防烈度的極罕遇地震烈度(9度，0.40g)水平，記為train2。相應(yīng)的，兩組測(cè)試集分別記為test1、test2。

表5記錄了所有模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果，指標(biāo)數(shù)值取為測(cè)試集地震動(dòng)預(yù)測(cè)結(jié)果的均值。

由表5可以看出：

表5 窗口大小取值分析的模型評(píng)價(jià)結(jié)果Table 5 Model evaluation results of window size analysis

1) 對(duì)同一組目標(biāo)地震動(dòng)，PGA決定了最優(yōu)預(yù)測(cè)精度：更小的PGA對(duì)應(yīng)更好的預(yù)測(cè)結(jié)果。相同條件下，M1模型的評(píng)價(jià)指標(biāo)均優(yōu)于M2模型。這是因?yàn)橐环矫骐S著PGA提高，響應(yīng)的非線性發(fā)展更加充分，進(jìn)入屈服段的歷程也隨之增加，神經(jīng)網(wǎng)絡(luò)更難以學(xué)習(xí)更復(fù)雜的滯回關(guān)系。另一方面，神經(jīng)網(wǎng)絡(luò)難以捕捉到時(shí)程后半段出現(xiàn)的塑性(殘余)位移量，從而引起WRMSE指標(biāo)的增加。盡管如此，在M2-100模型上，加權(quán)決定系數(shù)指標(biāo)依然保持在0.7以上，且后半段的彈性位移量得到了精確的還原，反映出良好的整體擬合能力。

2) 對(duì)同一結(jié)構(gòu)，各層的預(yù)測(cè)精度相似，具有相近的評(píng)價(jià)指標(biāo)。此外觀察到有量綱指標(biāo)WRMSE會(huì)隨層數(shù)增加而增大，這是由各層位移幅值的量級(jí)不同決定的。

3) 窗口大小取值(50，100)較為合理。M1模型在窗口大小取25、125時(shí)的評(píng)價(jià)指標(biāo)明顯劣于建議范圍內(nèi)的指標(biāo)。通過(guò)觀察時(shí)程可以發(fā)現(xiàn)，M1-125模型的誤差主要來(lái)源于時(shí)程整體的欠擬合，M1-25模型的誤差則主要來(lái)源于時(shí)程后半段的發(fā)散現(xiàn)象，這與上文的分析相符。

4) 模型的最適窗口大小與PGA和結(jié)構(gòu)抗震設(shè)防烈度的關(guān)系有關(guān)：PGA滿足高于設(shè)防烈度的罕遇地震烈度水平時(shí)，窗口大小應(yīng)選取50附近的較小值；PGA滿足高于設(shè)防烈度的極罕遇地震烈度水平時(shí)，窗口大小應(yīng)選取100附近的較大值。M1模型對(duì)應(yīng)于罕遇地震烈度，最適窗口大小為50。M2模型對(duì)應(yīng)于極罕遇地震烈度，最適窗口大小為100。這是由于在更大的PGA下，結(jié)構(gòu)更容易處于屈服后的強(qiáng)化階段，響應(yīng)的主頻率更低，波形更長(zhǎng)。而神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)是輸入形狀特征與物理機(jī)制共同作用的結(jié)果，因此需要增加窗口大小以獲取足夠的輸入信息。

4.2 數(shù)據(jù)集采樣間隔的選取

現(xiàn)代地震動(dòng)觀測(cè)儀器的采樣間隔一般低于0.01 s，因此一條完整的地震動(dòng)時(shí)程可能包含幾千到數(shù)萬(wàn)個(gè)采樣點(diǎn)。對(duì)于LSTM神經(jīng)網(wǎng)絡(luò)，使用原始時(shí)間間隔的地震動(dòng)記錄進(jìn)行訓(xùn)練意味著巨大的參數(shù)量與計(jì)算成本。因此為了盡可能地減少訓(xùn)練時(shí)間，提高輸入序列中的“信息密度”，需要對(duì)地震動(dòng)及其響應(yīng)時(shí)程進(jìn)行下采樣。

對(duì)于不同結(jié)構(gòu)的響應(yīng)時(shí)程預(yù)測(cè)，應(yīng)采用不同的下采樣間隔。采樣間隔 Δt的選取需要滿足以下兩個(gè)原則：1) 減少下采樣造成的峰值響應(yīng)損失，即采樣間隔小值優(yōu)先；2) 采樣間隔應(yīng)與建筑結(jié)構(gòu)自身特性有關(guān)，即結(jié)構(gòu)的自振周期越大，響應(yīng)振動(dòng)的波長(zhǎng)越大，需要的采樣間隔越大。采樣間隔Δt的選取可表示為：

式中，T1表示結(jié)構(gòu)的基本周期。

為了驗(yàn)證其合理性，對(duì)兩個(gè)結(jié)構(gòu)在不同數(shù)據(jù)集下的結(jié)構(gòu)響應(yīng)時(shí)程進(jìn)行了傅里葉變換并計(jì)算其平均主周期，結(jié)果如表6所示。觀察發(fā)現(xiàn)地震動(dòng)幅值與結(jié)構(gòu)特性均對(duì)響應(yīng)時(shí)程的波長(zhǎng)具有明顯影響。對(duì)于地震動(dòng)數(shù)據(jù)集，隨著PGA增大，響應(yīng)時(shí)程主周期(或波長(zhǎng))小幅增加，這與4.1節(jié)的分析相符。對(duì)于結(jié)構(gòu)特性，結(jié)構(gòu)基本周期與線性響應(yīng)時(shí)程主周期基本相同，由此可以證明結(jié)構(gòu)的基本周期可以作為響應(yīng)時(shí)程采樣間隔的控制因素。第3節(jié)中兩個(gè)框架結(jié)構(gòu)的基本周期分別為0.7533 s、0.4794 s，相應(yīng)的采樣間隔分別為0.07 s、0.05 s，滿足式(13)且與小值優(yōu)先的原則相符。

表6 不同地震動(dòng)與結(jié)構(gòu)的響應(yīng)主周期Table 6 Response main period under different ground motions and structures

5 模型泛化能力分析

結(jié)構(gòu)的地震響應(yīng)主要受到結(jié)構(gòu)自身動(dòng)力特性與地震動(dòng)特性兩個(gè)因素影響[35 ? 36]。為驗(yàn)證LSTM網(wǎng)絡(luò)模型在不同工況下的泛化能力，本節(jié)設(shè)計(jì)了例1、例2結(jié)構(gòu)下使用不同訓(xùn)練集、測(cè)試集的對(duì)比試驗(yàn)，并給出了不同指標(biāo)下的評(píng)價(jià)結(jié)果。

5.1 地震動(dòng)泛化能力分析

5.1.1 地震動(dòng)頻譜特性

地震動(dòng)頻譜特性顯示了不同頻率分量的強(qiáng)度的分布，反映了地震動(dòng)的動(dòng)力特征。對(duì)于不同頻譜特性的地震動(dòng)，其響應(yīng)預(yù)測(cè)性能可能也會(huì)有所不同。選取了4.1節(jié)中的M1-50模型進(jìn)行測(cè)試，并依據(jù)評(píng)價(jià)指標(biāo)WRMSE和加權(quán)決定系數(shù)對(duì)30條測(cè)試集地震動(dòng)的預(yù)測(cè)結(jié)果進(jìn)行了匯總，如圖9所示(左圖為按指標(biāo)數(shù)值升序排序后的分布，右圖直方圖分布)。

圖9 M1-50模型的測(cè)試集預(yù)測(cè)結(jié)果分布Fig.9 Distribution of prediction results of the test set of the M1-50 model

在30條測(cè)試集地震動(dòng)中，WRMSE指標(biāo)最低的3條地震動(dòng)編號(hào)為25、17、0，最高的3條地震動(dòng)編號(hào)為18、16、15，對(duì)應(yīng)地震動(dòng)的傅里葉幅值譜與加速度時(shí)程如圖10所示。

圖10 代表性地震動(dòng)的傅里葉幅值譜與加速度時(shí)程Fig.10 Fourier amplitude spectrum and acceleration time history of representative ground motions

對(duì)兩組結(jié)果進(jìn)行對(duì)比：在頻域上，第一組地震動(dòng)相比第二組具有較少的低頻(低于1 Hz)成分，呈現(xiàn)出典型的地震動(dòng)頻譜分布特征。在時(shí)域上，第二組地震動(dòng)由于幅值與頻率變化表現(xiàn)出的非線性更加明顯。此外，發(fā)現(xiàn)訓(xùn)練集地震動(dòng)的頻譜特征與第一組地震動(dòng)更為吻合，由此可以從數(shù)據(jù)不平衡分布的角度解釋不同地震動(dòng)間預(yù)測(cè)性能的差異，同時(shí)可以認(rèn)為：

2) 頻譜分布對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果有重要影響。整體而言，訓(xùn)練與測(cè)試地震動(dòng)頻譜分布的差異反映在訓(xùn)練數(shù)據(jù)分布的不平衡上。非典型頻譜分布地震動(dòng)樣本遠(yuǎn)遠(yuǎn)少于典型樣本，難以被神經(jīng)網(wǎng)絡(luò)充分學(xué)習(xí)，從而造成預(yù)測(cè)結(jié)果準(zhǔn)確性偏低。

3) 低頻段頻譜分布是最為明顯的影響因素。具體而言，低頻段幅值越高，地震動(dòng)在時(shí)程上越容易出現(xiàn)造成局部幅值偏移的低頻波，增加了非線性變化的復(fù)雜程度和預(yù)測(cè)難度。?

圖11 濾波前后16號(hào)地震動(dòng)預(yù)測(cè)結(jié)果對(duì)比Fig.11 Comparison of prediction results of No. 16 ground motion before and after filtering

5.1.2 地震動(dòng)幅值

在模型的實(shí)際應(yīng)用中，預(yù)測(cè)目標(biāo)地震動(dòng)可能并不局限于同一PGA，而是根據(jù)抗震設(shè)防等級(jí)進(jìn)行不同程度的調(diào)幅，因此需要考慮模型在非目標(biāo)峰值地震動(dòng)上的預(yù)測(cè)性能。

訓(xùn)練集與測(cè)試集的選取與第3節(jié)相同，但對(duì)地震動(dòng)進(jìn)行了不同等級(jí)的峰值加速度調(diào)幅。第一組訓(xùn)練集調(diào)幅為2.5 m/s2，記為train1。第二組訓(xùn)練集調(diào)幅為4 m /s2，記為train2。將前兩組訓(xùn)練集合并得到復(fù)合訓(xùn)練集，記為train3。同理，調(diào)幅得到了測(cè)試集test1、test2。

表7記錄了4個(gè)LSTM神經(jīng)網(wǎng)絡(luò)模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果。采用的指標(biāo)包括WRMSE、Pearson相關(guān)系數(shù)、R2w和峰值百分誤差，指標(biāo)數(shù)值取為測(cè)試集所有地震動(dòng)結(jié)果的均值。

表7 地震動(dòng)泛化能力分析的模型評(píng)價(jià)結(jié)果Table 7 Model evaluation results of earthquake generalization ability analysis

由表7可以看出：

1) LSTM神經(jīng)網(wǎng)絡(luò)對(duì)地震動(dòng)幅值的變異具有良好的泛化能力。當(dāng)窗口大小合適時(shí)，對(duì)非目標(biāo)峰值地震動(dòng)進(jìn)行預(yù)測(cè)仍然可以得到相對(duì)優(yōu)秀的結(jié)果，如M1-100在test2上仍然具有0.7707的加權(quán)決定系數(shù)，優(yōu)于M2-100。這可能是由于train2訓(xùn)練集中的響應(yīng)具有更大的塑性位移，干擾了模型對(duì)滯回特征的學(xué)習(xí)。

2) 目標(biāo)地震動(dòng)峰值水平較高時(shí)，使用不同幅值的復(fù)合訓(xùn)練集可以得到更優(yōu)秀的模型。M3-100相比M2-100在test2的各個(gè)指標(biāo)上都得到了一定程度的提高，尤其是WRMSE和峰值百分誤差分別為0.0126 m、11.31%，達(dá)到了所有模型中的最優(yōu)水平。這是因?yàn)閺?fù)合訓(xùn)練集增加了數(shù)據(jù)量，減少了訓(xùn)練中的過(guò)擬合，使訓(xùn)練損失得以下降至更低。

3) 通常情況下，可以考慮使用峰值水平較低的訓(xùn)練集進(jìn)行訓(xùn)練。一方面，低峰值水平響應(yīng)的塑性位移通常更小，即誤差干擾更小，模型更容易學(xué)習(xí)到結(jié)構(gòu)的滯回特性。另一方面，調(diào)試和訓(xùn)練時(shí)間相比復(fù)合訓(xùn)練集更短，易于應(yīng)用。

5.2 結(jié)構(gòu)模型泛化能力分析

為驗(yàn)證LSTM網(wǎng)絡(luò)模型在不同結(jié)構(gòu)上的預(yù)測(cè)能力與規(guī)律，基于第3節(jié)中的6層框架結(jié)構(gòu)設(shè)計(jì)了單獨(dú)的模型對(duì)比試驗(yàn)。表8記錄了所有模型的基本信息及其在不同測(cè)試集上的評(píng)價(jià)結(jié)果。

表8 結(jié)構(gòu)模型泛化能力分析的模型評(píng)價(jià)結(jié)果Table 8 Model evaluation results of structural model generalization ability analysis

由表8可知，6層框架結(jié)構(gòu)預(yù)測(cè)結(jié)果與2.2節(jié)、2.3節(jié)中的結(jié)論完全相符，但整體準(zhǔn)確度更高。這是由于使用了較小采樣間隔，數(shù)據(jù)集具有更低的采樣損失。

6 結(jié)論

本文提出了一種使用滑動(dòng)時(shí)間窗的非線性結(jié)構(gòu)地震響應(yīng)的LSTM預(yù)測(cè)模型，并在框架結(jié)構(gòu)上進(jìn)行了驗(yàn)證，給出了面向?qū)嶋H應(yīng)用的超參數(shù)選取原則。研究結(jié)果表明：

(1) LSTM可以準(zhǔn)確預(yù)測(cè)地震作用下框架結(jié)構(gòu)的非線性結(jié)構(gòu)響應(yīng)，引入滑動(dòng)時(shí)間窗遞推預(yù)測(cè)，解決了此前研究中地震動(dòng)時(shí)程必須固定長(zhǎng)度以及數(shù)據(jù)集必須預(yù)處理的問(wèn)題。由于神經(jīng)網(wǎng)絡(luò)算法適合分布式云部署的特點(diǎn)，該方法更加適用于城市地震響應(yīng)快速模擬等傳統(tǒng)方法受限的邊緣計(jì)算場(chǎng)景。

(2) 預(yù)測(cè)模型具有良好的泛化能力，對(duì)于變化的地震動(dòng)幅值、地震動(dòng)頻譜與結(jié)構(gòu)，均可以獲得較高的準(zhǔn)確度。

(3) 預(yù)測(cè)模型具有簡(jiǎn)單通用的結(jié)構(gòu)。根據(jù)需求，僅改變窗口大小參數(shù)便可適用于不同數(shù)據(jù)集，極大地降低了調(diào)試計(jì)算成本。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡