董長甜, 任天唯, 賢亮鵬
(1. 西南交通大學(xué)風(fēng)工程試驗(yàn)研究中心,四川成都610031; 2. 風(fēng)工程四川省重點(diǎn)實(shí)驗(yàn)室,四川成都610031)
近年來,建造于山區(qū)峽谷地區(qū)的大跨度橋梁等風(fēng)敏感性基礎(chǔ)設(shè)施逐漸增多,例如湘西矮寨大橋[1]、鄂西山區(qū)四渡河大橋和貴州北盤江大橋[2]等。然而,由于復(fù)雜的地理環(huán)境,山區(qū)峽谷橋址區(qū)的風(fēng)環(huán)境極為惡 劣[3],這便導(dǎo)致了風(fēng)致車輛事故、基礎(chǔ)設(shè)施結(jié)構(gòu)損壞事件的逐年增加,同時也給橋梁結(jié)構(gòu)施工安全性造成威脅。為保證橋梁在施工階段和服役階段的安全性,并對橋址區(qū)風(fēng)環(huán)境有更為深入的掌握,目前大多數(shù)山區(qū)峽谷地區(qū)大跨度橋梁均安裝有結(jié)構(gòu)健康監(jiān)測系統(tǒng)(Structure Health Monitor system, SHM system)。SHM為結(jié)構(gòu)健康評估和安全性監(jiān)測提供了大量寶貴的實(shí)測數(shù)據(jù),目前開展了大量的基于SHM的橋梁健康監(jiān)測研究[4]。同時,SHM為建立可靠且精準(zhǔn)的橋址區(qū)短期大風(fēng)預(yù)警系統(tǒng)提供了可能。然而,山區(qū)峽谷地區(qū)的風(fēng)速波動性較大,且非平穩(wěn)性較強(qiáng),如何進(jìn)行精準(zhǔn)的風(fēng)速預(yù)測仍然是一個極大的挑戰(zhàn)。
為建立可靠實(shí)用的橋梁大風(fēng)預(yù)警系統(tǒng),全方位掌握該橋址區(qū)風(fēng)特性是必不可少的。然而,影響來流風(fēng)速的因素較多,例如:高聳的山體結(jié)構(gòu)、大氣壓力變化、天氣變化等,這也為精準(zhǔn)預(yù)測風(fēng)速帶來了巨大的困難。目前,圍繞短期風(fēng)速預(yù)測展開的研究方法主要包括:物理方法[5]、統(tǒng)計學(xué)方法[6]、智能算法[7]等。其中,由于智能算法具有學(xué)習(xí)能力強(qiáng)、預(yù)測效果好、適用范圍廣等特點(diǎn),越來越多的學(xué)者開始著手于人工智能方法在短期風(fēng)速預(yù)測方面的研究[8-9]。特別地,基于信號分解技術(shù)和智能算法的組合模型在該問題上表現(xiàn)優(yōu)異[10],其主要思路為:基于小波變換(Wavelet Transform, WT)、經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)或變分模態(tài)分解(Variational Mode Decomposition,VMD)的信號分解技術(shù)將已獲得的風(fēng)速序列進(jìn)行分解,再將風(fēng)速子序列分別進(jìn)行智能算法模型構(gòu)建并疊加,得到最終的風(fēng)速預(yù)測值[11]。
短期風(fēng)速預(yù)測的問題本質(zhì)在于時間序列模型的構(gòu)建,這在多個領(lǐng)域均有較為成熟的研究[12-13]。該問題的研究難點(diǎn)在于如何挖掘隱含在前序時間序列當(dāng)中的規(guī)律和特征,并對其進(jìn)行模型建立。諸多關(guān)于時序建模的算法均表現(xiàn)出較好的性能,然而針對不同的問題需要對模型進(jìn)行比較和篩選,從而有效地將模型應(yīng)用到實(shí)際工程當(dāng)中。目前絕大多數(shù)短期風(fēng)速預(yù)測的研究圍繞于風(fēng)電場[5,8,14],而對于橋址區(qū)風(fēng)速預(yù)測的問題研究較少[9-15]。本文旨在建立一套可以精準(zhǔn)預(yù)測風(fēng)速的橋梁大風(fēng)預(yù)警系統(tǒng),首先利用EMD信號分解技術(shù)將SHM獲得的海量風(fēng)速數(shù)據(jù)進(jìn)行時序分解,并對子序列利用神經(jīng)網(wǎng)絡(luò)進(jìn)行時序建模。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)能夠?qū)颖局须[藏的關(guān)鍵信息進(jìn)行深度提取,且在圖像處理、視頻處理、時序信號建模等問題上表現(xiàn)優(yōu)異。然而,目前絕大多數(shù)研究均是利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像等二維信息的處理,對于時間序列、尤其是短期風(fēng)速預(yù)測的研究較少。本文結(jié)合EMD算法和卷積神經(jīng)網(wǎng)絡(luò),提出可以精準(zhǔn)預(yù)測橋址區(qū)風(fēng)速的EMD-CNN組合模型。利用某座山區(qū)峽谷大跨度橋梁長年實(shí)時監(jiān)測的風(fēng)速數(shù)據(jù)進(jìn)行模型驗(yàn)證,其結(jié)果表明該模型具有較好的預(yù)測性能。相較于差分自回歸移動平均模型(ARIMA)、支持向量機(jī)模型(SVM)、Elman神經(jīng)網(wǎng)絡(luò)和未經(jīng)過信號分解的卷積神經(jīng)網(wǎng)絡(luò)模型,該方法在多步短期風(fēng)速預(yù)測的精度上均有較大的優(yōu)勢。本文的結(jié)果可推廣至其他山區(qū)峽谷地區(qū)橋梁的短期風(fēng)速預(yù)測問題當(dāng)中,可為大跨度橋梁防災(zāi)減災(zāi)及大風(fēng)預(yù)警系統(tǒng)的建立提供參考。
考慮到山區(qū)峽谷地區(qū)風(fēng)速的非平穩(wěn)性,引入信號分解技術(shù)可對非平穩(wěn)風(fēng)進(jìn)行平穩(wěn)化處理,由此可對風(fēng)速時序信號進(jìn)行初步的信息提取。經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)被廣泛應(yīng)用于信號時頻域分析當(dāng)中,相比于被廣泛使用在信號處理領(lǐng)域的小波分析方法而言,EMD克服了基函數(shù)無自適應(yīng)性的問題,且無需過多的預(yù)先分析和干預(yù)。EMD方法在理論上可以應(yīng)用于任何類型的時間序列分解,因而在處理非平穩(wěn)及非線性時序信號問題上,相較于其他的平穩(wěn)化方法更具優(yōu)勢。EMD方法的核心思想是將時間序列分解成一系列本征模態(tài)函數(shù)(Intrinsic Mode Functions, IMF)。判斷是否為IMF需滿足2個基本條件:
(1) 在整個數(shù)據(jù)段內(nèi),極值點(diǎn)的個數(shù)和過零點(diǎn)的個數(shù)必須相等或相差最多不超過一個。
(2)在任意時刻,由局部極大值點(diǎn)和極小值點(diǎn)形成的上包絡(luò)線和下包絡(luò)線的平均值為零,即上、下包絡(luò)線相對于時間軸局部對稱。
本征模態(tài)函數(shù)各個分量包含了原始信號的不同時間尺度的局部特征信息,故EMD方法初步實(shí)現(xiàn)了風(fēng)速的信息提取。具體地,實(shí)現(xiàn)EMD方法的主要步驟為:
(1) 對于原始信號S(t),找出其信號上所有的極大值點(diǎn),并用三次樣條插值函數(shù)擬合形成原數(shù)據(jù)的上包絡(luò)線。
(2) 同樣地,找出所有的極小值點(diǎn),并將所有的極小值點(diǎn)通過三次樣條插值函數(shù)擬合形成原數(shù)據(jù)的下包絡(luò)線。
(3) 求解上包絡(luò)線和下包絡(luò)線的平均值,記作m1,并利用S(t)-m1獲取第一個中間信號h1。
(4) 判斷h1是否滿足本征模態(tài)函數(shù)的要求。若滿足,則標(biāo)記為IMF1;若不滿足,重復(fù)(1)~(3)。
(5) 用原始信號S(t)減去IMF1,作為新的原始信號,再通過(1)~(4),即可得到IMF2。
(6) 重復(fù)以上步驟,即可完成EMD信號分解。
基于以上步驟,原始信號最終可分解成式(1)。
(1)
其中,n為本征模態(tài)函數(shù)的個數(shù),fn+1為最終的趨勢函數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種用于引入卷積核的處理多維輸入信息的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。CNN具有表征學(xué)習(xí)能力,能夠按照其階層結(jié)構(gòu)對輸入信息進(jìn)行平移不變分類。CNN的提出來源于生物的視知覺機(jī)制,卷積核相當(dāng)于視覺神經(jīng)的感受野(Receptive field),故CNN相較于普通的全連接神經(jīng)網(wǎng)絡(luò)而言,其卷積操作可以大幅度降低神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)當(dāng)中的參數(shù),一方面可以挖掘出包含在輸入樣本當(dāng)中潛在的信息,另一方面可降低模型復(fù)雜度、加快神經(jīng)網(wǎng)絡(luò)收斂速度。由于風(fēng)速序列屬于一維信號,故本文采用一維卷積神經(jīng)網(wǎng)絡(luò)。在信號處理領(lǐng)域,一維卷積常用于信號延遲累積計算,其中的信號衰減率可類比于卷積神經(jīng)網(wǎng)絡(luò)中的濾波器或者卷積核。
假設(shè)存在信號序列S(t),則一維卷積操作可定義為式(2)。
S′(t)=S(t)?w
(2)
其中,w=ω1,ω2,…,ωk為卷積核,k為序列長度,?為卷積操作,可展開為式(3)。
(3)
一維卷積操作如圖1所示。
圖1 一維卷積操作示意
與數(shù)學(xué)領(lǐng)域常用的卷積計算不同的是,卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作不進(jìn)行信號的翻轉(zhuǎn),其原因 是卷積操作主要目的在于特征提取,其信號抽取能力與信號是否翻轉(zhuǎn)無關(guān)。卷積核的步長(stride)是指卷積核在滑動時的步長間隔,且信號常在兩端進(jìn)行補(bǔ)零以保證卷積操作后的信號S′(t)長度與原信號S(t)相等。假設(shè)卷積層的輸入神經(jīng)元個數(shù)為n,卷積核大小為m,步長為s,輸入神經(jīng)元兩端各填補(bǔ)p個0,那么輸出的神經(jīng)元數(shù)量為式(4)。
(n-m+2p)/s+1
(4)
通常地,卷積層之后一般連接一個非線性激活函數(shù)用以對特征值進(jìn)行非線性變化。常用的激活函數(shù)sigmoid(·)、tanh(·)和ReLu(·)表示如式(5)~(7)。另一方面,為了對輸入特征進(jìn)行選擇,降低特征數(shù)量,并減少參數(shù)數(shù)量,常常在卷積層之后添加一個池化層(Pooling layer)。常用的采樣操作包括最大池化和平均池化,最大池化即只取某一區(qū)域最大值,平均池化為取某一區(qū)域的平均值。
(5)
(6)
ReLU(x)=max(0,x)
(7)
在進(jìn)行卷積操作之后,可將特征壓縮至一維并連接一個全連接層,即可得到目標(biāo)輸出,其數(shù)學(xué)運(yùn)算可表示為式(8)。
yi=Wy·ht+b
(8)
其中,Wy和b分別表示全連接層的權(quán)重和偏置項。
通常,單層卷積操作無法深度挖掘時間序列隱藏的信息,一般的做法是增加多個隱藏層并配合非線性激活函數(shù)和采樣層。最終的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可通過鏈?zhǔn)椒▌t進(jìn)行梯度計算并通過反向傳播算法(Backpropagation)進(jìn)行訓(xùn)練,得到最優(yōu)的短期風(fēng)速預(yù)測模型。另一方面,為實(shí)現(xiàn)短期風(fēng)速的多步預(yù)測,可增加Wy矩陣維度,用以輸出多個維度的目標(biāo)值,即可滿足多步預(yù)測問題。
通常情況下,未進(jìn)行信號預(yù)分解的一維卷積神經(jīng)網(wǎng)絡(luò)即可實(shí)現(xiàn)短期風(fēng)速預(yù)測。然而,考慮到橋址區(qū)域風(fēng)環(huán)境的復(fù)雜性和風(fēng)速的非平穩(wěn)特性,精準(zhǔn)預(yù)測未來的來流風(fēng)速較為困難?;诖?本文提出一種EMD-CNN組合預(yù)測模型,其預(yù)測流程如圖2所示。具體地,可概括為幾個步驟:
圖2 橋址區(qū)風(fēng)速預(yù)測EMD-CNN模型
(1) 將已有風(fēng)速時程進(jìn)行EMD分解,得到多個子序列IMF1,IMF2,…,IMFi和趨勢函數(shù)rn+1。
(2) 針對步驟(1)中得到的n+1個子序列,基于一維卷積神經(jīng)網(wǎng)絡(luò)建立n+1個多步預(yù)測模型。
(3) 將步驟(2)中得到的所有子序列的預(yù)測值進(jìn)行累加計算,得到最終的預(yù)測結(jié)果。
本次研究的數(shù)據(jù)來源于我國西南地區(qū)某座山區(qū)峽谷橋梁SHM系統(tǒng)長年監(jiān)測的實(shí)測風(fēng)速數(shù)據(jù)。該橋地處我國西南地區(qū)康滇地帶的東部邊緣,氣象條件復(fù)雜,經(jīng)常遭受暴雨、暴雪、寒潮、凝凍、霜凍、大霧、秋綿雨、干旱等氣象災(zāi)害的影響,后期運(yùn)營養(yǎng)護(hù)期的管理問題突出。為了實(shí)時掌控大橋的安全使用狀態(tài)和損傷發(fā)展趨勢,該橋安裝有SHM系統(tǒng)。主梁及橋塔上安裝有超聲波風(fēng)速儀,可實(shí)時監(jiān)測和記錄該橋址區(qū)的風(fēng)速時程數(shù)據(jù)。超聲波風(fēng)速儀的采樣頻率為1 000 Hz,可采集來流風(fēng)速和風(fēng)向角。本次研究選取2019年9月末至12月末所采集的每30 min風(fēng)速數(shù)據(jù)(即以30 min作風(fēng)速平均)。圖3給出了所選取的風(fēng)速數(shù)據(jù)時程圖。選取的數(shù)據(jù)總長度為4 009,單獨(dú)劃分最后20%、即長度為802的風(fēng)速數(shù)據(jù)作為測試集,其余數(shù)據(jù)作為訓(xùn)練集(長度為3 207)。即:訓(xùn)練集用來訓(xùn)練預(yù)測模型,測試集用以評估最終模型的預(yù)測效果。圖4給出了訓(xùn)練集EMD分解示例,可以看出,原始風(fēng)速數(shù)據(jù)被分解成10個IMF分量和1個殘差分量。
圖3 某大跨橋梁區(qū)域2019年實(shí)測風(fēng)速時程(平均30 min)
圖4 訓(xùn)練集數(shù)據(jù)EMD分解結(jié)果示例
本次模型基于Pytorch深度學(xué)習(xí)框架構(gòu)建。Pytorch是一個開源的Python機(jī)器學(xué)習(xí)庫,由Facebook人工智能研究院基于Torch推出。相比于TensorFlow框架,Pytorch具有強(qiáng)大的GPU加速的張量計算,且支持動態(tài)神經(jīng)網(wǎng)絡(luò)。本文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)采用一維卷積操作,網(wǎng)絡(luò)包含2個卷積層,濾波器數(shù)量作為超參數(shù)進(jìn)行優(yōu)化,每個卷積層后連接池化層,并利用激活函數(shù)進(jìn)行非線性變換,池化層選擇最大池化方式,網(wǎng)絡(luò)最后連接一個全連接層以輸出目標(biāo)值。構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)如圖5所示。訓(xùn)練集數(shù)據(jù)以長度i進(jìn)行單步平滑移動,以序列尾端第1,2,…,j個時間點(diǎn)的風(fēng)速為目標(biāo)輸出,即可實(shí)現(xiàn)單步或多步風(fēng)速預(yù)測,具體的實(shí)時分解策略和滑動窗口預(yù)測疊加策略如圖6所示。卷積神經(jīng)網(wǎng)絡(luò)以Batch-size大小的小批量數(shù)據(jù)進(jìn)行分批訓(xùn)練,并利用窮舉搜索法對模型當(dāng)中的超參數(shù)進(jìn)行優(yōu)化調(diào)整,具體的參數(shù)搜索空間如表1所示。
表1 超參數(shù)搜索空間
圖5 構(gòu)建的深度一維卷積神經(jīng)網(wǎng)絡(luò)
圖6 單步風(fēng)速實(shí)時EMD分解和CNN預(yù)測示意
為驗(yàn)證本文提出的組合預(yù)測模型的最終性能,且考慮到本研究屬于典型的回歸問題,故采用如下4種常用的統(tǒng)計學(xué)誤差評價指標(biāo),包括平均絕對誤差(Mean Absolute Error, MAE),平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE),均方根誤差(Root Mean Square Error, RMSE)和決定系數(shù)(Coefficient of Determination,R2)見式(1)~式(4)。
(1)
(2)
(3)
(4)
基于本文提出的EMD-CNN組合模型,本文進(jìn)行了1-step、2-step和3-step風(fēng)速預(yù)測,并與ARIMA、SVM和CNN模型預(yù)測結(jié)果進(jìn)行比較,結(jié)果如圖7所示,其相應(yīng)的預(yù)測結(jié)果誤差評價如表2所示。
表2 不同模型多步預(yù)測誤差結(jié)果
圖7 不同模型的風(fēng)速多步預(yù)測值
由表2和圖7的結(jié)果可以看出,比較模型(ARIMA,SVM和CNN)和本文提出的EMD-CNN模型在短期風(fēng)速預(yù)測的問題上表現(xiàn)性能各異,但結(jié)果均較好。隨著預(yù)測步長的增大,不同模型的預(yù)測性能逐漸降低。相較于智能算法(SVM和
CNN)以及融合了智能算法的EMD-CNN模型而言,基于統(tǒng)計學(xué)方法的ARIMA模型較差,究其原因在于該方法無法深度挖掘非平穩(wěn)風(fēng)潛在的演化特征。對于智能算法而言,SVM模型和CNN模型在測試集上的預(yù)測結(jié)果相當(dāng)。相較于3種比較模型而言,本文提出的EMD-CNN模型在單步和多步風(fēng)速預(yù)測問題上效果顯著,各方面評價指標(biāo)均優(yōu)于其他3種模型。由此可見,將EMD技術(shù)融入到基于深度卷積神經(jīng)網(wǎng)絡(luò)的智能算法中,可以較好地挖掘非平穩(wěn)風(fēng)的演化特征,降低非平穩(wěn)性給多步風(fēng)速預(yù)測問題帶來的困難。
本文基于我國西南地區(qū)某座山區(qū)峽谷大跨度橋梁結(jié)構(gòu)健康監(jiān)測系統(tǒng)的2019年實(shí)測風(fēng)速數(shù)據(jù),對橋址區(qū)大風(fēng)預(yù)警系統(tǒng)建立過程中核心的短期風(fēng)速預(yù)測問題進(jìn)行了研究?;谛盘柼幚眍I(lǐng)域的EMD信號分解技術(shù)和人工智能領(lǐng)域的一維卷積神經(jīng)網(wǎng)絡(luò)模型,本文提出了EMD-CNN短期風(fēng)速預(yù)測模型。該模型以實(shí)測風(fēng)速數(shù)據(jù)進(jìn)行模型訓(xùn)練,并單獨(dú)劃分測試集風(fēng)速數(shù)據(jù)進(jìn)行模型的性能測試和誤差評價,并將預(yù)測結(jié)果與差分自回歸移動平均模型(ARIMA)、支持向量機(jī)模型(SVM)和未經(jīng)過信號分解的卷積神經(jīng)網(wǎng)絡(luò)模型作對比,可得出結(jié)論:
(1)基于統(tǒng)計學(xué)方法的ARIMA模型在單步和多步風(fēng)速預(yù)測問題上的表現(xiàn)顯著弱于基于智能算法的SVM、CNN和EMD-CNN等預(yù)測模型。
(2)SVM和CNN模型表現(xiàn)性能較為良好,可以說明智能算法在短期風(fēng)速預(yù)測問題上的有效性。
(3)結(jié)合EMD經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)的EMD-CNN智能組合模型在各評價指標(biāo)的結(jié)果上均由于其他3種模型,由此可以說明,該模型可應(yīng)用于橋址區(qū)大風(fēng)預(yù)警系統(tǒng)的建立當(dāng)中。