尚凡成, 李傳慶,2, 詹 可, 朱仁傳
(1.上海交通大學(xué) 海洋工程國家重點(diǎn)實(shí)驗(yàn)室; 船舶海洋與建筑工程學(xué)院,上海 200240;2.上海船舶運(yùn)輸科學(xué)研究所 航運(yùn)技術(shù)與安全國家重點(diǎn)實(shí)驗(yàn)室,上海 200135)
在實(shí)際海洋環(huán)境中,船海工程結(jié)構(gòu)物由于受到海洋風(fēng)、浪、流等環(huán)境因素的作用,會(huì)不斷產(chǎn)生六自由度搖蕩運(yùn)動(dòng),而劇烈的搖蕩運(yùn)動(dòng)對船舶海上作業(yè)產(chǎn)生一系列有害影響,包括對工作效率、安全性和船體結(jié)構(gòu)、各種裝備的影響等[1].如能在艦載機(jī)起飛和水下潛水器回收等船海結(jié)構(gòu)物作業(yè)場景中提前預(yù)知船舶運(yùn)動(dòng),給操作員提供輔助信息可以降低事故發(fā)生概率,提高作業(yè)能力和安全性.極短期預(yù)報(bào)利用船舶當(dāng)前或過去的運(yùn)動(dòng)狀態(tài)和某些己知的外部條件,使用某種方法來預(yù)測未來一段時(shí)間內(nèi)船舶運(yùn)動(dòng)狀態(tài)[2],以此為船舶海上航行以及海上任務(wù)作業(yè)提供控制輸入和輔助決策信息,進(jìn)而提高船舶在惡劣海況下的海上作業(yè)能力.
極短期預(yù)報(bào)具有實(shí)時(shí)性、不確定性的特點(diǎn),通常基于波浪或者船舶運(yùn)動(dòng)歷史的時(shí)歷數(shù)據(jù),使用時(shí)間序列分析方法對未來一段時(shí)期的波高或船舶運(yùn)動(dòng)姿態(tài)進(jìn)行預(yù)報(bào).20世紀(jì)80年代左右,經(jīng)典的自回歸模型等時(shí)間序列建模方法開始被廣泛用于波浪和船舶運(yùn)動(dòng)運(yùn)動(dòng)預(yù)報(bào)[3],這些傳統(tǒng)時(shí)序分析計(jì)算量比較小,但主要針對線性系統(tǒng),對非線性較強(qiáng)的系統(tǒng)預(yù)報(bào)結(jié)果不佳,具有很大局限性.
隨著人工智能技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)方法日趨成熟,因其可以任意精度逼近任意的非線性函數(shù),擬合能力較強(qiáng),所以逐漸受到研究者的關(guān)注.目前在時(shí)序分析中應(yīng)用較為廣泛的是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其一系列變體,特別是長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò),通過引入門控單元實(shí)現(xiàn)了長期記憶能力[4],預(yù)報(bào)效果較好.2016年Duan等[5]將經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)與支持向量機(jī)回歸結(jié)合對顯著波高進(jìn)行了預(yù)測研究.2017年Li等[6]使用具有外部輸入的非線性自回歸(NARX)神經(jīng)網(wǎng)絡(luò)對船舶運(yùn)動(dòng)進(jìn)行了單步與多步時(shí)序預(yù)測.2019年劉煜城[2]、2020年張彪等[7]使用RNN對船舶運(yùn)動(dòng)姿態(tài)進(jìn)行了預(yù)報(bào)研究.但上述研究大多仍局限在原有理論框架,往往使用單一神經(jīng)網(wǎng)絡(luò)模型,并且沒有充分利用諸如頻譜特征等已知信息,因此預(yù)報(bào)精度受限.而隨著神經(jīng)網(wǎng)絡(luò)理論的發(fā)展,開始出現(xiàn)第三代人工智能概念[8],注重知識(shí)、數(shù)據(jù)、算法、算力的融合,強(qiáng)調(diào)先驗(yàn)知識(shí)與基本物理定律的重要性.
神經(jīng)網(wǎng)絡(luò)是一種通用的問題處理框架,其在各個(gè)細(xì)分領(lǐng)域上取得較好效果離不開與該領(lǐng)域?qū)<抑R(shí)的融合.另外神經(jīng)網(wǎng)絡(luò)是一個(gè)典型的“黑箱模型”,通過融合專業(yè)知識(shí)有助于進(jìn)一步加深對神經(jīng)網(wǎng)絡(luò)底層原理的認(rèn)識(shí),同時(shí)有助于提高網(wǎng)絡(luò)泛化性.隨機(jī)海浪仍符合一定的統(tǒng)計(jì)規(guī)律,特定海區(qū)的隨機(jī)波浪往往具有穩(wěn)定的頻譜特性.在波浪和船舶運(yùn)動(dòng)姿態(tài)預(yù)測中,頻譜特性可以發(fā)揮更為重要的作用,值得探索時(shí)頻域結(jié)合的極短期預(yù)報(bào)模型.本文受生成式對抗思想的啟發(fā),提出一種改進(jìn)的LSTM神經(jīng)網(wǎng)絡(luò)架構(gòu),借助生成式對抗神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)增強(qiáng)能力,將波浪的頻譜特性反饋至LSTM神經(jīng)網(wǎng)絡(luò),通過融合頻域領(lǐng)域先驗(yàn)知識(shí),增強(qiáng)了神經(jīng)網(wǎng)絡(luò)對頻譜特性的捕捉能力,成功實(shí)現(xiàn)了時(shí)域、頻域信息耦合預(yù)報(bào).同時(shí)該改進(jìn)也可視為在原有LSTM模型的損失函數(shù)中加入正則化項(xiàng),可有效防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練中過擬合,提高模型泛化性.另外對頻域信息的學(xué)習(xí)也便于去除神經(jīng)網(wǎng)絡(luò)由于偶然誤差或其他原因產(chǎn)生的高頻噪聲分量,保證了神經(jīng)網(wǎng)絡(luò)輸出的預(yù)報(bào)準(zhǔn)確性.實(shí)驗(yàn)表明,該模型在波浪極短期時(shí)序預(yù)報(bào)上優(yōu)于傳統(tǒng)預(yù)報(bào)方法和原始LSTM神經(jīng)網(wǎng)絡(luò)架構(gòu),具有較高的實(shí)用價(jià)值.
LSTM神經(jīng)網(wǎng)絡(luò)是RNN的一個(gè)變體,可以有效解決簡單RNN的梯度爆炸或消失問題,結(jié)構(gòu)如圖1所示.與傳統(tǒng)RNN相比,LSTM網(wǎng)絡(luò)改進(jìn)[9]主要如下.
圖1 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 LSTM neural network
(1) 引入了門控機(jī)制控制信息傳遞的路徑,輸入門i、遺忘門f和輸出門o的狀態(tài)計(jì)算公式為
(1)
式中:σ(·)為Logistic函數(shù);輸出區(qū)間為(0,1);h為神經(jīng)網(wǎng)絡(luò)隱藏層的外部狀態(tài);ht-1為上一時(shí)刻的隱藏層外部狀態(tài);xt為當(dāng)前時(shí)刻的輸入;W為狀態(tài)-輸入權(quán)重矩陣;U為狀態(tài)-狀態(tài)權(quán)重矩陣;b為偏置向量;下標(biāo)i、f和o分別對應(yīng)相應(yīng)的門控單元.
(2) 引入一個(gè)新的內(nèi)部狀態(tài)進(jìn)行線性的循環(huán)信息傳遞,同時(shí)輸出信息給隱藏層的內(nèi)部狀態(tài)ct和外部狀態(tài)ht,計(jì)算公式為
(2)
上述門控單元中各權(quán)重矩陣和隱藏狀態(tài)ct、ht在訓(xùn)練過程中不斷更新,使得LSTM神經(jīng)網(wǎng)絡(luò)可以成功學(xué)習(xí)時(shí)序信息中的短期影響和長期規(guī)律,實(shí)現(xiàn)對未來時(shí)刻信息的預(yù)測.
生成式對抗思想的核心思想來源于博弈論的納什均衡[10],由一個(gè)生成器和一個(gè)判別器構(gòu)成,生成器G的目的是盡量學(xué)習(xí)真實(shí)的數(shù)據(jù)分布,而判別器D的目的是盡量正確判別輸入數(shù)據(jù)來自真實(shí)數(shù)據(jù)還是來自生成器[11].為了取得勝利,需要不斷優(yōu)化,提高各自的生成和判別能力,該過程使用目標(biāo)函數(shù)實(shí)現(xiàn).
minGmaxDV(D,G)=Ex~pdata(x)(lnD(x))+
Ez~pz(z)[ln(1-D(G(z)))]
(3)
式中:E為數(shù)據(jù)期望;pdata(x)與pz(z)分別為真實(shí)數(shù)據(jù)與生成數(shù)據(jù)概率分布.
在生成式對抗神經(jīng)網(wǎng)絡(luò)中需要首先固定生成器G,讓判別器D最大概率地分對訓(xùn)練樣本的標(biāo)簽.
maxDV(D,G)=Ex~pdata(x)(lnD(x))+
Ez~pz(z)[ln(1-D(G(z)))]
(4)
隨后需要固定判別器D,生成器G通過式(5)最大化D的損失以迷惑判別器,使生成器G的輸出與真實(shí)數(shù)據(jù)分布趨于相近.
maxGV(D,G)=Ez~pz(z)[ln(1-D(G(z)))]
(5)
生成式對抗神經(jīng)網(wǎng)絡(luò)具有數(shù)據(jù)增強(qiáng)能力.該思想成功實(shí)現(xiàn)了對抗性域適應(yīng)遷移學(xué)習(xí)[12]、不平衡樣本分類[13]等應(yīng)用,說明生成式具有對抗神經(jīng)網(wǎng)絡(luò)強(qiáng)大的信息歸納與生成能力,也證明了該思想與眾多神經(jīng)網(wǎng)絡(luò)架構(gòu)結(jié)合的靈活性.
海浪及船舶運(yùn)動(dòng)通常被視為一種隨機(jī)性過程,可以利用頻譜分析對海浪進(jìn)行統(tǒng)計(jì)意義上的考察.一般將隨機(jī)過程由時(shí)域到頻域的變換稱為隨機(jī)過程譜分析,設(shè)隨機(jī)過程的一個(gè)樣本為x(t),并設(shè)其物理含義為波面函數(shù).使用傅里葉變換直接將上述隨機(jī)過程進(jìn)行時(shí)域與頻域上的轉(zhuǎn)換:
(6)
式中:ω為頻率.
同時(shí)得到譜密度函數(shù):
(7)
式中:T為序列周期.
上述傅里葉變換針對連續(xù)函數(shù),實(shí)際中由于采樣頻率不能無窮小,得到的樣本往往是有限長的離散數(shù)據(jù),所以需要利用離散傅里葉變換方法.采用著名的快速傅里葉(FFT)算法[14]進(jìn)行時(shí)頻轉(zhuǎn)換,該方法認(rèn)為樣本x(t)是由N點(diǎn)構(gòu)成的序列,寫作x(n),n=0,1,…,N-1,對應(yīng)的時(shí)頻轉(zhuǎn)化式為
(8)
式中:k、n分別為對應(yīng)于ω、t的離散變量,k=0,1,…,N-1.可借助W因子的周期性和對稱性,實(shí)現(xiàn)快速時(shí)頻轉(zhuǎn)換.
波浪起伏和船舶搖蕩運(yùn)動(dòng)雖是一個(gè)隨機(jī)性過程,但是通過上述頻譜分析法可以在統(tǒng)計(jì)意義上進(jìn)行考察分析.PM譜、ITTC雙參數(shù)譜、JONSWAP 譜等多種可以近似描述波浪譜的表達(dá)式[1]也證明了海浪雖然在時(shí)域呈現(xiàn)巨大隨機(jī)性,但是在特定風(fēng)速下,特定海區(qū)的頻譜較為穩(wěn)定.圖2為4個(gè)機(jī)構(gòu)對北大西洋海區(qū)有義波高(Hs)出現(xiàn)概率P(Hs)的統(tǒng)計(jì),該統(tǒng)計(jì)說明了在特定海區(qū)中特定波高的出現(xiàn)概率一定.
圖2 北大西洋波高分布Fig.2 Wave height distribution in the North Atlantic
長時(shí)間統(tǒng)計(jì)得到的特定海區(qū)波浪頻譜往往呈現(xiàn)相似特征,能夠反映波浪的真實(shí)分布,其頻域特性反映了波浪的重要特征信息,對極短期預(yù)報(bào)有重要意義.但時(shí)頻轉(zhuǎn)換難以直接融合至LSTM神經(jīng)網(wǎng)絡(luò)框架中.受生成式對抗網(wǎng)絡(luò)(GAN)中對抗思想的啟發(fā),提出GAN-LSTM模型,旨在使用LSTM網(wǎng)絡(luò)替代生成器,將預(yù)報(bào)得到的結(jié)果和真實(shí)數(shù)據(jù)進(jìn)行頻域轉(zhuǎn)換后輸入判別器進(jìn)行判別,通過判別器使得LSTM神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)頻譜特征,實(shí)現(xiàn)時(shí)歷特征和頻譜特性的雙重近似,從而使得LSTM神經(jīng)網(wǎng)絡(luò)損失函數(shù)最小化的同時(shí)實(shí)現(xiàn)預(yù)報(bào)頻譜分布接近真實(shí)頻譜分布,即輸出數(shù)據(jù)的分布逐漸接近真實(shí)分布.
LSTM神經(jīng)網(wǎng)絡(luò)改進(jìn)形式實(shí)現(xiàn)過程如圖3所示,其中虛線框內(nèi)為GAN中的生成器,生成器得到的頻譜曲線由LSTM的輸出結(jié)果經(jīng)頻譜變換得到,判別器區(qū)分生成器頻譜分布與真實(shí)頻譜分布之間差異,并將其直接反饋至LSTM神經(jīng)網(wǎng)絡(luò)促使神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù)的頻譜特性能夠更接近真實(shí)頻譜特性.由于訓(xùn)練數(shù)據(jù)集往往是歷史測量數(shù)據(jù),數(shù)據(jù)量較為充足,所以使用訓(xùn)練數(shù)據(jù)集數(shù)據(jù)進(jìn)行頻譜變換可以反映特定海區(qū)對應(yīng)的頻譜特性,通過上述反饋過程實(shí)現(xiàn)頻譜信息嵌入LSTM神經(jīng)網(wǎng)絡(luò).在之后的預(yù)報(bào)過程中,可直接使用經(jīng)過上述訓(xùn)練過程的LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)報(bào),無需額外的頻譜特征輸入.通過引入GAN思想,成功解決了流式數(shù)據(jù)無法進(jìn)行頻譜分析的問題,成功將頻譜特性融入LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,充分利用了現(xiàn)有信息,成功實(shí)現(xiàn)時(shí)頻耦合預(yù)報(bào).
圖3 改進(jìn)的LSTM神經(jīng)網(wǎng)絡(luò)流程Fig.3 Flow chart of improved LSTM neural network process
改進(jìn)的LSTM目標(biāo)函數(shù)為
(9)
L1通常使用相對熵,又名KL散度表示:
L1=KL(p|q)=H′(p)-H′(p,q)
(10)
H(p,q)=Ez~p(z)(-lnp(z))=
(11)
式中:p為真實(shí)分布;q為生成分布;H′為交叉熵函數(shù).
從LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的角度來看,本文中LSTM神經(jīng)網(wǎng)絡(luò)改進(jìn)形式在原有LSTM神經(jīng)網(wǎng)絡(luò)目標(biāo)函數(shù)中添加了反映頻譜近似程度的正則化項(xiàng)L1,實(shí)踐表明使用正則化項(xiàng)可以在一定程度上減小神經(jīng)網(wǎng)絡(luò)輸出域空間,使得神經(jīng)網(wǎng)絡(luò)可以更快地收斂穩(wěn)定,并且可以防止神經(jīng)網(wǎng)絡(luò)參數(shù)過擬合[9].LSTM改進(jìn)形式的另一個(gè)優(yōu)點(diǎn)為通過對頻域特性的學(xué)習(xí)可以自動(dòng)抑制輸出噪聲信息,實(shí)現(xiàn)濾波平滑過程.
數(shù)據(jù)來自上海船舶運(yùn)輸科學(xué)研究所深水拖曳水池某實(shí)驗(yàn).深水拖曳水池長192 m,寬10 m,水深4.2 m;造波機(jī)為電液伺服搖板式,最大波高0.3 m,頻率范圍為0.25~2.00 Hz;浪高儀采用日本進(jìn)口的四自由度適航儀Gel-430-S及非接觸式超聲波浪高儀.測量頻率為50 Hz,波浪數(shù)據(jù)時(shí)長為240 s左右,共12 158個(gè)數(shù)據(jù),基本滿足訓(xùn)練和測試需要.模型試驗(yàn)與實(shí)船之間的縮尺比為λ=50,模型與實(shí)船之間滿足弗勞德相似關(guān)系和斯特勞哈爾相似關(guān)系,即對應(yīng)實(shí)際特征周期為λ0.5=7.071倍.
實(shí)測得到的波高(H)數(shù)據(jù)存在系統(tǒng)誤差如零飄、隨機(jī)誤差如高頻不規(guī)則振蕩和異常誤差如個(gè)別點(diǎn)跳點(diǎn)等現(xiàn)象,按照實(shí)驗(yàn)規(guī)定進(jìn)行相對應(yīng)的預(yù)處理,預(yù)處理后數(shù)據(jù)如圖4所示,其中fr為頻率.可知,預(yù)處理后數(shù)據(jù)集中于低頻段,分布較為理想.進(jìn)一步分析數(shù)據(jù)可知,波高時(shí)歷中平均周期為0.76 s,最小周期為0.08 s,最大周期為1.84 s.
圖4 波高數(shù)據(jù)時(shí)頻域特性Fig.4 Time-frequency domain characteristics of wave height data
3.2.1基線模型 為了更準(zhǔn)確地說明神經(jīng)網(wǎng)絡(luò)方法的優(yōu)越性,使用傳統(tǒng)時(shí)序模型作為基線模型進(jìn)行對照,常見的傳統(tǒng)時(shí)序模型包括自回歸(AR)模型、移動(dòng)平均(MA)模型、自回歸移動(dòng)平均(ARMA)模型等,具體模型選用根據(jù)對波高數(shù)據(jù)的自相關(guān)性和偏相關(guān)性分析決定.由圖5可知,自相關(guān)圖像呈現(xiàn)明顯“拖尾”現(xiàn)象,偏相關(guān)圖像呈現(xiàn)“截尾”現(xiàn)象.平穩(wěn)時(shí)間序列的偏相關(guān)系數(shù)(PACF)為r步截尾, 自相關(guān)系數(shù)(ACF)逐步衰減而不截尾, 則序列應(yīng)該選用AR模型[15].因此,基線模型最終決定為AR模型,表達(dá)式為
圖5 波高數(shù)據(jù)自相關(guān)偏相關(guān)分析Fig.5 Auto-correlation and partial-correlation analysis of wave height data
(12)
式中:r為模型階數(shù);aj為自回歸系數(shù);εt為隨機(jī)擾動(dòng)項(xiàng).
實(shí)際預(yù)報(bào)中,往往需要提前多步進(jìn)行預(yù)報(bào)從而給后續(xù)運(yùn)動(dòng)控制等留出充足的決策空間,AR模型無法直接用于多步后預(yù)測,需要進(jìn)行迭代遞推,即使用預(yù)報(bào)得到的Xt作為已知量進(jìn)一步預(yù)測Xt+1,重復(fù)該過程直至得到需要的Xt+n結(jié)果.
3.2.2LSTM神經(jīng)網(wǎng)絡(luò)模型 神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)AR模型的區(qū)別在于可以直接建立Xt-p~Xt-1與Xt+n之間的關(guān)系,避免了使用遞推迭代造成的誤差累積.影響LSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù)眾多,使用網(wǎng)格法考察訓(xùn)練數(shù)據(jù)量、依賴時(shí)間步、神經(jīng)網(wǎng)絡(luò)隱層數(shù)目、隱藏狀態(tài)數(shù)和優(yōu)化器參數(shù)等量對最終預(yù)報(bào)結(jié)果的影響,得到LSTM神經(jīng)網(wǎng)絡(luò)模型參數(shù)如下:隱藏層數(shù)為4,隱藏狀態(tài)為10,迭代次數(shù)為1 200次,依賴時(shí)間步為34.優(yōu)化算法使用Adam算法,其參數(shù)lr為0.001、beta_1為0.9、 beta_2為0.99、epsilon為 1×10-8.使用0~100 s上的數(shù)據(jù)作為訓(xùn)練集,共 5 000 個(gè)樣本點(diǎn).
改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò)中LSTM模塊同上,區(qū)別在于在訓(xùn)練過程中加入判別器模塊,判別器為4層的感知機(jī)模塊,其神經(jīng)元數(shù)目設(shè)為[3, 32, 32, 2],神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù)為頻率、幅值和相位,對真實(shí)樣本的結(jié)果標(biāo)記為1,來自生成器的樣本標(biāo)記為0,目標(biāo)函數(shù)使用交叉熵函數(shù).
3.2.3性能評價(jià)指標(biāo) 上述任務(wù)需要使用合適的度量函數(shù)對模型的結(jié)果進(jìn)行評價(jià),由于常需要對比多個(gè)不同模型之間的優(yōu)劣,所以性能評價(jià)函數(shù)應(yīng)具有一定普適性.常見的性能評價(jià)函數(shù)包括均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)等,其定義為
(13)
統(tǒng)一使用MSE和MAE對傳統(tǒng)時(shí)序分析模型、LSTM神經(jīng)網(wǎng)絡(luò)模型和改進(jìn)后的LSTM模型進(jìn)行評價(jià).使用測試集中100~200 s區(qū)間的數(shù)據(jù),共 5 000 個(gè)樣本點(diǎn).
分別使用基線方法(AR模型)、LSTM神經(jīng)網(wǎng)絡(luò)和改進(jìn)的LSTM神經(jīng)網(wǎng)絡(luò)提前5步(0.1 s)、10步(0.2 s)、15步(0.3 s)、20步(0.4 s)對上述波高時(shí)歷進(jìn)行預(yù)報(bào),訓(xùn)練數(shù)據(jù)集使用0~100 s數(shù)據(jù),測試數(shù)據(jù)集使用100 ~200 s數(shù)據(jù),性能評價(jià)指標(biāo)使用MSE和MAE,結(jié)果如表1所示.
表1 不同工況下預(yù)報(bào)精度對比Tab.1 Comparison of forecast accuracy under different conditions
由表1可知,在多數(shù)工況下LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行時(shí)間序列分析結(jié)果明顯優(yōu)于傳統(tǒng)時(shí)序分析方法,在MSE指標(biāo)方面,性能提升7%~15%,平均可實(shí)現(xiàn)11%左右的提升.改進(jìn)的LSTM神經(jīng)網(wǎng)絡(luò)較基線模型和原有LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)報(bào)精度均有所上升,4種工況下較基線模型性能平均提升16%,較原有神經(jīng)網(wǎng)絡(luò)性能提升5%左右,充分證明了改進(jìn)后神經(jīng)網(wǎng)絡(luò)的優(yōu)越性.部分情況下神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)得到的MAE略大于基線方法,這可能是由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中目標(biāo)評價(jià)函數(shù)設(shè)置導(dǎo)致,屬于神經(jīng)網(wǎng)絡(luò)中的固有問題.
為了說明3種預(yù)測模型的具體效果,隨機(jī)截取一段時(shí)間窗口進(jìn)行觀察.圖6為AR模型、LSTM模型與改進(jìn)LSTM模型預(yù)報(bào)結(jié)果的對比,對應(yīng)工況為提前預(yù)報(bào)5步.可知,時(shí)間序列分析方法存在一定滯后性,其中AR模型滯后性最明顯,且由于誤差累積在部分時(shí)刻會(huì)出現(xiàn)突峰,而使用神經(jīng)網(wǎng)絡(luò)方法無需迭代遞推,其預(yù)測總體上較穩(wěn)定;神經(jīng)網(wǎng)絡(luò)的預(yù)報(bào)過程中往往會(huì)出現(xiàn)偶然的波動(dòng)(噪聲),改進(jìn)后的LSTM相較于原始LSTM神經(jīng)網(wǎng)絡(luò)在一定程度上抑制了噪聲分量.
圖6 3種模型極短期預(yù)報(bào)結(jié)果(提前預(yù)報(bào)5步)Fig.6 Short-term forecast results of three models (5 steps in advance)
為了對比分析總體的預(yù)測結(jié)果,在整個(gè)測試集(對應(yīng)時(shí)長100 s)上使用LSTM神經(jīng)網(wǎng)絡(luò)與改進(jìn)LSTM進(jìn)行預(yù)報(bào)得到頻率特性曲線,對應(yīng)工況為提前預(yù)報(bào)15步,如圖7所示.
圖7 預(yù)測結(jié)果頻率特性曲線(提前預(yù)報(bào)15步)Fig.7 Frequency characteristic curve of prediction results (15 steps in advance)
以上結(jié)果表明,測試集上的頻譜特性與圖4中整體的頻譜特性較為相似,說明大量波浪統(tǒng)計(jì)信息對應(yīng)的頻譜存在穩(wěn)定性,故頻率信息可以視為先驗(yàn)信息進(jìn)行知識(shí)遷移用于上文所述的預(yù)報(bào)過程中.如局部放大圖所示,改進(jìn)LSTM對高頻分量起到抑制作用,達(dá)到了之前所述平滑濾波效果.本文中按照原始采樣頻率50 Hz對波高時(shí)歷直接進(jìn)行預(yù)報(bào),在該采樣頻率下大量數(shù)據(jù)位于波峰和波谷之間,可能導(dǎo)致神經(jīng)網(wǎng)絡(luò)對波峰和波谷的數(shù)據(jù)預(yù)報(bào)能力較差,最終出現(xiàn)1.6~1.8 Hz頻率區(qū)間內(nèi)的頻譜特性曲線與真實(shí)值差別較大的結(jié)果,故可進(jìn)一步探索LSTM和改進(jìn)LSTM模型在粗粒度預(yù)報(bào)方面的應(yīng)用.
與圖像識(shí)別、目標(biāo)檢測等領(lǐng)域不同,波浪和船舶運(yùn)動(dòng)對應(yīng)的頻譜往往是穩(wěn)定的,可以為波浪預(yù)報(bào)和運(yùn)動(dòng)姿態(tài)分析提供重要信息.但是頻譜信息目前較少地直接應(yīng)用至現(xiàn)有極短期預(yù)報(bào)方法中,主要有兩方面原因:一方面,目前的神經(jīng)網(wǎng)絡(luò)在船舶姿態(tài)時(shí)序預(yù)報(bào)領(lǐng)域的應(yīng)用大多停留在表面,沒有與本領(lǐng)域的專業(yè)知識(shí)進(jìn)行深度融合;另一方面,頻譜分析需要對數(shù)據(jù)整體進(jìn)行傅里葉變換,這個(gè)方式與極短期預(yù)報(bào)中數(shù)據(jù)流式傳入、預(yù)報(bào)結(jié)果流式傳出的在線預(yù)報(bào)方式不符,實(shí)踐中很難將頻域信息嵌入其中.受生成式對抗思想的啟發(fā),巧妙地將頻域信息嵌入LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,提出了GAN-LSTM改進(jìn)模型,該模型具有以下優(yōu)點(diǎn):
(1) 可以充分利用已知信息,實(shí)現(xiàn)時(shí)頻域耦合預(yù)報(bào).
(2) 通過學(xué)習(xí)頻域信息,抑制了原有LSTM模型高頻噪聲分量的輸出.
(3) 通過融合頻域知識(shí),提高了訓(xùn)練時(shí)的收斂速度,并一定程度上提高了神經(jīng)網(wǎng)絡(luò)的泛化性.
數(shù)值仿真實(shí)驗(yàn)表明,上述LSTM改進(jìn)模型預(yù)報(bào)精度高,在海浪預(yù)測和船舶姿態(tài)預(yù)報(bào)中可以起到重要作用.