班文超,沈良朵,陸凡,陳亮
(1.浙江海洋大學(xué)海洋工程裝備學(xué)院,浙江舟山 316022;2.浙江海洋大學(xué)船舶與海運(yùn)學(xué)院,浙江舟山 316022)
潮汐是最主要的的海洋物理要素之一,因此潮位預(yù)測(cè)也是識(shí)別、研究和開(kāi)發(fā)有效利用海洋資源的最主要技術(shù)手段。由于中國(guó)海洋面積廣大,潮汐變化復(fù)雜,因此不管是軍事方面還是國(guó)民經(jīng)濟(jì)建設(shè)等領(lǐng)域中,都必須建立詳細(xì)、精確、方便靈活的海洋潮汐保障體系,潮汐現(xiàn)象對(duì)軍事航海、海洋測(cè)量以及近海戰(zhàn)斗等都產(chǎn)生了重要的影響,因此進(jìn)行海洋潮位預(yù)測(cè),有著重大的實(shí)用價(jià)值與軍事意義。
潮位預(yù)測(cè)是對(duì)某個(gè)海域在未來(lái)某個(gè)時(shí)期內(nèi)的潮水漲落狀況做出的計(jì)算與預(yù)測(cè)。潮汐調(diào)和分析[1-2]將所預(yù)測(cè)海區(qū)的實(shí)際潮汐資料進(jìn)行潮汐研究,可以得到不同分潮的調(diào)和常數(shù),用于計(jì)算將來(lái)在特定時(shí)期內(nèi)的不同分潮的變動(dòng)狀況,再將各分潮疊加,即求得將來(lái)一定時(shí)間內(nèi)的潮位變化,據(jù)此就可以進(jìn)行潮位預(yù)測(cè)。經(jīng)典的潮汐調(diào)和分析方法為我國(guó)的潮汐研究做出了重大的貢獻(xiàn),卻無(wú)法保證潮位預(yù)測(cè)的準(zhǔn)確性。最近幾年深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展[3-4]為潮位預(yù)測(cè)的研究提供了新的方法[5]。1991 年,SEPP[6]分析了隨時(shí)間反向傳播帶來(lái)的梯度爆炸和梯度消失問(wèn)題,1997 年,SEPP 與JüRGEN 在LSTM 論文中引入CEC 單元解決BPTT 帶來(lái)的梯度爆炸和消失問(wèn)題,2012 年后神經(jīng)網(wǎng)絡(luò)飛速發(fā)展,LSTM 由此形成了比較系統(tǒng)的框架,已經(jīng)能夠利用復(fù)雜性構(gòu)件或多種非線(xiàn)性變換處理層對(duì)數(shù)據(jù)分析實(shí)現(xiàn)高度抽象技術(shù),同時(shí)實(shí)現(xiàn)對(duì)序列數(shù)據(jù)的長(zhǎng)短期記憶[7-8]。
本文將深度學(xué)習(xí)的方式運(yùn)用到對(duì)潮位的預(yù)測(cè)上,應(yīng)用一種深層神經(jīng)網(wǎng)絡(luò)的LSTM 模型[9-10],它可以完全發(fā)掘時(shí)序統(tǒng)計(jì)中的時(shí)間依賴(lài)性以提高數(shù)據(jù)信息維度,從而實(shí)現(xiàn)對(duì)潮位分析的高精度預(yù)測(cè)。因此,本文在深層神經(jīng)網(wǎng)絡(luò)LSTM 計(jì)算的基礎(chǔ)上建立了潮位分析預(yù)測(cè)模型并對(duì)算法進(jìn)行優(yōu)化,以提高所建模型的預(yù)測(cè)性和適用性[11-12]。
在經(jīng)典潮汐調(diào)和分析模型中[式(1)],每一分潮都可用三角函數(shù)來(lái)表示,一系列的三角函數(shù)進(jìn)行線(xiàn)性疊加后表達(dá)成水位。
式中:Z(t)為t 時(shí)刻觀測(cè)到的水位;σj、Hj以及gj為第j 個(gè)分潮對(duì)應(yīng)的角速度、振幅和遲角,°;j 為分辨的分潮的個(gè)數(shù);S0為平均海平面,式(1)中的Hj可以使用變量aj和bj線(xiàn)性化表達(dá):
在做線(xiàn)性回歸時(shí),需要用到式(3):
式中:Z 為觀測(cè)水位矩陣;A 為已知的系數(shù)矩陣;X 為待求解的未知參數(shù)矩陣,具體表達(dá)如式(4)和(5)所示:
根據(jù)最小二乘法,X 的解為:
LSTM 有較強(qiáng)的延時(shí)記憶數(shù)據(jù)的能力,在其掌握當(dāng)前內(nèi)容的時(shí)候,會(huì)獲取更長(zhǎng)時(shí)間跨度數(shù)據(jù)信息間的關(guān)系,達(dá)到長(zhǎng)期記憶,能夠?qū)κ挛锏陌l(fā)展做出比較精準(zhǔn)的預(yù)測(cè)。一個(gè)LSTM 細(xì)胞有3 個(gè)門(mén),分別叫做遺忘門(mén)(f 門(mén)),輸入門(mén)(i 門(mén))和輸出門(mén)(o 門(mén))。如圖1 所示,為神經(jīng)元結(jié)構(gòu)的單元體。
圖1 神經(jīng)元結(jié)構(gòu)(LSTM)Fig.1 Neuronal Structure (LSTM)
(1)遺忘門(mén),最后輸出的數(shù)值和現(xiàn)在輸入的數(shù)值,通過(guò)計(jì)算可以得出遺忘門(mén)輸出的數(shù)值,如同式(7)所表示的一樣
式中:ft為遺忘門(mén);σ 為標(biāo)準(zhǔn)的sigmoid 激活函數(shù);ht-1為上一時(shí)間的單元數(shù)值;Wf為權(quán)重?cái)?shù)值;xt為時(shí)間為t 時(shí)的輸入值;bf為偏置值的向量。
第一步通過(guò)遺忘門(mén)將我們不需要的信息從細(xì)胞狀態(tài)中移除,以上一步的ht-1和這一步的xt作為輸入,然后為Ct-1里的每個(gè)數(shù)字輸出一個(gè)0~1 間的值,記為ft,表示保留多少信息。
(2)輸入門(mén),輸入最后時(shí)間的數(shù)值和目前時(shí)間的數(shù)值,而后計(jì)算得出輸入門(mén)的輸出數(shù)值以及和候選單元狀態(tài)情況,式(8)和(9)可表示
式中:it為輸入門(mén);是目前輸入的狀態(tài)單元;tanh(·)是雙曲正切激活函數(shù)。
第二步?jīng)Q定在細(xì)胞狀態(tài)里存什么,把新的信息選擇性的記錄在細(xì)胞狀態(tài)中。sigmoid 層決定我們要更新什么值,這個(gè)概率表示為it,tanh 層創(chuàng)建一個(gè)候選值向量,將會(huì)被增加到細(xì)胞狀態(tài)中,然后更新細(xì)胞狀態(tài)時(shí)把這兩個(gè)結(jié)合起來(lái)。
第三步需要更新細(xì)胞狀態(tài),目前的單元狀態(tài)屬于遺忘門(mén)的數(shù)值和上一時(shí)間狀態(tài)相乘所得然后再加上輸入門(mén)兩部分的相乘結(jié)果,如式(10)所示:
式中:Ct為隱含層在t 時(shí)刻的狀態(tài)單元;ft為上一次遺忘關(guān)于信息Ct-1的程度;it為要將加入的程度,最后得到了本細(xì)胞的狀態(tài)Ct。
(3)輸出門(mén),輸出的數(shù)值ht-1和輸入的數(shù)值xt表示在t 時(shí)刻的輸入門(mén)的輸入值,而后得出輸出門(mén)如下
式中:Ot為當(dāng)前的輸出門(mén)。
第四步是通過(guò)sigmoid 層從而決定輸出Ct的哪些部分;而后使得細(xì)胞狀態(tài)通過(guò)tanh 層后與sigmoid層的數(shù)值相乘得到最終的輸出ht。
本次建模使用鎮(zhèn)海站2019 年、呂四站2018 年和海門(mén)站2020 年的全年潮汐數(shù)據(jù)作為實(shí)測(cè)數(shù)據(jù)集,每個(gè)全年潮汐數(shù)據(jù)集有8 760 組潮位數(shù)據(jù),采樣間隔為1 h,采用上述模型,進(jìn)行長(zhǎng)短期2 次預(yù)測(cè)對(duì)比,長(zhǎng)期數(shù)據(jù)模型使用前10 月數(shù)據(jù)建模,后2 月數(shù)據(jù)分析比較;短期數(shù)據(jù)模型使用前2 月數(shù)據(jù)建模,后10 月數(shù)據(jù)分析比較,而后使用模型預(yù)測(cè)300 h 潮位的結(jié)果繪圖。
采用經(jīng)典調(diào)和分析模型的潮位預(yù)測(cè)結(jié)果如圖2~4 所示,圖中藍(lán)色實(shí)線(xiàn)為實(shí)際的潮位數(shù)據(jù)值,橙色點(diǎn)劃線(xiàn)為調(diào)和分析模型的預(yù)測(cè)數(shù)據(jù)值,得出結(jié)論:在數(shù)據(jù)量足夠的情形下,經(jīng)典調(diào)和分析模型可以比較好的預(yù)測(cè)出潮位走勢(shì),只是在部分波峰波谷處有微小的誤差,預(yù)測(cè)效果較好。
圖2 定海站長(zhǎng)期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.2 Comparison between the observed and predicted values of the long-term harmonic model at Dinghai station
圖3 呂四站長(zhǎng)期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.3 Comparison between the observed and predicted values of the long-term harmonic model at Lyusi station
圖4 海門(mén)站長(zhǎng)期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.4 Comparison between the observed and predicted values of the long-term harmonic model at Haimen station
采用深層神經(jīng)網(wǎng)絡(luò)LSTM 模型的預(yù)測(cè)結(jié)果如圖5~8 所示,可以得出:LSTM 模型的損失基本接近0,圖形擬合的情況十分令人滿(mǎn)意,這表示在大量數(shù)據(jù)的支持下的LSTM 模型的預(yù)測(cè)精度很高。
圖5 長(zhǎng)期LSTM 模型損失圖Fig.5 Long-term LSTM model loss graph
圖6 定海站長(zhǎng)期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.6 Comparison between the observed and predicted values of the long-term LSTM model at Dinghai station
圖7 呂四站長(zhǎng)期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.7 Comparison of the observed and predicted values of the long-term LSTM model at Lyusi station
圖8 海門(mén)站長(zhǎng)期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.8 Comparison of observed and predicted values of long-term LSTM model at Haimen station
短期數(shù)據(jù)下的經(jīng)典調(diào)和分析模型潮位預(yù)測(cè)結(jié)果如圖9~11 所示,在數(shù)據(jù)集大量減少的情況下,經(jīng)典的潮汐調(diào)和分析方法不能夠很好的預(yù)測(cè)出潮位數(shù)據(jù)的值,有比較明顯的誤差產(chǎn)生。短期數(shù)據(jù)下的深層神經(jīng)網(wǎng)絡(luò)LSTM 模型潮位預(yù)測(cè)結(jié)果如圖12~15 所顯示,可以得出:LSTM 模型的損失還是基本接近0,圖形擬合的情況依舊令人滿(mǎn)意,預(yù)測(cè)值和實(shí)際數(shù)據(jù)值基本重合。
圖9 定海站短期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.9 Comparison of observed and predicted values of short-term harmonic model at Dinghai station
圖10 呂四站短期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.10 Comparison between the observed and predicted values of the short-term harmonic model at Lyusi station
圖11 海門(mén)站短期調(diào)和模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.11 Comparison of observed and predicted values of short-term harmonic model at Haimen station
圖12 短期LSTM 模型損失圖Fig.12 Short-term LSTM model loss graph
圖13 定海站短期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.13 Comparison of the observed and predicted values of the short-term LSTM model at Dinghai station
圖14 呂四站短期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.14 Comparison of the observed and predicted values of the short-term LSTM model at Lyusi station
圖15 海門(mén)站短期LSTM 模型觀測(cè)值與預(yù)測(cè)值對(duì)比圖Fig.15 Comparison of the observed and predicted values of the short-term LSTM model at Haimen station
為了方便比較模型的誤差,可以通過(guò)均方根誤差(RMSE)的指標(biāo)來(lái)評(píng)估模型的預(yù)測(cè)精度,表達(dá)式為
式中:m 為試驗(yàn)樣本的數(shù)量;yi和zi分別為潮位的觀測(cè)值和預(yù)測(cè)值。
以定海站,呂四站和海門(mén)站的數(shù)據(jù)為研究對(duì)象,在長(zhǎng)期數(shù)據(jù)的模型中,經(jīng)典的調(diào)和分析模型的RMSE值為0.19、0.1 和0.26,深層神經(jīng)網(wǎng)絡(luò)LSTM 模型的RMSE 值為0.07、0.06 和0.05,在短期數(shù)據(jù)的模型中,經(jīng)典的調(diào)和分析模型的RMSE 值為0.58、0.37 和0.32,深層神經(jīng)網(wǎng)絡(luò)LSTM 模型的RMSE 值為0.13、0.16和0.05。
由此可見(jiàn),在長(zhǎng)數(shù)據(jù)的支持下,2 個(gè)模型都能夠優(yōu)秀的完成潮位預(yù)測(cè)的任務(wù),但是相對(duì)而言深層神經(jīng)網(wǎng)絡(luò)LSTM 模型的預(yù)測(cè)精度更高。在短數(shù)據(jù)的支持下,經(jīng)典的調(diào)和分析模型的預(yù)測(cè)值和實(shí)測(cè)值時(shí)常達(dá)不到一致,尤其在波峰波谷時(shí)誤差更大,而深層神經(jīng)網(wǎng)絡(luò)LSTM 模型只是在部分地方的峰值出現(xiàn)了極小的偏差,總體效果十分優(yōu)越,這表明即使在數(shù)據(jù)集不夠龐大的情況下,深度神經(jīng)網(wǎng)絡(luò)LSTM 模型也能夠很好的完成潮位預(yù)測(cè)任務(wù),相對(duì)于經(jīng)典的潮汐調(diào)和方式,他的精確度更高,對(duì)數(shù)據(jù)集的要求更低。
深層神經(jīng)網(wǎng)絡(luò)LSTM 的模型在潮位預(yù)測(cè)中體現(xiàn)出良好的擬合度,在長(zhǎng)短期數(shù)據(jù)中都能夠較為精準(zhǔn)的完成潮位預(yù)測(cè)任務(wù),有效地克服了經(jīng)典調(diào)和分析方法短期數(shù)據(jù)預(yù)測(cè)結(jié)果不準(zhǔn)確的問(wèn)題,可以為潮位的預(yù)測(cè)提供一種新的方法;同時(shí),深層神經(jīng)網(wǎng)絡(luò)LSTM 的模型可以用于波高、流速等時(shí)間序列數(shù)據(jù)的預(yù)測(cè)研究。