李志剛 孫晨偉 魏 彪 孫曉川
(1.華北理工大學(xué)人工智能學(xué)院,河北唐山 063210;2.河北省工業(yè)智能感知重點(diǎn)實(shí)驗(yàn)室,河北唐山 063210)
隨著藍(lán)色經(jīng)濟(jì)的迅猛發(fā)展,智慧海洋時(shí)代即將到來,海洋通信受到廣泛的關(guān)注。高效的海洋通信是實(shí)時(shí)、連續(xù)、長(zhǎng)期、準(zhǔn)確的海洋環(huán)境監(jiān)測(cè)體系的可靠保證,有助于及時(shí)發(fā)布海洋環(huán)境相關(guān)信息(如災(zāi)害、氣象、航海等),為政府制定海洋防災(zāi)、減災(zāi)決策和區(qū)域規(guī)劃提供準(zhǔn)確的依據(jù)[1]。通常,海洋通信網(wǎng)絡(luò)包括海洋衛(wèi)星和岸基站兩個(gè)關(guān)鍵部分構(gòu)成。盡管衛(wèi)星通信的解決方案能夠?qū)崿F(xiàn)海洋廣域覆蓋,但是,這種方式依然具有固有的缺點(diǎn),如長(zhǎng)距離傳輸極易導(dǎo)致嚴(yán)重的時(shí)間延遲大,以及有限和昂貴的帶寬。另一方面,陸上岸基站覆蓋能力有限,僅能覆蓋有限的近海區(qū)域,覆蓋盲區(qū)是不可避免的。顯然,上述兩種通信模式已無法滿足日益增長(zhǎng)的海洋寬帶通信需求。
6G 將提供更高等級(jí)5G 功能擴(kuò)展,如Tbps 級(jí)數(shù)據(jù)速率、亞毫秒級(jí)延遲、厘米級(jí)定位等,可以構(gòu)建空天地海一體化互聯(lián)網(wǎng)絡(luò),這將在廣度和深度兩個(gè)維度上擴(kuò)大海洋覆蓋范圍,支持大規(guī)模高度多樣化的海洋業(yè)務(wù)需求[2]。對(duì)比現(xiàn)有的衛(wèi)星-岸基站通信方式,6G空天地海一體化網(wǎng)絡(luò)將使海洋環(huán)境監(jiān)測(cè)具有更為強(qiáng)大的數(shù)據(jù)處理能力,可以高效地分析處理浮標(biāo)、測(cè)量船、無人潛艇、無人機(jī)等設(shè)備獲取的高維、多源、異構(gòu)海洋環(huán)境數(shù)據(jù),為防災(zāi)減災(zāi)、海洋環(huán)境管理、海洋綜合利用等提供及時(shí)、準(zhǔn)確的決策依據(jù)。例如,在海洋災(zāi)害預(yù)警過程中,快速分析、處理和傳輸采集到的海洋環(huán)境數(shù)據(jù),從而對(duì)災(zāi)害級(jí)別、變化追蹤和發(fā)展趨勢(shì)做出實(shí)時(shí)、精準(zhǔn)的判斷。
6G空天地海一體化網(wǎng)絡(luò)部署將極大提升面向多樣化海洋服務(wù)應(yīng)用的數(shù)據(jù)全生命周期處理效率。當(dāng)前,深度學(xué)習(xí)已廣泛應(yīng)用于海洋環(huán)境數(shù)據(jù)建模,尤其是深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)[3-4]。盡管DNN 具有強(qiáng)大的學(xué)習(xí)能力,但是其數(shù)據(jù)處理過程相對(duì)耗時(shí)。超低時(shí)延、超大帶寬和泛在智連的6G空天地海一體化網(wǎng)絡(luò)能夠有效地提升深度學(xué)習(xí)在海洋環(huán)境數(shù)據(jù)處理中的可用性。現(xiàn)階段,基于DNN的海洋環(huán)境數(shù)據(jù)建模通常采用單步長(zhǎng)-單變量預(yù)測(cè)模式。例如,針對(duì)北極月平均海冰濃度預(yù)測(cè)任務(wù),文獻(xiàn)[5]提出了一種基于概率深度學(xué)習(xí)的極端海冰事件預(yù)測(cè)系統(tǒng)。文獻(xiàn)[6]提出了一種基于統(tǒng)計(jì)方法和深度學(xué)習(xí)的海面變量預(yù)測(cè)模型,并驗(yàn)證了其在中國(guó)南海海面高度和海面溫度短期預(yù)測(cè)的優(yōu)勢(shì)。文獻(xiàn)[7]構(gòu)建了一種基于去噪自動(dòng)編碼器和卷積長(zhǎng)短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型,用于預(yù)測(cè)全球海洋氣候變化趨勢(shì)。文獻(xiàn)[8]分析了赤潮災(zāi)害的相關(guān)因素,并基于深度學(xué)習(xí)強(qiáng)大的非線性特征捕獲能力,提出了一種基于線性回歸和深度置信網(wǎng)絡(luò)的赤潮災(zāi)害預(yù)測(cè)模型。文獻(xiàn)[9]在傳統(tǒng)深度置信網(wǎng)絡(luò)中加入隨機(jī)多時(shí)間因子,對(duì)海水富營(yíng)養(yǎng)化進(jìn)行了預(yù)測(cè)。文獻(xiàn)[10]提出了一種基于自適應(yīng)核映射相關(guān)向量機(jī)的海洋水質(zhì)預(yù)測(cè)模型,通過數(shù)據(jù)降維、非線性逼近和參數(shù)尋優(yōu)機(jī)制,實(shí)現(xiàn)高效的海洋環(huán)境數(shù)據(jù)預(yù)測(cè)。眾所周知,相比單步長(zhǎng)預(yù)測(cè)模式,多步長(zhǎng)預(yù)測(cè)能夠獲取更長(zhǎng)時(shí)間間隔的數(shù)據(jù)信息,更有利于面向海洋智慧應(yīng)用的高效管理和及時(shí)決策。此外,海洋環(huán)境因素彼此相互關(guān)聯(lián),多變量預(yù)測(cè)可以充分利用數(shù)據(jù)間的相關(guān)性,提高預(yù)測(cè)性能。
實(shí)際上,多步長(zhǎng)海洋環(huán)境時(shí)序數(shù)據(jù)預(yù)測(cè)是一項(xiàng)極具挑戰(zhàn)性的任務(wù),這是由于在多步長(zhǎng)模式下數(shù)據(jù)間的相關(guān)性被極大地削弱[11]。CNN 具有強(qiáng)大的空間特征學(xué)習(xí)能力(細(xì)粒度特征),而LSTM 具有良好的時(shí)序數(shù)據(jù)依賴關(guān)系捕捉能力(粗粒度特征)。二者的串聯(lián)結(jié)構(gòu)CNN-LSTM 已被證實(shí)能夠更有效地挖掘時(shí)序數(shù)據(jù)相關(guān)性,通過兩階段的特征提取,為預(yù)測(cè)提供更為優(yōu)秀的初始化值[12-13]。然而,基于單一LSTM 的粗粒度特征提取并不最優(yōu)的,難以最大化LSTM 的特征提取能力。在CNN-LSTM 基礎(chǔ)上,本文提出了基于多階段特征學(xué)習(xí)的海洋環(huán)境數(shù)據(jù)多步預(yù)測(cè)模型,這里,多階段的特征學(xué)習(xí)分別通過CNN 和OLSTMs來實(shí)現(xiàn)。前者用于提取海洋環(huán)境數(shù)據(jù)的細(xì)粒度特征,而后者采用PSO 尋優(yōu)多個(gè)LSTMs的最佳組合,以完成粗粒度的特征表達(dá)。兩階段學(xué)習(xí)到的最具代表性特征用于非線性逼近,從而提高海洋環(huán)境時(shí)間序列多步預(yù)測(cè)性能。
空天地海一體化通信網(wǎng)絡(luò)將以傳統(tǒng)的陸地?zé)o線通信網(wǎng)絡(luò)為基礎(chǔ),同時(shí)結(jié)合衛(wèi)星通信與海洋通信,形成覆蓋太空(通信衛(wèi)星、遙感衛(wèi)星和導(dǎo)航衛(wèi)星網(wǎng)絡(luò))、空中(無人機(jī)通信網(wǎng))、陸地(地面無線網(wǎng)絡(luò))和海洋(全域無線通信網(wǎng))的分級(jí)衛(wèi)星-無人機(jī)-陸地-海洋融合網(wǎng)絡(luò)[14],如圖1所示。這能夠?qū)崿F(xiàn)岸基站到船(S2V)、岸基站到無人機(jī)(S2U)、船到無人機(jī)(V2U)、無人機(jī)到無人機(jī)(U2U)、無人機(jī)到船(U2V)和船到船(V2V)的可靠通信,為海洋環(huán)境監(jiān)測(cè)提供廣域無線覆蓋和高效通信服務(wù)體驗(yàn),有效地支撐海洋大數(shù)據(jù)挖掘與分析。依托此海洋全方位綜合感知網(wǎng)絡(luò),本文提出了一種新型的海洋環(huán)境數(shù)據(jù)多步長(zhǎng)預(yù)測(cè)模型,即CNN-OLSTMs。結(jié)構(gòu)上,該模型由兩階段的特征提取器和非線性逼近器構(gòu)成,即基于CNN 的細(xì)粒度特征提取、多LSTMs 的粗粒度特征提取,以及最后的全連接層,如圖2 所示。首先,通過數(shù)據(jù)標(biāo)準(zhǔn)化以及平滑方法對(duì)海洋環(huán)境數(shù)據(jù)進(jìn)行預(yù)處理。其次,通過CNN 網(wǎng)絡(luò)進(jìn)行細(xì)粒度的特征提取,挖掘海洋環(huán)境數(shù)據(jù)的局部特征信息。進(jìn)一步,將LSTM 作為二階段的粗粒度特征提取器,不同于單一模式,本文采用了多個(gè)LSTMs 組合的方式,并通過PSO 優(yōu)化算法來確定多個(gè)LSTM 優(yōu)化配置,以最大化每個(gè)LSTM 對(duì)于時(shí)序關(guān)系的捕捉能力,從而更為有效地提取海洋環(huán)境數(shù)據(jù)長(zhǎng)相關(guān)的特征信息。最后,將獲取的海洋環(huán)境數(shù)據(jù)兩階段特征送入非線性逼近器,完成高精度的海洋環(huán)境時(shí)間序列預(yù)測(cè)。接下來,本文將對(duì)各個(gè)功能模塊進(jìn)行詳細(xì)介紹。
這里,采用CNN 進(jìn)行多維海洋環(huán)境數(shù)據(jù)的細(xì)粒度特征提取。CNN 通過卷積和池化完成更高層次的、更為抽象的數(shù)據(jù)表達(dá)[15]。具體地,考慮輸入多維的海洋時(shí)序數(shù)據(jù)S,CNN 卷積核的輸出特征x可表示如下:
式中,?為卷積操作,W為卷積核的權(quán)重向量,b表示偏移量,f(?)為激活函數(shù)。隨后,池化層對(duì)于卷積層得到的特征向量進(jìn)行降維處理(下采樣),提取重要的細(xì)粒度特征信息。
CNN-OLSTMs 采用多個(gè)LSTM 優(yōu)化組合的方式進(jìn)行二階段粗粒度特征提取。具體地,將CNN 提取到的細(xì)粒度特征送入到多個(gè)LSTM 中,進(jìn)行特征再學(xué)習(xí)。單一LSTM 的結(jié)構(gòu)如圖3 所示,其內(nèi)部計(jì)算公式表示如下:
式中,xt和ct分別為當(dāng)前時(shí)刻模型的輸入向量和輸出向量;ht-1為前一時(shí)刻模型狀態(tài)的輸出向量;Wxi、Wxf、Wxo、Wxc分別表示輸入層到輸入門、遺忘門、輸出門與模型狀態(tài)的權(quán)重向量;Whi、Whf、Who、Whc分別表示隱藏層到輸入門、遺忘門、輸出門與模型狀態(tài)的權(quán)重向量;bi、bf、bo、bc分別表示輸入門、遺忘門、輸出門與模型狀態(tài)的偏移量;σ(?)表示sigmoid激活函數(shù);⊙表示向量元素對(duì)應(yīng)位置相乘。
這里,我們采用PSO 優(yōu)化算法來尋優(yōu)LSTM 的最佳組合。假設(shè)不同LSTM 輸出的分配權(quán)重表示為M=[m1,m2,…,mn],其中n表示LSTM 數(shù)目,粒子的速度和位置更新方程表示如下:
式中,i=1,2,…,N,N為種群粒子總數(shù),vi為第i個(gè)粒子速度,rand()函數(shù)產(chǎn)生0 至1 之間的隨機(jī)數(shù),Mi為第i個(gè)粒子的位置,即每個(gè)LSTM 分配的權(quán)重,k1和k2為學(xué)習(xí)因子,pbesti為第i個(gè)粒子的最優(yōu)位置,gbesti為種群最優(yōu)位置。多個(gè)LSTM 組合優(yōu)化后的輸出公式為:
本文采用全連接層作為多步長(zhǎng)海洋環(huán)境時(shí)間序列的非線性逼近器,將優(yōu)化后的兩階段特征et作為全連接層的輸入,來實(shí)現(xiàn)海洋環(huán)境數(shù)據(jù)的非線性逼近,最終得到整個(gè)模型CNN-OLSTMs的預(yù)測(cè)輸出R,即
式中,L為全連接層的權(quán)重向量,b為偏置向量。通過反向傳播算法來最終確定參數(shù)L與b,這意味著CNN-OLSTMs 模型訓(xùn)練結(jié)束,可用于海洋環(huán)境時(shí)間序列多步前向預(yù)測(cè)。
表1 和表2 分別給出了CNN-OLSTMs 模型中LSTM 組合參數(shù)的優(yōu)化過程以及CNN-OLSTMs 模型的訓(xùn)練過程??傮w上,通過算法1不斷地尋優(yōu)LSTM最佳組合參數(shù),在每次迭代過程中,調(diào)用算法2中的Object 函數(shù)訓(xùn)練CNN-OLSTMs 模型,并計(jì)算模型損失函數(shù),其結(jié)果作為當(dāng)前尋優(yōu)的反饋值,繼續(xù)執(zhí)行算法1中組合參數(shù)的更新操作,直到模型測(cè)試結(jié)果達(dá)到預(yù)期效果為止。進(jìn)一步,我們從時(shí)間和空間復(fù)雜度討論CNN-OLSTMs模型訓(xùn)練的復(fù)雜性。假設(shè)訓(xùn)練算法每層循環(huán)的執(zhí)行次數(shù)均為n,顯然,CNN-OLSTMs模型訓(xùn)練的時(shí)間復(fù)雜度為O(n2)。本文將從模型復(fù)雜度的角度來分析模型,而對(duì)于空間復(fù)雜度來說,主要體現(xiàn)在模型訓(xùn)練過程中,參數(shù)所占用內(nèi)存空間的大小及其數(shù)量。CNN-OLSTMs模型訓(xùn)練的時(shí)間和空間復(fù)雜度的量化結(jié)果詳見本文的實(shí)驗(yàn)仿真部分。
表1 模型優(yōu)化流程Tab.1 Model optimization process
表2 CNN-OLSTMs模型訓(xùn)練Tab.2 CNN-OLSTMs training
在海洋環(huán)境數(shù)據(jù)預(yù)測(cè)任務(wù)中,本文對(duì)所提CNNOLSTMs模型的多步預(yù)測(cè)性能進(jìn)行了綜合驗(yàn)證評(píng)估,并與其他模型進(jìn)行了對(duì)比,包括CNN 模型、LSTM 模型以及GRU 模型,通過對(duì)比實(shí)驗(yàn)來進(jìn)一步證明模型的有效性。本文首先對(duì)海洋環(huán)境原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。其次,給出了模型性能的度量方法。最后,對(duì)CNN-OLSTMs模型的多步預(yù)測(cè)性能和復(fù)雜性進(jìn)行了綜合分析,并通過統(tǒng)計(jì)方法對(duì)進(jìn)行了驗(yàn)證。
本文所使用的數(shù)據(jù)來源于中國(guó)某海域真實(shí)采集的海洋環(huán)境數(shù)據(jù),涵蓋氣象、水文、營(yíng)養(yǎng)鹽、水質(zhì)等類型。數(shù)據(jù)集記錄了2019.04.15-2019.12.10 每隔半小時(shí)所監(jiān)測(cè)的海洋數(shù)據(jù),共計(jì)11519 條數(shù)據(jù)。特別地,本文使用的時(shí)間序列長(zhǎng)度為10001條,其中,8000條數(shù)據(jù)用于模型的訓(xùn)練,2001 條用于模型的性能測(cè)試。此外,CNN-OLSTMs 模型在訓(xùn)練時(shí)通過打亂樣本對(duì)的時(shí)間先后順序以獲得較高的泛化能力。另外,本文考慮對(duì)海洋生態(tài)環(huán)境影響極大的葉綠素a、濁度、水溫、亞硝酸鹽、藍(lán)綠藻、PH 值作為模型的輸入,同時(shí),也將以上因素作為模型的輸出。實(shí)質(zhì)上,這是多變量時(shí)間序列預(yù)測(cè)問題,充分考慮了數(shù)據(jù)間的相關(guān)性,以此來達(dá)到更好的非線性逼近性能。
針對(duì)原始海洋環(huán)境數(shù)據(jù)存在偏差和大量缺失值的問題,采用數(shù)據(jù)填充、數(shù)據(jù)平滑以及數(shù)據(jù)標(biāo)準(zhǔn)化方法來進(jìn)行海洋環(huán)境數(shù)據(jù)預(yù)處理。具體地,利用與缺失值緊鄰的上一值作為填充值,實(shí)現(xiàn)缺失值填補(bǔ)。針對(duì)海洋環(huán)境數(shù)據(jù)中存在異常值和多噪聲的問題,使用高斯平滑法抑制潛在的噪聲,其表達(dá)式為:
式中,x為輸入數(shù)據(jù),δ為相應(yīng)的標(biāo)準(zhǔn)差分布。最后,采用z-score 標(biāo)準(zhǔn)化方法對(duì)平滑后的數(shù)據(jù)進(jìn)行處理,并按比例縮放,使之落入一個(gè)小的特定區(qū)間,其表達(dá)式為:
式中,xi代表第i個(gè)序列樣本的特征值,代表序列樣本對(duì)應(yīng)特征值的均值,s代表序列樣本對(duì)應(yīng)特征值的標(biāo)準(zhǔn)差。
實(shí)際上,本文提出的CNN-OLSTMs 為多步長(zhǎng)多變量預(yù)測(cè)模型,同時(shí)預(yù)測(cè)6 種海洋環(huán)境因素。本文采用均方誤差(Mean Squared Error,MSE)度量指標(biāo)來評(píng)估模型的在對(duì)模型總體預(yù)測(cè)性能,即
進(jìn)一步,基于總體度量結(jié)果,分別采用均值絕對(duì)誤差(Mean Absolute Error,MAE)、歸一化均方根誤差(Normalized Root Mean Square Error,NRMSE)、決定系數(shù)(Coefficient of Determination,R2)以及方向變化預(yù)測(cè)(Prediction of Change in Direction,POCID)評(píng)估CNN-OLSTMs 針對(duì)每種海洋環(huán)境因素的預(yù)測(cè)性能,具體表達(dá)式如下:
式中,l為樣本集合的大小,為模型在t時(shí)刻的預(yù)測(cè)值,Yt為模型在時(shí)間步t時(shí)刻的真實(shí)值,σ2為預(yù)測(cè)值的方差,Yˉ為真實(shí)值的平均值,Dt為邏輯判別值,其大小由Ft決定,即:
如果Ft大于0,那么Dt等于1,否則等于0。通常,MAE 和NRMSE 數(shù)值越小則表明模型預(yù)測(cè)結(jié)果的殘差越小,即模型預(yù)測(cè)性能越好;而POCID 和R2越大意味著模型擬合效果越好。
為了驗(yàn)證CNN-OLSTMs 模型在海洋環(huán)境數(shù)據(jù)多步預(yù)測(cè)中的優(yōu)勢(shì),本文分別對(duì)比了CNN、LSTM 和GRU 模型。表3 給出了不同模型的多步預(yù)測(cè)性能??傮w上看,隨著預(yù)測(cè)步數(shù)的增加,所有評(píng)估模型的非線性逼近性能變差,而CNN-OLSTMs 具有最優(yōu)的海洋環(huán)境數(shù)據(jù)多步預(yù)測(cè)精度,其MSE 低于其他模型約一個(gè)數(shù)量級(jí)。進(jìn)一步,圖4~圖9 分別給出了不同海洋環(huán)境數(shù)據(jù)的多指標(biāo)預(yù)測(cè)性能度量結(jié)果,這里,考慮的預(yù)測(cè)步長(zhǎng)分別為1、3、6、9、12??梢钥闯?,本文提出的CNN-OLSTMs 在葉綠素a、濁度、水溫、PH和亞硝酸鹽時(shí)間序列預(yù)測(cè)任務(wù)中均表現(xiàn)出良好的非線性逼近性能。以葉綠素a 預(yù)測(cè)的度量NRMSE為例,CNN-OLSTMs 性能比LSTM、CNN 和GRU 分別提升了大約24.9%、67.1%和25.4%??傮w上,隨著預(yù)測(cè)步數(shù)的增加,所有評(píng)估模型的預(yù)測(cè)性能均出現(xiàn)不同程度的退化,這是由于步長(zhǎng)的增大極大地削弱了數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。但是,相比其他評(píng)估模型,CNN-OLSTMs性能評(píng)估指標(biāo)波動(dòng)性更為平緩,這說明預(yù)測(cè)步長(zhǎng)對(duì)其預(yù)測(cè)性能影響更小,主要?dú)w功于模型中兩階段的特征提取機(jī)制,為非線性逼近提供了良好的初始化點(diǎn)。
表4對(duì)比了多步預(yù)測(cè)模式下不同模型的時(shí)間復(fù)雜度,包括訓(xùn)練時(shí)間和測(cè)試時(shí)間,即:多輪迭代情況下評(píng)估模型的平均訓(xùn)練時(shí)間與測(cè)試時(shí)間。可以看出,CNN-OLSTMs訓(xùn)練及測(cè)試時(shí)間均高于其他模型,意味著更高的時(shí)間復(fù)雜度。表5度量了不同模型的空間復(fù)雜度。顯然,CNN-OLSTMs 模型的參數(shù)數(shù)量及參數(shù)大小都高于其他模型。綜上,結(jié)合表3~表5和圖4~圖9,本文提出的CNN-OLSTMs 實(shí)現(xiàn)了多步預(yù)測(cè)性能和模型復(fù)雜性方面的較好折中。
表3 不同模型的多步預(yù)測(cè)性能Tab.3 Multi-step prediction performance of different models
表4 不同模型的時(shí)間復(fù)雜度(單位:時(shí)間/s)Tab.4 Time complexity of different models(Unit:time/s)
表5 不同模型的空間復(fù)雜度Tab.5 Space complexity of different models
圖10 給出了在海洋環(huán)境數(shù)據(jù)12 步前向預(yù)測(cè)任務(wù)中不同模型的預(yù)測(cè)輸出與期望輸出對(duì)比圖,及其誤差波動(dòng)圖。直觀地,CNN-OLSTMs 和GRU 能夠有效地?cái)M合葉綠素a、濁度、水溫、藍(lán)綠藻、PH 和亞硝酸鹽時(shí)序數(shù)據(jù)的變化趨勢(shì),尤其對(duì)于一些尖峰點(diǎn)的擬合程度較高,而且其誤差波動(dòng)幅度相對(duì)較小。為進(jìn)一步評(píng)估模型預(yù)測(cè)性能,圖11 分別繪制出了評(píng)估模型在6 種海洋環(huán)境因素多步預(yù)測(cè)任務(wù)中的散點(diǎn)圖,這直觀地反映回歸分析中數(shù)據(jù)點(diǎn)在直角坐標(biāo)系平面上的分布情況,即多步長(zhǎng)海洋時(shí)序數(shù)據(jù)預(yù)測(cè)中預(yù)測(cè)值變化的總體趨勢(shì)。圖中的分布點(diǎn)越接近基準(zhǔn)線,則意味著這些點(diǎn)對(duì)應(yīng)的模型非線性逼近性能越好。通過圖中綠色標(biāo)識(shí)框可以看出,本文提出的CNN-OLSTMs 的預(yù)測(cè)結(jié)果,沿基準(zhǔn)線更為集中,表明其海洋因素預(yù)測(cè)值與真實(shí)值更為接近,模型的擬合性能更強(qiáng)。因此,從統(tǒng)計(jì)方法的角度再次驗(yàn)證了CNN-OLSTMs 具有良好的非線性逼近性能。
此外,本文還采用了t檢驗(yàn)來驗(yàn)證評(píng)估模型的預(yù)測(cè)性能。t檢驗(yàn)用來計(jì)算預(yù)測(cè)值和真實(shí)值在5%的顯著性水平下是否來自同一分布(假設(shè)是否被接受),由參數(shù)H和P決定。若H=0,則表明預(yù)測(cè)值和真實(shí)值可看作是來自同一統(tǒng)計(jì)分布的數(shù)據(jù);若H=1,則證明兩者有區(qū)分度。若參數(shù)P小于0.05,則認(rèn)為具有差異性,若P小于0.01,則說明差異極其顯著。評(píng)估模型的t檢驗(yàn)結(jié)果如表6 所示。可以看出,CNN-OLSTMs、GRU 以及LSTM 的H值為0,這意味著這些模型的預(yù)測(cè)輸出與真實(shí)的海洋環(huán)境時(shí)間序列可以看作是來自同一分布,預(yù)測(cè)結(jié)果被認(rèn)為真實(shí)可靠。然而,CNN 的H值為1,表明該模型的預(yù)測(cè)結(jié)果不符合海洋環(huán)境真實(shí)數(shù)據(jù)值的分布。另外,對(duì)于P值來說,CNN-OLSTMs 的P值大于其他評(píng)估模型,說明了所提模型的預(yù)測(cè)輸出與真實(shí)的海洋環(huán)境數(shù)據(jù)差異性較小,CNN-OLSTMs 的預(yù)測(cè)性能優(yōu)于其他模型。此外,CNN-OLSTMs 對(duì)水溫預(yù)測(cè)結(jié)果的t檢驗(yàn)的P值稍差與GRU 模型,這本質(zhì)上是由于數(shù)據(jù)采集過程中的一些不穩(wěn)定性,導(dǎo)致了數(shù)據(jù)分布的異常,產(chǎn)生了t檢驗(yàn)的偏差。綜上,基于t檢驗(yàn)分析,我們進(jìn)一步驗(yàn)證了CNN-OLSTMs 模型的有效性。
表6 不同評(píng)估模型性能的t檢驗(yàn)Tab.6 The performance t-tests of different evaluation models
未來6G 空天地海一體化海洋通信網(wǎng)絡(luò)能夠?qū)崿F(xiàn)多元異構(gòu)自適應(yīng)接入、多網(wǎng)系高效融合和多元業(yè)務(wù)承載,為海洋防災(zāi)、減災(zāi)、環(huán)境管理和區(qū)域規(guī)劃提供可靠的數(shù)據(jù)支撐。本文提出了一種基于多階段特征學(xué)習(xí)的海洋環(huán)境數(shù)據(jù)多步長(zhǎng)預(yù)測(cè)模型。CNN用于提取海洋環(huán)境時(shí)序數(shù)據(jù)的局部細(xì)粒度特征,在此基礎(chǔ)上,采用PSO 優(yōu)化多個(gè)LSTMs 實(shí)現(xiàn)二階段的特征再學(xué)習(xí),以充分捕捉時(shí)序數(shù)據(jù)間的依賴關(guān)系。仿真結(jié)果表明,對(duì)比GRU、LSTM 和CNN,本文提出的CNN-OLSTMs 模型的全局誤差MSE 小一個(gè)數(shù)量級(jí),局部誤差(以NRMSE 為例)分別降低了大約10%、10%和65%,進(jìn)一步,通過t檢驗(yàn)和散點(diǎn)圖驗(yàn)證了其良好的非線性逼近性能。但是,CNN-OLSTMs模型的時(shí)間和空間復(fù)雜度相對(duì)較高。未來工作將考慮通過剪枝、知識(shí)蒸餾、權(quán)值共享等模型壓縮方法解決此問題。