吉長東,王 強(qiáng),沈祎凡,潘 飛
(遼寧工程技術(shù)大學(xué) 測繪與地理科學(xué)學(xué)院,遼寧 阜新 123000)
全球衛(wèi)星導(dǎo)航系統(tǒng)(global navigation satellite system,GNSS),在各行各業(yè)都得到了廣泛應(yīng)用,當(dāng)GNSS衛(wèi)星信號穿過電離層時,預(yù)報電離層總電子含量(total electric contents,TEC)對研究電離層隨時間變化和電離層暴都有著重要意義[1-2]。目前應(yīng)用國際GNSS服務(wù)組織(international GNSS service,IGS)提供的格網(wǎng)數(shù)據(jù)建立高精度的TEC預(yù)報模型的方法在TEC短期預(yù)報中取得了很好的效果。具體包括自回歸移動平均模型(auto regressive integrated moving average,ARIMA)[3]、指數(shù)平滑(Holt-Winters)模型[4]、神經(jīng)網(wǎng)絡(luò)模型[5-8]等。其中,神經(jīng)網(wǎng)絡(luò)以其優(yōu)秀的學(xué)習(xí)能力、大規(guī)模并行處理海量數(shù)據(jù)能力以及其在處理非線性與時變性問題上有著巨大優(yōu)勢。但傳統(tǒng)的前饋式神經(jīng)網(wǎng)絡(luò)預(yù)測模型屬于一種非動態(tài)的非循環(huán)的神經(jīng)網(wǎng)絡(luò)模型,利用靜態(tài)網(wǎng)絡(luò)將動態(tài)時間序列建模問題當(dāng)作靜態(tài)建模問題,不能精確地反映TEC時間序列的特性,同時還存在著輸入數(shù)據(jù)個數(shù)難以確定、容易陷入局部最小值和網(wǎng)絡(luò)結(jié)構(gòu)難以確定等不足。而非線性自回歸(nonlinear auto regressive,NAR)神經(jīng)網(wǎng)絡(luò)模型[9-11]是一種動態(tài)的神經(jīng)網(wǎng)絡(luò)模型,能夠記憶以往時間序列的信息并加入到當(dāng)前的輸出計算中。同時,采用動態(tài)神經(jīng)網(wǎng)絡(luò)來對動態(tài)系統(tǒng)進(jìn)行預(yù)測,則能夠更好地反映出TEC時間序列的動態(tài)變化特性。由于時間序列的復(fù)雜性直接對其利用模型預(yù)測并不能取得很好的效果,文獻(xiàn)[12]首先利用經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)的方法對電離層TEC時間序列進(jìn)行分解變換,再對分解后的各個序列分別建立模型進(jìn)行預(yù)報,有效的提高了TEC值預(yù)報精度[12]。因此,本文采用經(jīng)驗?zāi)B(tài)分解[13-14]與非線性自回歸神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法對電離層TEC值進(jìn)行短期預(yù)報,并利用均方根誤差(root mean square error,RMSE)和日平均相對精度(relative accuracy,RA)來評定模型的預(yù)報精度。
NAR模型全稱是非線性自回歸模型它是一種回歸型的動態(tài)的循環(huán)神神經(jīng)網(wǎng)絡(luò)[9]。NAR模型可以實現(xiàn)時間序列依次多個輸入輸出,同時隱層之間采用自鏈接,展開后相當(dāng)于時序之間的相互影響,具有時間觀念。NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的輸入層和輸出層之前增加輸入滯時和輸出滯時來體現(xiàn)其動態(tài)特性。NAR模型的基本結(jié)構(gòu)可以由圖1表示[10]。
圖1中:Y(t)表示神經(jīng)網(wǎng)絡(luò)的輸入與輸出;1∶12表示延時階數(shù),即t時刻的電離層TEC值受到y(tǒng)(t-1),y(t-2),…,y(t-12)時刻TEC值的影響;w為鏈接權(quán)值;b為閾值。NAR電離層TEC值預(yù)測模型的數(shù)學(xué)表達(dá)式為
y(t)=f(y(t-1),y(t-2),y(t-3),…,
y(t-n))
(1)
式中:t為當(dāng)前時刻;n為延時變量的個數(shù);(t-1),y(t-2),…,y(t-n)為模型過去時刻的輸出值;y(t)表示當(dāng)前時刻的預(yù)測值;f是通過網(wǎng)絡(luò)訓(xùn)練的得到的非線性映射函數(shù)。具體的NAR網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示[11]。
圖2中:Xi為網(wǎng)絡(luò)的輸入信號;Hj為隱含層神經(jīng)元的輸出;O(t)為網(wǎng)絡(luò)的輸出。計算公式為
(2)
(3)
式中:Hj為隱含層的輸出;f為隱含層的激活函數(shù);Xi為輸入數(shù)據(jù);wij為輸入層第i個神經(jīng)元到隱含層第j個神經(jīng)元的系數(shù)(權(quán)值);aj為隱含層第j神經(jīng)元的線性關(guān)系的偏倚;O為網(wǎng)絡(luò)的輸出;wj為隱含層第j個神經(jīng)元到輸出層的權(quán)連接值;b為輸出層神經(jīng)元的閾值。
NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型需要通過不斷地調(diào)試參數(shù),使得電離層TEC的預(yù)測值與真值得到有效擬合。其中隱含層節(jié)點數(shù)和延時階數(shù)的選取對NAR動態(tài)神經(jīng)網(wǎng)模型的創(chuàng)建起著決定性作用。隱層節(jié)點個數(shù)的選取目前還沒有具體的數(shù)學(xué)公式,節(jié)點個數(shù)過多不僅會降低網(wǎng)絡(luò)的運行速度,同時還容易出現(xiàn)過度擬合問題,網(wǎng)絡(luò)的泛化能力降低;節(jié)點個數(shù)過少,雖然可以提高網(wǎng)絡(luò)的運行速度,但網(wǎng)絡(luò)的學(xué)習(xí)能力不夠,導(dǎo)致網(wǎng)絡(luò)的預(yù)報精度較差。隱含層節(jié)點數(shù)通常采用經(jīng)驗公式和大量試驗的方法來確定。經(jīng)驗公式為
(4)
式中:n1為隱含層節(jié)點神經(jīng)元個數(shù);n2為輸入層節(jié)點神經(jīng)元個數(shù);n3為輸出層節(jié)點神經(jīng)元個數(shù);a為[1,10]之間的調(diào)整值(整數(shù))。本文先以經(jīng)驗公式作為隱含層節(jié)點數(shù)的初始值然后經(jīng)過大量實驗不斷調(diào)整節(jié)點個數(shù)和延遲參數(shù)選取最優(yōu)神經(jīng)元結(jié)構(gòu)。隱層訓(xùn)練函數(shù)使用運算時間較短和收斂速度較快的LM算法。
經(jīng)驗?zāi)B(tài)分解是在傅里葉變換和小波變換的基礎(chǔ)上發(fā)展起來的一種新型的信號預(yù)處理的方法,它不需要任何基函數(shù)就可以自適應(yīng)的將復(fù)雜的無規(guī)律的信號分解為特征單一的不同頻率的imf分量和一個趨勢項,各個imf分量可以看作是影響原始信號的不同因數(shù),趨勢項則反映了原始信號的整體變化趨勢[12]。
EMD-NAR模型的算法流程圖如圖3所示。
首先利用EMD頻譜分析功能將IGS提供的電離層TEC數(shù)據(jù)進(jìn)行分解變換得到不同級別不同頻率的單一的子時間序列,然后對所得的各個子時間序列分別建立NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)報進(jìn)而重構(gòu)得到最終預(yù)報值。具體步驟如下:
1)利用EMD分解將TEC時間序列x(t)分解為一系列不同級別不同頻率且特征單一的imf分量,即[13]
(5)
式中:imfi為EMD分解所得到的本特征分量;n為分量總數(shù);r(t)為趨勢項余量。
2)對得到的分量和趨勢項分別建立NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)報,并整合所有模型的結(jié)果,得到TEC的預(yù)報值。采用IGS中心提供的觀測數(shù)據(jù)作為對比值,以日平均相對精度RA和均方根誤差RMSE作為評價指標(biāo)。其相應(yīng)的定義為
(6)
(7)
式中:Ipre,i為第i個歷元的預(yù)報值;IIGS,i為第i個歷元IGS中心的觀測值;n為時段的歷元長度。
根據(jù)太陽黑子數(shù)和F10.7指數(shù),選取IGS提供的2008年年積日第61~80天、第147~166天、第239~258天、第330~349天高緯度(85°N,120°E)、中緯度(45°N,120°E)和低緯度(5°N,120°E)數(shù)據(jù)作為電離層平靜期樣本序列;選取2013年年積日第146~165天和第225~244天高緯度(85°N,125°E)、中緯度(45°N,120°E)和低緯度(5°N,120°E)的數(shù)據(jù)建立電離層活躍期TEC時間序列。將所選TEC樣本序列數(shù)據(jù)分為3個部分:60 %(所選序列前12 d)的數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型,以10 %(所選序列中間2 d)的數(shù)據(jù)作為驗證集來輔助模型的構(gòu)建,以30 %(所選序列后6 d)的數(shù)據(jù)作為測試數(shù)據(jù)用于評估模型的精度。
為了驗證EMD-NAR模型的預(yù)報精度,采用單一的NAR模型、EMD-BP模型作為對比模型進(jìn)行對比分析,以預(yù)測擬合電離層TEC值圖形與計算誤差的形式來實證其差異。
圖4為EMD-NAR模型和單一的NAR模型的預(yù)報結(jié)果對比圖。其中橫坐標(biāo)為預(yù)測歷元的個數(shù),以時段長度2 h為單位;縱坐標(biāo)表示TEC值,單位為TUCu的個數(shù),1個TUCu等于“1016個電子/平方米”??梢钥闯鱿噍^于單一模型EMD-NAR模型的預(yù)報結(jié)果能更好地反映電離層TEC值的變化情況,預(yù)測性能更好,且預(yù)報結(jié)果IGS中心提供的TEC值更為接近,誤差更小。表1從整體上反映了單一NAR模型和EMD-NAR模型的殘差誤差的分布情況。單一NAR模型預(yù)報6 d的平均殘差小于1個TECu的約占66.7 %,而組合模型約為81.9 %,殘差大于3個TECu的單一NAR模型約占8.3 %,而EMD-NAR模型僅為5.5 %。
預(yù)報天數(shù)/dNAR模型/EMD-NAR模型(以TECu個數(shù)計)Δ<1 1≤Δ<22≤Δ<3Δ≥3158.3/75.016.7/8.38.3/16.716.7/0.0266.7/91.68.3/8.316.7/0.08.3/0.0358.3/83.333.3/0.08.3/8.30.0/8.3475.0/75.08.3/8.38.3/8.38.3/8.3575.0/75.00.0/16.716.7/0.08.3/8.3666.7/91.616.7/0.08.3/0.08.3/8.3
圖5為EMD-NAR模型和EMD-BP模型的預(yù)報結(jié)果對比圖。其中橫坐標(biāo)為預(yù)測歷元的個數(shù),以時段長度2 h為單位;縱坐標(biāo)表示TEC值,單位為TECu的個數(shù)。可以明顯看出相較于EMD-BP模型EMD-NAR模型具有更好的預(yù)報精度。統(tǒng)計不同時段的預(yù)報殘差得到表2??梢钥闯鯡MD-NAR模型的預(yù)報精度數(shù)學(xué)性能指標(biāo)方面也明顯優(yōu)于EMD-BP模型。
預(yù)報天數(shù)/dEMD-BP模型/EMD-NAR模型(以TECu個數(shù)計)Δ<1 1≤Δ<22≤Δ<3Δ≥3152.8/83.316.7/8.316.7/5.613.8/2.8261.1/75.019.4/16.711.1/8.38.3/0.0358.3/77.816.7/11.18.3/5.616.7/5.6463.9/83.38.3/8.316.7/2.811.1/5.6555.6/80.619.5/16.713.8/0.011.1/2.8666.7/75.016.7/16.78.3/5.68.3/2.8
計算各個時段的相對精度和RMSE得到表3,可以看出在相對精度和RMSE方面,EMD-NAR模型明顯優(yōu)于單一NAR模型和EMD-BP模型,從數(shù)學(xué)性能指標(biāo)方面驗證了上述結(jié)果。
表3 不同模型的RMSE和RA
圖6對EMD-NAR模型在平靜期和活躍期高、中、低3個不同緯度的預(yù)報結(jié)果進(jìn)行了統(tǒng)計,其中橫坐標(biāo)為預(yù)測歷元的個數(shù),以時段長度2 h為單位;縱坐標(biāo)表示TEC值,單位為TECu的個數(shù)??梢钥闯觯陔婋x層平靜期與活躍期利用EMD-NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型預(yù)測得到的TEC值與實際值相比在高、中和低緯度地區(qū)都能較好地反映TEC的變化情況。 且在平靜期有更好的擬合效果。
由表4的殘差統(tǒng)計結(jié)果得出,電離層平靜期和活躍期的預(yù)報殘差在1個TECu的分別占71.2 %和68.5 %,預(yù)報殘差大于3個TECu的分別為9.3 %和12.5 %。可以看出:總體來說EMD-NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型具有較高的預(yù)報精度,預(yù)報結(jié)果也比較理想;但是活躍期的電離層的不穩(wěn)定性導(dǎo)致在電離層平靜期的預(yù)報結(jié)果要明顯優(yōu)于電離層活躍期的預(yù)報結(jié)果。
預(yù)報天數(shù)/d平靜期活躍期Δ<1 1≤Δ<22≤Δ<3Δ≥3Δ<11≤Δ<22≤Δ<3Δ≥3175.011.15.68.363.913.98.313.9269.413.95.611.166.711.111.111.1366.716.711.15.669.411.15.613.9472.213.95.68.372.25.65.616.7575.08.35.611.166.78.38.311.1669.411.18.311.172.211.111.18.3
表5和表6對電離層平靜期、活躍期在不同經(jīng)度的相對精度和均方根誤差進(jìn)行了統(tǒng)計;從另一個角度驗證了圖6的結(jié)論。可以看出;EMD-NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型在平靜期和活躍期的不同經(jīng)緯度預(yù)報值都有較高相對精度和較優(yōu)的均方根誤差;預(yù)報結(jié)果的相對精度和均方根誤差在不同緯度地區(qū)略有差異,相對精度在低緯度地區(qū)最優(yōu),而均方根誤差則在高緯度地區(qū)最優(yōu),這主要是由TEC的含量在不同緯度有很大不同所導(dǎo)致的。
表5 電離層平靜期預(yù)測值的RMSE和RA
本文首先對比了單一NAR模型和EMD-NAR模型在相同環(huán)境下的預(yù)報性能,驗證了組合模型的優(yōu)越性,然后經(jīng)過大量實驗對EMD-NAR模型在不同環(huán)境下(不同活躍期、不同緯度)的預(yù)報性能做出如下小結(jié):
1)相較于單一NAR模型,EMD-NAR模型,預(yù)報效果和精度都有很好的提升,與實際數(shù)據(jù)吻合更好;
2)與一般神經(jīng)網(wǎng)絡(luò)相比,動態(tài)神經(jīng)網(wǎng)絡(luò)的擬合和預(yù)測性能更優(yōu);
3)EMD-NAR動態(tài)神經(jīng)網(wǎng)絡(luò)模型能很好地反映電離層TEC的變化特性,平靜期和活躍期的預(yù)測平均相對精度分別為94 %和88.3 %,預(yù)報殘差小于1個TECu的分別占71 %和68.5 %,小于3個TECu的分別占90.3 %和87.5 %,活躍期的電離層的不穩(wěn)定性導(dǎo)致在電離層平靜期的預(yù)報結(jié)果要明顯優(yōu)于電離層活躍期的預(yù)報結(jié)果。