高揚(yáng) 呂建永 王明 李婧媛 熊雅婷 彭光帥
(南京信息工程大學(xué)空間天氣研究所 南京 210044)
空間天氣的主要源頭是太陽活動(dòng), 太陽活動(dòng)的監(jiān)測和預(yù)報(bào)對人類社會發(fā)展具有重要價(jià)值. 預(yù)報(bào)的時(shí)效性、準(zhǔn)確性和規(guī)范性直接關(guān)系到能否有效避免惡劣空間天氣對人類社會帶來的巨大危害. 因此對源頭太陽活動(dòng)的長期監(jiān)測和預(yù)報(bào)顯得尤為重要, 太陽活動(dòng)及其對近地空間的影響也一直是空間天氣預(yù)報(bào)業(yè)務(wù)領(lǐng)域重要的研究課題. 其中F10.7和太陽黑子無疑是太陽活動(dòng)的最重要的兩個(gè)指標(biāo).F10.7指數(shù)(也稱為渥太華指數(shù)或Covington指數(shù))為10.7 cm的太陽輻射通量, 是日冕上所有源區(qū)的總射電輻射通量值, 為一個(gè)極好的太陽活動(dòng)指示器, 反映了太陽活動(dòng)性的強(qiáng)弱, 單位為sfu (1 sfu =10-22W·m-2·Hz-1).F10.7包含太陽活動(dòng)區(qū)的變化信息, 通常被人們稱為太陽F10.7指數(shù), 它是記錄太陽活動(dòng)時(shí)間最長的3個(gè)指數(shù)之一. 事實(shí)證明,F(xiàn)10.7指數(shù)在確定和預(yù)測空間天氣方面非常有價(jià)值.在許多高層大氣模型和磁層模型中有廣泛的科學(xué)應(yīng)用, 其長期數(shù)據(jù)記錄提供了6個(gè)太陽活動(dòng)周期的氣候信息. 而且, 由于F10.7可以在所有天氣條件下從地面準(zhǔn)確可靠地進(jìn)行測量, 是一個(gè)非??煽康臄?shù)據(jù)集, 幾乎沒有間隔或校準(zhǔn)問題.
F10.7是大氣密度模型的輸入?yún)?shù), 對其準(zhǔn)確預(yù)報(bào)尤為重要, 目前圍繞F10.7指數(shù)的短、中、長期預(yù)報(bào)是世界各地空間天氣預(yù)報(bào)機(jī)構(gòu)的重要業(yè)務(wù), 其中以未來幾天的短期預(yù)報(bào)為必備內(nèi)容. 目前對F10.7的預(yù)報(bào)主要類型有兩種: 自回歸分析方法和大數(shù)據(jù)結(jié)合機(jī)器深度學(xué)習(xí).
1985年, Mordvinov[1]開發(fā)了一個(gè)乘法自回歸模型來預(yù)測F10.7的月值. 2005年, Zhong等[2]采用奇異譜分析信號處理技術(shù)結(jié)合相似周期法預(yù)測太陽活動(dòng)低年的未來27 dF10.7, 選取了2004年5月的31 d數(shù)據(jù)作測試, 其預(yù)測的平均相對誤差為14%,中期預(yù)報(bào)結(jié)果優(yōu)于美國空軍(AAF). 2008年,Zhao等[3]通過研究太陽黑子數(shù)(SSN)和F10.7的關(guān)系, 根據(jù)前3 yr的線性回歸斜率與F10.7最大值之間的關(guān)系, 構(gòu)造了一種預(yù)測F10.7年最大值的F10.7長期預(yù)報(bào)方法. 2010年, Liu等[4]采用了54階自回歸模型, 利用前750 d歷史數(shù)據(jù)擬合出的模型預(yù)測太陽活動(dòng)峰年的27 dF10.7, 選取了2005-2007年間的612 d數(shù)據(jù)進(jìn)行測試, 其中期預(yù)報(bào)的平均相對誤差為19.6%, 預(yù)報(bào)結(jié)果和AAF相當(dāng). 2014年,Wang等[5]采用了自回歸方法, 利用前135 d歷史數(shù)據(jù)擬合模型后給出了后54 d的中期預(yù)報(bào), 其27 d預(yù)測結(jié)果和54階自回歸模型相當(dāng), 但使用的參數(shù)和需要的歷史資料都明顯減少. 由于各個(gè)活動(dòng)區(qū)域的隨機(jī)出現(xiàn)和復(fù)雜演化,F(xiàn)10.7指數(shù)在震蕩時(shí)間范圍內(nèi)的幅度及其周期都在不斷發(fā)生變化, 因此目前采用了傳統(tǒng)的數(shù)學(xué)統(tǒng)計(jì)以及信號頻譜分析等手段來提高預(yù)報(bào)準(zhǔn)確性的能力有限.
機(jī)器學(xué)習(xí)因其在數(shù)據(jù)處理中的出色性能日益受到重視, 也應(yīng)用到太陽活動(dòng)的研究中. 機(jī)器學(xué)習(xí)的產(chǎn)生和發(fā)展主要經(jīng)歷了兩個(gè)階段: 傳統(tǒng)的機(jī)器學(xué)習(xí)階段和深度學(xué)習(xí)階段. 1998年, Zen等[6]首先提出了基于人工神經(jīng)網(wǎng)絡(luò)來預(yù)報(bào)未來1個(gè)月的月均F10.7指數(shù), 模型中的輸入量不僅使用了F10.7歷史數(shù)據(jù)而且加入了前一個(gè)太陽活動(dòng)周期的一些統(tǒng)計(jì)信息. 2001年, Chatterjee等[7]采用了雙層隱藏層單元的神經(jīng)網(wǎng)絡(luò), 通過對一個(gè)太陽活動(dòng)周數(shù)據(jù)的擬合方式實(shí)現(xiàn)了一個(gè)可以利用11 d的歷史數(shù)據(jù)來預(yù)報(bào)未來1 dF10.7指數(shù)的動(dòng)態(tài)模型. 2009年, Huang等[8]提出使用支持向量回歸(Support Vector Regression,SVR)對2002-2006年太陽活動(dòng)低年進(jìn)行預(yù)測, 一日預(yù)報(bào)最優(yōu)平均絕對百分比誤差(MAPE)為2.71%.以上傳統(tǒng)的機(jī)器學(xué)習(xí)模型確實(shí)能在一定條件下解決部分問題, 但因?yàn)槠浔旧硎菧\層(只有一層或兩層), 因此不能更深入學(xué)習(xí)到數(shù)據(jù)隱藏的信息, 尤其是時(shí)間序列周期的復(fù)雜變化. 為了解決模型如何學(xué)習(xí)到大數(shù)據(jù)復(fù)雜性的問題, 深度學(xué)習(xí)出現(xiàn)了, 并開始應(yīng)用到其他各個(gè)領(lǐng)域.
2018年, Wang等[9]提出使用長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long and Short-Term Memory, LSTM), 建立了一個(gè)包含90個(gè)神經(jīng)元的隱藏層, 采用1959-2013年間55 yr共5個(gè)完整的太陽活動(dòng)周作為訓(xùn)練集, 并將1957-1958年峰年數(shù)據(jù)作為測試集1,2014-2015年谷年數(shù)據(jù)作為測試集2. 測試集1和測試集2的7 d預(yù)報(bào)相對誤差結(jié)果分別為12%和11%,27 d預(yù)報(bào)分別為14%和12%. 不同于以往的研究,在深度學(xué)習(xí)中, 預(yù)測的輸入和輸出值之間的關(guān)系不需要假設(shè). 神經(jīng)網(wǎng)絡(luò)對復(fù)雜的太陽活動(dòng)有很強(qiáng)的描述能力. LSTM模型可以一次訓(xùn)練、固定參數(shù), 大大簡化了日常預(yù)報(bào), 同時(shí)有利于模型在其他相關(guān)的應(yīng)用中推廣, 首次實(shí)現(xiàn)自動(dòng)化預(yù)報(bào)的工作. 在2020年, Okon等[10]利用反饋神經(jīng)網(wǎng)絡(luò)(BPNN)研究了SSN與F10.7的關(guān)系, 把太陽活動(dòng)周期劃分為4個(gè)階段, 并在每階段選取了70%數(shù)據(jù)作為訓(xùn)練集, 剩下的作為預(yù)測集. 結(jié)果表明利用SSN可以預(yù)測F10.7, 其預(yù)測集均方根誤差最優(yōu)約為13.68個(gè)太陽輻射通量單位.
F10.7指數(shù)的預(yù)報(bào)從傳統(tǒng)機(jī)器學(xué)習(xí)到深度學(xué)習(xí)的演變, 也是從監(jiān)督學(xué)習(xí)到無監(jiān)督學(xué)習(xí)的進(jìn)步, 讓深度學(xué)習(xí)算法自動(dòng)學(xué)習(xí)大數(shù)據(jù)的內(nèi)在復(fù)雜關(guān)系,Bruevich等[11]、Lukianova等[12]和Tapping等[13]的研究顯示了SSN、太陽黑子面積、極紫外輻射等太陽活動(dòng)評價(jià)指標(biāo)對F10.7的預(yù)報(bào)具有積極意義.Wang等[9]在總結(jié)和討論中對模型的后續(xù)改進(jìn)建議中也提到, 通過深度學(xué)習(xí)可以將這些數(shù)值指標(biāo)直接整合到模型中, 而LSTM作為深度學(xué)習(xí)時(shí)間序列模型的典型代表, 能夠直接從海量數(shù)據(jù)自動(dòng)學(xué)習(xí)有效特征. 與傳統(tǒng)方法相比, LSTM將這些信息融合要容易得多. SSN有更長的歷史記錄和更明顯的太陽活動(dòng)特征, 但當(dāng)前對于F10.7預(yù)報(bào), 還未有人嘗試把SSN引入到LSTM模型中, 而這也是本工作的嘗試.
本文的結(jié)構(gòu)如下: 第2節(jié)介紹數(shù)據(jù)來源和LSTM模型; 第3節(jié)介紹時(shí)間序列統(tǒng)計(jì)分析F10.7指標(biāo)和SSN兩者的關(guān)系; 第4節(jié)介紹模型的構(gòu)建和模型預(yù)報(bào)結(jié)果的對比研究; 最后為結(jié)語.
本研究需要用到的數(shù)據(jù)包括F10.7和SSN.F10.7指數(shù)數(shù)據(jù)可以從美國國家海洋和大氣管理局等機(jī)構(gòu)的網(wǎng)站下載(ftp://ftp.ngdc.noaa.gov,www.celestrak.com). SSN來自于http://www.sidc.be/silso/datafiles. 這些數(shù)據(jù)公布的時(shí)間長短不一, 我們首先選取公共時(shí)間點(diǎn)1957年10月1日至2020年12月31日的2.3萬個(gè)數(shù)據(jù)(包含19-24的5個(gè)太陽活動(dòng)周時(shí)間). 其次為了和美國空間天氣預(yù)報(bào)中心(SWPC)的結(jié)果進(jìn)行對比, 我們選擇1957年10月1日至1992年12月31日36 yr的數(shù)據(jù)作為訓(xùn)練集, 1993年1月1日至2020年12月31日28 yr的數(shù)據(jù)作為預(yù)測集.
深度神經(jīng)網(wǎng)絡(luò)(DNN)是機(jī)器學(xué)習(xí)模型, 已經(jīng)成功地解決了許多問題,如語音識別和圖像目標(biāo)識別.然而, 由于DNN是直接預(yù)測序列, 常用的DNN體系結(jié)構(gòu)(如前饋神經(jīng)網(wǎng)絡(luò))并不適合連續(xù)預(yù)測序列. 這種網(wǎng)絡(luò)只根據(jù)當(dāng)前的輸入產(chǎn)生預(yù)測, 與任何先前的輸入無關(guān), 因此忽略了時(shí)間序列問題中存在的時(shí)間依賴性. 因此, 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)提供了一種解決方案, 即使用內(nèi)部狀態(tài)以連續(xù)的時(shí)間步長來記憶信息.
傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型主要使用梯度反向傳播算法進(jìn)行訓(xùn)練, 這種方法會導(dǎo)致較長序列的梯度消失問題. 因此, 長短時(shí)的記憶神經(jīng)網(wǎng)絡(luò)是一種循環(huán)式記憶神經(jīng)網(wǎng)絡(luò)的形式, 專門為了克服這種梯度性能消失的問題產(chǎn)生, 是一個(gè)能夠存儲更長時(shí)間信息的模型. 這些長短時(shí)的記憶神經(jīng)網(wǎng)絡(luò)是由單元組成, 單元包含對信息流執(zhí)行操作的內(nèi)部機(jī)制門.這些門背后的一般思想是, 它們學(xué)習(xí)給定序列中的哪些數(shù)據(jù)是有意義應(yīng)該保存的, 哪些數(shù)據(jù)是可以忘記的. 這樣一來相關(guān)信息可以通過更長的序列傳遞, 因此, 模型可以做出更好的預(yù)測.
如圖1, 這是一個(gè)包含了3個(gè)交互層的LSTM重復(fù)模塊. 上方從左到右的黑線表示單元狀態(tài), 可以控制信息流并且把信息傳輸?shù)较乱粋€(gè)時(shí)刻狀態(tài). 圈中代表的是逐點(diǎn)算子(pointwise operation), 矩形框中表示的是學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)層. 合并的線表示向量連接, 分開的線表示向量復(fù)制, 其中it、ft、ot分別是t時(shí)刻的輸入門、遺忘門和輸出門,Ct、~Ct分別是狀態(tài)量和輸入量,σ(x)和tanh(x)分別代表sigmoid和tanh激活函數(shù),xt和ht分別表示t時(shí)刻的輸入向量和隱藏層向量.
圖1 LSTM的結(jié)構(gòu)圖Fig.1 Structure diagram of LSTM neural network
LSTM單元結(jié)構(gòu)一般需要包含3個(gè)門, 即it、ft和ot, 通過這3個(gè)門來控制神經(jīng)單元或者增加單元信息, 從而我們可以同時(shí)實(shí)現(xiàn)記憶和遺忘的功能. Yang等[14]對此進(jìn)行了詳細(xì)的描述, 這里予以簡單介紹. 門作為信息選擇性通過結(jié)構(gòu)由sigmoid和tanh激活函數(shù)以及點(diǎn)乘操作組成. sigmoid激活函數(shù)表達(dá)式為
激活函數(shù)給神經(jīng)元引入非線性元素, 使神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到非線性關(guān)系, 提高神經(jīng)網(wǎng)絡(luò)預(yù)測模型對F10.7指數(shù)預(yù)測的適用性. LSTM神經(jīng)網(wǎng)絡(luò)工作過程如下:
步驟1: 選擇丟棄哪些我們從上一個(gè)狀態(tài)中得到的信息. 遺忘門決定了哪些信息要保留, 哪些信息要忘記. 首先對xt和ht-1進(jìn)行加權(quán)和偏置,Wf和bf分別為遺忘門的權(quán)重和偏置量, 它通過一個(gè)sigmoid激活函數(shù)σ(x)傳遞信息,該函數(shù)賦值于0到1之間, 一個(gè)值接近1表示保留該信息, 而接近0的值表示忘記, 表達(dá)式為
步驟2: 更新信息. 同樣以上一個(gè)時(shí)刻ht-1及當(dāng)前輸入xt作為輸入進(jìn)行加權(quán)和偏置, 分別通過sigmoid和tanh激活函數(shù)信息, 產(chǎn)生[0, 1]之間的輸入控制量it和[-1, 1]之間的輸入量~Ct,it用于控制~Ct疊加到狀態(tài)量中的程度, 其計(jì)算公式為
式中Wi和Wc分別代表輸入門和控制單元權(quán)重,bi和bc分別是輸入和控制單元偏置.
步驟3: 決定模型輸出. 將ft與上一時(shí)刻狀態(tài)量Ct-1及輸入控制量it與輸入量~Ct分別按元素相乘, 得到保存歷史信息的當(dāng)前時(shí)刻狀態(tài)量Ct, 其計(jì)算公式為
式中⊙表示按元素相乘. 通過sigmoid激活函數(shù)控制ht-1及xt得到ot, 使用tanh激活函數(shù)將Ct壓縮到[-1, 1]之間, 再與產(chǎn)生的ot按元素相乘得到ht, 計(jì)算公式為
其中Wo和bo分別為輸出門權(quán)重和偏置. 最后對隱藏狀態(tài)量ht進(jìn)行加權(quán)和偏置得到預(yù)測值yt, 計(jì)算公式為
本文在構(gòu)建模型之前先要對F10.7和SSN的時(shí)間序列進(jìn)行分析. 它們的時(shí)間序列是有序的觀測值序列, 通常是按照時(shí)間觀測的, 符合魏武雄[15]在《時(shí)間序列分析》一書中對時(shí)間序列的特征總結(jié),即時(shí)間序列的本質(zhì)特征為觀測值是相互依賴或者相關(guān)的, 且觀測值是有序的.F10.7和SSN序列滿足以上特征: 觀測值有約11 yr的周期, 觀測值是相互依賴且有序的, 具體見圖2.
圖2 F10.7和SSN的時(shí)間序列圖Fig.2 Time series of F10.7 and sunspot number
從圖2可見, 數(shù)據(jù)包含了5-6個(gè)太陽活動(dòng)周期的數(shù)據(jù), 我們可以發(fā)現(xiàn)以下兩點(diǎn): (1)F10.7和SSN在整體的波動(dòng)趨勢上一致, 都準(zhǔn)確地反映了太陽活動(dòng)的周期性變化, 呈現(xiàn)出約11 yr周期的周期循環(huán); (2)兩者在局部上呈現(xiàn)細(xì)微的差異性, SSN的波動(dòng)幅度比F10.7要大, 周期特征更加明顯. 圖3是F10.7和SSN的一元線性擬合圖. 為了更具體地表示兩者的關(guān)系, 我們根據(jù)Okon等[10]所言兩者存在線性關(guān)系, 結(jié)合我們的數(shù)據(jù)對兩者進(jìn)行線性擬合并進(jìn)行了顯著性檢驗(yàn). 可以看到絕大多數(shù)的點(diǎn)散落在擬合直線周圍, 此外通過觀察可以看到在SSN約為60處有一個(gè)略偏離擬合曲線的點(diǎn)達(dá)到了250左右, 本著科學(xué)嚴(yán)謹(jǐn)?shù)脑瓌t, 不對這個(gè)略微離群點(diǎn)進(jìn)行處理.F10.7和SSN線性擬合相關(guān)性分析結(jié)果如下: (1)建立兩者的經(jīng)驗(yàn)公式,F(xiàn)10.7= 0.602× SSN + 66.765; (2)建立的線性模型擬合優(yōu)度R-square為0.91并且p值檢驗(yàn)小于0.01, 明顯通過檢驗(yàn). 在數(shù)值上更進(jìn)一步顯示出兩者存在緊密聯(lián)系, 都是太陽活動(dòng)的一種具體表現(xiàn). 因此我們接下來嘗試聯(lián)合SSN建立多變量LSTM (M-LSTM)模型.
圖3 F10.7和SSN的線性擬合公式和顯著性檢驗(yàn)Fig.3 Linear fitting formula and significance test for F10.7 and sunspot number
本節(jié)基于建立的聯(lián)合SSN的M-LSTM模型對F10.7進(jìn)行7 d短期預(yù)測, 實(shí)現(xiàn)過程如圖4所示, 具體實(shí)驗(yàn)步驟如下:
圖4 聯(lián)合SSN的M-LSTM神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練及預(yù)測流程圖Fig.4 The training and prediction flow chart of multivariable LSTM neural network combined with sunspot number
(1)獲取F10.7和SSN的數(shù)據(jù), 對數(shù)據(jù)進(jìn)行缺值檢查、描述性分析以及標(biāo)準(zhǔn)化等預(yù)處理措施; (2)對預(yù)處理過后的數(shù)據(jù)集按時(shí)間1993年前后劃分成訓(xùn)練集和預(yù)測集; (3)針對訓(xùn)練集數(shù)據(jù)特點(diǎn), 首先需要選取訓(xùn)練模型、確定模型結(jié)構(gòu), 通過訓(xùn)練數(shù)據(jù)確定LSTM的網(wǎng)絡(luò)層數(shù)以及初始值等參數(shù); (4)在迭代的過程中選取最佳訓(xùn)練模型并進(jìn)行保存; (5)利用預(yù)測集作為模型的輸入, 將獲得的輸出和實(shí)際值進(jìn)行比對實(shí)驗(yàn), 并統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果, 按年分類和SWPC進(jìn)行對比.
建模首先要進(jìn)行模型參數(shù)確定和分析. 考慮到太陽活動(dòng)表現(xiàn)出中短時(shí)間尺度平均27 d的周期性變化特征, 而模型的輸入需要包含至少一個(gè)完整的太陽自轉(zhuǎn)周期的信息, 為降低太陽一個(gè)自轉(zhuǎn)周期27 d內(nèi)可能出現(xiàn)異常值的影響, 本工作采用了兩個(gè)太陽自轉(zhuǎn)周期54 d作為模型的輸入. 對未來7 d的F10.7預(yù)報(bào). 本文所提出的聯(lián)合SSN的深度神經(jīng)網(wǎng)絡(luò)模型是基于PyTorch深度學(xué)習(xí)框架實(shí)現(xiàn)的, 主要是通過Adam梯度下降優(yōu)化算法對LSTM進(jìn)行優(yōu)化, 并自動(dòng)學(xué)習(xí)記憶時(shí)間序列的特征生成最優(yōu)模型, 最后通過全連接層后進(jìn)行結(jié)果預(yù)測. 所以我們在預(yù)測時(shí)使用標(biāo)準(zhǔn)化后的均方誤差(MSE)作為損失函數(shù)在模型中訓(xùn)練性能的評價(jià)標(biāo)準(zhǔn)(兩者曲線一起下降最優(yōu)). 用量變的形式呈現(xiàn)出隨著不斷迭代,模型通過Adam算法梯度下降不斷優(yōu)化減少Loss值的過程. 訓(xùn)練集和測試集的損失值見圖5.
圖5 訓(xùn)練集和測試集的損失值Fig.5 Loss values of training set and test set
訓(xùn)練集通過37次迭代Loss值從最初的0.0048迅速降低到17次迭代后的0.002564, 并穩(wěn)定緩慢地不斷下降直到迭代30次后達(dá)到最優(yōu)值0.002418,隨后緩慢波動(dòng)趨于平穩(wěn). 而測試集通過36次迭代Loss值從最初的0.002617迅速降低到16次迭代后的0.001433,并穩(wěn)定緩慢地不斷下降,直到在27次迭代后達(dá)到最優(yōu)的0.001374, 然后緩慢波動(dòng)趨于平穩(wěn).因此綜合考慮模型的魯棒性和通用性, 我們選擇測試集的第27次結(jié)果作為聯(lián)合SSN的M-LSTM最優(yōu)模型. 表1是最優(yōu)模型的詳細(xì)參數(shù), 供今后建模參考.
表1 聯(lián)合SSN的M-LSTM模型訓(xùn)練參數(shù)Table 1 Training parameters of the joint sunspot number multivariable LSTM model
參考業(yè)務(wù)部門, 如SWPC和中科院空間環(huán)境預(yù)報(bào)中心官網(wǎng)上的評估方法, 我們選取了3個(gè)評估量來衡量模型的性能, 分別為平均絕對誤差MAE、平均絕對百分比誤差MAPE和均方根誤差RMSE. 圖6是建立的聯(lián)合SSN的M-LSTM模型對1993-2019年F10.7指數(shù)第7 d預(yù)報(bào)的MAPE圖.從圖中我們可以看出, 預(yù)報(bào)誤差與太陽活動(dòng)水平呈正相關(guān). 太陽活動(dòng)處于峰年時(shí), 整體較高, 波動(dòng)較強(qiáng), 這導(dǎo)致預(yù)報(bào)誤差明顯偏大, 太陽活動(dòng)處于谷年時(shí)預(yù)報(bào)誤差較小, 上升和下降年的預(yù)報(bào)誤差和太陽活動(dòng)年的上升和下降期的趨勢基本吻合, 整體預(yù)報(bào)誤差在峰年和谷年之間. 聯(lián)合SSN建立的MLSTM模型預(yù)報(bào)的MAPE結(jié)果, 在太陽活動(dòng)峰年可達(dá)12.9%以內(nèi), 谷年最優(yōu)可達(dá)2.5%以內(nèi).
圖6 1993—2019年聯(lián)合SSN的M-LSTM模型預(yù)報(bào)F10.7指數(shù)第7 d的MAPE圖Fig.6 The seventh day MAPE of F10.7 index forecast by the joint sunspot number multivariable LSTM model from 1993 to 2019
為了檢驗(yàn)引入SSN對LSTM預(yù)報(bào)結(jié)果的影響,我們將建立的聯(lián)合SSN的M-LSTM和建立的僅用F10.7作為模型輸入的單變量LSTM(U-LSTM)的結(jié)果進(jìn)行對比, 結(jié)果如圖7所示. 可以看到我們建立的聯(lián)合SSN的M-LSTM模型的整體MAPE要低于僅用F10.7作為模型輸入的LSTM模型, 從局部來看, 聯(lián)合了SSN的模型對太陽活動(dòng)峰年預(yù)測的MAPE有明顯的降低, 最高從14.29降低到12.13,降低了2.16; 對太陽活動(dòng)谷年預(yù)測的MAPE也有一定的降低, 從預(yù)測結(jié)果的3.50減低到2.49, 降低了1.01, 整體提升了約5%的性能.
圖7 1993—2019年U-LSTM和M-LSTM模型預(yù)報(bào)F10.7指數(shù)第7 d的MAPE對比圖Fig.7 Comparison of the seventh day MAPE of F10.7 forecast by U-LSTM model and M-LSTM from 1993 to 2019
為了檢驗(yàn)我們建立的聯(lián)合SSN的M-LSTM模型短期預(yù)報(bào)的精度, 我們和SWPC制作發(fā)布的模型預(yù)測評估結(jié)果做了對比, 因?yàn)槠涔嫉腞MSE評估結(jié)果從1993-2013涵蓋約兩個(gè)太陽活動(dòng)周的數(shù)據(jù),我們也按照年統(tǒng)計(jì)了我們預(yù)測集的預(yù)測結(jié)果和其進(jìn)行對比. 結(jié)果對比圖如圖8.
圖8 1993—2013年M-LSTM模型和SWPC預(yù)報(bào)F10.7指數(shù)第7 d的RMSE對比圖Fig.8 Comparison of the seventh day RMSE of F10.7 forecast by M-LSTM model and SWPC from 1993 to 2013
我們發(fā)現(xiàn)聯(lián)合SSN的M-LSTM模型預(yù)報(bào)的RMSE低于SWPC, 約低了1.28, 相對下降11%.在2000年太陽活動(dòng)峰年降低得最多, 可達(dá)3.07. 可以發(fā)現(xiàn)本研究建立的聯(lián)合SSN的M-LSTM模型對太陽活動(dòng)峰年的預(yù)測較好, 對太陽活動(dòng)峰年復(fù)雜的太陽活動(dòng)預(yù)報(bào)要優(yōu)于SWPC的預(yù)報(bào). 對谷年的預(yù)報(bào)整體上也有一定的提升. 本研究建立的聯(lián)合SSN的M-LSTM模型, 僅用F10.7作為模型輸入的LSTM模型和SWPC預(yù)報(bào)對比統(tǒng)計(jì)結(jié)果見表2,注意SWPC公布的數(shù)據(jù)目前只截止到2013年.
從表2可以看出本文建立的U-LSTM在RMSE上總體優(yōu)于SWPC的預(yù)報(bào)結(jié)果, 具體來說, 僅用單變量建立的U-LSTM比SWPC要優(yōu)5.1%的性能, 而本文聯(lián)合SSN建立的M-LSTM模型還能繼續(xù)提升5%-6%的性能, 因此可以得出以下結(jié)論: (1)本文建立的U-LSTM適合作為F10.7的預(yù)報(bào)模型, RMSE比SWPC的預(yù)報(bào)結(jié)果低約5%;(2)本文建立的F10.7聯(lián)合SSN的M-LSTM模型, 優(yōu)于F10.7的單變量預(yù)報(bào), 并且在3個(gè)模型中結(jié)果最優(yōu), 其RMSE比SWPC的預(yù)報(bào)降低大約11%. 綜上所述, 用深度學(xué)習(xí)的LSTM表達(dá)F10.7演化時(shí)序性的方法在F10.7的預(yù)報(bào)中是有效的.
表2 聯(lián)合SSN的M-LSTM與SWPC及僅輸入F10.7的U-LSTM的比較Table 2 Comparison of M-LSTM combined with sunspot number with SWPC and U-LSTM with F10.7 input only
本研究在F10.7的短期7 d預(yù)報(bào)中首次考慮了SSN,建立了聯(lián)合SSN的M-LSTM模型,并與業(yè)務(wù)中使用的SWPC預(yù)報(bào)結(jié)果進(jìn)行了比較, 發(fā)現(xiàn)聯(lián)合SSN的M-LSTM模型優(yōu)于僅使用F10.7歷史數(shù)據(jù)的模型,而且兩者都比SWPC預(yù)報(bào)模型的性能好, 對太陽23、24周的預(yù)報(bào)結(jié)果顯示相關(guān)系數(shù)CC = 0.96并且RMSE為11.62, 比SWPC的預(yù)報(bào)結(jié)果約低11%.在太陽活動(dòng)峰年平均絕對百分比誤差最優(yōu)可達(dá)12.9%以內(nèi), 太陽活動(dòng)谷年最優(yōu)可達(dá)2.5%以內(nèi). 研究結(jié)果表明引入太陽黑子數(shù)在改進(jìn)LSTM 預(yù)報(bào)性能方面是有效的, M-LSTM優(yōu)于U-LSTM, SSN在其中起到了作用. M-LSTM優(yōu)于U-LSTM的結(jié)果與深度學(xué)習(xí)模型的特點(diǎn)有關(guān), 神經(jīng)網(wǎng)絡(luò)對復(fù)雜的太陽活動(dòng)有很強(qiáng)的描述能力,數(shù)據(jù)量越大、種類越豐富,能學(xué)習(xí)到的有效信息越多、建立的模型越完善. 此外, SSN有更大的波動(dòng)幅度, 可以更好地表征太陽活動(dòng)特征. 當(dāng)然,F(xiàn)10.7和SSN這兩個(gè)太陽活動(dòng)評價(jià)指標(biāo)由不同的儀器測量得到, LSTM深度學(xué)習(xí)模型可能相較于傳統(tǒng)模型更能學(xué)習(xí)到它們各自的優(yōu)點(diǎn)加以融合.