吳香華 陳以祺 官元紅 田心童 華亞婕
摘要 針對(duì)傳統(tǒng)時(shí)間序列模型無法有效預(yù)測(cè)模態(tài)混疊數(shù)據(jù)的不足,本文提出了一種基于CEEMDAN-SE-ARIMA的組合模型,并且對(duì)東北地區(qū)2016—2020年夏季降水量進(jìn)行了實(shí)證分析。首先,基于完全自適應(yīng)集合經(jīng)驗(yàn)?zāi)B(tài)分解方法,將降水時(shí)間序列分解為多個(gè)本征模態(tài)分量,并根據(jù)不同分量樣本熵的計(jì)算結(jié)果進(jìn)行分量序列重構(gòu)。然后,針對(duì)每一個(gè)重構(gòu)分量,構(gòu)建自回歸移動(dòng)平均預(yù)測(cè)模型。最后,將各分量的預(yù)測(cè)值進(jìn)行疊加,得到組合模型的預(yù)測(cè)值。此外,還構(gòu)建了ARIMA單一模型和其他組合模型,旨在與CEEMDAN-SE-ARIMA組合模型對(duì)比。結(jié)果表明:CEEMDAN-SE-ARIMA組合模型考慮了時(shí)間序列的模態(tài)混疊特征,能有效提高東北地區(qū)夏季降水時(shí)序模型的預(yù)測(cè)能力,具有良好的預(yù)測(cè)應(yīng)用價(jià)值。預(yù)測(cè)結(jié)果較單一模型和其他組合模型均有所提高,MASE降低了0.02~0.91 mm,RMSE降低了0.80~130.49 mm,MAE降低了2.52~129.84 mm,MAPE降低了1.08~35.53 mm。CEEMDAN-SE-ARIMA模型在降水變率較小的西北部區(qū)域預(yù)測(cè)效果更好,對(duì)東南部區(qū)域的極值分布中心預(yù)測(cè)較為準(zhǔn)確。
關(guān)鍵詞 東北夏季降水; 模態(tài)混疊; CEEMDAN; 樣本熵; ARIMA
全球氣候變暖是目前氣候變化的主要特征,直接影響到大氣中水汽含量和降水結(jié)構(gòu)的變化。在此背景下,與降水相關(guān)的極端天氣事件頻發(fā),每年都會(huì)給我國造成重大的經(jīng)濟(jì)損失。因此,對(duì)降水進(jìn)行科學(xué)準(zhǔn)確預(yù)測(cè),尤其是夏季汛期降水的變化,是目前亟待解決的問題(沈皓俊等,2020)。東北地區(qū)位于我國東北部,地處東北亞的核心位置,擁有高原、平原和山地3類地形單元,自南向北跨越暖溫帶、中溫帶和寒溫帶。復(fù)雜獨(dú)特的氣候特征和地理位置,導(dǎo)致東北地區(qū)夏季降水的成因與其他氣候區(qū)有著本質(zhì)區(qū)別,是我國較為典型的氣候“脆弱區(qū)”之一(趙俊虎等,2020)。東北夏季降水一直是短期氣候預(yù)測(cè)的重難點(diǎn),對(duì)其進(jìn)行預(yù)測(cè)研究具有重要的實(shí)際意義和必要性(廉毅等,2003;賈小龍和王謙謙,2006)。
目前,降水時(shí)間序列的預(yù)測(cè)方法主要有傳統(tǒng)的移動(dòng)平均法(Moving Average,MA)、自回歸法(Auto Regressive,AR)、自回歸移動(dòng)平均法(Auto-Regressive Moving Average,ARMA)和基于機(jī)器學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)法(Artificial Neural Network,ANN)等(田俊武等,2005;劉莉和葉文,2010;陳滬生等,2019;余洋和萬定生,2019)。然而,降水的隨機(jī)性和復(fù)雜性(蘇京志,2019)會(huì)大大降低ANN的收斂速度和預(yù)測(cè)精度,并且訓(xùn)練過程極易陷入局部最小值(賀玉琪等,2019)。MA、AR和ARMA等線性方法對(duì)數(shù)據(jù)的平穩(wěn)性有較高要求,難以適應(yīng)降水序列的非線性和非平穩(wěn)性。相比于以上幾種方法,差分自回歸移動(dòng)平均法(Auto Regressive Integrated Moving Average model,ARIMA)能夠處理非平穩(wěn)序列,在降水預(yù)測(cè)中應(yīng)用廣泛,且在短期降水預(yù)測(cè)中精度較高(李寧等,2019)。
由于降水受到水文、大氣環(huán)流、季風(fēng)、地形和人類活動(dòng)等多方面的影響(王文等,2014),降水時(shí)間序列容易產(chǎn)生很強(qiáng)的非平穩(wěn)隨機(jī)波動(dòng),同時(shí)展現(xiàn)出模態(tài)混疊、多時(shí)間尺度等復(fù)雜特征(郭品文和郎麗玲,2017;陳國鼎等,2018;顧偉宗等,2018)?;谝陨显颍瑐鹘y(tǒng)時(shí)間序列方法的預(yù)測(cè)誤差通常比較大。Huang et al.(1998)提出了一種處理非線性、非平穩(wěn)時(shí)間序列的新方法——經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法,該方法可以憑借數(shù)據(jù)自身的局部時(shí)變特征,自適應(yīng)地分解時(shí)頻,對(duì)序列進(jìn)行平穩(wěn)化處理。相比小波分析和傅立葉分解變換而言,EMD具有更好的時(shí)頻分辨率和自適應(yīng)的優(yōu)點(diǎn)(李智強(qiáng)等,2020),并且打破了傅立葉和小波分析平穩(wěn)、線性的前提局限(馬佳佳等,2021),已經(jīng)被成功且廣泛地應(yīng)用于水文時(shí)間序列的分析中。但是,EMD不可避免地容易產(chǎn)生本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)混疊現(xiàn)象,而模態(tài)混疊不僅使各時(shí)間尺度的IMF分量無法準(zhǔn)確體現(xiàn),甚至?xí)?dǎo)致個(gè)別IMF分量喪失物理意義。為了盡可能消除模態(tài)混疊問題,使分解產(chǎn)生的各IMF分量在物理上保持唯一性,Wu and Huang(2009)提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)濾波方法,該方法在一定程度上抑制了模態(tài)混疊問題,并在氣候預(yù)測(cè)中取得良好的效果。但是EEMD分解后的IMF分量噪聲有殘留,并且每一次需要主觀選擇加入不同幅值的白噪聲(韓慶陽等,2015)。因此,Torres et al.(2011)提出了一種完全自適應(yīng)集合經(jīng)驗(yàn)?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN),該方法通過在每一階段添加自適應(yīng)白噪聲,有效地克服了EEMD重構(gòu)誤差非零等問題,保證了分解的完整性,同時(shí)還減少了迭代次數(shù),提高了計(jì)算效率(黃金等,2020)。
綜上所述,傳統(tǒng)方法和單一方法難以對(duì)復(fù)雜的非線性、非平穩(wěn)降水序列進(jìn)行準(zhǔn)確度較高的預(yù)測(cè)(黃春艷等,2017)。因此,本文基于“分解-重構(gòu)-集成”的思想,結(jié)合CEEMDAN分解完整性較好、ARIMA短期預(yù)測(cè)精度較高和SE重構(gòu)效率較快的優(yōu)勢(shì),提出了CEEMDAN-SE-ARIMA組合預(yù)測(cè)模型。利用1970—2015年6—8月東北地面氣象觀測(cè)資料建立組合預(yù)測(cè)模型,并通過獨(dú)立檢驗(yàn)期(2016—2020年6—8月)的觀測(cè)資料評(píng)估模型的預(yù)測(cè)性能。為了驗(yàn)證CEEMDAN-SE-ARIMA模型的有效性,以獨(dú)立檢驗(yàn)期的評(píng)估指標(biāo)為基準(zhǔn),與其他模型進(jìn)行對(duì)比分析。該模型的提出可以為東北夏季降水預(yù)測(cè)和人工增雨效果檢驗(yàn)的自然降水量估算提供一種新思路(王婉和姚展予,2009)。
1 資料和方法
1.1 研究區(qū)域和資料
東北地區(qū)指我國東北部的遼寧省、吉林省、黑龍江省和內(nèi)蒙古東四盟(包括呼倫貝爾市、興安盟、通遼市、赤峰市)構(gòu)成的區(qū)域,地處歐亞大陸東端,東面和北面與朝鮮和俄羅斯兩國接壤,南臨渤海、黃海,與山東半島隔海相望,地域遼闊且地形多樣完整,地理位置為115.52°~135.09°E、38.72°~53.55°N。
東北夏季降水量預(yù)測(cè)所采用的資料來源于國家氣象科學(xué)數(shù)據(jù)中心(http://data.cma.cn)提供的1970—2020年中國地面氣候資料月值數(shù)據(jù)集。選用東北地區(qū)104個(gè)地面基本氣象觀測(cè)站及自動(dòng)站的逐月觀測(cè)數(shù)據(jù),資料選取時(shí)段為1970—2020年夏季(6—8月)。將觀測(cè)數(shù)據(jù)缺失間斷以及類型不一致的站點(diǎn)去除,最終用于本研究的資料是100個(gè)氣象站點(diǎn)的夏季累積降水?dāng)?shù)據(jù)。
1.2 研究方法
1.2.1 基于CEEMDAN的多尺度分解
CEEMDAN是目前最新的一種經(jīng)驗(yàn)?zāi)B(tài)分解方法,該方法在IMF分量的分解過程中自適應(yīng)地加入白噪聲,有效地解決了EMD模態(tài)混疊和EEMD重構(gòu)誤差非零等問題,在保證分解完整性的基礎(chǔ)上,節(jié)約了計(jì)算時(shí)間(王書平和魏曉萌,2017;陳璐,2019),尤其適合非平穩(wěn)降水時(shí)間序列的分析處理。
CEEMDAN是經(jīng)驗(yàn)?zāi)B(tài)分解,集成經(jīng)驗(yàn)?zāi)B(tài)分解和互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解的改進(jìn)方法(朱利明等,2020),具體算法如下:
1.2.4 組合預(yù)測(cè)模型評(píng)估指標(biāo)
綜合以上理論分析,首先將夏季降水?dāng)?shù)據(jù)利用CEEMDAN信號(hào)分析方法進(jìn)行分解和處理;其次利用SE熵值計(jì)算方法重構(gòu)序列分量;然后對(duì)重構(gòu)后的各個(gè)分量建立ARIMA預(yù)測(cè)模型;最后將預(yù)測(cè)值疊加,得到組合模型的預(yù)測(cè)值。
為了評(píng)估本文模型預(yù)測(cè)結(jié)果的優(yōu)劣,引入平均絕對(duì)誤差(MAE)、平均絕對(duì)縮放誤差(MASE)、均方根誤差(RMSE)和平均絕對(duì)百分誤差(MAPE)四種統(tǒng)計(jì)學(xué)指標(biāo)來評(píng)價(jià)模型的預(yù)測(cè)性能。MAE通過放大預(yù)測(cè)誤差較大的值,可以比較不同預(yù)測(cè)模型的穩(wěn)定性;MASE用于比較不同尺度的時(shí)間序列的預(yù)測(cè)準(zhǔn)確性;RMSE代表模型預(yù)測(cè)結(jié)果的標(biāo)準(zhǔn)偏差;MAPE不僅考慮了預(yù)測(cè)值和實(shí)測(cè)值之間的誤差,還考慮了誤差與實(shí)測(cè)值之間的比例,是一個(gè)衡量預(yù)測(cè)準(zhǔn)確性的指標(biāo)。
2 結(jié)果與分析
2.1 東北夏季降水分區(qū)
掌握東北地區(qū)不同區(qū)域夏季降水的一致性和差異性,有助于更加客觀高效地評(píng)估組合模型的預(yù)測(cè)準(zhǔn)確性、穩(wěn)定性。因此,對(duì)東北近51 a夏季降水進(jìn)行區(qū)劃和區(qū)域代表性站點(diǎn)選取是非常有必要的。運(yùn)用經(jīng)驗(yàn)正交函數(shù)分解(EOF)分析東北地區(qū)夏季降水的主要空間振蕩型及變化敏感區(qū)域(趙春雨等,2009;潘留杰等,2018;王麗娟等,2020),運(yùn)用旋轉(zhuǎn)經(jīng)驗(yàn)正交函數(shù)分解(REOF)對(duì)降水量場(chǎng)進(jìn)行客觀區(qū)劃(江志紅和丁裕國,1994)。
本文對(duì)東北地區(qū)100個(gè)氣象臺(tái)站1970—2020年6—8月標(biāo)準(zhǔn)化的累積降水量做EOF分析。通過North準(zhǔn)則檢驗(yàn)(North et al.,1982),發(fā)現(xiàn)前5個(gè)空間主模態(tài)通過了95%置信水平檢驗(yàn),表明特征根誤差范圍不重疊,其分解得到的5個(gè)模態(tài)具有相對(duì)明確的物理意義信號(hào)。通過EOF分析發(fā)現(xiàn):東北地區(qū)夏季降水既有全區(qū)一致(第一模態(tài))的分布特點(diǎn),也有南北反相(第二模態(tài))的分布差異。為了進(jìn)一步揭示東北地區(qū)夏季降水的地域特征,對(duì)EOF分析的前5個(gè)特征向量做REOF分析。表1列舉了EOF和REOF前5個(gè)模態(tài)的方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率,可以看出前5個(gè)模態(tài)的累計(jì)方差貢獻(xiàn)率超過了一半,為56.35%,故前5個(gè)模態(tài)的特征向量可以較好地解釋東北地區(qū)夏季降水分布類型。
由REOF的空間分布(圖2)可見,前5個(gè)空間主模態(tài)中的高值中心幾乎涵蓋了整個(gè)東北區(qū)域。結(jié)合色標(biāo)尺,按照載荷分量絕對(duì)值大于0.16作為標(biāo)準(zhǔn)將東北地區(qū)夏季降水量分為5個(gè)區(qū),分別為:第Ⅰ區(qū)域,即南部地區(qū)(遼寧和吉林東南部);第Ⅱ區(qū)域,即東北部地區(qū)(黑龍江東南部和吉林北部);第Ⅲ區(qū)域,即西南部地區(qū)(內(nèi)蒙古東四盟南部、遼寧西部、吉林西北部);第Ⅳ區(qū)域,即東南部地區(qū)(黑龍江南部、吉林東部);第Ⅴ區(qū)域,即西北部(黑龍江北部、內(nèi)蒙古東四盟西部)。結(jié)合東北夏季累積降水空間分布(圖1)可知,東北西部地區(qū)夏季降水量較為匱乏,南部地區(qū)夏季降水量較為充沛,夏季降水量自東南向西北從700 mm逐漸降低至200 mm以下。因此,劃分的5個(gè)區(qū)域在降水量空間分布上具有明顯差異。
結(jié)合區(qū)劃結(jié)果、氣候特征和地理位置,本文選取了5個(gè)代表站點(diǎn):瓦房店、綏化、索倫、白城和嫩江。瓦房店位于遼東半島中西部,屬于暖溫帶大陸性季風(fēng)氣候,夏季降水量的標(biāo)準(zhǔn)差為99.88 mm;綏化位于松嫩平原的呼蘭河流域,屬于中溫帶濕潤氣候,夏季降水量的標(biāo)準(zhǔn)差為91.41 mm;索倫位于大興安嶺南麓,屬于溫帶大陸性季風(fēng)氣候,夏季降水量的標(biāo)準(zhǔn)差為99.59 mm;白城位于嫩江平原西部,屬于中溫帶半干旱季風(fēng)氣候,夏季降水量的標(biāo)準(zhǔn)差為125.31 mm;嫩江位于松嫩平原連接大、小興安嶺山地的過渡地帶,屬于中溫帶亞濕潤季風(fēng)氣候,夏季降水量的標(biāo)準(zhǔn)差為111.32 mm。相較而言,白城和嫩江的夏季降水量離散程度較大,瓦房店、綏化和索倫的離散程度較小。分別對(duì)5個(gè)典型站點(diǎn)進(jìn)行組合模型的預(yù)測(cè),預(yù)測(cè)模型的預(yù)測(cè)時(shí)效被設(shè)為1 a。
2.2 東北夏季降水預(yù)測(cè)及對(duì)比分析
以東北地區(qū)5個(gè)典型站點(diǎn)1970—2020年共 51 a的實(shí)測(cè)夏季降水量序列作為研究對(duì)象,分別采用單一ARIMA模型,基于EEMD、CEEMDAN的ARIMA預(yù)測(cè)模型和基于CEEMDAN-SE的ARIMA模型對(duì)東北夏季降水進(jìn)行預(yù)測(cè)分析。為了更好地檢驗(yàn)?zāi)P偷耐馔颇芰?,本文使用滾動(dòng)預(yù)測(cè)的方式對(duì)模型進(jìn)行訓(xùn)練和預(yù)測(cè),即:分別用1970—2015年、1970—2016年、1970—2017年、1970—2018年和1970—2019年的夏季降水量資料構(gòu)建預(yù)測(cè)模型,將2016—2020年的資料用于預(yù)測(cè)效果的檢驗(yàn)。
2.2.1 降水時(shí)間序列的分解和重構(gòu)
以瓦房店站為例,運(yùn)用EEMD和CEEMDAN分解方法對(duì)夏季降水時(shí)間序列進(jìn)行分解,兩種方法均得到4個(gè)本征模態(tài)函數(shù)(IMFi,i=1,2,3,4)即不同時(shí)間尺度特征的子序列和一個(gè)趨勢(shì)項(xiàng)RES(圖3a、b)。兩種分解方法的分量頻率均逐漸降低,并且某些分量呈現(xiàn)出周期性。從趨勢(shì)項(xiàng)RES能夠看出,瓦房店站夏季降水有上升趨勢(shì)。計(jì)算5個(gè)分量的樣本熵,并將熵值接近的分量作為一組來重構(gòu),重構(gòu)后的高頻分量、低頻分量和趨勢(shì)分量如圖3c所示。
2.2.2 降水時(shí)間序列的預(yù)測(cè)
完成以上降水時(shí)間序列的分解和重構(gòu)以后,首先將各分量分別進(jìn)行ARIMA預(yù)測(cè),然后將各分量預(yù)測(cè)值疊加,計(jì)算未來一年的預(yù)測(cè)值。本文采用4個(gè)統(tǒng)計(jì)指標(biāo)評(píng)估CEEMDAN-SE-ARIMA模型的降水量預(yù)測(cè)性能,并與單一ARIMA模型、基于EEMD分解的ARIMA模型進(jìn)行比較,獨(dú)立檢驗(yàn)期的預(yù)測(cè)結(jié)果如圖4所示,比較結(jié)果如表3所示。從預(yù)測(cè)結(jié)果可以看出:組合模型比單一的ARIMA模型預(yù)測(cè)效果好。特別地,由于ARIMA模型無法直接地識(shí)別出非平穩(wěn)降水量時(shí)間序列的季節(jié)性、周期性等多時(shí)間尺度特征,從而導(dǎo)致模型在獨(dú)立檢驗(yàn)期的預(yù)測(cè)結(jié)果近乎同一數(shù)值,預(yù)測(cè)結(jié)果較差,這也從一個(gè)側(cè)面反映出非平穩(wěn)時(shí)間序列分解的重要性與必然性。此外,根據(jù)預(yù)測(cè)結(jié)果與實(shí)測(cè)值的相關(guān)性檢驗(yàn),CEEMDAN-SE-ARIMA模型在5個(gè)站點(diǎn)的相關(guān)系數(shù)分別為:0.90、0.89、0.84、0.62、0.89??梢钥闯?,白城的相關(guān)系數(shù)較?。?0.6),這可能與白城夏季降水量較少,數(shù)據(jù)離散程度較大有關(guān)。除了白城外,模型在檢驗(yàn)時(shí)段內(nèi)的相關(guān)系數(shù)較高,普遍高于0.84,且均通過0.1的顯著性檢驗(yàn)??梢员砻鰿EEMDAN-SE-ARIMA模型對(duì)東北夏季降水變化趨勢(shì)的預(yù)測(cè)性能較為可靠,對(duì)降水預(yù)測(cè)具有一定的參考價(jià)值。
由表3可知,CEEMDAN-SE-ARIMA的性能最佳,其次是CEEMDAN-ARIMA和EEMD-ARIMA,最后是ARIMA。特別地,CEEMDAN-SE-ARIMA在瓦房店的效果最好,其次是綏化、索倫和嫩江,最后是白城。除此之外,在白城、索倫和瓦房店,不同預(yù)測(cè)模型的標(biāo)準(zhǔn)偏差和穩(wěn)定性差異較小,偏差差異最小僅為24.68 mm,穩(wěn)定性差異最小僅為17.60 mm;而綏化和嫩江的偏差差異和穩(wěn)定性較大,偏差差異最大可達(dá)130.49 mm,穩(wěn)定性差異最大可達(dá)129.84 mm。索倫、瓦房店和綏化不同預(yù)測(cè)模型的準(zhǔn)確性差異較小,差異最小僅為7.42 mm,白城和嫩江差異較大,最大可達(dá)35.53 mm。由此可見,新的組合模型在降水量不同的區(qū)域效果提升程度不盡相同。
2.3 組合預(yù)測(cè)模型性能評(píng)估
科學(xué)可靠的性能評(píng)估是模型在實(shí)際預(yù)測(cè)應(yīng)用中至關(guān)重要的前提。為了評(píng)估CEEMDAN-SE-ARIMA組合模型在整個(gè)東北地區(qū)的適用性和穩(wěn)定性,利用東北地區(qū)100個(gè)氣象站點(diǎn)的夏季累積降水?dāng)?shù)據(jù),分別對(duì)各個(gè)站點(diǎn)構(gòu)建CEEMDAN-SE-ARIMA組合預(yù)測(cè)模型,并從評(píng)估指標(biāo)的統(tǒng)計(jì)特征以及實(shí)測(cè)值與預(yù)測(cè)值的空間分布兩個(gè)角度對(duì)模型的預(yù)測(cè)性能進(jìn)行分析。圖5給出了該組合模型獨(dú)立檢驗(yàn)期(2016—2020年)各個(gè)站點(diǎn)的MASE、RMSE、MAE和MAPE箱線圖。就中位數(shù)而言,MASE和MAPE分別為0.62 mm和25.93 mm,MAE和RMSE分別為69.24 mm和82.09 mm。除了個(gè)別異常站點(diǎn)外,其余站點(diǎn)對(duì)應(yīng)的MASE均小于1.52 mm,MAPE均小于67.31 mm??傮w來說,作為一種客觀預(yù)測(cè)方法,CEEMDAN-SE-ARIMA組合模型對(duì)東北地區(qū)絕大部分站點(diǎn)的夏季降水預(yù)測(cè)準(zhǔn)確性較高,預(yù)測(cè)性能較好,說明該模型具有一定的區(qū)域適用性和穩(wěn)定性。
圖6為獨(dú)立檢驗(yàn)期的實(shí)測(cè)值和預(yù)測(cè)值的空間分布對(duì)比。從圖6可以看出各年實(shí)況與預(yù)測(cè)的雨帶分布位置基本對(duì)應(yīng),大值中心走向基本一致。其中,西北部區(qū)域的預(yù)測(cè)效果最好,這可能是由該區(qū)域降水量較少,降水變率較小導(dǎo)致的;其次,組合模型對(duì)東部和南部區(qū)域的降水極值分布中心預(yù)測(cè)較為準(zhǔn)確;最后,該模型對(duì)東北夏季降水量的空間分布特征有著較好的預(yù)測(cè)效果,但在具體數(shù)值的預(yù)測(cè)程度上略顯不足??傮w而言,CEEMDAN-SE-ARIMA組合模型在東北地區(qū)100個(gè)站點(diǎn)夏季降水預(yù)測(cè)中仍然有著良好的效果。
3 結(jié)論
本文構(gòu)建了一個(gè)新的多尺度組合預(yù)測(cè)模型,首先基于CEEMDAN方法對(duì)站點(diǎn)夏季降水時(shí)間序列進(jìn)行分解,其次計(jì)算分解得到的各本征模態(tài)分量的樣本熵,根據(jù)熵值大小將相近的分量進(jìn)行重構(gòu),然后對(duì)重構(gòu)得到的新分量序列進(jìn)行ARIMA建模,最后將各分量預(yù)測(cè)值疊加得到模型預(yù)測(cè)值。對(duì)東北地區(qū)5個(gè)典型站點(diǎn)夏季降水量進(jìn)行預(yù)測(cè)分析和效果評(píng)估,并將該組合模型推廣到東北地區(qū)其他站點(diǎn),結(jié)果表明:
1)REOF分析將東北地區(qū)劃分為南部、東北部、西南部、東南部和西北部5個(gè)夏季降水量變化特征區(qū)域。相對(duì)而言,第Ⅰ區(qū)域夏季降水量較多,第Ⅱ區(qū)域和第Ⅲ區(qū)域次之,第Ⅳ區(qū)域和第Ⅴ區(qū)域較少。
2)CEEMDAN方法能夠有效地分解出降水的隨機(jī)擾動(dòng)響應(yīng)、周期性響應(yīng)和整體趨勢(shì)響應(yīng)。相較EEMD分解,能顯著提高模型的預(yù)測(cè)效果。提高的程度在降水量偏少的地方比降水量偏多的地方要大,例如:綏化CEEMDAN-ARIMA模型的RMSE比EEMD-ARIMA模型降低了6.27 mm,而嫩江則降低了19.17 mm。
3)SE算法通過重構(gòu)分量,不僅可以大大地減少預(yù)測(cè)計(jì)算量,而且也可以提高模型的預(yù)測(cè)準(zhǔn)確性和穩(wěn)定性。特別地,經(jīng)過SE算法重構(gòu),模型的MAE降低了4.02~18.40 mm;MAPE降低了1.08~3.54 mm。
4)基于不同區(qū)域、不同氣候類型的夏季降水序列,本文提出的CEEMDAN-SE-ARIMA組合模型與其他模型相比,預(yù)測(cè)準(zhǔn)確性提高了1.08~35.53 mm,穩(wěn)定性提高了3.33~129.84 mm。比較5個(gè)站點(diǎn)的MAE和MAPE,新模型在降水量較大的區(qū)域穩(wěn)定性和準(zhǔn)確性更好。
5)將CEEMDAN-SE-ARIMA組合模型應(yīng)用到東北100個(gè)站點(diǎn)夏季降水預(yù)測(cè)中,絕大部分站點(diǎn)的預(yù)測(cè)性能較好。模型對(duì)東北地區(qū)夏季降水基本空間分布和雨帶位置的預(yù)測(cè)較為準(zhǔn)確,泛化能力較強(qiáng)。
參考文獻(xiàn)(References)
陳滬生,周玉良,周平,等,2019.基于小波和ARIMA的黃山市年降水量分析及預(yù)測(cè)[J].南水北調(diào)與水利科技,17(5):50-55. Chen H S,Zhou Y L,Zhou P,et al.,2019.Analysis and prediction of annual precipitation in Huangshan City based on wavelet and ARIMA[J].South North Water Transf Water Sci& Technol,17(5):50-55.doi:10.13476/j.cnki.nsbdqk.2019.0109.(in Chinese).
崔金鑫,鄒輝文,2020.基于CEEMDAN-MR-PE-NLE多頻優(yōu)化組合模型的碳金融市場(chǎng)價(jià)格預(yù)測(cè)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),50(3):105-120. Cui J X,Zou H W,2020.Carbon financial market price forecasting based on CEEMDAN-MR-PE-NLE multi-frequency optimization combined model[J].Math Pract Theory,50(3):105-120.(in Chinese).
陳璐,2019.基于LSTM模型的金融時(shí)間序列預(yù)測(cè)算法研究[D].黑龍江:哈爾濱工業(yè)大學(xué). Chen L,2019.Research on financial time series forecasting algorithm based on LSTM model[D].Heilongjiang:Harbin Institute of Technology.(in Chinese).
陳國鼎,荊海曉,李小寶,等,2018.基于經(jīng)驗(yàn)?zāi)B(tài)分解與傳統(tǒng)水文分析法的降雨序列研究[J].水利水電技術(shù),49(11):8-14. Chen G D,Jing H X,Li X B,et al.,2018.Study on rainfall time series based on empirical mode decomposition and traditional hydrological methods[J].Water Resour Hydropower Eng,49(11):8-14.doi:10.13928/j.cnki.wrahe.2018.11.002.(in Chinese).
顧偉宗,張莉,伯忠凱,等,2018.不同時(shí)間尺度上黃淮地區(qū)夏季降水異常成因及預(yù)測(cè)研究[J].大氣科學(xué)學(xué)報(bào),41(3):388-394. Gu W Z,Zhang L,Bo Z K,et al.,2018.Study on the causes and prediction of summer precipitation in the Huanghuai area on different time scales[J].Trans Atmos Sci,41(3):388-394.doi:10.13878/j.cnki.dqkxxb.20170405001.(in Chinese).
郭品文,郎麗玲,2017.ENSO與中國東部夏季降水異常關(guān)系的年代際變化[J].大氣科學(xué)學(xué)報(bào),40(4):463-472. Guo P W,Lang L L,2017.Interdecadal variation of the relationship between ENSO and East-China summer rainfall[J].Trans Atmos Sci,40(4):463-472.doi:10.13878/j.cnki.dqkxxb.20150117001.(in Chinese).
黃金,吳慶良,陳釩,2020.基于CEEMDAN-WPT聯(lián)合去噪的災(zāi)后求救信號(hào)能量分布特征研究[J].南京理工大學(xué)學(xué)報(bào),44(2):194-201. Huang J,Wu Q L,Chen F,2020.Study on energy distribution character about post-disaster rescue signal based on CEEMDAN-WPT denoising[J].J Nanjing UnivSci Technol,44(2):194-201.doi:10.14177/j.cnki.32-1397n.2020.44.02.010.(in Chinese).
賀玉琪,王棟,王遠(yuǎn)坤,2019.BRR-SVR月降水量預(yù)測(cè)優(yōu)化模型[J].水利學(xué)報(bào),50(12):1529-1537. He Y Q,Wang D,Wang Y K,2019.BRR-SVR optimization model for monthly precipitation prediction[J].J Hydraul Eng,50(12):1529-1537.doi:10.13243/j.cnki.slxb.20190479.(in Chinese).
黃春艷,韓志偉,暢建霞,等,2017.基于EEMD和GRNN的降水量序列預(yù)測(cè)研究[J].人民黃河,39(5):26-28. Huang C Y,Han Z W,Chang J X,et al.,2017.Prediction analysis of rainfall series based on EEMD and GRNN model[J].Yellow River,39(5):26-28.doi:10.3969/j.issn.1000-1379.2017.05.007.(in Chinese).
韓慶陽,孫強(qiáng),王曉東,等,2015.CEEMDAN去噪在拉曼光譜中的應(yīng)用研究[J].激光與光電子學(xué)進(jìn)展,52(11):274-280. Han Q Y,Sun Q,Wang X D,et al.,2015.Application of CEEMDAN in Raman spectroscopy denoising[J].Laser & Optoelectron Prog,52(11):274-280.doi:10.3788/LOP52.113003.(in Chinese).
Huang N E,Shen Z,Long S R,et al.,1998.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc R SocLond A,454(1971):903-995.doi:10.1098/rspa.1998.0193.
賈小龍,王謙謙,2006.東北地區(qū)汛期降水異常的大氣環(huán)流特征分析[J].高原氣象,25(2):309-318. Jia X L,Wang Q Q,2006.Analyses on general circulation character of precipitation anomaly in Northeast China flood season[J].Plateau Meteor,25(2):309-318.doi:10.3321/j.issn:1000-0534.2006.02.018.(in Chinese).
江志紅,丁裕國,1994.近40年我國降水量年際變化的區(qū)域性特征[J].南京氣象學(xué)院學(xué)報(bào),17(1):72-78. Jiang Z H,Ding Y G,1994.Regional features of interannual variation of rainfall over China over the past 4 decades[J].J Nanjing Inst Meteorol,17(1):72-78.(in Chinese).
李寧,劉瑜,王大剛,2019.基于ARIMA和EEMD的東江流域季節(jié)降水預(yù)報(bào)研究[J].人民珠江,40(3):52-58,70. Li N,Liu Y,Wang D G,2019.Seasonal precipitation forecast study based on ARIMA and EEMD in the Dongjiang River Basin[J].Pearl River,40(3):52-58,70.doi:10.3969/j.issn.1001-9235.2019.03.010.(in Chinese).
李智強(qiáng),鄒紅霞,齊斌,等,2020.基于EEMD-ARIMA的年降水預(yù)測(cè)擬合模型研究[J].計(jì)算機(jī)應(yīng)用與軟件,37(11):46-50,78. Li Z Q,Zou H X,Qi B,et al.,2020.A fitting model of annual precipitation prediction based on eemd-arima[J].Comput Appl Softw,37(11):46-50,78.doi:10.3969/j.issn.1000-386x.2020.11.008.(in Chinese).
劉莉,葉文,2010.基于BP神經(jīng)網(wǎng)絡(luò)時(shí)間序列模型的降水量預(yù)測(cè)[J].水資源與水工程學(xué)報(bào),21(5):156-159. Liu L,Ye W,2010.Precipitation prediction of time series model based on BP artificial neural network[J].J Water Resour Water Eng,21(5):156-159.(in Chinese).
廉毅,沈柏竹,高樅亭,等,2003.東亞夏季風(fēng)在中國東北區(qū)建立的標(biāo)準(zhǔn)、日期及其主要特征分析[J].氣象學(xué)報(bào),61(5):548-558,643. Lian Y,Shen B Z,Gao Z T,et al.,2003.The study of the on-set criterion and the date of east Asian summer monsoon in Northeast China and its main characteristic analysis[J].Acta Meteorol Sin,61(5):548-558,643.doi:10.3321/j.issn:0577-6619.2003.05.004.(in Chinese).
馬佳佳,蘇懷智,王穎慧,2021.基于EEMD-LSTM-MLR的大壩變形組合預(yù)測(cè)模型[J].長江科學(xué)院院報(bào),38(5):47-54. Ma J J,Su H Z,Wang Y H,2021.Combinatorial prediction model for dam deformation based on EEMD-LSTM-MLR[J].J Yangtze River Sci Res Inst,38(5):47-54.doi:10.11988/ckyyb.20200705.(in Chinese).
North G R,Bell T L,Cahalan R F,et al.,1982.Sampling errors in the estimation of empirical orthogonal functions[J].Mon Wea Rev,110(7):699-706.doi:10.1175/1520-0493(1982)110<0699:seiteo>2.0.co;2.
潘留杰,張宏芳,陳小婷,等,2018.秦嶺及周邊地區(qū)夏季降水的主模態(tài)分析[J].大氣科學(xué)學(xué)報(bào),41(3):377-387. Pan L J,Zhang H F,Chen X T,et al.,2018.Dominant modes of summer precipitation in Qinling and surrounding areas[J].Trans Atmos Sci,41(3):377-387.doi:10.13878/j.cnki.dqkxxb.20161019001.(in Chinese).
Pincus S M,1991.Approximate entropy as a measure of system complexity[J].Proc Natl Acad Sci USA,88(6):2297-2301.doi:10.1073/pnas.88.6.2297.
沈皓俊,羅勇,趙宗慈,等,2020.基于LSTM網(wǎng)絡(luò)的中國夏季降水預(yù)測(cè)研究[J].氣候變化研究進(jìn)展,16(3):263-275. Shen H J,Luo Y,Zhao Z C,et al.,2020.Prediction of summer precipitation in China based on LSTM network[J].Clim Change Res,16(3):263-275.doi:10.12006/j.issn.1673-1719.2019.067.(in Chinese).
蘇京志,2019.降水時(shí)間隨機(jī)性對(duì)月總降水量的影響[J].大氣科學(xué)學(xué)報(bào),42(1):109-116. Su J Z,2019.The influence of temporally-random precipitation on monthly total precipitation[J].Trans Atmos Sci,42(1):109-116.doi:10.13878/j.cnki.dqkxxb.20180929001.(in Chinese).
田俊武,尚松浩,孫麗艷,等,2005.山西瀟河灌區(qū)參考作物騰發(fā)量和降水的隨機(jī)特性[J].農(nóng)業(yè)工程學(xué)報(bào),21(10):26-30. Tian J W,Shang S H,Sun L Y,et al.,2005.Stochastic characters of reference evapotranspiration and precipitation of Xiaohe Irrigation Areas,Shanxi Province[J].Trans Chin Soc Agric Eng,21(10):26-30.doi:10.3321/j.issn:1002-6819.2005.10.007.(in Chinese).
Torres M E,Colominas M A,Schlotthauer G,et al.,2011.A complete ensemble empirical mode decomposition with adaptive noise[C]//2011 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).Prague,Czech Republic.IEEE,4144-4147.doi:10.1109/ICASSP.2011.5947265.
王麗娟,鄧方俊,陳小素,2020.近45 a浙江連陰雨時(shí)空分布的環(huán)流特征及成因[J].大氣科學(xué)學(xué)報(bào),43(4):707-717. Wang L J,Deng F J,Chen X S,2020.Circulation characteristics and causes of time-space distribution of continuous rainy weather in Zhejiang Province over the past 45 years[J].Trans Atmos Sci,43(4):707-717.doi:10.13878/j.cnki.dqkxxb.20190513001.(in Chinese).
王書平,魏曉萌,2017.基于CEEMDAN分解的北京市電力消費(fèi)預(yù)測(cè)研究[C]//第十九屆中國管理科學(xué)學(xué)術(shù)年會(huì)論文集.南京:771-779. Wang S P,Wei X M,2017.Power consumption prediction of Beijing based on CEEMDAN decomposition[C].Proceedings of the 19th Chinese Conference on Management Science.Nanjing:771-779.(in Chinese).
王文,任冉,李耀輝,2014.基于EEMD的黃河中上游夏季降水預(yù)報(bào)方法的研究[J].氣象科學(xué),34(3):261-266. Wang W,Ren R,Li Y H,2014.Summer rainfall prediction in the upper and middle reaches of the Yellow River with EEMD method[J].J Meteorol Sci,34(3):261-266.doi:10.3969/2014jms.0004.(in Chinese).
Wu Z H,Huang N E,2009.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Adv Adapt Data Anal,1(1):1-41.doi:10.1142/s1793536909000047.
王婉,姚展予,2009.人工增雨統(tǒng)計(jì)檢驗(yàn)結(jié)果準(zhǔn)確度分析[J].氣象科技,37(2):209-215. Wang W,Yao Z Y,2009.Accuracy analysis of statistical evaluation result in precipitation enhancement experiment[J].Meteor Sci Technol,37(2):209-215.doi:10.19517/j.1671-6345.2009.02.020.(in Chinese).
余洋,萬定生,2019.基于WNN-SVM的水文時(shí)間序列預(yù)測(cè)方法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,(09):13-17,70. Yu Y,Wan D S,2019.Study on hydrological time series prediction method based on WNN-SVM[J].Computer Technology and Development,(09):13-17,70.(in Chinese).
楊斌,楊世海,曹曉冬,等,2019.基于EMD-QRF的用戶負(fù)荷概率密度預(yù)測(cè)[J].電力系統(tǒng)保護(hù)與控制,47(16):1-7. Yang B,Yang S H,Cao X D,et al.,2019.Short-term consumer load probability density forecasting based on EMD-QRF[J].Power SystProt Control,47(16):1-7.doi:10.19783/j.cnki.pspc.181207.(in Chinese).
趙俊虎,熊開國,陳麗娟,2020.東北夏季降水預(yù)測(cè)技巧偏低的原因探討[J].大氣科學(xué),44(5):913-934. Zhao J H,Xiong K G,Chen L J,2020.The causes of low predictive skills of precipitation in flood season in Northeast China[J].Chin J Atmos Sci,44(5):913-934.doi:10.3878/j.issn.1006-9895.1911.19132.(in Chinese).
朱利明,卓靜超,邢世玲,2020.基于CEEMDAN-NAR-ARIMA組合模型的橋梁結(jié)構(gòu)健康監(jiān)測(cè)應(yīng)變預(yù)測(cè)[J].科學(xué)技術(shù)與工程,20(4):1639-1644.Zhu L M,Zhuo J C,Xing S L,2020.Strain prediction of bridge structural health monitoring based on CEEMDAN-NAR-ARIMA combination model[J].Sci Technol Eng,20(4):1639-1644.(in Chinese).
趙春雨,王冀,嚴(yán)曉瑜,等,2009.東北地區(qū)冬季降雪的氣候特征及其區(qū)劃[J].自然災(zāi)害學(xué)報(bào),18(5):29-35. Zhao C Y,Wang J,Yan X Y,et al.,2009.Climatic characteristics and regionalization of winter snowfall in Northeast China[J].J Nat Disasters,18(5):29-35.doi:10.3969/j.issn.1004-4574.2009.05.005.(in Chinese).
趙會(huì)茹,張士營,趙一航,等,2021.基于自適應(yīng)噪聲完備經(jīng)驗(yàn)?zāi)B(tài)分解-樣本熵-長短期記憶神經(jīng)網(wǎng)絡(luò)和核密度估計(jì)的短期電力負(fù)荷區(qū)間預(yù)測(cè)[J].現(xiàn)代電力,38(2):138-146. Zhao H R,Zhang S Y,Zhao Y H,et al.,2021.Short-term power load interval prediction based on CEEMDAN-SE-LSTM and KDE[J].Mod Electr Power,38(2):138-146.doi:10.19725/j.cnki.1007-2322.2020.0329.(in Chinese).
This paper proposes a combination model based on CEEMDAN-SE-ARIMA that aims to address the shortcomings of traditional time series models that cannot effectively predict modal aliased data.The proposed modelcombines the advantages of the complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN),the high short-term prediction accuracy of an auto-regressive integrated moving average model (ARIMA),and the fast efficiency of sample entropy (SE) reconstruction.The model is empirically analyzed for summer precipitation in Northeast China from 2016 to 2020.First,based on the fully adaptive ensemble empirical mode decomposition method,the precipitation time series is decomposed into multiple eigenmode components,and the component sequence is reconstructed according to the calculation results of the entropy of different component samples.Then,for each reconstruction component,an autoregressive moving average forecast model is constructed.Finally,the predicted value of each component is superimposed to obtain the predicted value of the combined model.Additionally,the ARIMA single model and other combined modelsare constructed to be compared with the CEEMDAN-SE-ARIMA combined model.The results show that the CEEMDAN-SE-ARIMA combined accounts for the time series modal aliasing characteristics,effectively improves the forecasting ability of the summer precipitation time series model in Northeast China,and has good forecast application value.Compared with the single model and other combined models,the forecast results are improved.MASE decreases by 0.02—0.91 mm,RMSE decreases by 0.80—130.49 mm,MAE decreases by 2.52—129.84 mm,and MAPE decreases by 1.08—35.53 mm.The CEEMDAN-SE-ARIMA model has a better prediction effect in the northwest region,where the precipitation variability is small,and the prediction of the extreme value distribution center in the southeast region is more accurate.
summer precipitation in Northeast China;modal aliasing;CEEMDAN;SE;ARIMA
doi:10.13878/j.cnki.dqkxxb.20210513001
(責(zé)任編輯:袁東敏)