国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ARIMA模型的臺風頻次預測

2016-03-18 05:20:19劉珊陳幸榮蔡怡
海洋預報 2016年1期
關(guān)鍵詞:時間序列分析ARIMA模型

劉珊,陳幸榮,蔡怡

(國家海洋環(huán)境預報中心,北京100081)

?

基于ARIMA模型的臺風頻次預測

劉珊,陳幸榮,蔡怡

(國家海洋環(huán)境預報中心,北京100081)

摘要:基于日本東京臺風中心的逐月臺風生成頻次資料,為最近30 a的臺風逐月生成頻次時間序列建立了合適的ARIMA乘積季節(jié)模型,并用該模型對2010—2014年的臺風逐月生成頻次進行了預測。結(jié)果表明:時間序列中的ARIMA乘積季節(jié)模型在預測臺風頻次方面具有一定的預測技巧,除2013年外,其余4 a模型提前1 a預測的全年臺風生成總數(shù)的異常情況均與觀測一致。

關(guān)鍵詞:臺風生成頻次;時間序列分析;ARIMA模型

1 引言

臺風是夏秋季節(jié)影響我國東部沿海地區(qū)的最重要災害性天氣系統(tǒng)。每年因臺風引起的直接和間接自然災害給人民生命和國家財產(chǎn)造成的損失十分巨大。

提高臺風災害的預測水平是增強臺風防御能力和減輕臺風災害損失的有效手段。在臺風預測方面,李祚泳等[1-2]嘗試用人工神經(jīng)網(wǎng)絡方法和投影尋蹤回歸方法對臺風次數(shù)做出預測;Chan等[3-4]利用ENSO各項指數(shù)、東亞及西北太平洋的環(huán)流因子及南方濤動指數(shù),澳大利亞季風強度和南太平洋副高強度等作為影響因子,建立統(tǒng)計模型來預測西北太平洋地區(qū)的熱帶氣旋活動;范可[5]研究了冬春季大氣環(huán)流對臺風生成頻次的影響,并確定了冬春季的北太平洋海冰面積指數(shù)和春季北太平洋濤動指數(shù)為新預測因子,并在此基礎上建立了新的預測模型。然而,影響臺風生成的因子眾多且相互之間關(guān)系復雜,所以對臺風生成頻次的預測并非易事。上述工作在不同的方面對臺風頻次預測進行了探索,但目前,臺風生成頻次的預測準確度仍然較低,還遠不能滿足防災減災的實際需要。因此,嘗試不同的方法預測臺風生成頻次,進一步提高臺風生成頻次的預測準確率仍然十分必要。

時間序列分析是一種動態(tài)數(shù)據(jù)處理的統(tǒng)計方法,該方法基于隨機過程理論和數(shù)理統(tǒng)計學方法,研究隨機數(shù)據(jù)序列所遵從的統(tǒng)計規(guī)律,具有結(jié)構(gòu)簡單,建模速度快,預測精度高等特點。目前,時間序列分析廣泛應用在商業(yè)、氣象、農(nóng)業(yè)、生物科學等各領域。在本文中,我們將采用時間序列分析方法對西北太平洋臺風的生成頻次進行建模和預測,以期望該模型在預測臺風生成頻次方面有較好的結(jié)果,并能夠應用到業(yè)務預測中為防災減災的實際需要提供科學參考。

2 資料和方法

本文中用到的1981—2013年逐月的臺風生成頻次資料來自日本東京臺風中心。本文所采用的方法主要是ARIMA乘積季節(jié)模型。

20世紀70年代,美國統(tǒng)計學家Box和英國統(tǒng)計學家Jenkins提出了一整套關(guān)于時間序列分析、預測和控制的方法,被稱為Box-Jenkins建模方法。求和自回歸移動平均ARIMA(Autoregressive integrated moving average)模型是這一系列模型中最為基本的模型之一,現(xiàn)被廣泛地應用在自然科學、工程技術(shù)和社會科學的諸多領域[6]。

ARIMA(p,d,q)模型的基本結(jié)構(gòu)如下:

式中:xt為時間序列X=(x1,x2,x3,…,xt,…,xn)在t時刻的觀測值;B為延遲算子,有Bpxt=xt-p;?d為d階差分算子,有?d=(1-B)d;Φ(B)為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項式,有

Θ(B)為平穩(wěn)可逆ARMA(p,q)模型的移動平滑系數(shù)多項式,有為零均值白噪聲序列。

當一個時間序列存在季節(jié)效應,且這種季節(jié)效應與長期趨勢效應和隨機波動之間存在著復雜的相互關(guān)系,簡單的ARIMA模型不足以提供其中的相關(guān)關(guān)系,這時就需要ARIMA乘積季節(jié)模型。ARIMA乘積季節(jié)模型是隨機季節(jié)模型與ARIMA模型的結(jié)合,一個階數(shù)為(p,d,q)×(P,D,Q)S的ARIMA乘積季節(jié)模型結(jié)構(gòu)如下:

式中:?DS為D階以周期S為步長的季節(jié)差分運算,,其余變量及符號的意義與(1)式相同。

在實現(xiàn)建模的過程中,我們選擇的應用軟件為R。R軟件是一種可用于統(tǒng)計計算和作圖的編程語言及環(huán)境,可提供廣泛的統(tǒng)計操作和作圖技術(shù),并且具有良好的可擴展性[7-9]。在建立模型的過程中,我們首先基于1981—2009年的逐月臺風生成頻次數(shù)據(jù)建立了針對2010年的逐月臺風生成頻次的季節(jié)乘積模型,然后在1981—2009年數(shù)據(jù)的基礎上補充2010年的數(shù)據(jù)作為建模樣本,建立針對2011年的逐月臺風生成頻次模型;之后以此類推,分別建立針對2012、2013和2014年的逐月臺風生成頻次模型。

圖1 1981—2009年逐月臺風生成頻次序列

3 建模過程

下文中我們以針對2010年逐月臺風生成頻次的建模過程為例,介紹適用于臺風生成頻次的ARIMA乘積季節(jié)模型的建立過程。建立乘積季節(jié)模型分為以下4個步驟:時間序列的平穩(wěn)化,建模前的“白噪聲”檢驗,模型的識別、定階和參數(shù)估計以及模型參數(shù)和殘差檢驗。

3.1時間序列的平穩(wěn)化

在利用ARIMA模型進行建模之前,首先需要對時間序列的平穩(wěn)性進行檢驗。平穩(wěn)性檢驗有2種常用方法,一是直接通過時序圖的特征進行判斷,二是構(gòu)造檢驗統(tǒng)計量進行假設檢驗,常用的平穩(wěn)性統(tǒng)計檢驗方法是單位根檢驗(unit root test)。

圖1是1981—2009年逐月的臺風生成頻次。從圖中可以看出:該時間序列沒有明顯的長期趨勢,但存在較為明顯的年循環(huán)。另外,近30 a的逐年臺風生成總頻次序列也不存在明顯的多年周期(圖略)。所以,在建立ARIMA模型前首先需要對現(xiàn)有的時間序列進行平穩(wěn)化處理。

由于該序列存在較為明顯的年變化,故首先進行步長為12個月的季節(jié)變換,去除年循環(huán)。

進行過季節(jié)差分的時間序列如圖2所示,原始的臺風生成頻次序列進行季節(jié)變換后,變成了既沒有長期趨勢又不存在明顯周期的平穩(wěn)時間序列。單位根檢驗的結(jié)果也證實了變換后序列平穩(wěn)這一結(jié)論。

單位根檢驗計算得到的p值為0.01,小于選定的顯著性水平0.05,則可以拒絕序列非平穩(wěn)的原假設,認為變換之后的序列平穩(wěn)。

3.2建模前的“白噪聲”檢驗

建模前的“白噪聲”檢驗是建模前的一個重要步驟。值得指出的是,并非所有的平穩(wěn)時間序列都存在分析的價值和待挖掘的相關(guān)關(guān)系。平穩(wěn)時間序列中存在一種“白噪聲”序列,這種序列中各個序列值彼此之間沒有任何相關(guān)性,過程是純隨機的,即該序列是一個沒有記憶的序列,過去的行為對將來的發(fā)展沒有絲毫的影響,所以從統(tǒng)計分析角度而言,“白噪聲”序列雖然為平穩(wěn)序列,但沒有任何分析的價值。所以,在得到平穩(wěn)化的序列之后,我們要對平穩(wěn)序列進行“白噪聲”檢驗,以確認該平穩(wěn)序列非“白噪聲”序列,存在繼續(xù)分析的價值。

表1 季節(jié)差分序列的Ljung-Box檢驗結(jié)果

我們利用Ljung-Box方法對經(jīng)過季節(jié)變換的臺風生成頻次序列(見圖2)進行了白噪聲檢驗,結(jié)果如下:

取顯著性水平0.05,可以發(fā)現(xiàn):經(jīng)過季節(jié)變換的臺風逐月生成頻次序列在延遲6階時,檢驗結(jié)果p值大于顯著性水平,但是在延遲12階時,檢驗結(jié)果p值遠遠小于顯著性水平。這表明:變換后的序列在某些延遲階數(shù)仍然具有明顯的相關(guān)關(guān)系,可以拒絕序列為純隨機白噪聲的原假設,認為序列中仍然存在待挖掘的相關(guān)關(guān)系,需要進一步的分析。

圖2 經(jīng)過季節(jié)差分的逐月臺風生成頻次序列

3.3模型的識別、定階和參數(shù)估計

接下來我們開始對進行過季節(jié)差分變換的逐月臺風生成頻次序列進行ARIMA建模。在建立模型之前,首先計算該序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),以便確定建立ARIMA模型的類型和階數(shù)。

圖3和圖4分別是經(jīng)過季節(jié)差分變換后的臺風生成頻次序列的自相關(guān)圖和偏自相關(guān)圖。

可以發(fā)現(xiàn):序列的自相關(guān)系數(shù)在落后12階時明顯超出了2倍的標準差范圍,而偏自相關(guān)系數(shù)則是在落后12階和24階時明顯超出了2倍的標準差范圍。這表明差分后的序列仍含有一定的季節(jié)效應。但是無論是自相關(guān)系數(shù)還是偏相關(guān)系數(shù),在1—12階的范圍內(nèi),相關(guān)系數(shù)都大體落在2倍標準差范圍內(nèi),沒有值顯著的超出2倍標準差范圍,這表明差分后的序列的短期相關(guān)性不明顯。

圖3 經(jīng)過季節(jié)差分的臺風生成頻次的自相關(guān)圖

圖4 經(jīng)過季節(jié)差分的臺風生成頻次的偏自相關(guān)圖

根據(jù)上述分析,我們對臺風生成頻次的ARIMA乘積季節(jié)模型進行定階。首先,自相關(guān)圖和偏自相關(guān)圖顯示12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都未明顯超出2倍標準差范圍,故認為差分后的序列沒有明顯的短期相關(guān),所以嘗試ARIMA季節(jié)模型的p,d,q均取值為0。再考慮季節(jié)自相關(guān)和偏自相關(guān)特征,即考察延遲12階、24階等以周期長度為單位的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)特征,發(fā)現(xiàn)季節(jié)自相關(guān)系數(shù)截尾,偏自相關(guān)系數(shù)拖尾,故嘗試ARIMA季節(jié)模型的P,Q取為0和1。因為目前我們已經(jīng)對原始的臺風生成頻次序列進行過一次季節(jié)差分,所以這里D取值為1。綜上所述,我們要擬合的乘積季節(jié)模型為ARIMA(0,0,0)× (0,1,1)12。

R計算得到的模型待估參數(shù)為-0.8842,所以據(jù)此寫出的擬合模型為:

?12xt=(1+0.8842B12)εt(3)

3.4模型參數(shù)和殘差檢驗

對擬合模型進行檢驗,包括對模型中待估參數(shù)的顯著性檢驗和對模型殘差的“白噪聲”檢驗兩部分。

首先對待估參數(shù)的顯著性進行檢驗。模型中的待估參數(shù)為-0.884 2,其標準誤差為0.041 2,所以模型的真值在區(qū)間(-0.884 2±0.041 2)內(nèi),顯著不為零,所以我們模型中得到的待估參數(shù)是顯著的。

接著對模型殘差進行檢驗。我們對模型的殘差進行“白噪聲”檢驗的目的是為了檢查建立的ARIMA乘積季節(jié)模型是否充分提取了臺風生成頻次序列中的有效信息,此次進行的“白噪聲”檢驗與建模型之前的“白噪聲”檢驗目的不同,我們希望模型的剩余殘差是完全隨機的序列,即我們的模型已將有效信息全部提取。

模型殘差的“白噪聲”檢驗結(jié)果如表2所示:

表2 模型殘差的Ljung-Box檢驗結(jié)果

從表2的結(jié)果中可以看到:無論是延遲6階還是延遲12階的p值都顯著大于0.05。這表明,我們沒有理由拒絕殘差為白噪聲的原假設,即建立的模型殘差通過了“白噪聲”檢驗。

4 預測

在建立合適的ARIMA乘積季節(jié)模型之后,我們利用該模型對2010年的逐月臺風生成頻次進行了預測。

圖5給出了由模型預測的2010年逐月臺風生成頻次。藍色虛線為擬合結(jié)果,藍色實線為預測結(jié)果,黑色實線為觀測結(jié)果。可以看到,模型對臺風逐月生成頻次的擬合很好,兩者之間的相關(guān)系數(shù)達到0.84,而且2010年的臺風逐月生成頻次的預測結(jié)果跟觀測結(jié)果是非常一致的。

為了更全面的檢查ARIMA乘積季節(jié)模型在預測臺風逐月生成頻次上的表現(xiàn),我們在1981—2009年逐月臺風生成頻次序列的基礎上依次逐年補充了2010—2013年的逐月臺風生成頻次,并按照上文中的步驟重新進行了建模和預測(圖略)。

圖5 根據(jù)ARIMA(0,0,0)×(0,1,1)12模型預測的2010年逐月臺風生成頻次

圖6 2010—2014年預測與觀測的臺風逐月生成頻次距平同號率

分析2010—2014年的預測結(jié)果表明:在全年臺風生成總頻次異常方面,預測模型有著不錯的表現(xiàn)。2010—2014年中,除2013年外,其余4 a模型提前一年預測的臺風生成總頻次異常情況與觀測一致。在臺風生成較活躍的6—10月份,模型在2010、2011、2014年表現(xiàn)良好,且對這3 a中6—10月臺風生成總數(shù)的異常偏多偏少情況預測正確,但對2012 和2013年6—10月臺風生成頻次預測情況不夠理想,表現(xiàn)為沒有預測出這2 a 6—10月臺風生成偏多的情況。

圖6為2010—2014年預測臺風逐月生成頻次與觀測臺風逐月生成頻次的距平同號率分布??梢钥吹剑耗P皖A測與觀測臺風逐月生成頻次的距平同號率存在月際間的差別,其中表現(xiàn)最好的為11月和12月,最差的為5月。這表明,在臺風的逐月生成頻次上,11月和12月的臺風生成頻次的季節(jié)相關(guān)性最好,5月最差。這種預測技巧上的月際差別主要是因為5月是春夏轉(zhuǎn)換的季節(jié),臺風生成源地的熱力和動力條件變化較劇烈,造成該月臺風生成頻次的年際變化較大;而11、12月都屬于一年中臺風活動最不活躍的月份,年際變化較小。

5 總結(jié)與討論

本文基于時間序列分析中的ARIMA乘積季節(jié)模型,通過序列平穩(wěn)化,建模前的“白噪聲”檢驗,模型的識別、定階和參數(shù)估計以及模型參數(shù)和殘差檢驗等步驟為最近30 a的逐月臺風生成頻次序列建立了合適的ARIMA乘積季節(jié)模型,并用該模型對2010—2014年的臺風逐月生成頻次進行了預測。結(jié)果表明:模型提前一年預測的2010、2011、2012和2014年臺風全年生成總頻次異常與觀測吻合。在臺風生成較活躍的6—10月,模型能夠正確預測出2010,2011及2014年活躍期內(nèi)臺風生成偏多或偏少的情況,但對2012和2013年6—10月臺風生成頻次異常情況的預測不夠理想。另外,模型預測與觀測臺風逐月生成頻次的距平同號率存在月際差別,11月和12月最好,5月最差。

另外,值得指出的一點是,雖然利用時間序列預測模型對時間序列進行分析預測時只考慮歷史時間序列的變化而不直接考慮其他因素對時間序列的影響,但這并不等于完全忽視這些因素的影響,因為時間序列本身正是在各種相關(guān)因素的相互作用下形成的。對歷史數(shù)據(jù)變動規(guī)律的概括,也正是對各種復雜因素影響時間序列規(guī)律的概括[10]。從模型預測的臺風生成頻次的結(jié)果來看,ARIMA乘積季節(jié)模型對臺風生成頻次有一定的預測能力,且在某些年份有非常不錯的表現(xiàn),但漏報和錯報的問題也仍然存在。在以后的工作中,我們會繼續(xù)研究優(yōu)化模型的方法,進一步提高臺風頻次的預測水平。

參考文獻:

[1]李祚泳,鄧新民.人工神經(jīng)網(wǎng)絡在臺風預報中的應用初探[J].自然災害學報, 1995, 4(2): 86-90.

[2]李祚泳,鄧新民,桑華民.臺風登陸華南年頻次的投影尋蹤回歸預測模型[J].熱帶氣象學報, 1998, 14(2): 181-185.

[3] Chan J C L, Shi J E, Lam C M. Seasonal Forecasting of Tropical Cyclone Activity Over the Western North Pacific and the South China Sea[J]. Weather and Forecasting, 1998, 13(4): 997-1004.

[4] Chan J C L, Shi J E, Liu K S. Improvements in the Seasonal Forecasting of Tropical Cyclone Activity Over the Western North Pacific[J]. Weather and Forecasting, 2001, 16(4): 491-498.

[5]范可.西北太平洋臺風生成頻次的新預測因子和新預測模型[J].中國科學D輯:地球科學, 2007, 37(9): 1260-1266.

[6]彭志行,鮑昌俊,趙楊,等. ARIMA乘積季節(jié)模型及其在傳染病發(fā)病預測中的應用[J].數(shù)理統(tǒng)計與管理, 2008, 27(2): 362-368.

[7] Teetor P. R語言經(jīng)典實例[M].李洪成,朱文佳,沈毅成,譯.北京:機械工業(yè)出版社, 2013.

[8] Cryer J D, Chan K S.時間序列分析及應用[M].潘紅宇,譯.北京:機械工業(yè)出版社, 2011.

[9]王燕.應用時間序列分析[M]. 3版.北京:中國人民大學出版社, 2012.

[10]張利.基于時間序列ARIMA模型的分析預測算法研究及系統(tǒng)實現(xiàn)[D].鎮(zhèn)江:江蘇大學, 2008.

Typhoon generation frequency prediction based on ARIMA model

LIU Shan, CHEN Xing-rong, CAI Yi
(National Marine Environmental Forecasting Center, Beijing 10081 China)

Abstract:In this paper, an ARIMA product seasonal model is established for the monthly typhoon generation frequency time series during the last 30 years based on the monthly typhoon generation frequency data from Tokyo typhoon center of Japan. The monthly typhoon generation frequency prediction for the years 2010—2014 is completed through this model. The results show that, the ARIMA product seasonal model performs quite well in predicting the typhoon generation frequency. Except for 2013, the anomalies of the total annual typhoon generation frequency of the remaining four years predicted one year in advance by this model are all consistent with the observations.

Key words:typhoon generation frequency; time series analysis;ARIMAmodel

作者簡介:劉珊(1986-),女,助理研究員,博士,主要從事短期氣候預測方面的研究。E-mail: liushan@nmefc.gov.cn

基金項目:海洋公益性行業(yè)科研專項經(jīng)費項目(201505013);國家自然科學基金項目(41440039)。

收稿日期:2015-12-26

中圖分類號:P444

文獻標識碼:A

文章編號:1003-0239(2016)01-0053-06

猜你喜歡
時間序列分析ARIMA模型
基于時間序列模型的中國出口總額分析及預測
基于R軟件的金融時間序列的預測分析
基于Eviews上證綜合指數(shù)預測
時代金融(2016年29期)2016-12-05 16:12:09
淮北市生態(tài)足跡動態(tài)演變分析
基于ARIMA模型的滬銅期貨價格預測研究
商(2016年27期)2016-10-17 06:06:02
對我國進出口總額的預測
商(2016年22期)2016-07-08 14:41:15
組合預測法在我國糧食產(chǎn)量預測中的應用
商(2016年19期)2016-06-27 14:21:53
微信公眾號未來發(fā)展態(tài)勢的實證預測
中國記者(2016年1期)2016-03-03 18:08:02
基于MATLAB的時間序列預測
中國石化產(chǎn)業(yè)產(chǎn)能過剩測度及預警
铜鼓县| 沙田区| 扬中市| 信丰县| 闽侯县| 综艺| 新化县| 玉田县| 河南省| 堆龙德庆县| 名山县| 杭锦旗| 淮安市| 柘城县| 汉源县| 措美县| 中西区| 宝鸡市| 县级市| 沿河| 万荣县| 稷山县| 车险| 金沙县| 祁东县| 牡丹江市| 集贤县| 凉山| 霞浦县| 济宁市| 斗六市| 安乡县| 沽源县| 三台县| 鄂托克旗| 昭通市| 珲春市| 临沭县| 阜宁县| 乌拉特中旗| 驻马店市|