葉曉波 王 松
(楚雄師范學院計算機信息管理中心,云南 楚雄 675000)
ARIMA模型在楚雄市年平均氣溫預測中的應用研究*
葉曉波 王 松
(楚雄師范學院計算機信息管理中心,云南 楚雄 675000)
文章運用時間序列ARIMA模型的建模方法對云南省楚雄市1961年到2010年年平均氣溫進行分析研究,通過SAS軟件建立了ARIMA(p,d,q)時間序列模型,同時運用建立的模型對楚雄市未來4年的年平均氣溫值進行了預測;本文的研究結果對當?shù)毓まr(nóng)業(yè)生產(chǎn)、人民生活具有一定參考價值。
時間序列;ARIMA;氣溫;SAS
氣溫的變化對工農(nóng)業(yè)生產(chǎn)、環(huán)境、水資源、人民生活有很大的影響,對氣溫的建模及預測一直是人工智能領域的熱點話題,本文利用SAS軟件對楚雄市1961年到2010年年平均氣溫進行分析研究,采用差分運算將原序列轉換成平穩(wěn)時間序列,采取ARIMA模型的建模方法對序列分析建模,從而為楚雄市年平均氣溫建立了ARIMA(p,d,q)時間序列模型,最后運用建立的模型對楚雄市未來4年的年平均氣溫進行了預測。
一個平穩(wěn)非白噪聲序列是一個蘊含相關信息的序列,為提取該序列中的有用信息,通常建立一個線性模型來擬合該序列的發(fā)展,ARMA模型是目前最常用的平穩(wěn)序列擬合模型;如果序列要經(jīng)過差分后才是平穩(wěn)非白噪聲序列,就要使用ARIMA模型進行擬合。
ARMA模型又稱為自回歸移動平均模型,是目前用來擬合平穩(wěn)序列最常用的模型,它包含有三種基本形式:自回歸模型AR(p),移動平均模型MA(q)和自回歸移動平均模型ARMA(p,q)。通常把具有如下結構的模型稱為自回歸移動平均模型,簡記為 ARMA(p,q):
對非平穩(wěn)時間序列的有用信息提取通常采用差分方法,許多非平穩(wěn)序列差分后會顯示出平穩(wěn)序列的性質,具有該性質的非平穩(wěn)序列稱為差分平穩(wěn)序列。對差分平穩(wěn)序列可使用ARIMA模型進行擬合。
ARIMA模型又稱為求和自回歸移動平均模型,簡記為ARIMA(p,d,q)模型,該模型具有如下結構:
其中:
對一個時間序列嘗試進行ARIMA模型建模時,通常按照以下步驟完成建模過程:
(1)直觀檢驗平穩(wěn)性。此步驟一般可通過繪制時間序列的時序圖進行觀察,如果序列的時序圖顯示出平穩(wěn)性,就可轉入下一步進行平穩(wěn)性和純隨機性檢驗;如果序列的時序圖呈現(xiàn)非平穩(wěn)性,則可對序列使用差分運算等方法來進行進一步的處理,只有處理后的序列呈現(xiàn)平穩(wěn)性才有可能使用ARIMA模型建模。
(2)平穩(wěn)性和純隨機性檢驗。如果平穩(wěn)序列呈現(xiàn)純隨機性,則說明該序列的各項之間沒有任何相關關系,應該終止序列的建模工作;只有序列顯示出平穩(wěn)性和非純隨機性才有價值對其進行建模。
(3)模型定階。計算序列的樣本自相關系數(shù)和偏自相關系數(shù)的值,根據(jù)樣本自相關圖、偏自相關圖和逆自相關圖的性質對模型的階數(shù)進行直觀識別。
(4)參數(shù)估計及模型檢驗。根據(jù)模型定階的結果,估計模型中未知參數(shù)的值,檢驗模型的顯著性及對殘差進行白噪聲檢驗,選擇最優(yōu)模型。
(5)預測。使用以上步驟建立的模型對序列進行短期預測。
本文選取云南省楚雄市1961年至2010年年平均氣溫值進行ARIMA建模,并用所建模型對楚雄市未來4年年平均氣溫進行預測,取得了較好的效果,下面是具體的建模預測過程:
(1)觀察值序列
表1 楚雄市1961年—2010年年平均氣溫 (數(shù)據(jù)來源:楚雄州氣象局)
(2)判斷序列的平穩(wěn)性
在SAS軟件中繪制楚雄市1961年—2010年年平均氣溫時序圖 (圖1),時序圖顯示該序列呈現(xiàn)出顯著的線性上升趨勢,為典型的非平穩(wěn)序列。根據(jù)該序列所呈現(xiàn)的特點,嘗試對序列進行1階差分運算并繪制差分后的時序圖。圖2就是對原序列進行1階差分運算后所繪制的時序圖,時序圖顯示出差分后序列在均值附近比較穩(wěn)定的波動,直觀分析原序列經(jīng)過1階差分運算后顯示出平穩(wěn)性。
圖1 楚雄市1960—2010年年平均氣溫序列時序圖
圖2 楚雄市1960—2010年年平均氣溫1階差分后序列時序圖
(3)平穩(wěn)性和純隨機性檢驗。
為了進一步確定差分后的序列的平穩(wěn)性和序列是否屬于純隨機性序列,在SAS軟件中使用identify語句對差分后的序列進行平穩(wěn)性和純隨機性檢驗,表2是檢驗結果:
表2 序列1階差分后純隨機性檢驗結果
差分后的序列純隨機性檢驗QLB統(tǒng)計量的P值均小于0.05,說明差分后該序列屬于非白噪聲平穩(wěn)時間序列,可以進行ARIMA模型建模。
(4)模型定階
為了確定模型的階數(shù),在SAS軟件中使用identify語句對差分后的序列進行自相關和偏自相關圖的分析,分析結果顯示差分后的序列自相關圖不截尾,偏自相關圖除了延遲1階、2階和6階的偏自相關系數(shù)顯著大于2倍標準差之外,其它階數(shù)的偏自相關系數(shù)都位于2倍標準差之內。根據(jù)自相關圖和偏自相關圖的特點,可嘗試構造疏系數(shù)模型AR(1,2,6)。
同時,SAS系統(tǒng)也為建模者自動獲得相對最優(yōu)模型提供了方法,在identify命令中增加可選命令MINIC來獲得一定范圍內的最優(yōu)模型定階。在本實例中使用以下identify命令進行自動相對最優(yōu)模型的選擇:
identify var=x1(1)minic p= (0:7)q= (0:7)nlag=24;
圖3是identify命令輸出的最小信息量結果,從圖3可以看出,BIC信息量相對最小的是BIC(6,0),即SAS系統(tǒng)分析結果認為AR(6)模型是相對最優(yōu)模型。
綜合考慮前面的分析結果,本例擬采用ARIMA模型和AR(6)模型對序列進行擬合。
圖3 identify命令輸出的最小信息量結果
(5)參數(shù)估計及模型檢驗
在SAS軟件中分別使用以下語句對AR(1,2,6)模型和AR(6)模型進行參數(shù)估計:
AR(1,2,6) 模型參數(shù)估計語句:estimate p= (1,2,6);
AR(6)模型參數(shù)估計語句:estimate p=6;
參數(shù)估計輸出結果顯示AR(1,2,6)模型和AR(6)模型的均值MU不顯著 (t檢驗統(tǒng)計量的P值分別為0.2510和0.0581),因此在兩個模型的參數(shù)估計語句后加上NOINT選項,除去常數(shù)項,再次估計未知參數(shù)的結果,表3是AR(1,2,6)模型參數(shù)估計輸出結果,表4是AR(6)模型參數(shù)估計輸出結果,兩個模型的輸出結果顯示模型未知參數(shù)均顯著。表5是AR(1,2,6)模型殘差自相關檢驗結果,表6是AR(6)模型殘差自相關檢驗結果,該統(tǒng)計結果顯示延遲各階的QLB統(tǒng)計量的P值均大于0.05,所以兩個模型的殘差為白噪聲序列;從以上分析可知:AR(1,2,6)模型和AR(6)模型都顯著成立。
表3 AR(1,2,6)模型參數(shù)估計輸出結果
表4 AR(6)模型參數(shù)估計輸出結果
表5 AR(1,2,6)模型殘差自相關檢驗結果
表6 AR(6)模型殘差自相關檢驗結果
(6)選擇最優(yōu)模型
為了從兩個顯著成立的模型中找出最優(yōu)模型,一般情況下使用AIC和SBC準則進行檢驗,能使AIC和SBC信息量最小的模型就是最優(yōu)模型;表7是兩個模型的AIC、SBC信息量檢驗結果,從表中可發(fā)現(xiàn)兩個模型中AR(6)模型的AIC信息量較小,而AR(1,2,6)模型的SBC信息量較小,從而無法使用AIC和SBC準則進行檢驗;在該種情況下可參考方差估計值和標準差估計值,最優(yōu)模型應該是方差估計值和標準差估計值最小的模型,根據(jù)表7中的檢驗結果,選擇AR(6)模型為最優(yōu)模型。
表7 模型的顯著性參數(shù)對比
綜上所述,在SAS軟件中最終得到AR(6)模型為:
(7)序列預測
在ASA軟件中使用forecast語句對楚雄市未來4年的年平均氣溫進行預測,預測結果如表8所示,圖4是對預測結果所繪制的時序圖,圖中帶*號的折線是原時間序列,中間不帶*號的折線是預測結果,最上面和最下面的折線是95%的置信上限和下限。
表8 楚雄市未來4年年平均氣溫預測結果
圖4 楚雄市未來4年年平均氣溫預測結果
從最終時間序列數(shù)據(jù)擬合結果來看,ARIMA模型對楚雄市年平均氣溫的擬合總的趨勢是一致的,誤差不大,預測值均在置信區(qū)間內,可見預測效果良好。但ARIMA模型主要適用于時間序列的短期預測,對于長期的預測方法還有待于進一步研究。
[1]王燕.應用時間序列分析 [M].北京:中國人民大學出版社,2005.
[2]孫淑珍,劉雙.ARIMA模型在房屋銷售價格指數(shù)預測中的應用及SAS實現(xiàn) [J].湖南文理學院學報 (自然科學版).2010,22(2):1—4.
[3]王正洪,蔡蕙,蔡冠玉.基于SAS軟件的城市電力需求ARIMA模型及預測 [J].現(xiàn)代電子技術.2007,30(2):165—167.
[4]唐玉娜,李啟會.ARMA模型在預測問題中的應用 [J].嘉興學院學報.2006,18(S1):183—187.
[5]王柏勇.鄱陽湖區(qū)永修縣年季氣溫變化趨勢預測 [J].南昌工程學院學報.2010,29(3):73—75.
The application of ARIMA model in the prediction of Annual average temperature of Chuxiong City
YE Xiao-bo;WANG Song
(The Computer Information Management Center,Chuxiong Normal University,Chuxiong 675000,China)
This paper applies modeling method of time series ARIMA model to analyze the average temperature from 1961—2010 of Chuxiong City,and to establish ARIMA(p,d,q)time series model by the SAS software.Meanwhile,using established model forecast future 4 years average temperature.This research results has certain reference value on the local industrial,agricultural production and people's life.
time series;ARIMA;temperature;SAS
TP3
A
1671-7406(2012)06-0016-06
2012-04-25
葉曉波 (1975—),男,云南大姚人,碩士,楚雄師范學院計算機信息管理中心講師,主要研究方向:人工智能。
(責任編輯 劉洪基)