王巍
(池州學(xué)院,安徽 池州 247000)
基于ARIMA模型的安徽省城鎮(zhèn)化水平預(yù)測(cè)研究
王巍
(池州學(xué)院,安徽池州247000)
城鎮(zhèn)化發(fā)展水平同一個(gè)地區(qū)經(jīng)濟(jì)發(fā)展水平、政府政策制定與實(shí)施密切相關(guān).運(yùn)用時(shí)間序列理論,以ARIMA模型為重要分析工具,選取安徽省1955-2014年城鎮(zhèn)化水平數(shù)據(jù),利用EViews軟件擬合了ARIMA模型并對(duì)未來(lái)安徽省城鎮(zhèn)化水平進(jìn)行了短期預(yù)測(cè).結(jié)果表明,ARIMA(1,2,1)模型通過(guò)了參數(shù)顯著性檢驗(yàn)和模型顯著性檢驗(yàn),模型的擬合效果良好,并且安徽省城鎮(zhèn)化水平短期預(yù)測(cè)精度高.模型預(yù)測(cè)結(jié)果表明,安徽省未來(lái)城鎮(zhèn)化發(fā)展勢(shì)頭較好.
時(shí)間序列;ARIMA模型;城鎮(zhèn)化水平;預(yù)測(cè)
城鎮(zhèn)化水平是衡量一個(gè)地區(qū)經(jīng)濟(jì)發(fā)展水平的重要標(biāo)志,也是考察一個(gè)地區(qū)城鎮(zhèn)化進(jìn)程的基本方法.所謂城鎮(zhèn)化是指農(nóng)村人口不斷向城鎮(zhèn)轉(zhuǎn)移,第二、三產(chǎn)業(yè)不斷向城鎮(zhèn)聚集,從而使城鎮(zhèn)數(shù)量增加,城鎮(zhèn)規(guī)模擴(kuò)大的一種歷史過(guò)程.城鎮(zhèn)化的核心是人口就業(yè)結(jié)構(gòu)、經(jīng)濟(jì)產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)化過(guò)程和城鄉(xiāng)空間社區(qū)結(jié)構(gòu)的變遷過(guò)程.因此,為了反映人口在城鎮(zhèn)的集中過(guò)程和程度,城鎮(zhèn)化水平一般用城鎮(zhèn)人口占總?cè)丝诘陌俜直葋?lái)表示.
對(duì)于城鎮(zhèn)化水平的研究,關(guān)于城鎮(zhèn)化速度的預(yù)測(cè),近年來(lái)已經(jīng)形成了諸多預(yù)測(cè)方法,主要有:(1)新陳代謝GM(1,2)模型預(yù)測(cè)法.白先春,李炳?。?006)采用新陳代謝GM(1,1)進(jìn)行了預(yù)測(cè),很好的實(shí)現(xiàn)了灰色系統(tǒng)新信息優(yōu)先的原理,但是沒(méi)有充分開(kāi)發(fā)利用已知的“最少”信息;(2)趨勢(shì)外推預(yù)測(cè)法.常用的趨勢(shì)外推預(yù)測(cè)模型有多項(xiàng)式模型、指數(shù)模型、修正指數(shù)模型、冪函數(shù)模型、邏輯斯蒂模型(Logistic)和龔伯茨模型等.李迅等(2000)用1980-1998年我國(guó)城鎮(zhèn)化水平數(shù)據(jù)以時(shí)間t為自變量,城鎮(zhèn)非農(nóng)業(yè)人口比重Yt為因變量,擬合了一次多項(xiàng)式模型;(3)經(jīng)濟(jì)因素相關(guān)分析預(yù)測(cè)法.城鎮(zhèn)化與經(jīng)濟(jì)發(fā)展相互影響,經(jīng)濟(jì)發(fā)展促進(jìn)人口向城市流動(dòng),提高城鎮(zhèn)化水平.周一星(1982),李文溥、陳永杰(2001)選取了人均GNP的對(duì)數(shù)值作為自變量,構(gòu)造了半對(duì)數(shù)回歸模型;饒會(huì)林(1999)選取了工業(yè)勞動(dòng)人口比重,構(gòu)造了簡(jiǎn)單線性回歸模型;李迅等(2000),王金營(yíng)(2003)選取了人均GDP分別構(gòu)造了回歸模型.
本文利用城鎮(zhèn)化水平的時(shí)間序列數(shù)據(jù)建立ARIMA模型對(duì)安徽省城鎮(zhèn)化水平進(jìn)行分析和預(yù)測(cè).結(jié)果表明:應(yīng)用ARIMA(p,d,q)模型擬合安徽省城鎮(zhèn)化水平的短期數(shù)據(jù)精確度很高,預(yù)測(cè)結(jié)果對(duì)安徽省城鎮(zhèn)化水平發(fā)展趨勢(shì)的判斷具有一定的指導(dǎo)意義.
1.1ARIMA模型的結(jié)構(gòu)
ARIMA模型又稱之為求和自回歸移動(dòng)平均模型,簡(jiǎn)記為ARIMA(p,d,q),具有如下結(jié)構(gòu):
式中,▽d=(1-B)d;Φ(B)=1-?1B-…-?pBp為平穩(wěn)可逆序列模型的自回歸系數(shù)多項(xiàng)式;Θ(B)=1-θ1B-…-θqBq為平穩(wěn)可逆序列ATMA(p,q)模型的移動(dòng)平滑系數(shù)多項(xiàng)式.
求和自回歸移動(dòng)平均模型這個(gè)名字的由來(lái)是因?yàn)閐階差分后序列可以表示為:
式(1.1)可以簡(jiǎn)記為:
由式(1.2)可以看出,ARIMA模型的實(shí)質(zhì)就是差分運(yùn)算與ARIMA模型的組合,即任何非平穩(wěn)序列都可以通過(guò)差分運(yùn)算實(shí)現(xiàn)平穩(wěn)后再建立ARMA模型了.
1.2時(shí)間序列的平穩(wěn)性檢驗(yàn)
序列滿足平穩(wěn)性條件是建立模型的首要前提,建模之前首先要對(duì)序列進(jìn)行平穩(wěn)性檢驗(yàn).平穩(wěn)性檢驗(yàn)的方法主要有時(shí)序圖檢驗(yàn)、自相關(guān)圖檢驗(yàn)以及單位根檢驗(yàn).鑒于時(shí)序圖檢驗(yàn)和自相關(guān)圖檢驗(yàn)較大程度上受到人的主觀因素的影響,這里采用單位根檢驗(yàn)法.而ADF檢驗(yàn)是單位根檢驗(yàn)中最常見(jiàn)的.以AR(p)過(guò)程為例,其特征方程為:
若特征方程的所有單位根都在單位圓內(nèi),則序列滿足平穩(wěn)性條件.構(gòu)造ADF檢驗(yàn)統(tǒng)計(jì)量如下:
1.3模型定階
模型定階主要依據(jù)樣本的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),根據(jù)它們表現(xiàn)出來(lái)的性質(zhì),選擇適當(dāng)?shù)哪P蛿M合觀察值序列.即根據(jù)樣本觀測(cè)值序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)估計(jì)自相關(guān)階數(shù)p和移動(dòng)平均階數(shù)q.模型的定階過(guò)程也就是模型的識(shí)別過(guò)程.模型定階的基本原則如表1所示.
表1 ARMA模型定階
相關(guān)系數(shù)截尾及階數(shù)的判斷很大程度上依靠人的主觀經(jīng)驗(yàn),但樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的近似分布對(duì)模型的定階具有很大的幫助.通常,若樣本自相關(guān)系數(shù)或偏自相關(guān)系數(shù)在最初的d階明顯超出2倍標(biāo)準(zhǔn)差,而后幾乎95%的自相關(guān)系數(shù)都落在2倍標(biāo)準(zhǔn)差范圍內(nèi),且衰減為小值的過(guò)程非常突然,這種情況視為自相關(guān)截尾,階數(shù)為d.反之,視為拖尾.
1.4模型參數(shù)估計(jì)與檢驗(yàn)
1.4.1參數(shù)估計(jì)
選擇合適的模型后,接著要利用搜集到的序列觀察值估計(jì)模型中的未知參數(shù).對(duì)于一個(gè)非中心化的ARMA(p,q)模型,有
該模型共含有p+q+2個(gè)未知參數(shù),未知參數(shù)的估計(jì)方法主要有三種:矩估計(jì)法、極大似然估計(jì)和最小二乘估計(jì).
1.4.2模型檢驗(yàn)
模型檢驗(yàn)主要包括模型的顯著性檢驗(yàn)和參數(shù)的顯著性檢驗(yàn).模型的顯著性檢驗(yàn)主要檢驗(yàn)?zāi)P吞崛〉男畔⑹欠癯浞?,模型是否有?一個(gè)好的擬合模型應(yīng)能夠提取觀察值序列中的幾乎所有信息,換言之,擬合殘差將不再蘊(yùn)含任何相關(guān)信息.因此,模型的顯著性檢驗(yàn)主要檢驗(yàn)殘差序列是否是白噪聲序列.模型參數(shù)顯著性檢驗(yàn)的目的是為了使模型最為精簡(jiǎn),若某個(gè)參數(shù)不顯著,表示該參數(shù)所對(duì)應(yīng)的自變量對(duì)因變量的影響不明顯,該自變量即可剔除.
1.5模型預(yù)測(cè)
對(duì)任意一個(gè)未來(lái)時(shí)刻t+l,?l≥1而言,該時(shí)刻的序列值可以用它的歷史數(shù)據(jù)xt+l+1,…,xt+1,xt,…的線性函數(shù)來(lái)表示.根據(jù)線性函數(shù)的可加性,所有的未知?dú)v史信息xt+l-1,…,xt+1都可以用已知?dú)v史信息xt,xt-1,…的線性函數(shù)表示,并用該函數(shù)形式估計(jì)xt+l,即序列的第l步預(yù)測(cè)值)為:
目前,最常用的預(yù)測(cè)原則是預(yù)測(cè)方差最小原則,即
通過(guò)查詢《安徽省統(tǒng)計(jì)年鑒(2015年)》得到1955年至2014年安徽省60年的城鎮(zhèn)化水平數(shù)據(jù),見(jiàn)表2.
表2 1955至2014年安徽省城鎮(zhèn)化水平
圖1 安徽省城鎮(zhèn)化變化情況(1955年-2014年)
從圖1可以看出,安徽省城鎮(zhèn)化水平一直保持增長(zhǎng)的態(tài)勢(shì),尤其是1996之后增長(zhǎng)速度明顯加快.很明顯,安徽省城鎮(zhèn)化水平序列不滿足平穩(wěn)性條件,通過(guò)差分運(yùn)算發(fā)現(xiàn),序列的二階差分序列平穩(wěn)性較好,并通過(guò)了單位根檢驗(yàn),如表3所示.
表3 2階差分的ADF檢驗(yàn)結(jié)果
二階差分序列的自相關(guān)偏自相關(guān)系數(shù)如圖2所示,從圖可以看出,二階差分序列自相關(guān)系數(shù)和偏自相關(guān)系數(shù)均一階截尾,因此,原始序列可以建立ARIMA(1,2,1)模型.
圖2 2階差分序列相關(guān)系數(shù)圖
模型參數(shù)估計(jì)結(jié)果如表4所示,從表4可以看出,C、AR(1)、MA(1)的參數(shù)均具有顯著性,即模型通過(guò)了參數(shù)顯著性檢驗(yàn).
表4 模型參數(shù)估計(jì)結(jié)果
再檢驗(yàn)?zāi)P偷娘@著性,即檢驗(yàn)ARIMA(1,2,1)模型殘差序列是否為白噪聲序列,見(jiàn)圖3.從圖中可以看出,各階延遲下的LB統(tǒng)計(jì)量的P值都顯著大于0.05,可以認(rèn)為這個(gè)擬合模型的殘差序列屬于白噪聲序列,說(shuō)明模型已經(jīng)提取觀察值序列中幾乎所有的樣本相關(guān)信息,擬合殘差項(xiàng)中將不再蘊(yùn)含任何相關(guān)信息,即擬合模型顯著有效.
圖3 模型殘差項(xiàng)的Q值檢驗(yàn)
運(yùn)用ARIMA(1,2,1)模型對(duì)安徽省城鎮(zhèn)化水平進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如表5所示.其中,通過(guò)網(wǎng)絡(luò)查詢得知,2015年安徽省城鎮(zhèn)化水平實(shí)際值為51%,模型預(yù)測(cè)結(jié)果為50.9%,模型的預(yù)測(cè)值與實(shí)際值誤差很小,預(yù)測(cè)誤差低于0.2%,說(shuō)明模型預(yù)測(cè)效果良好.
表5 模型預(yù)測(cè)值與實(shí)際值
雖然,ARIMA(1,2,1)模型對(duì)安徽省城鎮(zhèn)化水平預(yù)測(cè)效果良好,但判別模型的方法和準(zhǔn)則很多,只是在某個(gè)方面而言模型是最優(yōu)的.另外,時(shí)間序列模型一般適用于短期預(yù)測(cè),長(zhǎng)期預(yù)測(cè)誤差需要進(jìn)一步驗(yàn)證,預(yù)測(cè)效果也待實(shí)際檢驗(yàn).安徽省的城鎮(zhèn)化水平受到社會(huì)、政治、經(jīng)濟(jì)、文化等眾多要素的影響,城鎮(zhèn)化水平發(fā)展具有一定程度上偶然性,從長(zhǎng)期來(lái)看,安徽省城鎮(zhèn)化水平表現(xiàn)出增長(zhǎng)的趨勢(shì).因此,采用ARIMA(1,2,1)模型對(duì)安徽省城鎮(zhèn)化水平進(jìn)行短期預(yù)測(cè)具有一定的參考價(jià)值.
〔1〕馬軍.城鎮(zhèn)化水平的度量、評(píng)價(jià)和預(yù)測(cè)[J].浙江統(tǒng)計(jì),1999(2).
〔2〕王燕.應(yīng)用時(shí)間序列分析 [M].中國(guó)人民大學(xué)出版社,2015.135-152
〔3〕張曉峒.EViews使用指南與案例[M].機(jī)械工業(yè)出版社,2007.232-243.
〔4〕陳夫凱.運(yùn)用ARIMA模型的我國(guó)城鎮(zhèn)化水平預(yù)測(cè)[J].重慶理工大學(xué)學(xué)報(bào),2014(4).
O21;F224.7
A
1673-260X(2016)07-0015-03
2016-04-12
校級(jí)課題2015年池州學(xué)院自然科學(xué)研究項(xiàng)目:基于地區(qū)差異視角的安徽省人口老齡化計(jì)量研究(2015ZR004)