王文皓
摘 要:本文利用時間序列模型,對1949-2010年的全國人口數(shù)量進(jìn)行了預(yù)測,并構(gòu)建ARIMA(自回歸移動平均模型)模型,對數(shù)據(jù)的平穩(wěn)性進(jìn)行檢驗(yàn),確定ARIMA模型可以對全國總?cè)丝谶M(jìn)行短期的預(yù)測。
關(guān)鍵詞:時間序列;總?cè)丝冢籄RIMA模型
一個國家的人口數(shù)量對于一國的經(jīng)濟(jì)發(fā)展、社會發(fā)展以及國家資源利用情況有著較大的影響,由此可見,人口問題對于一國發(fā)展起到了至關(guān)重要的影響?;谶@一點(diǎn)來看,對未來人口數(shù)量的有效預(yù)測,對于促進(jìn)國家、地區(qū)社會經(jīng)濟(jì)發(fā)展來說,具有十分重要的意義?;跁r間序列分析全國總?cè)丝?,能夠?yàn)槌鞘幸?guī)劃、減輕資源壓力等提供有效的參考和借鑒,使國家根據(jù)總?cè)丝谇闆r制定有效的人口政策。從我國人口情況來看,我國是一個人口眾多的國家,人口問題對我國經(jīng)濟(jì)、社會發(fā)展起到了巨大的影響。從我國人口發(fā)展現(xiàn)狀來看,人口發(fā)展暴露出一些嶄新的問題。如出生人口男女比例失調(diào)、人口老齡化問題日益嚴(yán)重等,這些問題成為我國人口健康發(fā)展的重要影響因素。因此,針對于我國人口問題,如何做好人口的有效預(yù)測,為經(jīng)濟(jì)、社會發(fā)展提供依據(jù),是現(xiàn)階段必須把握的一個重要問題?;跁r間序列分析人口預(yù)測模型,其在預(yù)測精確度方面,要遠(yuǎn)遠(yuǎn)高于其他模型,對其進(jìn)行有效利用,具有重要意義。本文結(jié)合統(tǒng)計學(xué)相關(guān)原理,利用ARIMA模型對全國人口時間序列數(shù)據(jù)進(jìn)行了預(yù)測分析,希望能夠?yàn)槿珖丝陬A(yù)測提供一些參考和借鑒。
1 時間序列概述
1.1 時間序列分析
目前,關(guān)于時間序列問題的研究,國內(nèi)外學(xué)術(shù)界已經(jīng)有較多的研究成果。在1982年,鄧聚龍教授針對于我國人口預(yù)測問題,提出了灰色系統(tǒng)理論,該理論具有較好的現(xiàn)實(shí)融合性,其所需要的樣本容量相對較小。在進(jìn)行人口數(shù)量預(yù)測過程中,通過使用灰色模型GM(1,1),對灰色系統(tǒng)進(jìn)行分析、建模、求解。此外,logistic模型在人口預(yù)測方面也發(fā)揮了較大的作用,該模型針對于S型增長的種群進(jìn)行描述,對種群的動態(tài)變化規(guī)律予以把握,從而對種群日后的發(fā)展變化情況進(jìn)行預(yù)測和分析。此外,Leslie矩陣是一種分析動物種群數(shù)量變動的數(shù)學(xué)模型,該模型與ARMA模型的結(jié)合,有助于提升人口預(yù)測的準(zhǔn)確性。本文在對時間序列分析過程中,注重對Leslie矩陣的原理進(jìn)行把握,并在ARIAM模型應(yīng)用過程中進(jìn)行滲透,提升模型分析的準(zhǔn)確性和可靠性[1]。
時間序列分析主要是指借助于一個事物過去的變化規(guī)律,對事物未來的發(fā)展趨勢進(jìn)行有效預(yù)測,把握事物未來可能發(fā)生的變化。具體地來說,時間序列分析主要是指對事物變化規(guī)律進(jìn)行發(fā)現(xiàn),并把握這種規(guī)律在事物未來時間上的變化和延伸,從而對事物的變化狀況能夠做出較為準(zhǔn)確的預(yù)測。時間序列的定義,主要考慮到了隨機(jī)數(shù)據(jù)按照時間的先后順序排列,通過構(gòu)建模型對規(guī)律進(jìn)行分析和把握,實(shí)現(xiàn)對隨機(jī)數(shù)據(jù)序列的統(tǒng)計規(guī)律分析目的,對實(shí)際問題做好有效解決。
1.2 時間序列概念
在對時間序列概念分析過程中,考慮到了統(tǒng)計學(xué)意義,假設(shè)T是實(shí)數(shù)集合的子集,并且對于任意固定的,其中Yt為隨機(jī)變量,的全體是一個隨機(jī)過程,將其記為:{Yt}。同時,對于固定的t,Yt為隨機(jī)變量,當(dāng)t在集合T中取遍所有值的時候,得到隨機(jī)過程。一般來說,T的取值如下:
在公式(1)中,T為隨機(jī)過程,并且這種情況下,對應(yīng)的時間為連續(xù)的時間;在公式(2)中,這種情況T為隨機(jī)序列,并且T為離散狀態(tài)[2]。
1.3 時間序列的分解
對于時間序列的分解,通常用Y表示確定性的時間序列,這種狀態(tài)下,該序列可以分解為以下幾個部分:
在上述公式中,T表示了時間序列中的趨勢項(xiàng);C表示時間序列中的循環(huán)項(xiàng);S表示時間序列中的季節(jié)項(xiàng);e表示了時間序列的隨機(jī)項(xiàng)。
1.4 ARIMA模型
ARIMA模型也就是自回歸移動平均模型,該模型是一種精度較高的時序短期預(yù)測模型,在對ARIMA模型應(yīng)用過程中,其考慮到了存在一些的時間序列依賴于時間t的一族隨機(jī)變量,并且構(gòu)成這種單個序列值具有不確定性,而序列存在著一定的規(guī)律性,可以用數(shù)學(xué)模型對其進(jìn)行表示。通過對ARIMA模型的研究和分析發(fā)現(xiàn),借助于ARIMA模型能夠?qū)r間序列的結(jié)構(gòu)和特征進(jìn)行認(rèn)知,實(shí)現(xiàn)對規(guī)律的把握,并對數(shù)據(jù)進(jìn)行更加準(zhǔn)確的預(yù)測。關(guān)于ARIMA模型的基本形式,如下:
公式中,令
,
,
并對其進(jìn)行簡化處理,有:
,公式中,L表示滯后算子;表示L的p自回歸系數(shù)多項(xiàng)式;表示L的q階平均系數(shù)多項(xiàng)式。而和則分別表示自回歸算子和移動平均算子。在對ARIMA模型分析過程中,實(shí)際上是對ARMA模型與差分運(yùn)算的結(jié)合。
ARIMA模型在應(yīng)用過程中,主要根據(jù)ARIMA模型的散點(diǎn)圖和自相關(guān)函數(shù)及其偏自相關(guān)函數(shù)圖,利用ADF單位根對時間序列的方差進(jìn)行檢驗(yàn),對數(shù)據(jù)的波動行進(jìn)行衡量,以把握數(shù)據(jù)序列的變化趨勢,從而對目標(biāo)序列的周期性變化規(guī)律進(jìn)行把握。但對ARIMA模型應(yīng)用過程中,存在著差分后不是平穩(wěn)序列的情況,這就需要對ARIMA模型做出相應(yīng)的改進(jìn),而ARMA模型對差分運(yùn)算進(jìn)行了結(jié)合,能夠很好地解決ARIMA模型存在的弊端和不足[3]。因此,在利用時間序列進(jìn)行全國人口數(shù)量預(yù)測過程中,利用ARMA模型與ARIMA模型,保證預(yù)測數(shù)據(jù)的準(zhǔn)確性和可靠性。
2 全國人口時間序列模型的預(yù)測分析
2.1 人口數(shù)據(jù)的平穩(wěn)性檢驗(yàn)與處理
在利用ARIMA模型進(jìn)行全國人口時間序列分析過程中,要對選擇的樣本數(shù)據(jù)信息做好數(shù)據(jù)平穩(wěn)性檢驗(yàn)和處理。在數(shù)據(jù)選擇上,本文通過查閱通過統(tǒng)計年鑒,對1949-2010年的全口人口數(shù)據(jù)信息進(jìn)行了獲取。關(guān)于1949年-2010年的全國人口序列情況,如圖1所示:
結(jié)合圖1的全國人口序列圖來看,我國人口在1949年-2010年期間,呈現(xiàn)出一個快速上升的趨勢,但是在1960年前后,全國人口數(shù)量出現(xiàn)了一定的回落,除了這一時間段外,其余年份均處于一個快速上升的趨勢。結(jié)合全國人口序列來看,1949年-2010年期間,人口年均增長率突破了17%,年均增長人口數(shù)量突破了1450萬人。但結(jié)合獲取的數(shù)據(jù)來看,我國人口均增長率保持在17%以上,但結(jié)合每年的情況來看,人口增長率實(shí)際上呈現(xiàn)出一定的下降趨勢。從改革開放以前的人口增長來看,這一時間段的人口增長率突破了20%;而從1978年實(shí)施改革開放以后,這一時間段的人口增長率在13%左右,由此可見,人口增長率呈現(xiàn)出了下降的趨勢。結(jié)合1949-2010年全國人口序列來看,這是一個非平穩(wěn)序列,需要對其進(jìn)行處理。
通過對人口序列Yt進(jìn)行ADF檢驗(yàn),得出,從這兩個數(shù)值來看,其大于臨界值。由此可見,該數(shù)據(jù)存在著單位根,沒有通過ADF單位根檢驗(yàn),屬于非平穩(wěn)序列。關(guān)于ADF檢驗(yàn)結(jié)果,如表1所示:
結(jié)合表1序列的ADF檢驗(yàn)結(jié)果來看,非平穩(wěn)序列在5%的顯著性水平下處于平穩(wěn)狀態(tài),這樣一來,對模型定階,通過一階差分后,可以構(gòu)建模型。
2.2 ARMA模型構(gòu)建
在對非平穩(wěn)序列進(jìn)行處理后,對其進(jìn)行一階差分處理,構(gòu)建模型。同時,結(jié)合序列的相關(guān)圖,自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都是拖尾的,這樣一來,選擇的函數(shù)模型為:模型。通過對模型進(jìn)行檢驗(yàn)發(fā)現(xiàn),當(dāng)和時,參數(shù)可通過檢驗(yàn),構(gòu)建模型。關(guān)于模型的參數(shù)估計,如表2所示:
結(jié)合表2模型參數(shù)估計的統(tǒng)計結(jié)果來看,在5%的顯著性水平下,回歸方程不存在序列相關(guān)性,對回歸方程的估計結(jié)果有效。同時,對模型的殘差圖進(jìn)行獲取,發(fā)現(xiàn)其符合時間序列模型擬合條件。
最終,對模型進(jìn)行確定:
2.3 討論分析
1)在對全國人口預(yù)測過程中,本文選擇了1949年-2010年的全國人口數(shù)據(jù),以此構(gòu)建了ARIMA模型。在數(shù)據(jù)分析過程中發(fā)現(xiàn),利用模型進(jìn)行數(shù)據(jù)預(yù)測,通過對模型參數(shù)進(jìn)行有效設(shè)計,并對模型數(shù)據(jù)進(jìn)行檢驗(yàn),預(yù)測的誤差相對較小,預(yù)測具有較好的擬合精度,實(shí)現(xiàn)了對全國人口的短期預(yù)測。通過對ARIMA模型的應(yīng)用,可以對全國人口數(shù)量進(jìn)行較為精確地預(yù)測,這為經(jīng)濟(jì)、社會發(fā)展提供了一定的參考。
2)通過利用ARIMA模型進(jìn)行全國人口預(yù)測發(fā)現(xiàn),模型的精確度較高。2011年我國人口總數(shù)達(dá)到了13.473億人,這與模型預(yù)測的數(shù)值基本吻合。從我國人口數(shù)量的特征來看,人口呈現(xiàn)出了上升的趨勢,這與我國人口基數(shù)大的特征聯(lián)系密切。同時,人口數(shù)量大幅度增長的情況下,我國人口老齡化問題比較突出,勞動人口數(shù)量呈現(xiàn)出了下降的趨勢。生育率保持著較低的增長率,而人口老齡化的增長率加快,需要撫養(yǎng)的老年人口數(shù)量不斷增多。這種情況下,我國經(jīng)濟(jì)發(fā)展將受到人口老齡化問題影響,導(dǎo)致經(jīng)濟(jì)受阻。從推測的結(jié)果來看,預(yù)計在2040年左右,我國人口將進(jìn)入人口負(fù)債期,人口負(fù)債程度也會隨著時間而加重。因此,在日后的發(fā)展過程中,針對于我國人口問題,主要考慮到了勞動力的供給問題,以保證經(jīng)濟(jì)發(fā)展能夠處于一個正常狀態(tài),避免人口負(fù)債導(dǎo)致經(jīng)濟(jì)發(fā)展后退。此外,從人口出生的性別比情況來看,人口性別比得到了有效的治理,男女比例失衡問題有望得到解決。最后,從人口的城鎮(zhèn)比來看,隨著城市化步伐日益加快,城鎮(zhèn)人口比重超過了50%,流動人口數(shù)量呈現(xiàn)出大幅度增加的趨勢。隨著城市經(jīng)濟(jì)建設(shè),大量農(nóng)村人口涌入城市,外來城市務(wù)工人員數(shù)量增加,形成了廉價的勞動紅利。
3)從全國人口時間序列模型預(yù)測分析來看,我國人口問題的把握,要注重對人口質(zhì)量問題予以重點(diǎn)關(guān)注,尤其是勞動人口。而由勞動人口引發(fā)的農(nóng)民工子女教育問題也將備受關(guān)注。在這一過程中,政策制定要注重對農(nóng)民工子女的教育問題予以把握,并對勞動人口質(zhì)量問題予以重點(diǎn)關(guān)注,以有效應(yīng)對人口負(fù)擔(dān)。通過時間序列模型對全國人口數(shù)量進(jìn)行預(yù)測,目的就在于把握人口問題,使人口問題能夠得到針對性的解決,以服務(wù)于我國社會經(jīng)濟(jì)的發(fā)展和進(jìn)步。
參考文獻(xiàn)
[1]張林泉.全國人口時間序列模型預(yù)測研究[J].高師理科學(xué)刊,2012,32(04):11-14.
[2]孟超. 基于Leslie矩陣和時間序列分析的人口預(yù)測研究[D].吉林:吉林大學(xué),2012.
[3]顧海燕.時間序列分析在人口預(yù)測問題中的應(yīng)用[J].黑龍江工程學(xué)院學(xué)報,2007(03):69-71.