曹 靜
(華南農業(yè)大學 數(shù)學與信息學院,廣東 廣州 510642)
國內年度GDP數(shù)據(jù)的貝葉斯時間序列分析
曹 靜
(華南農業(yè)大學 數(shù)學與信息學院,廣東 廣州 510642)
利用改革開放以來的年度GDP數(shù)據(jù),采用基于馬爾科夫鏈蒙特卡洛(MCMC)算法的貝葉斯隨機搜索方法進行模型選擇,建立時間序列模型。結果表明,貝葉斯時間序列模型的預測精度優(yōu)于文獻中經(jīng)常采用的ARIMA模型,在分析我國總體經(jīng)濟發(fā)展規(guī)律和變化趨勢方面具有較好效果。
國內生產(chǎn)總值;時間序列;貝葉斯模型選擇;馬爾科夫鏈蒙特卡羅法
國內生產(chǎn)總值(Gross Domestic Product,GDP)是度量國內所有常住單位在一定時期內生產(chǎn)和提供的最終產(chǎn)品或服務的重要總量指標。一般來說,GDP會受到多種因素的影響,因此運用結構性因果模型分析和預測GDP比較困難,而將歷年的GDP數(shù)據(jù)作為時間序列進行分析,則具有較強的可操作性和重要的現(xiàn)實意義。
近年來,許多文獻利用時間序列方法對我國GDP發(fā)展規(guī)律進行研究。例如,王維國等(2010)將基于貝葉斯推斷的多個突變點判斷理論用于我國GDP序列數(shù)據(jù)的分析[1]。郭景威、李宏斌(2012)對1970~2009 年我國的人均GDP 數(shù)據(jù)建立ARMA時間序列模型[2]。陳家清等(2012)以改革開放30 年來我國國民生產(chǎn)總值(GNP)環(huán)比基數(shù)建立自激勵門限自回歸模型,并對模型進行貝葉斯分析[3]。已有文獻采用的方法多數(shù)只能確定時間序列模型的最高階數(shù),而且所得模型一般包含不顯著的延遲變量。同時,當候選子模型的個數(shù)較多時,傳統(tǒng)方法在計算上會顯得相當乏力。本文采用George 和 McCulloch(1993)提出的一種貝葉斯隨機搜索變量選擇方法(Stochastic Search Variable Selection, SSVS)[4]對我國改革開放以來的年度GDP數(shù)據(jù)(見表1)建立一個層次貝葉斯混合模型,由示性變量的取值選擇模型中的滯后項,具有最高后驗概率的子模型即為最優(yōu)模型,其計算過程比較復雜,需要采用Chen, M. H., Shao, Q. M.和Ibrahim, J. G(2000)提出的馬爾科夫鏈蒙特卡洛(Markov chain Monte Carlo, MCMC)模擬算法[5]對模型進行估計和選擇。
《中國國民經(jīng)濟核算體系(2002)》采納聯(lián)合國1993年公布的《國民經(jīng)濟核算體系》(SNA)的基本核算原則、內容和方法,因此1952年以來的年度GDP數(shù)據(jù)時間序列具有可比性。
表1 1978~2013年中國國內生產(chǎn)總值年度數(shù)據(jù) 單位:億元
注:數(shù)據(jù)來自于國家統(tǒng)計局網(wǎng)站(www.stats.gov.cn)、《中國統(tǒng)計年鑒》和國家統(tǒng)計數(shù)據(jù)庫(http://219.235.129.58)。
利用基于MCMC算法的貝葉斯隨機搜索模型選擇方法,建立GDP年度數(shù)據(jù)序列的自回歸AR(p)模型。設{xt}為原始數(shù)據(jù), {yt}是對{xt}進行對數(shù)變換和一階差分變換后的數(shù)據(jù)序列,它滿足
yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt
(2.1)
Y=Xφ+ε.
(2.2)
令Y0=(y0,y-1,…,y1-p)'是序列{yt}的初始值。我們視這些初始值為未知參數(shù),并假定Y0的先驗分布服從正態(tài)分布,即
Y0~Np(μ,∑).
(2.3)
引入變量γj,其取值為0或者1。變量γj的作用是當所選擇模型沒有包含yt-j項時,則γj=0;當所選擇模型包含yt-j項時,則γj=1。假設
(2.4)
P(γj=1)=Pj,P(γj=0)=1-Pj.
(2.5)
Pj可被視為yt-j包括在模型中的先驗概率。將(2.4)式改寫成矩陣形式,有
φ|γ~N(0,DγRDγ),
(2.6)
這里γ=(γ1,…,γp)',R是先驗相關矩陣,Dγ=diag(d1τ1,…,dpτp) 。若γj=0,則dj=1;若γj=1,則dj=cj。R一般取R=1或者R∞(X'X)-1。假定在γ給定條件下σ2的先驗分布是一個逆Gamma分布,即
(2.7)
為了簡化計算,選擇υγ=υ和λγ=λ 。由貝葉斯原理,γ的后驗分布為
π(γ|D)∞π(y|γ)π(γ),
(2.8)
3.1 年度GDP的貝葉斯分析
將SSVS方法應用到1978~2013年我國GDP數(shù)據(jù)序列,嘗試利用MCMC算法模擬得到該時間序列數(shù)據(jù)的最大后驗概率模型。表2是由貝葉斯SSVS方法得到的后驗概率較高的幾個模型及其后驗概率。表3列出了根據(jù)模擬數(shù)據(jù)擬合的系數(shù)向量φ和變量γ的估計值。圖1是由SSVS方法得到的最佳模型的參數(shù)φ1和相應的示性變量r1`的模擬軌跡圖。
表2 遴選模型的滯后項及其后驗模型概率
表3 系數(shù) 和拉丁變量 的貝葉斯估計值(括號內是標準差)
圖1 最佳模型的參數(shù)和相應的示性變量 的模擬軌跡圖
因此1982~2013年GDP變換數(shù)據(jù){yt}的最佳自回歸模型為下列AR(1)模型
yt=1.0028689yt-1+εt.
(3.1)
變換為原始GDP數(shù)據(jù){xt}后的最佳模型為
log(xt)=2.0028689log(xt-1)-1.0028689log(xt-2)+εt,
(3.2)
采用模型(3.2)對原始數(shù)據(jù)進行預測,計算得到的平均絕對預測誤差為
3.2 年度GDP的ARIMA模型分析
對我國GDP年度數(shù)據(jù)的對數(shù)變換序列zi=log(xi)進行ARIMA建模分析。圖2是我國1982~2013年GDP總值的時間序列圖和自相關圖形。
圖2 1978年至2013年中國國內生產(chǎn)總值時序圖和自相關圖
從PACF圖可以看出,我國GDP數(shù)據(jù)變換后的序列具有4階自相關特征。根據(jù)時序圖和ARIMA模型結果,選擇ARIMA(4,1,1)模型對數(shù)據(jù)序列{zi}進行擬合,所得模型結果為
zt=1.7872708zt-1-1.001398zt-2+0.7193049zt-3-0.6653182zt-4+0.1601425zt-5+εt-0.5334912εt-1
計算得到的平均絕對預測誤差為
它略大于貝葉斯SSVS方法的平均絕對預測誤差。
將貝葉斯隨機搜索變量選擇方法應用到自回歸時間序列模型,在分層貝葉斯模型框架下,給出相應未知參數(shù)的先驗分布以及后驗分布,并討論了該方法的一些超參數(shù)設置的問題。特別地,我們將時間序列的初始值作為未知參數(shù),使得整個貝葉斯推斷基于初始值是無條件的。與ARIMA模型方法相比,本文所得最佳模型滯后項少且預測精度較高,說明本文方法可以更好地分析和預測我國GDP年度總量的發(fā)展趨勢。
我們使用數(shù)據(jù)驅動(Data Driven)方法分析GDP數(shù)據(jù),采用基于MCMC算法的貝葉斯方法建立我國GDP數(shù)據(jù)的時間序列模型,該模型的意義在于從定量關系上刻畫GDP的發(fā)展規(guī)律和趨勢并可用于短期預測。從模型結果可以看出,我國GDP在短期內將繼續(xù)呈現(xiàn)持續(xù)增長的趨勢,這符合我國GDP 發(fā)展現(xiàn)況。
需要指出的是,由于GDP的短期高增長是以資源的過度投入和環(huán)境的破壞為代價的,因此它的長期成本要高于正常的均衡增長。這說明中國經(jīng)濟在高速增長的同時還會遇到環(huán)境治理、國際金融危機等不確定因素的影響, 因此不能一味地追求每年都達到較高的經(jīng)濟增長速度, 要綜合考慮未來幾年的發(fā)展環(huán)境,制定科學合理的經(jīng)濟發(fā)展戰(zhàn)略。
[1] 王維國,王 霞,顏 敏.時間序列多個突變點的貝葉斯推斷——對我國GDP數(shù)據(jù)的實證分析[J].數(shù)學的實踐與認識,2010(9):45-53.
[2] 郭景威,李宏斌.中國人均GDP時間序列的實證分析與預測[J].經(jīng)濟論壇,2012(3):9-12.
[3] 陳家清,張智敏,王仁祥.基于貝葉斯自激勵門限自回歸模型的中國GNP經(jīng)濟分析[J].統(tǒng)計與決策,2012(13):28-31.
[4] George E I,McCulloch R E, Variable selection via Gibbs sampling[J].Journal of American Statistical Association,1993(423):881-889.
[5] Chen M H,Shao Q M,Ibrahim J G.Monte Carlo methods in Bayesian computation[M].New York, Springer, 2000.
(編輯:唐 芳)
Bayes Time Series Analysis of Domestic Annual GDP Data
CAO Jing
(School of Mathematics and Information, Agricultural University Of South China, Guangzhou 510642, China)
Since the reform and opening-up of China's annual GDP data,in this paper, a Bayesian stochastic search method based on Markoff Montecalo (MCMC) algorithm is used to select the model,and set up time series model. Data analysis results show that, Bayes time series model is superior to the ARIMA model which is often used in the literature. It has a good effect on the analysis of the law of economic development and the trend of change in China.
GDP; time series; Bayes model selection; Markov Chain Monte Carlo(MCMC)
2016-07-12
教育部人文社會科學研究青年基金項目(15YJC790004).
曹 靜(1981-),女,四川簡陽人,講師,碩士,研究方向:農村產(chǎn)業(yè)經(jīng)濟與制度經(jīng)濟、數(shù)理金融統(tǒng)計.
F224
A
2095-8978(2017)01-0035-04