国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國(guó)老齡人口死亡率建模及預(yù)測(cè)

2016-12-13 05:13:12張桂軍黃佩佩
關(guān)鍵詞:置信區(qū)間估計(jì)值年齡組

鄭 靜,張桂軍,黃佩佩

(杭州電子科技大學(xué)數(shù)學(xué)研究所,浙江 杭州 310018)

?

中國(guó)老齡人口死亡率建模及預(yù)測(cè)

鄭 靜,張桂軍,黃佩佩

(杭州電子科技大學(xué)數(shù)學(xué)研究所,浙江 杭州 310018)

我國(guó)老齡人口死亡率在時(shí)間上存在高度線性相關(guān)性,并且其對(duì)數(shù)死亡率的改善速度存在非線性特征.根據(jù)我國(guó)老齡人口實(shí)際死亡率特點(diǎn),提出一個(gè)新的模型,使得這些性質(zhì)在模型中得到體現(xiàn).并針對(duì)我國(guó)老齡人口死亡率數(shù)據(jù)較少的特點(diǎn),使用MCMC方法對(duì)模型參數(shù)進(jìn)行估計(jì),預(yù)測(cè)時(shí)充分利用參數(shù)的分布信息,給出未來(lái)幾年死亡率的均值和分布情況,從而使預(yù)測(cè)結(jié)果更加可信.

老齡人口死亡率;馬爾科夫鏈蒙特卡羅方法;Lee-Cater模型

0 引 言

全球人口死亡率經(jīng)歷了一百多年的持續(xù)下降,而且這種趨勢(shì)仍在持續(xù),但引起死亡率下降的原因發(fā)生了一些變化.文獻(xiàn)[1]提出,早期的死亡率下降主要是由新生兒的成活率提高引起,近年來(lái)主要來(lái)源于70歲以上人口的增多.因此,對(duì)老齡人口死亡率的建模和預(yù)測(cè)顯得尤為重要.

早期應(yīng)用最廣的老齡人口死亡率模型是Gompertz模型,這個(gè)模型是單因子的死亡率模型,對(duì)高齡人口估計(jì)值偏大.文獻(xiàn)[2]中的經(jīng)典Lee-Cater模型也存在同樣問題,對(duì)老齡人口死亡率預(yù)測(cè)不夠準(zhǔn)確.2005年,文獻(xiàn)[3]提出了Logistic模型,它刻畫的是單因素年齡的死亡率;正如Lee-Cater模型并不適用于英國(guó)和澳大利亞,Logistic模型對(duì)我國(guó)的老齡人口死亡率數(shù)據(jù)擬合的準(zhǔn)確度也不夠.近年來(lái),文獻(xiàn)[4-5]利用Lee-Cater的確定模型和隨機(jī)化模型對(duì)中國(guó)的死亡率進(jìn)行建模,文獻(xiàn)[6]研究了我國(guó)老年人口的死亡率趨勢(shì).本文在經(jīng)典Lee-Cater模型的基礎(chǔ)上,提出了一種新的老齡人口死亡率模型,根據(jù)1994—2012年我國(guó)老齡人口死亡率數(shù)據(jù),用MCMC算法對(duì)模型進(jìn)行了驗(yàn)證,并對(duì)未來(lái)10年的死亡率進(jìn)行了預(yù)測(cè).

1 模型構(gòu)造

1.1 經(jīng)典Lee-Cater模型

經(jīng)典Lee-Cater模型最初用于美國(guó)人口死亡率的建模,其原始模型為:

ln mx,t=αx+βxkt+εx,t

(1)

其中:mx,t為x歲人群在t年的中心死亡率;αx為特定x歲人群的平均對(duì)數(shù)死亡率;kt為對(duì)數(shù)死亡率隨時(shí)間t的變化程度,也稱為死亡率指數(shù);βx為特定x歲人群對(duì)數(shù)死亡率對(duì)kt的依賴程度;εx,t為殘差項(xiàng),假設(shè)服從均值為0,方差為σ2的正態(tài)分布.為了得到唯一的解,還需將參數(shù)進(jìn)行標(biāo)準(zhǔn)化:∑βx=1,∑kt=0.在Lee-Carter模型中,kt有一個(gè)負(fù)的漂移項(xiàng),從而對(duì)數(shù)死亡率表現(xiàn)為線性下降趨勢(shì).Lee-Carter模型的主要缺點(diǎn)是所有年齡死亡率的下降速度都由同一kt決定,從而導(dǎo)致了老年人口死亡率預(yù)測(cè)值偏高.

1.2 我國(guó)老齡人口死亡率數(shù)據(jù)分析

本文的分析數(shù)據(jù)來(lái)源于中國(guó)統(tǒng)計(jì)年鑒(1994—2012)[7]、中國(guó)人口與就業(yè)統(tǒng)計(jì)年鑒(1994—2012)[8],經(jīng)過數(shù)據(jù)分析,得出我國(guó)老齡人口死亡率有以下特征.

1)老齡人口死亡率與時(shí)間高度相關(guān).

2013年,文獻(xiàn)[9]指出,老齡人口死亡率與時(shí)間高度相關(guān)的.為了考察我國(guó)老齡人口死亡率的相關(guān)性,本文引入時(shí)間效應(yīng)項(xiàng),用來(lái)消除各年齡組死亡率因在時(shí)間上的共同驅(qū)動(dòng)而存在的相關(guān)性.定義移除年效應(yīng)的老年人口死亡率的相關(guān)系數(shù)為:

(2)

移除年效應(yīng)的老年人口死亡率的相關(guān)性不再具有一致性,相關(guān)系數(shù)的絕對(duì)值小于0.6,說明56~90歲的死亡率的高度線性相關(guān)性主要表現(xiàn)在年時(shí)間效應(yīng)上.

2)我國(guó)老齡人口對(duì)數(shù)死亡率呈非線性變化.

在相關(guān)分析中,死亡率在時(shí)間項(xiàng)存在時(shí)為高度一致的線性相關(guān),移除后表現(xiàn)出弱相關(guān)性.在經(jīng)典的Lee-Cater模型中,時(shí)間項(xiàng)βxkt為帶負(fù)漂移的隨機(jī)游走,這意味著時(shí)間項(xiàng)的線性下降,從而對(duì)數(shù)死亡率線性下降.我國(guó)老齡人口對(duì)數(shù)死亡率改善速度不是線性變化的,存在速度的改變.將死亡率時(shí)間趨勢(shì)項(xiàng)進(jìn)行分解,在模型中考慮對(duì)數(shù)死亡率下降速度的變化.

令ωx,t=ln mx,t-αx-κt,ωx,t的一階差分為Δx,t=ωx,t+1-ωx,t,

根據(jù)1994—2012年我國(guó)人口死亡率數(shù)據(jù)分析老齡人口死亡率的改善速度趨勢(shì)項(xiàng),得到的結(jié)果如表1所示.

表1 a的估計(jì)值和估計(jì)方差

1.3 雙重時(shí)間效應(yīng)的Lee-Cater模型

由前面的分析,針對(duì)我國(guó)老齡人口的死亡率的特點(diǎn),本文提出以下模型:

(3)

其中,mx,t為年齡x歲在第t年的死亡率;參數(shù)αx為x歲年齡組的人口歷年平均對(duì)數(shù)死亡率,度量x歲人口死亡率的平均水平;κt為第t年對(duì)各年齡組死亡率影響;參數(shù)λ為死亡率長(zhǎng)期改善因子,反應(yīng)死亡率在隨時(shí)間改變的同時(shí),各年齡組自身死亡率的改善程度;βx為改善因子,反映不同年齡組死亡率改善的速度,βx為正值時(shí)表示該年齡組的死亡率改善速度低于死亡率改善的平均水平,為負(fù)值時(shí)表示死亡率改善速度高于平均水平.

2 模型擬合

經(jīng)典的Lee-Cater模型采用奇異值分解來(lái)估計(jì)參數(shù)然后進(jìn)行二次估計(jì),是利用假設(shè)死亡人口服從Poisson分布對(duì)參數(shù)進(jìn)行極大似然估計(jì),這些估計(jì)方法都難以給出參數(shù)的分布信息.MCMC方法不需要做額外的假設(shè),也不需要二次估計(jì),同時(shí)能給出估計(jì)量的區(qū)間估計(jì).在進(jìn)行預(yù)測(cè)時(shí),MCMC方法考慮了估計(jì)參數(shù)的分布信息,從而能保證在數(shù)據(jù)量較少的情況下,模型估計(jì)參數(shù)對(duì)數(shù)據(jù)的依賴,保證模型的穩(wěn)定性.

2.1 MCMC參數(shù)估計(jì)方法

數(shù)據(jù)來(lái)源為中國(guó)人口與就業(yè)統(tǒng)計(jì)年鑒和人口普查.從相關(guān)性分析中知道,55歲的死亡率和其它年齡組的死亡率有較大差異,在模型計(jì)算中選取1994—2012年的56~90歲的人口死亡率數(shù)據(jù)擬合模型:

ln mx,t=αx+κt+βxe-λt+εx,t

(4)

2.2 參數(shù)的估計(jì)值及其分布

在實(shí)驗(yàn)中,共計(jì)迭代1 500次.去掉前面500個(gè)迭代值,利用樣本均值作為估計(jì)量的估計(jì)值,樣本的第50個(gè)次序統(tǒng)計(jì)量和第950個(gè)次序統(tǒng)計(jì)量構(gòu)成估計(jì)量的95%置信區(qū)間,各參數(shù)的估計(jì)值如圖1—4所示.

圖1 αx的估計(jì)

圖2 βx的估計(jì)

圖3 κt的估計(jì)

圖4 λ的樣本直方圖

圖1—3中點(diǎn)劃線為估計(jì)參數(shù)的95%置信上限,虛線為估計(jì)參數(shù)的95%置信下限.圖1是死亡率中心水平αx的估計(jì)值,死亡率中心和年齡之間近似的線性關(guān)系.圖2中改善速度βx在56~77歲更趨向取正值,而之后的死亡率趨向取負(fù)值,在77歲之前的死亡率中,死亡率改善速度小于整體趨勢(shì),77歲之后的改善速度比整體水平更快,從而還有更大的改善空間.圖3為的短期趨勢(shì)κt估計(jì)值,可以看出,在整體上κt有線性下降的趨勢(shì).圖4為長(zhǎng)期趨勢(shì)項(xiàng)λ的直方圖,大于0的λ表示死亡率具有非線性下降趨勢(shì).

2.3 擬合誤差

根據(jù)1994—2012年的56~90歲的人口死亡率數(shù)據(jù),并利用MCMC算法進(jìn)行參數(shù)估計(jì),擬合絕對(duì)誤差如圖5所示,模型擬合的殘差相關(guān)性如圖6所示.

圖5 絕對(duì)誤差

圖6 殘差相關(guān)性

從圖5可以看出,模型的誤差都非常小,特別是在85歲以下,絕對(duì)誤差為0.02,然而在85歲以上,誤差增加,這主要是因?yàn)檫@5個(gè)年齡組人口基數(shù)小,并且本身數(shù)據(jù)波動(dòng)大.圖6已經(jīng)沒有顯著的相關(guān)性,說明本文所用的模型是充分的.

部分年齡死亡率的誤差的相關(guān)統(tǒng)計(jì)如表2所示.

表2 死亡率擬合誤差

從表2可以看出,絕對(duì)誤差最大的88歲組的相對(duì)誤差為3.01%,絕對(duì)誤差下的相對(duì)誤差為10.21%,其它組均在10%以下.

3 老齡人口死亡率預(yù)測(cè)

3.1 死亡率模型檢驗(yàn)

接下來(lái)研究模型的預(yù)測(cè)表現(xiàn),需要對(duì)短期時(shí)間趨勢(shì)項(xiàng)κt進(jìn)行外推,從圖3中可以看出,κt有近似下降趨勢(shì),序列均值存在漂移,利用時(shí)間序列方法對(duì)κt項(xiàng)進(jìn)行建模,擬合模型為:

(5)

κt是含有一個(gè)單位根的非平穩(wěn)過程,并且有一個(gè)負(fù)的漂移,κt的一階差分為AR(1)模型.模型中常數(shù)項(xiàng)的方差為0.000 3,一階滯后系數(shù)的方差為0.032 0.模型的常數(shù)項(xiàng)為-0.03,從而死亡率在總體上有-0.02的改進(jìn)速度.為了驗(yàn)證模型的預(yù)測(cè)表現(xiàn)和穩(wěn)定性,分別以1994—2011年、1994—2010年、1994—2009年為原始數(shù)據(jù)對(duì)2012年死亡率進(jìn)行一步,二步、三步預(yù)測(cè),圖7為模型依賴不同數(shù)據(jù)下對(duì)2012年預(yù)測(cè),圖8為利用2011年之前數(shù)據(jù)對(duì)2012年進(jìn)行預(yù)測(cè)的90%置信區(qū)間.

圖7 預(yù)測(cè)2012年死亡率

圖8 預(yù)測(cè)2012年死亡率置信區(qū)間

對(duì)比圖7中3個(gè)估計(jì)值的曲線,不同數(shù)據(jù)預(yù)測(cè)的2012年死亡率之間偏差很小,即使在高年齡組,不同預(yù)測(cè)值之間偏差也很小.在多步預(yù)測(cè)和實(shí)際值之間,56~64歲的估計(jì)和實(shí)際值基本重疊,65~75歲之間死亡率估計(jì)偏低,76~85歲的死亡率估計(jì)值和實(shí)際值相互交錯(cuò).從圖8中可以看出,所有死亡率的估計(jì)在90%的置信區(qū)間以內(nèi).86歲及其以上年齡組死亡率被低估,其實(shí)際值在90%的置信區(qū)間以外,這個(gè)年齡段實(shí)際死亡率高于模型估計(jì)的死亡率.

由圖7和圖8可以看出,模型在預(yù)測(cè)時(shí)對(duì)原始數(shù)據(jù)依賴較小,模型比較穩(wěn)定.在90%的置信區(qū)間以內(nèi),85歲以下預(yù)測(cè)都是在預(yù)測(cè)區(qū)間內(nèi)部,特別是在低年齡組,死亡率的預(yù)測(cè)在均值上,結(jié)合表2的數(shù)據(jù),在低年齡組的死亡率擬合相對(duì)誤差為6%,模型在穩(wěn)定性和精確性上都有良好表現(xiàn).

3.2 未來(lái)10年死亡率預(yù)測(cè)

圖7顯示說明,模型沒有出現(xiàn)過擬合現(xiàn)象,并且在多步預(yù)測(cè)上預(yù)測(cè)均值和實(shí)際死亡率也相差很小,可知模型在多步預(yù)測(cè)上有較高的精度.利用時(shí)間序列對(duì)κt進(jìn)行預(yù)測(cè),從而預(yù)測(cè)未來(lái)10年的死亡率,如圖9、10所示.

圖9 2017年和2022年預(yù)測(cè)死亡率

圖10 2022年預(yù)測(cè)死亡率置信區(qū)間

從圖9中可以看出,2017年和2022年死亡率的差異非常小,說明未來(lái)10年老年人口死亡率呈下降趨勢(shì).從置信區(qū)間中也可以看出預(yù)測(cè)死亡率在分布上是有偏的.可以得出以下幾點(diǎn)結(jié)論:1)2012—1017年的死亡率改善效果不明顯,而在2017—2022年的死亡率改善明顯.2)年齡較高的死亡率改善要比年齡較小的死亡率改善更快.未來(lái)10年內(nèi),74歲以下的死亡率基本沒有改善的跡象,然而85歲以上死亡率改善明顯.3)到2022年,在95%的置信區(qū)間內(nèi),死亡率水平不會(huì)超過2012年的死亡率水平,同時(shí),未來(lái)死亡率的改善區(qū)間非常大.

4 結(jié)束語(yǔ)

本文重點(diǎn)研究了我國(guó)老齡人口的死亡率建模及預(yù)測(cè)問題,在經(jīng)典的Lee-Cater模型的基礎(chǔ)上,提出一個(gè)全新的模型,雙重時(shí)間效應(yīng)的Lee-Carter模型.把死亡率隨時(shí)間的改善分解為短期改善和長(zhǎng)期改善,其中在短期改善上,利用隨機(jī)游走建模,在長(zhǎng)期改善上,利用指數(shù)函數(shù)建模,并利用MCMC方法進(jìn)行參數(shù)估計(jì)和預(yù)測(cè).本文的模型在預(yù)測(cè)時(shí)考慮了參數(shù)的分布,很好地克服了因我國(guó)老齡人口的死亡數(shù)據(jù)不足造成的參數(shù)波動(dòng)問題,從而在不同的歷史數(shù)據(jù)下都有較好的預(yù)測(cè)表現(xiàn).

[1]WILMOTH J R, DEEGAN L J, LUNDSTR?M H, et al. Increase of maximum life-span in Sweden, 1861-1999[J]. Science, 2000, 289(5488): 2366-2368.

[2]LEE R D, CARTER L R. Modeling and forecasting US mortality [J]. Journal of the American statistical association, 1992, 87(419): 659-671.

[3]BONGAARTS J. Long-range trends in adult mortality: Models and projection methods[J]. Demography, 2005, 42(1): 23-49.

[4]王曉軍,任文東.有限數(shù)據(jù)下Lee-Carter模型在人口死亡率預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)研究,2012,29(6):87-94.

[5]吳曉坤,王曉軍.中國(guó)人口死亡率Lee-Carter模型的再抽樣估計(jì)、預(yù)測(cè)與應(yīng)用[J].中國(guó)人口科學(xué),2014(4):27-34.

[6]王曉軍,趙明.中國(guó)高齡人口死亡率隨機(jī)波動(dòng)趨勢(shì)分析[J].統(tǒng)計(jì)研究,2014,31(9):51-57.

[7]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒[DB/OL].[2015-12-01].http://#cnki.net/kns55/Navi/HomePage.aspx?id=N2010100096&name=YINFN&floor=1.

[8]國(guó)家統(tǒng)計(jì)局人口和就業(yè)統(tǒng)計(jì)司.中國(guó)人口和就業(yè)統(tǒng)計(jì)年鑒[DB/OL].[2015-12-01].http://#cnki.net/kns55/navi/YearBook.aspx?id=N2014050071&floor=1.

[9]MITCHELL D, BROCKETT P, MENDOZA-ARRIAGA R, et al. Modeling and forecasting mortality rates[J]. Insurance Mathematics & Economics, 2013, 52(2): 275-285.

Modeling and Forecasting for Chinese Aging Population Mortality

ZHENG Jing, ZHANG Guijun, HUANG Peipei

(InstituteofMathematics,HangzhouDianziUniversity,HangzhouZhejiang310018,China)

There is a high linear correlation for Chinese aging population mortality about time. It exits nonlinear characteristics to the rate of improvement of logarithm mortality. In this paper, we propose a new model to fit the characteristics of the actual mortality rate of aging population. MCMC method is used to estimate the parameters of the model, which can solve the problem of less data of aging population. Using MCMC methods, the mean and distribution of forecasting mortality are given. The prediction results are more credible because our method utilizes distribution information about the parameters.

aging mortality; MCMC method; Lee-Cater model

10.13954/j.cnki.hdu.2016.06.015

2016-03-31

鄭靜(1970-),女,安徽安慶人,副教授,統(tǒng)計(jì)學(xué).

C812

A

1001-9146(2016)06-0071-06

猜你喜歡
置信區(qū)間估計(jì)值年齡組
定數(shù)截尾場(chǎng)合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
p-范分布中參數(shù)的置信區(qū)間
多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
列車定位中置信區(qū)間的確定方法
對(duì)廣東省成年男子BMI指數(shù)的分析
統(tǒng)計(jì)信息
2018年4月世界粗鋼產(chǎn)量表(續(xù))萬(wàn)噸
2005年與2010年河北省經(jīng)濟(jì)較好與經(jīng)濟(jì)一般城市成年女子健身程度的比較與分析
2014年5月世界粗鋼產(chǎn)量表萬(wàn)噸
张家港市| 辽中县| 遂宁市| 永寿县| 汝南县| 通榆县| 攀枝花市| 兖州市| 阜新市| 四会市| 礼泉县| 集贤县| 陆丰市| 凤翔县| 新晃| 丽水市| 汝南县| 莱西市| 崇州市| 洞口县| 余干县| 闸北区| 江源县| 东城区| 安塞县| 溧阳市| 石景山区| 澄城县| 汤原县| 衡东县| 星座| 靖西县| 常州市| 井研县| 辛集市| 乐安县| 英德市| 兰考县| 林口县| 石景山区| 永济市|