,
(上海理工大學(xué) 管理學(xué)院 ,上海 200093)
人口出生率及出生人口數(shù)量的預(yù)測(cè),是人口預(yù)測(cè)中最基本的內(nèi)容之一,其重要性毋庸置疑.以往的研究表明,人口預(yù)測(cè)有數(shù)學(xué)方法(特指選用某種適當(dāng)?shù)闹本€或曲線函數(shù),擬合區(qū)域人口過去的發(fā)展變化,建立回歸模型,預(yù)測(cè)區(qū)域人口將來發(fā)展趨勢(shì)的方法)、隊(duì)列預(yù)測(cè)法、多區(qū)域矩陣法、社會(huì)經(jīng)濟(jì)模型法及其他預(yù)測(cè)方法等[1].由于所使用的數(shù)據(jù)較少,且數(shù)據(jù)易于獲取,人口預(yù)測(cè)的數(shù)學(xué)方法得到部分研究者的青睞.但如果使用不當(dāng)?shù)脑?數(shù)學(xué)預(yù)測(cè)方法也可能使人口預(yù)測(cè)結(jié)果出現(xiàn)較大的偏誤.本研究以2014年發(fā)表的《上海市人口結(jié)構(gòu)變化預(yù)測(cè)研究》[2]一文中的相關(guān)論述為例,比較分析該文預(yù)測(cè)的相關(guān)問題,探索更為準(zhǔn)確的人口出生率預(yù)測(cè)方法.
上海市人口出生率的數(shù)據(jù)主要來源于上海市人口和計(jì)劃生育委員會(huì)網(wǎng)站、上海市人口和計(jì)劃生育年鑒[3],以及上海市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)中戶籍人口出生率和常住人口出生率資料[4].文獻(xiàn)[2]使用的上海市歷年戶籍人口出生率數(shù)據(jù)如表1所示.
文獻(xiàn)[2]使用雙變量回歸分析(自變量X為年份,因變量Y為出生率)的方式,依據(jù)表1數(shù)據(jù),假定生育政策不進(jìn)行調(diào)整的基礎(chǔ)上,采用SPSS預(yù)測(cè)分析2013—2050年的上海市常住人口出生率[2],該團(tuán)隊(duì)得出上海市常住人口出生率的預(yù)測(cè)公式為
Y=100.458 097 773 243 5Xa
式中,a=-0.675 222 788 553 966 1.
據(jù)這個(gè)常住人口出生率的預(yù)測(cè)公式,他們也得到了上海市2013—2050年常住人口出生率預(yù)測(cè)值結(jié)果[2].
經(jīng)查證文獻(xiàn)[2]所使用的數(shù)據(jù)僅為上海市戶籍人口的出生率數(shù)據(jù),但在我國(guó)超大城市中,其常住人口構(gòu)成既包含戶籍人口,又包含大量外來常住人口.而且,戶籍常住人口的年齡結(jié)構(gòu)與外來常住人口的年齡結(jié)構(gòu)往往有較大差別,戶籍人口中老齡化較嚴(yán)重,而外來常住人口中主要以15~49歲的青壯年人口為主(見下頁(yè)表2),年齡結(jié)構(gòu)的不同對(duì)出生率的影響較大.
表1 上海市歷年人口出生率Tab.1 Birth rate in the city of Shanghai
按照文獻(xiàn)[2]所依據(jù)的基礎(chǔ)數(shù)據(jù)和列出的研究結(jié)果,用SPSS統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)分析過程進(jìn)行檢驗(yàn),發(fā)現(xiàn)其采用的是曲線回歸方法中的冪函數(shù)回歸模型,但提供的預(yù)測(cè)結(jié)果在年份上略有差錯(cuò),即“上海市2013—2050年出生率預(yù)測(cè)結(jié)果表”中所呈現(xiàn)的應(yīng)是2012—2049年上海市常住人口出生率的預(yù)測(cè)數(shù)據(jù).
表2 “六普”上海市戶籍常住人口與外省市常住人口年齡結(jié)構(gòu)比較
由于文獻(xiàn)[2]得出的上海市常住人口出生率的預(yù)測(cè)結(jié)果是2013—2050年(實(shí)際應(yīng)為2012—2049年),可將預(yù)測(cè)值與對(duì)應(yīng)年份人口出生率實(shí)際發(fā)生值進(jìn)行比較,以評(píng)估預(yù)測(cè)誤差大小.根據(jù)近年《上海市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》,將常住人口、戶籍人口出生率數(shù)值與文獻(xiàn)[2]的常住人口出生率預(yù)測(cè)值進(jìn)行比較,結(jié)果如表3和表4所示.
表3 依照常住人口口徑計(jì)算的出生率預(yù)測(cè)誤差及出生人數(shù)預(yù)測(cè)誤差率
由表3可見,依照常住人口口徑計(jì)算,文獻(xiàn)[2]的出生率預(yù)測(cè)誤差不小,最近5年實(shí)際出生率數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)之差為1.5‰~3.3‰.根據(jù)最近5年的年中人口數(shù)推算,對(duì)應(yīng)出生人數(shù)為3.5~7.8萬人,其出生人數(shù)預(yù)測(cè)誤差率最低為19.43%,最高達(dá)到34.50%.
由表4可見,依照戶籍人口口徑計(jì)算,文獻(xiàn)[2]的出生率預(yù)測(cè)誤差也不小,最近5年實(shí)際戶籍人口出生率數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)之差為1.2‰~3‰,預(yù)測(cè)誤差所對(duì)應(yīng)出生人數(shù)為1.70~4.32萬人,其出生人數(shù)預(yù)測(cè)誤差率最低為16.27%,最高達(dá)33.40%.
表4 依照戶籍人口口徑計(jì)算的出生率預(yù)測(cè)誤差及出生人數(shù)預(yù)測(cè)誤差率
由表3和表4可以看出,不管使用哪個(gè)口徑計(jì)算,實(shí)際值與預(yù)測(cè)值均存在數(shù)個(gè)千分比的偏差,戶籍人口和常住人口的出生率預(yù)測(cè)偏差均較大,其中常住人口出生率預(yù)測(cè)偏差更明顯,遠(yuǎn)超一般預(yù)測(cè)可以容忍的10%.顯然,這樣的數(shù)學(xué)方法對(duì)人口出生率的預(yù)測(cè)是不太科學(xué)的.
那么,是否采用其他回歸方法預(yù)測(cè)效果會(huì)更好一些呢?本文采用10種曲線回歸模型及線性模型進(jìn)行分析,并對(duì)模型結(jié)果進(jìn)行檢驗(yàn).表5中各回歸方法下的預(yù)測(cè)誤差指采用某種回歸方法進(jìn)行擬合,根據(jù)回歸方程預(yù)測(cè)某年的出生率數(shù)據(jù)與實(shí)際該年的人口出生率數(shù)據(jù)進(jìn)行比較的差值.平均誤差是指根據(jù)回歸方程預(yù)測(cè)的5年數(shù)據(jù)與迄今為止5年的實(shí)際人口出生率數(shù)據(jù)進(jìn)行比較,計(jì)算5年中平均每年預(yù)測(cè)數(shù)據(jù)的誤差值.由于回歸方程預(yù)測(cè)的結(jié)果可能高于,也可能低于實(shí)際人口出生率,在計(jì)算平均誤差時(shí)先根據(jù)年度預(yù)測(cè)誤差值取絕對(duì)值后再求和、求平均值.
由表5可以看出,采用數(shù)學(xué)方法,預(yù)測(cè)誤差最大為線性模型方法,曲線回歸模型方法預(yù)測(cè)誤差均比線性模型方法預(yù)測(cè)誤差要小.而在曲線回歸方法中,使用冪函數(shù)回歸模型預(yù)測(cè)得到的5年平均預(yù)測(cè)誤差最小,只有1.97‰.
我國(guó)的人口發(fā)展經(jīng)歷過從高出生率到低出生率的人口轉(zhuǎn)型[5].以20世紀(jì)70年代為界,上海也實(shí)現(xiàn)了高出生率到低出生率的人口轉(zhuǎn)換.如果不考慮這種人口轉(zhuǎn)型而貿(mào)然使用轉(zhuǎn)型前后的全部數(shù)據(jù)進(jìn)行回歸分析,自然會(huì)造成前述預(yù)測(cè)誤差較大的情況.為此,本文分別使用1978—2011年和2000—2011年的戶籍人口出生率數(shù)據(jù),再同樣使用10種曲線回歸方法和線性模型來預(yù)測(cè)上海市人口出生率變化趨勢(shì).預(yù)測(cè)結(jié)果與2012—2016年實(shí)際的上海市人口出生率數(shù)據(jù)進(jìn)行比較,測(cè)算不同回歸方法擬合的預(yù)測(cè)誤差,結(jié)果如表6和下頁(yè)表7所示.
表5 10種曲線回歸預(yù)測(cè)方法的預(yù)測(cè)誤差及線性模型預(yù)測(cè)誤差Tab.5 Prediction errors of the ten curve regression prediction methods and the linear model ‰
表6 基于1978—2011年出生率數(shù)據(jù)的曲線回歸預(yù)測(cè)、線性模型預(yù)測(cè)誤差Tab.6 Prediction errors of the curve regression method and the linear model based on the birth rate data from 1978 to 2011‰
由表6可見,基于1978—2011年的出生率數(shù)據(jù),逆模型回歸方法及S模型預(yù)測(cè),每年預(yù)測(cè)誤差僅為0.64‰~0.83‰.而表7中,基于2000—2011年的出生率數(shù)據(jù),7種曲線回歸模型預(yù)測(cè)方法每年預(yù)測(cè)誤差均小于1‰.考慮到上海曾經(jīng)歷人口轉(zhuǎn)換過程,將預(yù)測(cè)基礎(chǔ)數(shù)據(jù)范圍適當(dāng)調(diào)整后,擬合方程預(yù)測(cè)的結(jié)果與近年實(shí)際值之間的差值均有所縮小.
可見,總體來看,依據(jù)幾乎全部可獲數(shù)據(jù)年份、時(shí)間跨度最長(zhǎng)的數(shù)據(jù)所作的預(yù)測(cè),其結(jié)果與近年實(shí)際值比較,平均誤差值最大;而依據(jù)近期年份、時(shí)間跨度較小的數(shù)據(jù)所作的預(yù)測(cè)分析,其平均誤差值反而最小.
表8中(見下頁(yè)),c1是基于1978—2011年數(shù)據(jù),采用擬模型方法進(jìn)行擬合得到的預(yù)測(cè)的結(jié)果與實(shí)際年份戶籍人口出生率之差.d1是據(jù)此計(jì)算的預(yù)測(cè)出生人數(shù)與當(dāng)年實(shí)際出生人數(shù)之差,e1是該方法下出生人數(shù)預(yù)測(cè)誤差率.同理,c2是基于2000—2011年數(shù)據(jù),采用二次項(xiàng)模型方法進(jìn)行擬合得到的預(yù)測(cè)的結(jié)果與實(shí)際年份戶籍人口出生率之差,d2是據(jù)此計(jì)算的預(yù)測(cè)出生人數(shù)與當(dāng)年實(shí)際出生人數(shù)之差,e2是該方法下出生人數(shù)預(yù)測(cè)誤差率.
表7 基于2000—2011年出生率數(shù)據(jù)的曲線回歸預(yù)測(cè)、線性模型預(yù)測(cè)誤差Tab.7 Prediction errors of the curve regression method and the linear model based on the birth rate data from 2000 to 2011 ‰
表8 基于1978—2011年數(shù)據(jù)與2000—2011年數(shù)據(jù)的兩種出生率預(yù)測(cè)誤差及出生人數(shù)預(yù)測(cè)誤差率Tab.8 Forecast errors of the calculated birth rate and the calculated number of births according to the registeredpopulation based on the data from 1978 to 2011 and from 2000 to 2011
由表8可見,依據(jù)新的擬合與預(yù)測(cè),其初始預(yù)測(cè)結(jié)果與最近5年實(shí)際的人口出生率較為接近,其預(yù)測(cè)出生人數(shù)誤差最小的僅為900人左右,最多也沒有超過2萬人.最近5年預(yù)測(cè)出生人數(shù)與實(shí)際相比,預(yù)測(cè)誤差率絕大部分在11%以下,甚至有2014年的預(yù)測(cè)出生人數(shù)與實(shí)際相比,預(yù)測(cè)誤差率在5%以內(nèi).不過,總體來看,這兩種方法的預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)相比時(shí)高時(shí)低,不太穩(wěn)定,用來作為人口規(guī)劃的基礎(chǔ),仍有一些不足.
依據(jù)前文復(fù)盤檢驗(yàn)發(fā)現(xiàn),對(duì)于人口出生率的預(yù)測(cè),其準(zhǔn)確性不僅與回歸模型的選擇有關(guān),也與所選擇的數(shù)據(jù)有關(guān).考慮人口出生率歷史性轉(zhuǎn)變的規(guī)律,只基于眾所周知的政治時(shí)間(1978年以來)或矚目時(shí)間(2000年跨入新世紀(jì)以來)選擇基礎(chǔ)數(shù)據(jù)的范圍,預(yù)測(cè)精度比文獻(xiàn)[2]的要更好一些.但這些方法依然不能確定選用哪一時(shí)間段的數(shù)據(jù)、采用哪一種回歸模型進(jìn)行數(shù)學(xué)擬合預(yù)測(cè)結(jié)果會(huì)更好.因此,有必要拋開數(shù)學(xué)方法預(yù)測(cè)人口出生率的做法[2,6],更多回歸到依托人口學(xué)本身的基本規(guī)律來進(jìn)行相關(guān)預(yù)測(cè).以往研究表明,人口的出生率主要受人口的性別、年齡分布等因素的影響[7-10].出生率是生育率(一年中新生嬰兒數(shù)同育齡婦女人數(shù)的比率)和育齡婦女在總?cè)丝跀?shù)中比重的乘積,后兩個(gè)因素都直接影響著出生率的變動(dòng).因此,可以據(jù)此重新設(shè)定,開發(fā)出更具可靠性的預(yù)測(cè)人口出生率的研究方法.
中國(guó)人口與發(fā)展研究中心開發(fā)的國(guó)際化人口預(yù)測(cè)軟件PADIS-INT_v1.2.2.5,具有功能強(qiáng)大、技術(shù)先進(jìn)、方便快捷、準(zhǔn)確率高、可視化效果好、輸入簡(jiǎn)單、輸出結(jié)果豐富等特點(diǎn).依據(jù)上海市2010年“六普”常住人口分性別年齡數(shù)據(jù),再根據(jù)上海市2010年左右人口發(fā)展態(tài)勢(shì)的基礎(chǔ)上設(shè)定基本參數(shù)(其關(guān)鍵點(diǎn)就是對(duì)死亡水平、生育水平、遷移水平、性別比等參數(shù)的設(shè)定)后,進(jìn)行初步預(yù)測(cè),主要預(yù)測(cè)參數(shù)是:起始人口為2010年“六普”分性別年齡的上海市常住人口(共計(jì)23 019 196人),死亡水平設(shè)定為男性人均預(yù)期壽命由80歲漸增至83歲,女性由84歲漸增至87歲,模型生命表為聯(lián)合國(guó)生命表(一般模型),生育水平由1左右漸增至1.3左右,生育模式為“六普”時(shí)戶籍人口生育模式,出生性別比由112漸降至108,遷移水平為先增后降漸趨平穩(wěn)增長(zhǎng)的態(tài)勢(shì),遷移模式以“六普”時(shí)遷移情況為準(zhǔn).在這樣仍顯粗略的條件設(shè)定下,進(jìn)行2011—2050年的人口預(yù)測(cè),其預(yù)測(cè)結(jié)果中包含人口粗出生率的預(yù)測(cè)數(shù)據(jù).將此預(yù)測(cè)數(shù)據(jù)與2011—2016年已知的常住人口出生率實(shí)際數(shù)據(jù)進(jìn)行比較,其6年平均預(yù)測(cè)誤差值為1.34‰.本次預(yù)測(cè)中,對(duì)基期人口直接采用六普人口分性別年齡數(shù)據(jù),未按2010年年終人口數(shù)據(jù)進(jìn)行調(diào)整.另外,死亡生命表未依據(jù)上海市實(shí)際情況進(jìn)行專門計(jì)算,而是套用聯(lián)合國(guó)生命表(一般模型)作為模型生命表,且遷移模式的設(shè)定上未依年齡進(jìn)行精確設(shè)計(jì),這些都在一定程度上損害了預(yù)測(cè)的精確度.但即便如此,使用人口學(xué)軟件獲得的預(yù)測(cè)結(jié)果與前述純數(shù)學(xué)方法的預(yù)測(cè)結(jié)果相比,平均誤差還是要小很多,如表9所示.
表9 上海市常住人口出生率實(shí)際值與預(yù)測(cè)值比較Tab.9 Comparison between the actual value and thepredicted value of the birth rate in Shanghai ‰
人口出生率的影響因素較多[11],具有較大的不確定性.本研究發(fā)現(xiàn),單純的數(shù)學(xué)回歸預(yù)測(cè)難以科學(xué)把握現(xiàn)實(shí)人口出生率走向.對(duì)類似的擬合與預(yù)測(cè)結(jié)果,需要引起高度警惕.當(dāng)然,雖然有些研究對(duì)上海市常住人口出生率的預(yù)測(cè)因誤差較大而難有更大的參考價(jià)值,但這并不否認(rèn)這些研究對(duì)上海市將長(zhǎng)期處于10‰以下的超低出生率起到了警示作用.實(shí)際上,考慮到人口因素,將基礎(chǔ)數(shù)據(jù)范圍縮短至人口出生率歷史性轉(zhuǎn)變后的兩個(gè)時(shí)間段,采用純數(shù)學(xué)方法,可以一定程度上改善預(yù)測(cè)精度較差的缺陷,但是,這種預(yù)測(cè)方法的普適性還沒有經(jīng)過更多的驗(yàn)證,目前只能存疑.然而,考慮人口的性別、年齡結(jié)構(gòu)以及生育率等因素,用人口軟件進(jìn)行出生率的預(yù)測(cè),可以獲得預(yù)測(cè)精度更高、更穩(wěn)健的結(jié)果.這也說明,更多地考慮人口發(fā)展的一些規(guī)律性因素,將使人口出生率的預(yù)測(cè)精度更高,學(xué)者對(duì)自身研究結(jié)果也會(huì)有更大的自信.
[1] 王桂新.區(qū)域人口預(yù)測(cè)方法及應(yīng)用[M].上海:華東師范大學(xué)出版社,2000.
[2] 王裕明,吉祥,劉彩云.上海市人口結(jié)構(gòu)變化預(yù)測(cè)研究[J].上海經(jīng)濟(jì)研究,2014(3):89-98.
[3] 上海市統(tǒng)計(jì)局.上海統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2016.
[4] 國(guó)家統(tǒng)計(jì)局上海調(diào)查總隊(duì).上海市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)[R].上海:上海市統(tǒng)計(jì)局,2016.
[5] 張本飛.中國(guó)人口出生率的轉(zhuǎn)變與西方的比較[J].西北人口,2006,27(1):57-60.
[6] 王成科.灰色數(shù)列預(yù)測(cè)模型在人口出生率研究中的應(yīng)用[J].數(shù)理醫(yī)藥學(xué)雜志,1994,7(4):353-355.
[7] 袁小平,梁海艷.中國(guó)人口年齡結(jié)構(gòu)變動(dòng)對(duì)出生率的影響研究[J].西北人口,2014,35(6):49-53.
[8] 楊慧詩(shī),孟晗.關(guān)于人口出生率影響因素的逐步回歸分析[J].現(xiàn)代商業(yè),2010(5):177-178.
[9] 李松臣,張世英.基于逐步回歸法的人口出生率影響因素分析[J].統(tǒng)計(jì)與決策,2008(4):7-9.
[10] 王國(guó)軍,趙小靜,周新發(fā).我國(guó)人口出生率影響因素實(shí)證研究 [J].經(jīng)濟(jì)問題,2016(2):7-11.
[11] 李建偉.我國(guó)人口出生率的影響因素及其發(fā)展趨勢(shì)[J].發(fā)展研究,2014(9):71-78.