楊 泱
(復(fù)旦大學(xué),上海 200433)
全國有592個國家級貧困縣,云南省占73個〔1〕,是貧困縣最多的省份。云南省129個縣(區(qū))中,不屬于國家級貧困縣的僅有56個〔2〕,貧困地區(qū)落后的經(jīng)濟(jì)狀況嚴(yán)重制約著云南省宏觀經(jīng)濟(jì)發(fā)展。區(qū)域經(jīng)濟(jì)發(fā)展的整體情況很難用少數(shù)幾個指標(biāo)全面概括,但生產(chǎn)總值是十分重要的指標(biāo)之一,研究這56個縣(區(qū))生產(chǎn)總值的總體和人均情況無疑可以為云南乃至全國貧困縣的宏觀經(jīng)濟(jì)發(fā)展提供參考,并有利于縮小區(qū)域發(fā)展差距。
多元線性回歸模型中因變量Y與自變量X之間的關(guān)系為:Y=β0+β1X1+β2X2+ … +βkXk+ε〔3〕,其中β0為y軸截距,β1,…,βk為自變量X1,…,Xk的系數(shù)。誤差ε表示實(shí)際值與估計(jì)值的差異,在k=1時,ε代表Yi與直線之間的距離,在k≥2時它代表Yi與響應(yīng)面(re?sponse surface)的距離。由于β0,…,βk是總體系數(shù),所以通常是未知的,需要運(yùn)用擬合回歸方程估計(jì)系數(shù)的值。估計(jì)方程為其中b0,…,bk是β0,…,βk的無偏差估計(jì)量。
選取云南56個非國家級貧困縣(區(qū))2013年統(tǒng)計(jì)數(shù)據(jù),設(shè)生產(chǎn)總值(億元)(按2013年價格計(jì)算)為因變量Y1;設(shè)總?cè)丝冢ㄈf人)、規(guī)模以上工業(yè)企業(yè)主營業(yè)務(wù)收入(億元)、人均固定資產(chǎn)投資(不含農(nóng)戶)(元/人)、鄉(xiāng)村人口(萬人)、公共財(cái)政預(yù)算支出(億元)分別為X11,…,X15。再設(shè)兩個啞變量(dummy variable)概括區(qū)位、政策因素,分別為:X16=1,縣(區(qū))位于滇中經(jīng)濟(jì)圈;X16=0,縣(區(qū))位于滇中經(jīng)濟(jì)圈之外。X17=1,邊境縣(區(qū));X17=0,非邊境縣(區(qū))。滇中經(jīng)濟(jì)圈是指昆明、曲靖、玉溪、楚雄四市(州),邊境縣(區(qū))是指與緬甸、老撾、越南三國接壤的縣(區(qū)),非國家級貧困縣是指云南省129個縣(區(qū))中排除73個國家級貧困縣后剩下的56個縣(區(qū))。設(shè)人均生產(chǎn)總值(元/人)(按2013年價格計(jì)算)為因變量Y2;設(shè)城鎮(zhèn)居民可支配收入(元/人)、規(guī)模以上工業(yè)企業(yè)利稅總額(億元)、農(nóng)村貧困發(fā)生率(百分比)、農(nóng)村居民人均純收入(元/人)、人均固定資產(chǎn)投資(不含農(nóng)戶)(元/人)分別為X21,…,X25,并設(shè)X26、X27兩個啞變量,其定義與X16、X17相同。對Y1、Y2分別進(jìn)行回歸分析,結(jié)果見表1和表2。
F1=71.48,F(xiàn)2=53.33,F(xiàn)檢驗(yàn)的相伴概率P近似于0,回歸方程顯著。R-Sq(調(diào)整)減緩了自變量個數(shù)對擬合優(yōu)度的干擾,其值為90.00%與86.95%,因變量中不能被方程解釋的部分較小,R-Sq(預(yù)測)衡量模型預(yù)測和擬合水平,其值為82.88%與79.89%,擬合效果良好。以兩個自變量為一組(啞變量除外),建立樣本相關(guān)系數(shù)r的矩陣(限于篇幅,圖略),發(fā)現(xiàn)某些自變量之間存在一定的相關(guān)關(guān)系。另外,在表1中觀察到大于10的方差膨脹因子,因此,模型中存在多重共線性問題。
表1 云南省56個非國家級貧困縣Y1的回歸分析結(jié)果
表2 云南省56個非國家級貧困縣Y2的回歸分析結(jié)果
多重共線性常見于涉及經(jīng)濟(jì)變量的模型中,可導(dǎo)致方程的系數(shù)存在誤差。例如表1中公共財(cái)政預(yù)算支出系數(shù)為負(fù),說明在其他條件不變的情況下,提高公共財(cái)政預(yù)算支出反而降低了生產(chǎn)總值,該結(jié)論沒有經(jīng)濟(jì)學(xué)意義。另一方面,多重共線性導(dǎo)致t檢驗(yàn)結(jié)果參考性降低。綜上,當(dāng)模型包含較多的自變量,尤其當(dāng)自變量之間存在一定的相關(guān)關(guān)系時,不僅增加了第一類錯誤發(fā)生的概率,還可能導(dǎo)致多重共線性的發(fā)生,需要對模型進(jìn)行改進(jìn)。
逐步回歸法以統(tǒng)計(jì)顯著性為基礎(chǔ),是簡便有效解決多重共線性問題的方法之一。逐步回歸有三種方法,較為常用的是逐步法,其步驟為對自變量逐個進(jìn)行回歸分析,然后比較F檢驗(yàn)的P與入選P(P-to-enter),若所有自變量的P均高于預(yù)先設(shè)定的入選P,則逐步回歸不可用,須改用其他方法或調(diào)整入選P;若一個自變量的P低于入選P,選擇該自變量引入模型;若多個自變量的P低于入選P,則選擇其中P最低者引入模型。在引入第一個自變量的條件下,用同樣的方法考察是否引入第二個變量。在引入新變量時,對于原來已經(jīng)引入的變量,其相伴概率P可能會發(fā)生變化,須比較變化后的P與刪除P(P-to-leave),不符合刪除P的自變量被排除。以上步驟重復(fù)多次,直到?jīng)]有變量被引入和刪除為止。另外,可以選擇入選F與刪除F代替對應(yīng)的P。用所選數(shù)據(jù)進(jìn)行逐步回歸分析,選擇入選P為0.05,刪除P為0.1,結(jié)果見表3和表4。
表3 云南省56個非國家級貧困縣Y1的逐步回歸分析結(jié)果
表4 云南省56個非國家級貧困縣Y2的逐步回歸分析結(jié)果
隨著逐步回歸步驟1~4(第二個模型1~3),兩個回歸模型的R-Sq(調(diào)整)逐步升高,標(biāo)準(zhǔn)誤差S逐步降低。再比較之前的回歸結(jié)果,F(xiàn)值均有提高,方差膨脹因子(圖略)均小于10。模型在逐步回歸后得到優(yōu)化,多重共線性問題被解決。
殘差еi是誤差ε的估計(jì)量,回歸分析要求殘差滿足三個假設(shè):一是服從均值為零的正態(tài)分布;二是方差恒定;三是殘差之間獨(dú)立〔4〕。因此,需要做正態(tài)檢驗(yàn)、異方差檢驗(yàn)。因?yàn)閿?shù)據(jù)是截面數(shù)據(jù),自相關(guān)檢驗(yàn)不需要。
以Y軸為殘差,X為擬合值作出兩圖(圖略),兩圖形狀十分類似,散點(diǎn)大致集中在圖的左側(cè),似乎并未隨機(jī)分布,懷疑存在異方差。圖中存在一些點(diǎn)偏離其他點(diǎn),經(jīng)核實(shí)原始數(shù)據(jù)正確,計(jì)算過程無誤,予以保留。進(jìn)一步使用White檢驗(yàn)(不使用交叉項(xiàng))和 Glejser檢驗(yàn)〔5-7〕,對于 Y1方程分別得到統(tǒng)計(jì)量19.76241,相伴概率P為0.0006,統(tǒng)計(jì)量22.75764,P為0.0001,對于Y2方程分別得到統(tǒng)計(jì)量11.28562,P為0.0103,統(tǒng)計(jì)量10.02346,P為0.0184,異方差存在。采用加權(quán)最小二乘法解決異方差,如果所取的權(quán)數(shù)合適,它并不會扭曲模型的經(jīng)濟(jì)意義,還能改善模型的各項(xiàng)指標(biāo)〔8〕,權(quán)數(shù)W常用自變量或殘差的-2 至 2 次方的倒數(shù)。取W=1/∣ei∣1.5〔9-10〕,使用加權(quán)二乘法后再一次計(jì)算White檢驗(yàn)和Glejser檢驗(yàn),對于Y1方程分別得到統(tǒng)計(jì)量3.914968,P為0.5617和統(tǒng)計(jì)量3.531453,P為0.4731,對于Y2方程分別得到統(tǒng)計(jì)量3.952946,P為0.4124和統(tǒng)計(jì)量4.836801,P為0.1841,模型的R-Sq(調(diào)整)等指標(biāo)也得到優(yōu)化。但加權(quán)二乘法優(yōu)化模型的代價之一是可能導(dǎo)致多重共線性,尤其是在權(quán)數(shù)選擇失當(dāng)?shù)那闆r下,因此,檢查模型的方差膨脹因子,發(fā)現(xiàn)均小于10(圖略),多重共線性問題不存在。
Jarque-bera(以下簡稱JB)統(tǒng)計(jì)量基于總體為正態(tài)分布時,它近似服從于自由度為2的卡方分布,其計(jì)算公式JB=n/6〔S2+1/4(k-3)2〕,原假設(shè)H0:數(shù)據(jù)服從正態(tài)分布,備擇假設(shè)H1:數(shù)據(jù)不服從正態(tài)分布。計(jì)算JB統(tǒng)計(jì)量,分別得到JB1=2.3171,相伴概率P為0.3139,JB2=0.4197,P為0.8107,得出結(jié)論為不拒絕原假設(shè),認(rèn)為殘差服從正態(tài)分布。
回歸模型為:生產(chǎn)總值(億元)=-23.1629+0.2642人均固定資產(chǎn)投資(不含農(nóng)戶)(元/人)+0.3858規(guī)模以上工業(yè)企業(yè)主營業(yè)務(wù)收入(億元)+4.1366總?cè)丝冢ㄈf人)-2.7056鄉(xiāng)村人口(萬人);人均生產(chǎn)總值(元/人)=-18440.2894+190.0439規(guī)模以上工業(yè)企業(yè)利稅總額(億元)+1.8204城鎮(zhèn)居民可支配收入(元/人)+43.1773人均固定資產(chǎn)投資(不含農(nóng)戶)(元/人)。其他條件固定時,1萬人口的增長解釋了4.1366億元的生產(chǎn)總值,將單位化簡后1的人口增長解釋了41366的生產(chǎn)總值,即人均41366元。接近同時期全國人均水準(zhǔn),而全省人均生產(chǎn)總值僅25083元。參照全國,云南省這56個縣(區(qū))的生產(chǎn)總值增長雖取得一定成效,但相對發(fā)達(dá)地區(qū)仍然較低。在省內(nèi)來說,這56個縣(區(qū))的生產(chǎn)總值與全省平均水平存在較大差異,一部分地區(qū)已經(jīng)發(fā)展起來,但未能帶動貧窮落后的地區(qū)。因此,云南省各區(qū)域的均衡發(fā)展是將來值得關(guān)注的問題之一。一單位的城鎮(zhèn)居民可支配收入解釋了1.8204單位的人均生產(chǎn)總值,揭示了提高城鎮(zhèn)居民可支配收入是提高人均生產(chǎn)總值的途徑之一。鄉(xiāng)村人口的系數(shù)為負(fù)值表明鄉(xiāng)村人口越多的地區(qū),生產(chǎn)總值越低,直接的解決方法是提高農(nóng)民的綜合素質(zhì),推動農(nóng)業(yè)的商品化、集約化。另一方面,借助戶籍制度改革和城市化進(jìn)程使得一部分富余的鄉(xiāng)村勞動力轉(zhuǎn)化為城鎮(zhèn)居民,推進(jìn)城鄉(xiāng)之間協(xié)調(diào)發(fā)展。人均固定資產(chǎn)投資(不含農(nóng)戶)、規(guī)模以上工業(yè)企業(yè)主營業(yè)務(wù)收入、規(guī)模以上工業(yè)企業(yè)利稅總額的系數(shù)為正,這些縣(區(qū))應(yīng)該進(jìn)一步擴(kuò)大投資、建立良好的投資環(huán)境、吸納外部資金并承接部分沿海地區(qū)的產(chǎn)業(yè),發(fā)揮投資在生產(chǎn)總值增長中的拉動作用。另一方面,擴(kuò)大工業(yè)企業(yè)的規(guī)模、拓展產(chǎn)品的銷路、提高企業(yè)的產(chǎn)品競爭力和利潤率也能有力地帶動生產(chǎn)總值的增長。工業(yè)企業(yè)繳納的稅收是財(cái)政收入的來源之一,起到調(diào)節(jié)社會經(jīng)濟(jì)結(jié)構(gòu)的作用,因此,這56個縣(區(qū))應(yīng)該重視轄區(qū)內(nèi)工業(yè)企業(yè)的發(fā)展。
在56個縣(區(qū))中,自變量滇中經(jīng)濟(jì)圈和邊境縣(區(qū))相較于其他自變量顯著性不夠明顯,因此,被逐步回歸排除,說明區(qū)位因素對這56個縣(區(qū))的影響不夠顯著,滇中經(jīng)濟(jì)圈的建設(shè)還有待加強(qiáng),邊境的貿(mào)易往來還需擴(kuò)大。
〔1〕國務(wù)院扶貧開發(fā)領(lǐng)導(dǎo)小組辦公室.國家扶貧開發(fā)工作重點(diǎn)縣名單〔EB/OL〕.(2012-03-19)〔2015-03-15〕.http://www.cpad.gov.cn/publicfiles/business/htmlfiles/FPB/fpyw/201203/175445.html.
〔2〕云南省統(tǒng)計(jì)局.云南統(tǒng)計(jì)年鑒2014〔M〕.北京:中國統(tǒng)計(jì)出版社,2014:481-566.
〔3〕Gerald Keller.Statistics for Management and Economics〔M〕.9th ed.USA:South-Western Cengage Learning,2009:525-735.
〔4〕易丹輝.數(shù)據(jù)分析與Eviews應(yīng)用〔M〕.北京:中國人民大學(xué)出版社,2008:1-50.
〔5〕金燁.GDP核算的回歸估算方法研究〔D〕.上海:上海交通大學(xué),2011.
〔6〕龔秀芳.回歸模型中異方差數(shù)據(jù)的處理〔D〕.上海:華東師范大學(xué),2002.
〔7〕張敏.自相關(guān)過程的統(tǒng)計(jì)過程控制方法研究〔D〕.天津:天津大學(xué),2006.
〔8〕鄭春茂.加權(quán)回歸及權(quán)函數(shù)的變換在生物量建模中的應(yīng)用〔J〕.華東森林經(jīng)理,2012,26(2):77-79.
〔9〕王軍.回歸模型異方差性分析〔J〕.科技和產(chǎn)業(yè),2008,8(1):61-63.
〔10〕張晉昕,黨容.時間序列分析中的異方差性〔J〕.統(tǒng)計(jì)與信息論壇,2002,17(6):62-64.