楊世箐 ,楊成鋼,
(1.西南石油大學(xué) 文法學(xué)院,成都 6100501;2.西南財(cái)經(jīng)大學(xué) 人口研究所,成都 610074)
宏觀統(tǒng)計(jì)指標(biāo)數(shù)據(jù)可以從量化層面向人們?nèi)嬲故疽粐虻貐^(qū)國民經(jīng)濟(jì)和社會發(fā)展的具體狀況,但眾多豐富繁雜的統(tǒng)計(jì)指標(biāo)又往往相對重疊,在邏輯歸屬上也較為模糊,并不能直觀呈現(xiàn)各子系統(tǒng)特定的發(fā)展實(shí)際。因此眾多研究者往往會對官方公布的宏觀統(tǒng)計(jì)指標(biāo)進(jìn)行篩選和賦權(quán)進(jìn)而構(gòu)建能夠?qū)iT評價(jià)某個(gè)經(jīng)濟(jì)社會子系統(tǒng)發(fā)展?fàn)顩r的指標(biāo)體系模型并通過收集截面數(shù)據(jù)加以實(shí)證應(yīng)用,從研究的針對性和科學(xué)性而言,這確實(shí)是一種可行的思路,也形成了一套相對成熟的研究范式,如布萊克(Cyril E Black)[1]、英克爾斯(Alex Inkeles)[2]等人的現(xiàn)代化水平測度指標(biāo)體系,聯(lián)合國開發(fā)計(jì)劃署的HDI[3]指數(shù)等。目前,國內(nèi)也出現(xiàn)了基于統(tǒng)計(jì)指標(biāo)選取的系統(tǒng)評價(jià)模型構(gòu)建和應(yīng)用的研究熱潮,眾多學(xué)者紛紛借鑒不同的模型構(gòu)建及應(yīng)用方法對我國或各地區(qū)的相關(guān)經(jīng)濟(jì)社會領(lǐng)域進(jìn)行發(fā)展水平評價(jià)的實(shí)證分析,但介于宏觀統(tǒng)計(jì)指標(biāo)數(shù)據(jù)的諸多特性,相關(guān)指標(biāo)體系模型的構(gòu)建及應(yīng)用方法仍然有待仔細(xì)推敲和具體商榷。
依據(jù)宏觀統(tǒng)計(jì)指標(biāo)構(gòu)建測度模型與眾多經(jīng)濟(jì)學(xué)和社會學(xué)等統(tǒng)計(jì)分析模型不同,其不需要去發(fā)展指標(biāo),研究者所需要做的重要工作就是從已有指標(biāo)中去篩選能夠反映某一子系統(tǒng)發(fā)展?fàn)顩r的特定統(tǒng)計(jì)值指標(biāo)。在這一環(huán)節(jié),已有研究基本是在一定的學(xué)理探討或經(jīng)驗(yàn)分析的基礎(chǔ)上主觀確定最終的測度指標(biāo),并不會采取相應(yīng)的定量手段加以補(bǔ)充,在指標(biāo)選取的原則上,也通常沿用豐富性、代表性等原則。這也會引申出兩個(gè)值得商榷的問題,一方面,宏觀統(tǒng)計(jì)指標(biāo)數(shù)據(jù)是一個(gè)典型的時(shí)間序列,其在數(shù)理上會呈現(xiàn)出典型的連帶性特征,如果期望通過追求指標(biāo)的豐富性而達(dá)成全面測度的目的實(shí)際是一種不可取的思路,因?yàn)閷Υ罅吭跀?shù)據(jù)上連帶性的指標(biāo)(如GDP、人均GDP;人口出生率、死亡率和自然增長率等)進(jìn)行賦權(quán)匯總而產(chǎn)生的重復(fù)計(jì)算很可能會導(dǎo)致統(tǒng)計(jì)結(jié)果的失真;另一方面,如果側(cè)重代表性原則,那么經(jīng)驗(yàn)分析后選取的少量代表性指標(biāo)可能不具備可收集性,就必須進(jìn)一步探尋對其具備可替代性的指標(biāo),而通過這種途徑最終主觀選取的指標(biāo)很可能又不能全面反映特定子系統(tǒng)發(fā)展的全貌(反映社會公平程度的基尼系數(shù)目前不具備可收集性,用城鄉(xiāng)收入比指標(biāo)替代,而該指標(biāo)波動(dòng)性較強(qiáng),并不能全面客觀反映當(dāng)前社會公平狀況)。
在基于統(tǒng)計(jì)指標(biāo)選取的系統(tǒng)評價(jià)模型構(gòu)建過程中,要解決在指標(biāo)篩選層面存在的上述局限,針對宏觀統(tǒng)計(jì)指標(biāo)的特性,應(yīng)該以代表性為首要原則,兼顧可收集性和豐富性,通過主客觀相結(jié)合,以定性和定量相互輔助的方式進(jìn)行指標(biāo)篩選。具體操作可以分為兩步,第一步是通過定性闡述方式篩選出參考指標(biāo),進(jìn)而引入變量R型聚類這一統(tǒng)計(jì)分析手段,具體的步驟方法[4]是:
首先,在每一類參考指標(biāo)中依據(jù)可收集性原則篩選出可收集完整數(shù)據(jù)的指標(biāo)進(jìn)而收集數(shù)據(jù)并進(jìn)行相關(guān)數(shù)據(jù)數(shù)據(jù)處理;
其次,計(jì)算指標(biāo)的相關(guān)指數(shù):
其中,r為指標(biāo)i與其他指標(biāo)間的相關(guān)系數(shù),mi為指標(biāo)i所在類的指標(biāo)個(gè)數(shù);
最后,比較各指標(biāo)相關(guān)指數(shù),最大的相關(guān)指數(shù)對應(yīng)的指標(biāo)即可以選取為該類的代表性指標(biāo)。如分別有指標(biāo)X1、X2和X3構(gòu)成一類,那么其對應(yīng)的相關(guān)指數(shù)分別為和,如果-R1最大,則選取 X1作為能夠該類狀況的代表性指標(biāo)。
在社會統(tǒng)計(jì)學(xué)中,變量R型聚類適用于在大變量集中尋找代表性變量的情況,其完全根據(jù)變量數(shù)據(jù)的內(nèi)在數(shù)理關(guān)系,通過降維的手段簡化變量集的同時(shí)也可以充分減少數(shù)據(jù)信息的損失。在基于統(tǒng)計(jì)指標(biāo)選取基礎(chǔ)上的測度模型中,通過這一方法得出的代表性變量,既可以有效消減同一類別中眾多變量數(shù)據(jù)間的重復(fù)計(jì)算局限,也能節(jié)省測量時(shí)間,在數(shù)據(jù)損失較少的情況下保持測度的有效性,達(dá)成研究目的。
在指標(biāo)體系賦權(quán)上,目前學(xué)界大都采用專家意見法(德爾菲法)或熵權(quán)法進(jìn)行。由于上述兩種賦權(quán)方法在國內(nèi)研究中被大量應(yīng)用和說明,本文在此不作贅述。在基于宏觀統(tǒng)計(jì)指標(biāo)篩選構(gòu)建的評價(jià)模型賦權(quán)層面,也可以針對具體的研究狀況,采用因子分析法和模糊綜合評判法這兩種具體手段進(jìn)行。
1.2.1 因子分析法
所謂因子分析即是指探討在存在相關(guān)關(guān)系的各統(tǒng)計(jì)指標(biāo)變量之間,是否存在不能直接觀察到,但對觀測指標(biāo)變量的變化起支配作用的潛在因子(可以視為觀測指標(biāo)隸屬的要素層)。假設(shè)有統(tǒng)計(jì)指標(biāo)x1,x2,x3,x4,……,xm。各指標(biāo)變量與其所屬要素層的關(guān)系可以表述為:
其中,xji為具體指標(biāo)變量,F(xiàn)j為對具體指標(biāo)變量起支配作用的特定因子(要素層),aji為指標(biāo)變量對該因子的因子載荷,因子載荷表示變量xji對公共因子Fj的依賴程度,反映了變量在公因子上的負(fù)荷,其絕對值大小即說明變量對其公因子的相對重要性程度。而在各指標(biāo)變量的賦權(quán)操作中,從特定指標(biāo)變量對其所屬要素的因子載荷的絕對值大小可以判斷該指標(biāo)變量在其所屬要素中的重要性程度,換句話說,因子載荷絕對值大小即可作為指標(biāo)賦權(quán)的實(shí)際參考。
1.2.2 模糊綜合評判法
模糊綜合評判法是國內(nèi)學(xué)者[5]于上世紀(jì)80年代提出的一種基于模糊數(shù)學(xué)的綜合評價(jià)方法。其在思路上類似于專家意見法,但具體計(jì)算步驟和方法略有不同。其主要是運(yùn)用模糊數(shù)學(xué)對受到多種因素制約的事物或?qū)ο笞龀鲆粋€(gè)總體的評價(jià),將定性的評價(jià)轉(zhuǎn)換為定量的評價(jià)結(jié)論,近年來在國民經(jīng)濟(jì)社會發(fā)展領(lǐng)域的宏觀模型構(gòu)建中得到廣泛的應(yīng)用。其具體步驟為:
首先,確定評判系統(tǒng)指標(biāo)集和指標(biāo)權(quán)重集:
U=(U1,U2,U3, ···,Ui)
A=(A1,A2,A3, ···,Ai)
其中,Ui為第i個(gè)指標(biāo),Ai為對應(yīng)指標(biāo)的權(quán)重。
其次,確定類指標(biāo)評價(jià)等級:
V=(V1,V2,V3,·V4)(假設(shè)為四等級評判)
第三,確定評判矩陣Ri:
第四,收集各類評價(jià)并形成按類評價(jià)矩陣R:
最后,求總評價(jià)結(jié)果
B=R×A
應(yīng)用模糊綜合評判方法,可以通過測量不同人對某個(gè)事物或現(xiàn)象的態(tài)度和看法,從而最終對該事物或現(xiàn)象進(jìn)行模糊評判,如對某個(gè)發(fā)展系統(tǒng)內(nèi)部要素(U1、U2、U3)進(jìn)行權(quán)重分配,可通過設(shè)計(jì)問卷調(diào)查若干名專家學(xué)者對此三個(gè)要素重要性的認(rèn)知情況,最終結(jié)果為在U1方面,有50%的專家認(rèn)為其最重要,40%的專家認(rèn)為非常重要,10%的專家認(rèn)為比較重要,沒有專家認(rèn)為其不重要,可記為VU1=(0.7,0.3,0.0,0.0);同理假設(shè)VU2=(0.5,0.4,0.1,0.0),VU3=(0.3,0.4,0.3,0.0),通過特定的模糊變換關(guān)系可知依據(jù)專家評價(jià)后將三個(gè)要素分別為賦權(quán)為0.6、0.4和0.3,進(jìn)行歸一化處理后的權(quán)重最終分別為0.4615,0.3077和0.2307。
在指標(biāo)體系模型的應(yīng)用上,研究者一般會根據(jù)研究需要,通過相應(yīng)的統(tǒng)計(jì)分析方法考察指標(biāo)或系統(tǒng)間的互動(dòng)關(guān)系,最常見就是運(yùn)用回歸分析考察指標(biāo)體系中各指標(biāo)變量或其反映的系統(tǒng)發(fā)展量化狀況間的因果關(guān)系(影響效力大?。?,根據(jù)不同的研究目的和適用性,傳統(tǒng)的回歸分析應(yīng)用目前主要是采用最小平方法(OLS)原理進(jìn)行的多元線性回歸和曲線估計(jì)等。
由于統(tǒng)計(jì)指標(biāo)變量均為定距層次的連續(xù)型變量,因此運(yùn)用回歸分析具備先天的契合性,在指標(biāo)體系模型的應(yīng)用中,用一個(gè)指標(biāo)(指數(shù))變量作為因變量,其他多個(gè)指標(biāo)(指數(shù))作為自變量進(jìn)行多元線性回歸分析,可以從數(shù)量層面考察不同指標(biāo)(指數(shù))變量間的非確定性因果關(guān)系,其數(shù)學(xué)表達(dá)式可以寫作:
其中b為回歸系數(shù),即每個(gè)自變量對因變量影響力大小,其數(shù)值沒有固定上下限,受制于自變量的運(yùn)算單位,如果要進(jìn)一步比較不同自變量對因變量的影響強(qiáng)度,只要將b轉(zhuǎn)換成標(biāo)準(zhǔn)回歸系數(shù)β即可。
多元線性回歸對于考察任意指標(biāo)(指數(shù))變量的因果關(guān)系非常方便,但需要注意的是:
首先,必須重視前期的相關(guān)理論分析和經(jīng)驗(yàn)論證。在線性回歸中,因果關(guān)系的設(shè)定不是由統(tǒng)計(jì)方法決定的[6],哪些指標(biāo)變量為因,哪些為果,關(guān)鍵取決于統(tǒng)計(jì)之前的理論和經(jīng)驗(yàn)分析,例如勞動(dòng)力人口數(shù)和GDP指標(biāo),在統(tǒng)計(jì)分析上可以得出互為因果的結(jié)論,但從經(jīng)驗(yàn)上分析則明顯不能選取GDP指標(biāo)為自變量而勞動(dòng)力人口數(shù)為因變量。
其次,必須要對回歸模型進(jìn)行全面的檢驗(yàn)。實(shí)際上,對于任何不同的指標(biāo)變量,不管其是否具有線性關(guān)系,都可以用線性回歸的統(tǒng)計(jì)方法做出一個(gè)回歸模型,但如果不同的指標(biāo)變量間根本就不存在線性關(guān)系,那么這一模型就沒有任何意義,因此要對模型的線性擬合度進(jìn)行檢驗(yàn),其一般包括對回歸系數(shù)和常數(shù)項(xiàng)的顯著性檢驗(yàn)、方差齊性檢驗(yàn)、殘差正態(tài)性檢驗(yàn)和多重共線性診斷等環(huán)節(jié),在進(jìn)行回歸分析前,根據(jù)指標(biāo)變量數(shù)據(jù)勾畫散點(diǎn)圖,觀察其是否存在線性關(guān)系也可以是前期直觀判斷是否需要建立回歸模型的一個(gè)常用方法。
最后,必須解決共線性問題。在多元線性回歸方程中,自變量由于彼此相關(guān)而會導(dǎo)致共線性問題,這就給考察自變量對因變量的凈影響力帶來一定的困難,當(dāng)一組自變量存在共線性時(shí),就應(yīng)該剔除引起共線性的一個(gè)或多個(gè)變量,由此才能保障模型的擬合優(yōu)度。共線性問題是建立回歸模型過程中必須面對而又較難解決的問題,而統(tǒng)計(jì)指標(biāo)(指數(shù))變量相互之間會帶有較強(qiáng)的相關(guān)性,因此共線性診斷在指標(biāo)體系模型應(yīng)用中的回歸分析層面更顯重要。一般而言,共線性診斷通過容許度(Tolerance)和方差膨脹因子(VIF)的數(shù)值來判斷,容許度定義為Tol=1-Ri2,方差膨脹因子定義為VIF=1/Tol,二者呈倒數(shù)關(guān)系,從公式中可以看出,某個(gè)自變量與其他自變量的相關(guān)性越大,容許度(VIF)就越小(大),其間的共線性就越強(qiáng)。
此外,在指標(biāo)體系模型應(yīng)用中,OLS算法的回歸分析雖然存在典型的易用性,但遇到指標(biāo)間存在交互影響或者需要探討指標(biāo)間更為復(fù)雜的因果關(guān)系時(shí),這種統(tǒng)計(jì)方法的適用性不足就凸顯出來,此時(shí)應(yīng)該根據(jù)不同的情況和實(shí)際的研究需要,適當(dāng)引入二階段最小平方法回歸分析或路徑分析加以解決。
2.2.1 二段最小平方法應(yīng)用說明
用宏觀統(tǒng)計(jì)指標(biāo)(指數(shù))作為自變量與因變量在很多情況下會存在變量間的交互作用(如反映經(jīng)濟(jì)增長的GDP與反映人口素質(zhì)的人口受教育年限指標(biāo),反映物價(jià)水平的CPI與眾多人民需求指標(biāo)等),此時(shí)用普通的最小二乘法(OLS)算法會忽視因變量對自變量的影響,其建立的回歸模型也是在假設(shè)誤差項(xiàng)與自變量間不存在相關(guān)關(guān)系基礎(chǔ)上得出的,而實(shí)際上正是由于因變量對自變量的反饋?zhàn)饔枚鴮?dǎo)致誤差項(xiàng)與自變量間存在相關(guān)關(guān)系,這就破壞了OLS回歸的假設(shè)條件,從而使模型產(chǎn)生一定的偏差。要解決這個(gè)問題,可以使用二段最小平方法(2SLS)建立回歸模型,即使用兩階段最小平方法,用其他的變量(工具變量)對自變量進(jìn)行預(yù)測,然后用預(yù)測值再進(jìn)行回歸,這樣就可以有效解決OLS回歸的局限,消減回歸模型的偏差。在二段最小平方法回歸模型中,工具變量具有重要意義,其可以被理解為模型的外生變量,即在模型中不受其他變量影響,但影響模型中某些變量的變量,這就決定了工具變量雖然與模型中某個(gè)內(nèi)生變量高度相關(guān),但與誤差項(xiàng)則不相關(guān),因此引入工具變量進(jìn)行第一階段預(yù)測就可以滿足OLS回歸分析的經(jīng)典假設(shè)。當(dāng)然,單靠統(tǒng)計(jì)方法是無法確定工具變量的,其也需要在充分的定性探討后發(fā)現(xiàn)??偟膩碚f,二段最小平方法回歸的原理如圖1所示。
圖1 二段最小平方法回歸分析路徑示意圖
2.2.2 路徑分析的適用情況
路徑分析是回歸分析的拓展,回歸分析只有一個(gè)因變量,因此只要構(gòu)建一個(gè)回歸方程,而路徑分析則針對多個(gè)因變量通過構(gòu)建一組回歸方程來分析多個(gè)變量組成的因果網(wǎng)(圖2)。如圖2的多元線性回歸方程:
其可以分解為方程組為:
圖2 變量間的因果網(wǎng)示意(單向)
從上述過程可以看出,路徑分析的實(shí)質(zhì)是就是將一個(gè)回歸方程分解為多個(gè)回歸方程,并由此來觀測各自變量對因變量的遞歸因果關(guān)系,其在分析原理上與回歸分析是一致的。
基于宏觀統(tǒng)計(jì)指標(biāo)篩選的的指標(biāo)體系測度模型的構(gòu)建是針對性考察和評價(jià)某一經(jīng)濟(jì)社會發(fā)展子系統(tǒng)發(fā)展?fàn)顩r的有效手段,只有通過科學(xué)嚴(yán)謹(jǐn)?shù)乃悸贩椒?,定性和定量相結(jié)合的研究手段,對代表性指標(biāo)進(jìn)行篩選和賦權(quán),并根據(jù)具體情況運(yùn)用對應(yīng)的統(tǒng)計(jì)分析手段進(jìn)行應(yīng)用分析,才能保障系統(tǒng)評價(jià)的有效性和合理性。涉及具體的分析方法和步驟在眾多研究中也有詳實(shí)介紹,本文在此不作贅述,僅針對模型構(gòu)建的宏觀思路方法及其應(yīng)用分析層面的適應(yīng)性統(tǒng)計(jì)手段進(jìn)行了初步的分析和討論,以期望對后續(xù)適應(yīng)不同情況的相關(guān)研究起到一定的借鑒啟發(fā)。
[1]C·E·布萊克著.現(xiàn)代化的動(dòng)力[M].段小光譯.成都:四川人民出版社,1988.
[2]阿列克斯·英克爾斯,戴維·H·史密斯著.從傳統(tǒng)人到現(xiàn)代人——六個(gè)發(fā)展中國家中的個(gè)人變化[M].顧昕譯.北京:中國人民大學(xué)出版社,1992.
[3]聯(lián)合國開發(fā)計(jì)劃署.2006年人類發(fā)展報(bào)告[R].2006.
[4]盧紋岱.SPSS for Windows統(tǒng)計(jì)分析(第2版)[M].北京:電子工業(yè)出版社,2002.
[5]汪培莊.模糊集合論及其應(yīng)用[M].上海:上海科學(xué)技術(shù)出版社,1983.
[6]翁定軍.社會定量研究的數(shù)據(jù)處理——原理與方法[M].上海:上海大學(xué)出版社,2002.