熊 彥
(1.中南財(cái)經(jīng)政法大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,湖北武漢430073;2.佛山科學(xué)技術(shù)學(xué)院數(shù)學(xué)與大數(shù)據(jù)學(xué)院,廣東佛山528000)
我國(guó)城鎮(zhèn)居民健康自評(píng)數(shù)據(jù)的幾個(gè)統(tǒng)計(jì)檢驗(yàn)
熊 彥1,2
(1.中南財(cái)經(jīng)政法大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,湖北武漢430073;2.佛山科學(xué)技術(shù)學(xué)院數(shù)學(xué)與大數(shù)據(jù)學(xué)院,廣東佛山528000)
研究個(gè)人健康與社會(huì)經(jīng)濟(jì)地位之間的關(guān)系,基于微觀調(diào)查數(shù)據(jù),分別從卡方齊性和卡方獨(dú)立性兩個(gè)角度,檢驗(yàn)了自評(píng)健康得分與教育程度、職業(yè)地位的相關(guān)性。結(jié)果顯示,自評(píng)健康得分與教育程度高度相關(guān),教育程度高的個(gè)人,其自評(píng)健康越好;自評(píng)健康得分與就業(yè)身份相關(guān)。
自評(píng)健康;卡方齊性;卡方獨(dú)立性;
健康原本是一個(gè)醫(yī)學(xué)課題,從上世紀(jì)70年代開(kāi)始,學(xué)者們認(rèn)識(shí)到健康與社會(huì)經(jīng)濟(jì)狀況密切相關(guān),隨著越來(lái)越多的研究關(guān)注收入、教育和職業(yè)等社會(huì)經(jīng)濟(jì)地位相關(guān)指標(biāo)和健康之間的關(guān)系,健康已經(jīng)成為醫(yī)學(xué)、社會(huì)學(xué)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)科學(xué)等多學(xué)科的一個(gè)綜合課題。文獻(xiàn)[1-2]對(duì)基于跨國(guó)層面和英美國(guó)家內(nèi)部數(shù)據(jù)的健康指標(biāo)與經(jīng)濟(jì)社會(huì)指標(biāo)之間的關(guān)系進(jìn)行了研究。由于數(shù)據(jù)獲取等方面的原因,針對(duì)我國(guó)的相關(guān)研究比較薄弱,已有的一些研究,主要集中在居民健康與宏觀經(jīng)濟(jì)指標(biāo)之間的關(guān)系方面[3],基于微觀層面的文獻(xiàn)尚不多見(jiàn)。本文旨在利用微觀調(diào)查數(shù)據(jù),對(duì)個(gè)人健康與個(gè)人經(jīng)濟(jì)社會(huì)地位之間的關(guān)系進(jìn)行相關(guān)統(tǒng)計(jì)檢驗(yàn),為進(jìn)一步的定量研究奠定基礎(chǔ)。
本文的數(shù)據(jù)來(lái)源于中國(guó)家庭收入分配項(xiàng)目(CHIP)調(diào)查數(shù)據(jù),CHIP項(xiàng)目由中外學(xué)者共同組織,并由國(guó)家統(tǒng)計(jì)局協(xié)助實(shí)施,至今已進(jìn)行了6次,相關(guān)調(diào)查技術(shù)和實(shí)施細(xì)節(jié)在文獻(xiàn)[4]中已有詳細(xì)介紹,在此不再贅述。最新發(fā)布的CHIP數(shù)據(jù)為2013年的數(shù)據(jù)(以下簡(jiǎn)稱CHIP2013),調(diào)查范圍為全國(guó)15個(gè)省份,其中東、中、西部各5個(gè),樣本對(duì)全國(guó)總體狀況有較好的代表性。鑒于我國(guó)城鄉(xiāng)二元分割的現(xiàn)狀,項(xiàng)目組在發(fā)布數(shù)據(jù)時(shí),將樣本分成了城鎮(zhèn)居民、流動(dòng)人口和農(nóng)村居民三類(lèi),本文選取其中的城鎮(zhèn)居民作為研究對(duì)象。CHIP2013涵蓋了居民個(gè)人在健康、人口特征、教育職業(yè)、社會(huì)關(guān)系和經(jīng)濟(jì)狀況等方面的信息。
在既有的研究中,個(gè)人健康的度量指標(biāo),隨著研究者對(duì)健康概念的不同界定,有不同的選擇,一般來(lái)講,側(cè)重醫(yī)學(xué)考量的文獻(xiàn)較多選擇疾病營(yíng)養(yǎng)方面的指標(biāo),而側(cè)重社會(huì)經(jīng)濟(jì)考量的文獻(xiàn),通常選擇自評(píng)健康作為測(cè)度指標(biāo)。發(fā)達(dá)國(guó)家的經(jīng)驗(yàn)研究表明,自評(píng)健康指標(biāo)與客觀的疾病營(yíng)養(yǎng)方面的指標(biāo)有高度相關(guān)性。本文選擇受訪者自評(píng)健康作為測(cè)度個(gè)人健康的指標(biāo)。CHIP2013中,個(gè)人自評(píng)健康分為5個(gè)等級(jí),分別為非常好、好、一般、不好和非常不好。
社會(huì)經(jīng)濟(jì)地位是一個(gè)主觀的概念,測(cè)度標(biāo)準(zhǔn)更難以統(tǒng)一,本文在此不做過(guò)多探討,鑒于較為常見(jiàn)的是從教育程度、職業(yè)和收入等維度入手,本文采用統(tǒng)計(jì)檢驗(yàn)手段,分別檢驗(yàn)我國(guó)城鎮(zhèn)居民自評(píng)健康與個(gè)人教育程度、職業(yè)地位之間的關(guān)系,其中教育程度選用最高學(xué)歷,職業(yè)地位選擇當(dāng)前就業(yè)身份。CHIP2013中,最高學(xué)歷有9個(gè)選項(xiàng),分別為未上過(guò)學(xué)、小學(xué)、初中、高中、高職、中專(zhuān)、大專(zhuān)、本科、研究生;就業(yè)身份有4個(gè)選項(xiàng):雇主、雇員、自營(yíng)職業(yè)和家庭幫工。刪除遺漏條目后,最終樣本量為10 168條數(shù)據(jù),各變量描述統(tǒng)計(jì)見(jiàn)表1。
表1 樣本描述統(tǒng)計(jì)
由于所選指標(biāo)均為分類(lèi)數(shù)據(jù),其中自評(píng)健康為有序分類(lèi)數(shù)據(jù),性別、教育程度和職業(yè)地位為無(wú)序分類(lèi)數(shù)據(jù),因此需選擇定性數(shù)據(jù)相關(guān)性檢驗(yàn)方法。
2.1 卡方齊性檢驗(yàn)
考慮自評(píng)健康與教育程度之間的相關(guān)關(guān)系,先將自評(píng)健康與學(xué)歷匯總成列聯(lián)表。從表1的描述統(tǒng)計(jì)中看出,學(xué)歷變量有9個(gè)分類(lèi),較為分散。根據(jù)實(shí)際情況,將其合并為三類(lèi),其中1~3為義務(wù)教育類(lèi),4~7為職業(yè)教育類(lèi),8~9為高等教育類(lèi)。
我們需要比較每一個(gè)教育程度組別中,各自評(píng)健康得分的相對(duì)頻率是否一致,或者說(shuō)每一個(gè)教育程度組別中的健康相對(duì)頻率的差異是否全由隨機(jī)因素導(dǎo)致。為此,將每一個(gè)教育組別對(duì)應(yīng)的健康分類(lèi)看成一個(gè)多項(xiàng)分布,每個(gè)多項(xiàng)分布有5個(gè)類(lèi),問(wèn)題轉(zhuǎn)化為:要檢驗(yàn)各多項(xiàng)分布在每一個(gè)類(lèi)的概率都是相同的。
更一般的,對(duì)J個(gè)多項(xiàng)分布,每一個(gè)有I個(gè)分類(lèi),如果用Pij表示第j個(gè)多項(xiàng)分布中第i個(gè)類(lèi)的概率,則檢驗(yàn)原假設(shè)為
為檢驗(yàn)原假設(shè),構(gòu)造皮爾遜卡方統(tǒng)計(jì)量,比較觀測(cè)值與期望值。先假定數(shù)據(jù)由每個(gè)多項(xiàng)分布的獨(dú)立樣本組成,用nij表示第j個(gè)多項(xiàng)分布中第i類(lèi)的計(jì)數(shù),ni表示第i類(lèi)的總數(shù),nj表示第j個(gè)多項(xiàng)的總數(shù),n..表示累積總數(shù)。要求出期望頻數(shù),還需要如下引理估計(jì)多項(xiàng)分布的概率。
引理1 在H0假設(shè)下,參數(shù)Pi(=Pi1=Pi2=…=PiJ)的最大似然估計(jì)為
證明 見(jiàn)參考文獻(xiàn)[5]。
于是,對(duì)于第j個(gè)多項(xiàng)分布,第i類(lèi)的期望數(shù)為
因此,皮爾遜卡方統(tǒng)計(jì)量為
可以證明,該統(tǒng)計(jì)量在大樣本下,近似服從χ2=((I-1)(J-1))。將觀測(cè)頻數(shù)、期望頻數(shù)列于下表2。
表2 自評(píng)健康與學(xué)歷列聯(lián)表
計(jì)算得出,城鎮(zhèn)居民樣本數(shù)據(jù)中,卡方統(tǒng)計(jì)量值為206.59,對(duì)α=0.01與α=0.001,χ2(8)的上側(cè)分位數(shù)分別為20.09與26.12,因此,拒絕原假設(shè),即各教育組的各自評(píng)健康得分類(lèi)有顯著差異。通過(guò)逐一比較各單元格觀測(cè)頻數(shù)和期望頻數(shù),可以看出,義務(wù)教育組中,自評(píng)健康不好和非常不好的觀測(cè)頻數(shù)均高于期望頻數(shù);職業(yè)教育組中,自評(píng)健康好的觀測(cè)頻數(shù)高于期望頻數(shù);高等教育組中自評(píng)健康非常好的觀測(cè)頻數(shù)高于期望頻數(shù)。這一結(jié)果顯示:教育程度越高,其自評(píng)健康的得分越高。
2.2 卡方獨(dú)立性檢驗(yàn)
考慮自評(píng)健康得分與就業(yè)身份的相關(guān)性,同上將二者匯總成列聯(lián)表。由于自營(yíng)職業(yè)者和家庭幫工比例較小,合并成一類(lèi),稱為自由職業(yè)。與上面檢驗(yàn)思路不同的是,我們?cè)谶@里將自評(píng)健康得分和就業(yè)身份視為兩個(gè)隨機(jī)變量,列聯(lián)表數(shù)據(jù)視為二維變量的一次觀測(cè),問(wèn)題轉(zhuǎn)化為檢驗(yàn)兩個(gè)隨機(jī)變量是否統(tǒng)計(jì)上相互獨(dú)立。
一般的,樣本容量為n,記Pij(i=1,…,I,j=1,…,J)為二維隨機(jī)變量的單元概率,令
分別表示邊際概率。兩個(gè)隨機(jī)變量相互獨(dú)立的原假設(shè)即為
同樣,為構(gòu)造卡方統(tǒng)計(jì)量,需要如下引理。
引理2在H0原假設(shè)下,Pij的最大似然估計(jì)為
進(jìn)而
證明 見(jiàn)參考文獻(xiàn)[5]。
可以看出,此處期望頻數(shù)與上一節(jié)的期望頻數(shù)是一致的,因此,后面統(tǒng)計(jì)量的構(gòu)造及分布同上。我們把自評(píng)健康與就業(yè)身份列于表3.
經(jīng)計(jì)算,卡方統(tǒng)計(jì)量的值為54.58,對(duì)α=0.01與α=0.001,的上側(cè)分位數(shù)分別為20.09與26.12,因此,拒絕原假設(shè),即各教育組的各自評(píng)健康得分類(lèi)有顯著差異。
表3 自評(píng)健康與就業(yè)身份列聯(lián)表
本文基于中國(guó)城鎮(zhèn)居民微觀調(diào)查數(shù)據(jù),用不同的統(tǒng)計(jì)方法分別嚴(yán)格檢驗(yàn)了個(gè)人健康與教育、職業(yè)間的相關(guān)性??疾靷€(gè)人健康與教育相關(guān)性時(shí)使用了卡方齊次性檢驗(yàn),考察個(gè)人健康與就業(yè)身份的相關(guān)性時(shí)使用了卡方獨(dú)立性檢驗(yàn),兩種思路假設(shè)不同,抽樣思路也不同,齊性檢驗(yàn)是在行或列邊際固定的條件下推導(dǎo)的,獨(dú)立性檢驗(yàn)是在僅僅固定總量的條件下推導(dǎo)的,兩種思路最終在統(tǒng)計(jì)量設(shè)計(jì),自由度計(jì)算上一致。統(tǒng)計(jì)檢驗(yàn)結(jié)果表明,教育程度與個(gè)人自評(píng)健康有很強(qiáng)的相關(guān)性,具體而言,教育程度越高,自評(píng)健康越好;就業(yè)身份與個(gè)人自評(píng)健康有相關(guān)性。本文的結(jié)論揭示了健康與社會(huì)經(jīng)濟(jì)因素之間關(guān)系的一方面,而這些社會(huì)經(jīng)濟(jì)因素變量究竟通過(guò)什么機(jī)制影響個(gè)人健康,如何量化這些影響,值得進(jìn)一步深入研究。
[1]BACKLUND E,SORLIE P D,JOHANSON J.A Comparison of the Relationships of Education and Income with Mortality:The National Longitudinal MortalityStudy[J].Social Science&Medicine,1999,49(3):1373-1384.
[2]BENZEVAL M,JUDGE K,SHOULS S.Understanding the Relationship between Income and Health:How Much can be Gleaned fromCross-Sectional Data[J].Social Policy&Administration,2001,35(4):376-396.
[3]齊亞強(qiáng),牛建林.地區(qū)經(jīng)濟(jì)發(fā)展與收入分配狀況對(duì)我國(guó)居民健康差異的影響[J].社會(huì)學(xué)評(píng)論,2015(3):65-76.
[4]SHI L,SATO H,SICULAR T.Rising Inequality in China:Challenges to a Harmonious Society[M].Cambridge:Cambridge Universitypress,2013:337-415.
[5]JOHNA.Rice:Mathematical Statistics and Data Analysis[M].Singapore:Cengage LearningPress,2007:354-365.
【責(zé)任編輯:王桂珍 foshanwgzh@163.com】
Some statistical test on self-rating health data of urban residents of China
XIONGYan1,2
(1.School ofStatistic and Mathematic,Zhongnan UniversityofEconomyand Law,Wuhan 430073,China; 2.School ofMathematic and BigData,Foshan University,Foshan 528000,China)
The relationship between individual health and socioeconomic status is researched in this paper.Based on micro-data,the correlation between self-rating health and education,self-rating health and occupational status is tested by chi-square homogeneity and chi-square independence separately.The result shows that self-rating health and education is high correlation,the higher one’s education status is,the higher score his self-ratinghealth is.What’s more,there exists correlativitybetween self-ratinghealth and occupational status.
self-ratinghealth;chi-square homogeneity;chi-square independence
R195
A
1008-0171(2017)02-0005-04
2016-11-09
熊 彥(1982-),男,湖南婁底人,佛山科學(xué)技術(shù)學(xué)院講師,中南財(cái)經(jīng)政法大學(xué)在讀博士生。