張艷玲
(昌吉學(xué)院數(shù)學(xué)系 新疆 昌吉 831100)
基于對應(yīng)分析的新疆農(nóng)村居民消費情況
張艷玲
(昌吉學(xué)院數(shù)學(xué)系 新疆 昌吉 831100)
以新疆農(nóng)村地區(qū)2000年到2008年這8年評價居民消費情況的8項指標(biāo)為研究對象,用多元統(tǒng)計學(xué)的對應(yīng)分析進(jìn)行新疆農(nóng)村居民消費情況比較研究,結(jié)果表明:新疆農(nóng)村居民在家庭設(shè)備、用品及服務(wù)、居住、醫(yī)療保健、交通和通訊方面的消費上升的較快,尤其以交通和通訊方面的消費增長最為明顯;而在食品、衣著、文化教育娛樂用品及服務(wù)、其他商品和服務(wù)方面的消費增長不是很明顯,其中文化教育娛樂用品及服務(wù)、其他商品和服務(wù)方面的消費近乎零增長。
新疆農(nóng)村居民消費;對應(yīng)分析;SPSS統(tǒng)計軟件
人們在自然科學(xué)和社會科學(xué)的許多研究工作中,常常需要分析處理含有多個變量的數(shù)據(jù)問題,研究探索多元關(guān)系的復(fù)雜性,對應(yīng)分析作為多元統(tǒng)計分析的一個重要內(nèi)容,其核心思想是高維度空間的向量向低維度空間的投影,從而解釋變量間的相關(guān)關(guān)系及相關(guān)程度,有直觀、簡便、降低計算復(fù)雜性的優(yōu)點。自20世紀(jì)70年代傳入我國以來,被廣泛應(yīng)用于地質(zhì)、醫(yī)學(xué)、生物等各個領(lǐng)域。本文通過對應(yīng)分析探索西部大開發(fā)以來新疆農(nóng)村居民的消費情況。
2.1 原理介紹
對應(yīng)分析是R型因子分析與Q型因子分析的結(jié)合,它是利用降維的思想以達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的,不過,與因子分析不同的是,它同時對數(shù)據(jù)表中的行與列進(jìn)行處理,尋求以低維圖形表示數(shù)據(jù)表中行與列之間的關(guān)系。對應(yīng)分析的一大特點就是可以在一張二維圖上同時表示出兩類屬性變量的各種狀態(tài),以直觀、簡潔的形式描述屬性變量各種狀態(tài)之間的相關(guān)關(guān)系及不同屬性變量之間的相互關(guān)系[4]。它通過一個過渡矩陣Z將二者有機結(jié)合起來,具體說就是使含有n個樣品p個變量的原始資料矩陣X=(xij)n×p變成一個過渡矩陣Z=(zij)n×p,并使R=Z′Z(分析變量之間關(guān)系的協(xié)方差矩陣)與Q=ZZ′(分析樣品之間關(guān)系的協(xié)方差矩陣)具有相同的非零特征根,它們相應(yīng)的特征向量之間也有密切的關(guān)系。
對協(xié)方差矩陣R、Q進(jìn)行加權(quán)主成份分析或因子分析,分別能提取兩個最重要的公因子R1、R2和Q1、Q2。由于采用的是一種特殊變換方法,公因子R1與Q1在本質(zhì)上是相同的,公因子R2與Q2本質(zhì)上也是相同的,故可用Diml作為R1與Q1的統(tǒng)一標(biāo)志,Dim2作為R2與Q2的統(tǒng)一標(biāo)志,于是可將(R1,Q1)和(R2,Q2)兩組數(shù)據(jù)點在由(Dim1,Dim2)組成的同一坐標(biāo)系中作出因子平面點聚圖,即把變量點和樣品點同時反映在具有相同坐標(biāo)軸的因子平面上,以便對變量點和樣品點一起考慮進(jìn)行分類。
2.2 方法步驟
設(shè)xij表示第j個指標(biāo)的第i個樣品觀測,原始資料矩陣為:
(1)按行、列分別求和,得行和Xi·和列和X·j及總和X··。
(2)由原始矩陣X出發(fā)計算數(shù)據(jù)規(guī)格化的概率矩陣P及數(shù)據(jù)變換矩陣Z。
(4)因子分析
R型 計算協(xié)方差矩陣R=Z′Z的特征根λ1≥λ2≥…≥λp,一般按累計百分比(貢獻(xiàn)率)≥80%取前m個特征根,并計算對應(yīng)的特征向量u1,u2,…,um,得R型因子載荷矩陣:
Q型 對上述m個特征根λ1≥λ2≥…≥λm,計算對應(yīng)其矩陣Q=ZZ′的特征向量V1=ZU1, V2=ZU2,…,Vm=ZUm,再將特征向量單位化,得Q型因子載荷矩陣:
(5)在同一坐標(biāo)軸上作圖。由于R和Q具有相同的非零特征根,故相應(yīng)的因子貢獻(xiàn)率相同,R和Q這種對應(yīng)關(guān)系,使得變換后的數(shù)據(jù)對行和對列是對等的,因而可以對兩者對應(yīng)起來分析。在二維因子軸上作圖,將R的第一因子和第二因子及Q的第一因子和第二因子同時繪在同一坐標(biāo)軸上,即可揭示行因素的不同水平及列因素的不同水平間的對應(yīng)關(guān)系。
3對新疆農(nóng)村居民消費情況數(shù)據(jù)的對應(yīng)分析
根據(jù)數(shù)據(jù)的可得性與科學(xué)性,本文選取的是反映新疆農(nóng)村居民消費情況的8個指標(biāo)進(jìn)行考察:食品(X1)、衣著(X2)、居住(X3)、家庭設(shè)備、用品及服務(wù)(X4)、醫(yī)療保健(X5)、交通和通訊(X6)、文化教育娛樂用品及服務(wù)(X7)、其他商品和服務(wù)(X8)。資料來源于《新疆統(tǒng)計年鑒》(2000年-2009年)。由于目前最新的統(tǒng)計年鑒只能查到2008年的數(shù)據(jù),所以本文就研究新疆農(nóng)村居民過去9年的消費情況。
本文采用SPSS16.0統(tǒng)計軟件對九年的數(shù)據(jù)進(jìn)行分析[1,2],分析的步驟是首先在新疆農(nóng)村居民消費8項主要經(jīng)濟指標(biāo)中找出最能說明主要問題的因子成分,并根據(jù)不同權(quán)重的最后取值得分利用對應(yīng)分析的方法進(jìn)行分析。[3]
表1 2000年-2008年農(nóng)村居民消費情況
對表1進(jìn)行對應(yīng)分析,我們首先得到其慣量和χ2的分解,見下表:
表2 慣量和χ2的分解
由表2可知,前兩個公因子的累計貢獻(xiàn)率達(dá)到94.12%,解釋了原列聯(lián)表資料的大部分信息,因此兩個公因子表示的二維因子載荷圖可以基本表達(dá)消費與年份兩屬性變量間的關(guān)系,且第一個公因子的貢獻(xiàn)率已經(jīng)達(dá)到88.56%,以第一維度為主。從而可以得到年份因子和消費因子在這兩個公因子上的因子載荷與信息量,見表3和表4:
表3 消費因子(行因子)載荷與信息量
表4 年份因子(列因子)載荷與信息量
由表3可知,近年來,新疆農(nóng)村居民的消費主要集中在交通和通訊、其他商品和服務(wù)、食品上。表3和表4分別顯示了消費因子和年份因子在兩個公因子上的載荷,以表3中的食品為例,其結(jié)果可表示為:食品=-0.0826*Dim1-0.0158*Dim2。即在Dim1與Dim2作為縱坐標(biāo)與橫坐標(biāo)的直角坐標(biāo)系中,每一種消費就是一個點,如食品的坐標(biāo)為(-0.0826,-0.0158)。且消費與年份的平面聚合圖如下圖所示:
圖1 消費與年份的平面聚合圖
在Dim1*Dim2的圖表中,表示年的這些點用年數(shù)減去2000得到的單個數(shù)字標(biāo)圖,表示消費指標(biāo)的這些點按表1中的順序依次表示為F、C、R、S、H、T、E、Q。由圖1可以看出,從2000年到2008年,新疆農(nóng)村居民在家庭設(shè)備、用品及服務(wù)、居住、醫(yī)療保健、交通和通訊方面的消費上升的較快,尤其以交通和通訊方面的消費增長最為明顯;而在食品、衣著、文化教育娛樂用品及服務(wù)、其他商品和服務(wù)方面的消費增長不是很明顯,其中文化教育娛樂用品及服務(wù)、其他商品和服務(wù)方面的消費近乎零增長。
總結(jié)上面的分析結(jié)果,可以看出新疆農(nóng)村居民的生活消費支出結(jié)構(gòu)是存在一定差異的。本文用對應(yīng)分析的方法得出的結(jié)論與實際情況基本符合,要得出更加理想的結(jié)論,需要對數(shù)據(jù)進(jìn)一步挖掘。不過,以上結(jié)論大體上得出了較滿意的探索性結(jié)果,由此可看到對應(yīng)分析在統(tǒng)計數(shù)據(jù)分析應(yīng)用中的獨特魅力。
[1]陶鳳梅等編著.對應(yīng)分析數(shù)學(xué)模型及其應(yīng)用[M].北京:科學(xué)出版社,2008:1-40.
[2]高惠璇等編譯.SAS系統(tǒng)SAS/Stat軟件使用手冊[M].北京:中國統(tǒng)計出版社,1997:427-457.
[3]張鐵軍,周曉明等.對應(yīng)分析在分子流行病學(xué)基因分型中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2006,23(2):101-103.
[4]何曉群編著.多元統(tǒng)計分析[M].中國人民大學(xué)出版社,2007:195-219.
(責(zé)任編輯:代琴)
O212.4
A
1671-6469-(2010)04-0045-04