国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

各城市消費水平差異層次聚類及因子分析

2017-05-13 01:24:25凌標(biāo)燦魏洪霞
華北科技學(xué)院學(xué)報 2017年1期
關(guān)鍵詞:消費水平對話框特征值

凌標(biāo)燦,魏洪霞

(華北科技學(xué)院 研究生院,北京 東燕郊 101601)

各城市消費水平差異層次聚類及因子分析

凌標(biāo)燦,魏洪霞

(華北科技學(xué)院 研究生院,北京 東燕郊 101601)

隨著經(jīng)濟的快速發(fā)展,我國各城市消費水平存在明顯差異,且差異一直在發(fā)生變化。消費水平涉及到多個因素,為了便于比較,使分析簡潔直觀,本文先后采用聚類分析和因子分析的方法進行研究。本文首先介紹聚類分析和因子分析的基本知識,其次將分析數(shù)據(jù)全國各地區(qū)的人均消費支出錄入到spss,進行聚類分析,將31個地區(qū)分為三類;再次進行因子分析對其消費水平進行排名。最后對運行結(jié)果進行分析。分析各城市消費水平差異的主要影響因素以及差異的變化趨勢。

人均消費水平;聚類分析;因子分析

1 聚類及因子分析理論

聚類分析的實質(zhì)是建立一種分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們在性質(zhì)上的親密程度在沒有先驗知識的情況下自動進行分類。聚類分析包括對對個案的聚類分析和對變量的聚類分析。聚類分析的方法,主要有兩種,一種是“快速聚類分析方法”,另一種是“層次聚類分析方法”[1]。

層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對象結(jié)合在一起,以逐次聚合的方式,它將觀察值分類,直到最后所有樣本都聚成一類。層次聚類分析有兩種形式,一種是對樣本(個案)進行分類,稱為Q型聚類,它使具有共同特點的樣本聚齊在一起,以便對不同類的樣本進行分析;另一種是對研究對象的觀察變量進行分類,稱為R型聚類。它使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)[2]。

本論文采用層次聚類的Q型聚類,對個案進行聚類分析。

因子分析的基本思想是根據(jù)相關(guān)性大小把原始變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,而不同組的變量間的相關(guān)性則較低。每組變量代表一個基本結(jié)構(gòu),并用一個不可觀測的綜合變量表示,這個基本結(jié)構(gòu)就稱為公共因子[3]。

因子分析模型在形式上和多元回歸模型相似,每個觀測變量由一組因子的線性組合來表示。設(shè)有p觀測變量,其可觀測隨機向量X=(X1,X2,…,Xp)為零均值、單位方差的標(biāo)準(zhǔn)化向量,即均值向量E(X)=0,協(xié)方差陣Cov(X)=∑,且協(xié)方差陣∑與相關(guān)矩陣R相等。因子分析模型的一般表達(dá)形式為[4]

X=AF+E

(1)

xi=ai1fi1+ai2fi2+…+aimfum+ei

(2)

因子分析可以分為確定因子載荷,因子旋轉(zhuǎn)及計算因子得分三個步驟。

2 分析資料

本論文分析的資料如下表1,2014年全國各地區(qū)人均消費支出情況,根據(jù)對此表的分析觀察各地區(qū)的消費水平差異。

表1 2014年全國居民分地區(qū)人均消費支出 單位:元

數(shù)據(jù)來源國家統(tǒng)計局2015年。

分析資料中有八個消費因子,x1——食品煙酒,x2——衣著,x3——居住,x4——生活用品,x5——交通通信,x6——教育文化娛樂,x7——醫(yī)療保健,x8——其他用品及服務(wù)。將數(shù)據(jù)錄入到spss。

3 分析過程

3.1 聚類分析

在主菜單欄中選擇分析—分類—系統(tǒng)聚類命令,打開對話框,將x1,x2…x8作為變量,因為本論文選擇分層聚類中Q型聚類分析的方法,所以在對話框中選擇個案,其余為默認(rèn)值;計劃將31個地區(qū)分為三類,所以在統(tǒng)計量對話框中選擇單一方案,聚類數(shù)為3;在繪制對話框中選中樹形圖,其余為默認(rèn)值;在方法對話框中,選擇組間連接,區(qū)間選擇平方Euclidean距離;在保存對話框中單一方案聚類數(shù)也為3。

3.2 運行結(jié)果分析

根據(jù)表2,本論文將案例分為三組,第二列表示每個案例所屬于的組數(shù)。案例1和9即北京和上海屬于第一類,消費水平高;案例2,10,11,13,19,即天津,江蘇,浙江,福建,廣東屬于第二類,消費水平相對中等;3,4,5,,6,7,8,12,14,15,16,17,18,20-31,即河北山西,內(nèi)蒙古,遼寧,吉林,黑龍江,安徽,江西,山東,河南,湖北,湖南,廣西,海南,重慶,四川,貴州,云南,西藏,陜西,甘肅,青海,寧夏,新疆屬于第三類,消費水平相對較低。

表2 群集成員

圖1為分層聚類分析的冰柱圖,觀察冰柱圖從最后一行開始。當(dāng)聚成30類時,7和8為一類,即吉林和黑龍江為一類,其他自成一類;當(dāng)聚成25類時,25和28為一類,14和12為一類,18和17為一類,27、8和7 為一類,其他的各為一類。以此類推,直至所有觀察個案全部聚成一類。當(dāng)聚成三類時,如圖中的虛線所示,案例1和9即北京和上海屬于第一類;案例2,10,11,13,19,即天津,江蘇,浙江,福建,廣東屬于第二類;3,4,5,,6,7,8,12,14,15,16,17,18,20-31,即河北山西,內(nèi)蒙古,遼寧,吉林,黑龍江,安徽,江西,山東,河南,湖北,湖南,廣西,海南,重慶,四川,貴州,云南,西藏,陜西,甘肅,青海,寧夏,新疆屬于第三類。同上表結(jié)論一致。

圖1 冰柱圖

圖2樹形圖以躺倒樹的形式展現(xiàn)了聚類分析中的每一次類合并的情況。SPSS自動將各類間的距離映射在0~25之間,并將聚類過程近似地表示在圖上[5]。觀察樹狀圖,當(dāng)分為兩類時,1和9一類,剩下的為一類。如圖2中虛線所示,將其分為三類時,案例1和9即北京和上海屬于第一類;案例2,10,11,13,19即天津,江蘇,浙江,福建,廣東屬于第二類;3,4,5, 6,7,8,12,14,15,16,17,18,20-31即河北山西,內(nèi)蒙古,遼寧,吉林,黑龍江,安徽,江西,山東,河南,湖北,湖南,廣西,海南,重慶,四川,貴州,云南,西藏,陜西,甘肅,青海,寧夏,新疆屬于第三類。同上結(jié)論一致。

圖2 樹狀圖

3.3 因子分析

在主菜單欄中選擇分析—降維—因子分析命令,打開對話框,將x1,x2...x8作為變量,在描述統(tǒng)計對話框中選擇系數(shù),顯著性水平,KMO和Bartlett的球形度檢驗;在抽取對話框中方法選擇主成份,選中碎石圖,特征值設(shè)為0.4,其余為默認(rèn)值;在旋轉(zhuǎn)對話框中選擇最大方差法;在得分對話框中選中保存為變量,顯示因子得分系數(shù)矩陣。

3.4 運行結(jié)果分析

表3 相關(guān)矩陣

變量之間的相關(guān)系數(shù)較大,都在0.655以上,說明這變量存在較為顯著的相關(guān)性,也說明有進行因子分析的必要。

表4 KMO和Bartlett的檢驗

KMO(Kaiser-Meyer-Olkin)檢驗統(tǒng)計量是用于比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的。

KMO統(tǒng)計量是取值在0和1之間。當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平方和時,KMO值接近1.KMO值越接近于1,意味著變量間的相關(guān)性越強,原有變量越適合作因子分析;當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和接近0時,KMO值接近0.KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。

Kaiser給出了常用的KMO度量標(biāo)準(zhǔn): 0.9 以上表示非常適合;0.8 表示適合;0.7 表示一般;0.6表示不太適合;0.5 以下表示極不適合。

Bartlett球度檢驗:巴特利特球度檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對應(yīng)的相伴概率值小于用戶心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣不可能是單位陣,即原始變量之間存在相關(guān)性,適合于做主成份分析;相反,如果該統(tǒng)計量比較小,且其相對應(yīng)的相伴概率大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不宜于做因子分析[6]。

本論文KMO值文為0.848,所以適合作因子分子;球形度檢驗顯著性值為0,也說明適合作因子分析。

表5 解釋的總方差

表5中,合計表示特征值,特征值的大小反應(yīng)公因子方差貢獻(xiàn),方差的%為特征值占方差的百分?jǐn)?shù),累計%為特征值占方差百分?jǐn)?shù)的累加值,根據(jù)特征值大于0.4的原則提取2個因子的特征值、占方差百分?jǐn)?shù)及其累加值。這兩個因子解釋的方差占總方差的91.774%,能比較全面的反映所有信息,旋轉(zhuǎn)平方和載入欄為旋轉(zhuǎn)因子矩陣后的2個因子的特征值、占方差百分?jǐn)?shù)及其累加值。

圖3為碎石圖,橫坐標(biāo)為因子序號,縱坐標(biāo)為各因子對應(yīng)的特征值。在圖中根據(jù)因子序號和對應(yīng)特征值描點,然后用直線連接,即為碎石圖。根據(jù)點間連接坡度的陡緩程度,從碎石圖中可以比較清楚地看出因子的重要程度。比較陡的直線說明直線斷點對應(yīng)的因子的特征值較大,比較緩的直線則對應(yīng)較小的特征值差值[7]。從圖中可以看出,因子1和2之間連線的坡度相對較陡,說明前2個因子是主要因子,這和表中的結(jié)論是一致的。

圖3 碎石圖

變量旋轉(zhuǎn)成分成份成分得分系數(shù)矩陣1212x1916312576-479x2373887-494780x3854457377-233x4739596134056x5768542214-042x6750587153033x7463829-354620x8768600158033提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。

旋轉(zhuǎn)后的成份矩陣與成份矩陣相比,更好地對主因子進行解釋。旋轉(zhuǎn)后的因子負(fù)荷矩陣兩端集中,能更好地解釋主因子。從表中可以看出,第一個因子與x1,x3關(guān)系緊密,第二個因子與x2,x7關(guān)系密切。

根據(jù)成分得分系數(shù)矩陣,

F1=0.576x1-0.494x2+0.377x3+0.134x4+0.153x6-0.354x7+0.158x8

F2=-0.479x1+0.78x2-0.233x3+0.056x4-0.042x5+0.033x6+0.62x7+0.033x8

由此可計算得到公共因子得分F1、F2。

使用因子分析法計算綜合得分,以旋轉(zhuǎn)后各公共因子的方差貢獻(xiàn)率作為權(quán)數(shù),與各公共因子相乘得到綜合評價分?jǐn)?shù)。該計算公式為[8]

F=(52.599F1+39.175F2)/91.774

(3)

根據(jù)公式(3),算出綜合得分,在進行排名,結(jié)果如下表7。

表7 各地區(qū)消費水平綜合得分和排名

排在前兩名的是上海和北京,然后是天津,浙江,江蘇,廣東,福建,再其次是其他城市。因子分析所得各地區(qū)消費水平排名結(jié)果與上文聚類分析分類結(jié)果一致。但聚類分析只能分成幾種類別,而因子分析更加精確,將消費水平進行綜合排名,結(jié)果清晰一目了然。

4 結(jié)論

從因子成分旋轉(zhuǎn)矩陣表6可見,第一公共因子在食品煙酒,居住,生活用品及服務(wù),交通通信,教育文化娛樂和其他幾個方面有較大的載荷,我們可以把因子命名為綜合消費因子,因為其綜合反映了五個消費項目的情況,從載荷系數(shù)的絕對值大小來看,我國各地區(qū)消費水平差異從大到小為食品煙酒,居住,交通通信,其他用品及服務(wù),教育文化娛樂,生活用品及服務(wù)。而從因子載荷系數(shù)符號來看,均大于零,說明各城市之間差異趨于上升趨勢,說明我國各地區(qū)消費水平差異越來越大。

第二公因子在衣著和醫(yī)療保健有較大的載荷,我們可以將其命名為衣著及醫(yī)療消費因子,衣著消費水平差異較大,醫(yī)療保健消費水平差異較小,且差異越來越大。

第一個公因子(綜合消費因子)對原始變量的方差貢獻(xiàn)率為52.599%,是造成各地區(qū)消費水平的差異的主要因素,第二個公因子(衣著及醫(yī)療消費因子)對原始變量的方差貢獻(xiàn)率為39.175%,是造成各城市消費水平差異的次要因素。

從各地區(qū)消費水平綜合得分和排名表中可以看出上海,北京,天津,浙江,江蘇,廣東,福建,內(nèi)蒙古,遼寧綜合得分大于零,其余的城市綜合得分小于零,說明上海,北京,天津,浙江,江蘇,廣東,福建,內(nèi)蒙古,遼寧消費水平相對較高,其余的城市的消費水平較低。且按排名消費水平呈越來越低的趨勢。

從分析結(jié)果可以得到,地區(qū)消費存在較大的差異,且差異依然呈增長趨勢,所以國家應(yīng)通過相關(guān)政策縮小消費差距,而消費水平的差異與收入有很大關(guān)系,應(yīng)避免貧富差距太大,以免對經(jīng)濟及社會造成不良影響。

因此,從長期看,國家各省市的收入差異應(yīng)呈縮小趨勢。

[1] 宋志剛,等. spss16實用教程[M]. 人民郵電出版社,2008:209-210.

[2] 李玉光,等. spss19.0統(tǒng)計分析入門與提高[M]. 北京:清華大學(xué)出版社,2014:261-318.

[3] 白云杰. 山西煤礦安全因子分析評價及對策研究[D]. 太原理工大學(xué),2010.

[4] 李圣梅. 因子分析在企業(yè)綜合經(jīng)濟效益評價中的應(yīng)用[J]. 企業(yè)管理,2005.

[5] 陶曉華. 聚類分析在企業(yè)固定資產(chǎn)管理中的應(yīng)用[D]. 山東師范大學(xué),2008.

[6] 鄧菲. 因子分析在我國城鎮(zhèn)居民消費結(jié)構(gòu)變動的應(yīng)用[J]. 科技經(jīng)濟市場,2008:45-46.

[7] 方集. 基于因子分析法的品牌定位測評模型構(gòu)建及實證研究[D]. 重慶:重慶大學(xué),2005.

[8] 姜永明,等. 基于因子分析法的管道外腐蝕因素分析與評價[J]. 油氣儲運,2010(8):605-608 .

Hierarchical cluster analysis and factor analysis of difference ofthe consumptive level in different cities

LING Biao-can,WEI Hong-xia

(GraduateSchool,NorthChinaInstituteofScienceandTechnology,Yanjiao, 101601,China)

With the rapid development of economy, there are obvious differences in the consumption level of all cities in China, and the difference is always changing. Consumption level involves many factors, in order to facilitate comparison, so that the analysis is simple and intuitive, this paper has used the method of cluster analysis and factor analysis.This paper first introduces the basic knowledge of cluster analysis and factor analysis, the analysis of the per capita consumption expenditure data of various regions of the country to SPSS, the first cluster analysis, 31 regions will be divided into three categories; then the factor analysis to rank their consumption level. Finally the operation results are analyzed.The main influencing factors and the changing trend of the difference of consumption level.

Per capita consumption level; cluster analysis; factor analysis

2017-01-09

魏洪霞(1993-),女,河北秦皇島人,華北科技學(xué)院在讀碩士研究生,研究方向:安全工程。E-mail:386294494@qq.com

F126.1

A

1672-7169(2017)01-0110-07

猜你喜歡
消費水平對話框特征值
我國體育產(chǎn)業(yè)發(fā)展對城鄉(xiāng)居民消費溢出效應(yīng)的作用及優(yōu)化
預(yù)計到2050年中國城鄉(xiāng)消費水平將無明顯差距
一類帶強制位勢的p-Laplace特征值問題
單圈圖關(guān)聯(lián)矩陣的特征值
中國人均消費世界排名與增長預(yù)測研究
——基于指數(shù)增長模型
正常恢復(fù)虛擬機
Bootlace Worms’Secret etc.
我國人均消費水平影響因素分析
基于商奇異值分解的一類二次特征值反問題
關(guān)于兩個M-矩陣Hadamard積的特征值的新估計
砚山县| 双鸭山市| 疏附县| 鸡东县| 富蕴县| 岳西县| 天柱县| 建湖县| 措美县| 朝阳市| 布拖县| 花莲市| 大洼县| 武平县| 镇江市| 安图县| 常山县| 东乌珠穆沁旗| 隆昌县| 清远市| 陆丰市| 苍梧县| 淮北市| 汉沽区| 温泉县| 南澳县| 新巴尔虎右旗| 永春县| 吉木萨尔县| 阿拉善右旗| 北宁市| 泌阳县| 凉山| 大宁县| 稻城县| 明水县| 文山县| 温泉县| 弥渡县| 临高县| 商河县|