摘要:文章主要依據(jù)2006年的統(tǒng)計年鑒數(shù)據(jù),針對2005年全國31個省市自治區(qū)直轄市(除港澳臺地區(qū)外)的23個主要經(jīng)濟發(fā)展指標。運用因子分析方法得出三個意義較為明確的公因子。然后運用聚類分析方法得到各地區(qū)經(jīng)濟發(fā)展層次分布狀況,運用判別分析方法進行分析評價,并根據(jù)分析結(jié)果,結(jié)合實際情況對其根本原因進行了探討。
關(guān)鍵詞:因子分析;聚類分析;判別分析:經(jīng)濟發(fā)展
一、引言
當今社會是一個信息爆炸的時代,社會中存在多種不確定性,所以要正確使用數(shù)據(jù)分析方法進行數(shù)據(jù)分析,有效提取信息是生活中決策的關(guān)鍵。我國經(jīng)濟發(fā)展水平是大家都很關(guān)心的問題,它關(guān)系到人民的生活水平,社會的發(fā)展程度以及國家的綜合國力,因此研究我國各地區(qū)的經(jīng)濟發(fā)展水平非常有必要。
因子分析、聚類分析和判別分析是多元統(tǒng)計分析中三個重要的分析方法。本文針對2005年全國31個省市自治區(qū)直轄市(除港澳臺地區(qū)外)的主要經(jīng)濟發(fā)展指標,先后運用因子分析方法、聚類分析方法和判別分析方法,進行分析評價。
二、文獻綜述
目前,針對區(qū)域經(jīng)濟的研究很多,隨著研究地不斷深入,越來越多的定量方法被引入進來。吳玉鳴在采用因子分析法對我國31個行政區(qū)劃的第三產(chǎn)業(yè)綜合發(fā)展水平進行了評估,提出實施第三產(chǎn)業(yè)非均衡協(xié)調(diào)發(fā)展戰(zhàn)略。梁曉俐對全國30個行政區(qū)劃的經(jīng)濟發(fā)展水平進行了主成分分析,根據(jù)因子加權(quán)綜合得分進行分類排序,得到全國的經(jīng)濟發(fā)展水平總體上呈現(xiàn)東高西低的地域分布。這幾篇文章都只是對各地區(qū)經(jīng)濟發(fā)展水平進行了排序,并沒有很好地進行分類,不利于看出各個地區(qū)經(jīng)濟發(fā)展的快慢情況。陳佳、吳潤衡、劉喜波先后運用因子分析方法和聚類分析方法針對2004年全國31個省市自治區(qū)直轄市(除港澳臺地區(qū)外)的26個主要經(jīng)濟發(fā)展指標進行分析評價。王維、李仕明、肖磊先后運用因子分析方法和聚類分析方法,對全國31個省、市、自治區(qū)的地區(qū)經(jīng)濟發(fā)展水平進行動態(tài)分析。這幾篇文獻使用的數(shù)據(jù)都已經(jīng)比較陳舊,不能反映近幾年的經(jīng)濟發(fā)展。為了彌補以上不足,本文對全國2006年的經(jīng)濟數(shù)據(jù)進行分析,首先對所選的經(jīng)濟指標做因子分析,科學(xué)有效地縮減指標規(guī)模,得出三個意義較為明確的公共因子,再用聚類分析方法,得到各地區(qū)經(jīng)濟發(fā)展層次分布狀況,最后用判別分析方法看所選方法的判斷準確性。
三、樣本數(shù)據(jù)
本文選取了2005年全國地區(qū)23個主要經(jīng)濟發(fā)展指標(數(shù)據(jù)來源:《中國國家統(tǒng)計年鑒2006》):年底人口數(shù)(萬人);就業(yè)人員(萬人);職工人數(shù)(萬人);地區(qū)生產(chǎn)總值(億元);人均地區(qū)生產(chǎn)總值(元);商品房銷售額(萬元);竣工房屋面積(萬平方米);房屋住宅銷售面積(萬平方米);職工平均工資(元);旅游外匯收入(百萬美元);社會消費品零售總額(億元);各地區(qū)貨物周轉(zhuǎn)量(億噸公里);各地區(qū)貨運量(萬噸);各地區(qū)客運量(萬人);城鎮(zhèn)居民平均每人全年總收入(元);農(nóng)村居民平均每人全年總收入(元);城鎮(zhèn)居民全年最終消費支出(億元);農(nóng)村居民全年最終消費支出(億元);城鎮(zhèn)固定資產(chǎn)投資(億元);外商投資總額(億美元);稅金總額(萬元);利潤總額(億元);工業(yè)增加值(億元)。
四、統(tǒng)計分析
本文采用SPSS11.5進行統(tǒng)計分析。
(一)對原始數(shù)據(jù)的因子分析和主成分分析
1、KMO檢驗與Bartlett球度檢驗(見表1)。KOM值是用于比較觀測相關(guān)系數(shù)值與偏相關(guān)系數(shù)值的一個指標,其值越逼近于1,表示對這些變量進行因子分析的效果越好。本樣本的KOM值為0.792,適合因子分析,而且可以得到比較滿意的結(jié)果。而且,Bartlett球度檢驗的顯著性概率為0.000小于顯著性水平0.05,也說明適合因子分析。
c2d435552210947a53af4e7bc50c66fc
2、旋轉(zhuǎn)后的因子載荷矩陣。利用SPSS提取了三個因子,因為未經(jīng)旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上都有較高的載荷,為了使因子更具直觀含義,所以運用方差極大法對因子載荷矩陣旋轉(zhuǎn)。因子1包括年底人口數(shù)、就業(yè)人員、職工人數(shù)、地區(qū)生產(chǎn)總值、房屋住宅銷售面積、社會消費品零售總額、各地區(qū)貨運量、各地區(qū)客運量、城鎮(zhèn)居民全年最終消費支出、農(nóng)民居民全年最終消費支出、城鎮(zhèn)固定資產(chǎn)投資、利潤總額和工業(yè)增加值,主要反映經(jīng)濟總量和人民生活水平,所以可以命名為經(jīng)濟總量因子;因子2包括人均地區(qū)生產(chǎn)總值、商品房銷售額、竣工房屋面積、職工平均工資旅游外匯收入、城鎮(zhèn)居民平均每人全年總收入、農(nóng)村居民平均每人全年總收入、外商投資總額和稅金總額,反映的是全社會各方面收入情況,可以命名為收入因子;因子3只有各地區(qū)貨物周轉(zhuǎn)量這一個變量,這個變量對于我國經(jīng)濟發(fā)展具有重要作用,所以可以命名為經(jīng)濟發(fā)展因子。
3、因子得分函數(shù)。根據(jù)因子得分矩陣,可以得到因子得分函數(shù):
(二)對綜合得分數(shù)據(jù)的聚類分析
對全國各地區(qū)經(jīng)濟發(fā)展水平進行3-6類的聚類分析,類間距離為類間平均鏈鎖法,樣本間距離為歐式距離平方法。通過對比發(fā)現(xiàn)分為四類是比較恰當?shù)?,能夠體現(xiàn)各省市經(jīng)濟發(fā)展的快慢情況。分成四類時:北京和上海屬于第一類;江蘇、浙江和山東屬于第三類;廣東屬于第四類;其他屬于第二類。我們分析不同類的地區(qū)時同樣采用指標平均值。
通過分析各類均值結(jié)果,可以得出各類地區(qū)所選取的經(jīng)濟指標方面發(fā)展的水平情況,綜合分析就可得出各類地區(qū)的發(fā)展水平。
(三)對各類進行判別分析
因為本身所選的樣品就比較少,所以沒有從中抽調(diào)一些分析,這樣我們可以用交互驗證的方法來判別聚類效果優(yōu)劣(見表2)。
表2顯示了交互驗證結(jié)果??梢钥吹皆撆袆e函數(shù)的準確率為100%,交互驗證的結(jié)果和自身驗證的結(jié)果完全相同,因此該判別函數(shù)是較為穩(wěn)定的。
五、結(jié)論
應(yīng)該說本文的分析結(jié)果對于宏觀地考察地區(qū)經(jīng)濟發(fā)展狀況以及對各地區(qū)制定和調(diào)整經(jīng)濟發(fā)展戰(zhàn)略是具有一定的實際意義的。
從因子分析的結(jié)果來看,因子l包含了全部信息的65.136%,這說明我國經(jīng)濟的發(fā)展主要是經(jīng)濟總量的增長。
以下幾個問題值得我們注意:城鎮(zhèn)固定資產(chǎn)投資額的載荷較高,所以投資熱問題是我們一直比較關(guān)注的;人口因素的載荷也是比較高,說明人口因素在中國經(jīng)濟增長中所起的作用不容忽視;交通運輸量相關(guān)指標的載荷很大,這說明交通在經(jīng)濟發(fā)展中起了很重要的作用,而且從目前來看,各個城市都比較重視交通的發(fā)展。
因子2反映了一個我們現(xiàn)在比較關(guān)注的問題——城鄉(xiāng)差距問題。此外,商品房和住房指標的載荷也很突出,說明2005年我國的房地產(chǎn)業(yè)的發(fā)展非常突出,從目前的形式來看,房地產(chǎn)仍然是非常熱門的。
從聚類分析的結(jié)果,可以得出如下結(jié)論:2005年,經(jīng)濟發(fā)展最快的省份是廣東;其次是江蘇、浙江、山東三??;發(fā)展中等的是北京、上海;其他省份發(fā)展相對比較慢。
從判別分析的結(jié)果來看,以上分類的結(jié)果是比較理想的。
盡管以上分析只是就2005年我國經(jīng)濟發(fā)展水平的評價,但是卻可以從中發(fā)現(xiàn)長期以來我國經(jīng)濟的一些優(yōu)勢和存在的一些問題,也可以看出一些我國經(jīng)濟的未來發(fā)展趨勢。
由于查找的數(shù)據(jù)有限,數(shù)據(jù)雖比之前研究的文獻新,但相對來說也不是最新的,所以有待以后用更新更多的數(shù)據(jù)進行分