?
SPSS的聚類分析在經(jīng)濟(jì)地理中的應(yīng)用
1引語
經(jīng)濟(jì)地理研究中,經(jīng)常需要對所研究的區(qū)域進(jìn)行經(jīng)濟(jì)區(qū)劃分,以便進(jìn)行分類指導(dǎo)。如何進(jìn)行經(jīng)濟(jì)區(qū)劃分呢?利用世界上著名的統(tǒng)計軟件SPSS(Statistical Program for Social Science)的聚類分析功能,效果相對比較理想。聚類分析法是理想的多變量統(tǒng)計技術(shù),主要有分層聚類法和迭代聚類法(蘇金明,2000)。聚類分析也稱群分析是研究分類的一種多元統(tǒng)計方法。它的基本原理是:首先講一定數(shù)量的樣品(或指標(biāo))各自看成一類,然后根據(jù)樣品(或指標(biāo))的親疏程度,將親密程度最高的兩類進(jìn)行合并;然后考慮合并后的類與其他類之間的親疏程度,再進(jìn)行合并;重復(fù)這一過程,直至將所有的樣品(或指標(biāo))合并為一類。
對貴州省各州市的9個地區(qū)(貴陽、遵義、安順、黔南、黔東南、銅仁、畢節(jié)、六盤水、黔西南)進(jìn)行經(jīng)濟(jì)區(qū)劃分,就利用了SPSS的聚類分析功能。
2建立指標(biāo)體系
2.1確定分類指標(biāo)
進(jìn)行經(jīng)濟(jì)區(qū)劃分,應(yīng)考慮的指標(biāo)因素很多的。既要以經(jīng)濟(jì)因素為主,又要考慮自然因素和社會因素;既要有直接指標(biāo),又要有間接指標(biāo);既要有影響經(jīng)濟(jì)因素的指標(biāo),又要有經(jīng)濟(jì)現(xiàn)象引起的指標(biāo);既要考慮經(jīng)濟(jì)發(fā)展的現(xiàn)狀,又要考慮經(jīng)濟(jì)發(fā)展的過程和經(jīng)濟(jì)發(fā)展的未來方向;既要有可以查閱到或計算出確切數(shù)據(jù)的指標(biāo),又要有無確切數(shù)據(jù)的指標(biāo)。
參考有關(guān)資料,我確定了對貴州省各地區(qū)進(jìn)行經(jīng)濟(jì)區(qū)劃分的指標(biāo)。有確切數(shù)據(jù)的指標(biāo)如表1所示,無確切的數(shù)據(jù)的指標(biāo)有煤炭資源、油氣資源、建材資源和區(qū)位商貿(mào)。
表1 經(jīng)濟(jì)區(qū)劃分指標(biāo)
2.2填充指標(biāo)數(shù)據(jù)
參照《貴州省統(tǒng)計年鑒》2011卷、《貴州省水資源公報》等書,查得或計算出表1各具體指標(biāo)的數(shù)據(jù)如表2所示。
表2 貴州省各州市的9個地區(qū)經(jīng)濟(jì)區(qū)劃分的指標(biāo)數(shù)據(jù)(數(shù)據(jù)單位見表1)
2.3轉(zhuǎn)換指標(biāo)數(shù)據(jù)
由于不同變量之間存在不同量綱、不同數(shù)量級,為使各個變量更具有可比性,有必要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換。目前進(jìn)行數(shù)據(jù)處理的方法大致有三種,即標(biāo)準(zhǔn)化、極差標(biāo)準(zhǔn)化和正規(guī)化。為便于更直觀的比較各市之間同一指標(biāo)的數(shù)值大小,采用了正規(guī)化轉(zhuǎn)換方式(張?zhí)K江,2003)。其計算公式為:
公式中Xi為正規(guī)劃后的值,Xi為原值,Xmax為最大值,Xmin為最小值。
進(jìn)行正規(guī)化轉(zhuǎn)換后,0≦Xi≦1。另外,對9個地區(qū)的煤炭資源、油氣資源、建材資源和區(qū)位商貿(mào)等指標(biāo)也根據(jù)實際情況采用專家打分法,給出一個介于0-1的數(shù)。所有參與聚類分析的指標(biāo)數(shù)據(jù)見表3。
表3 貴州省各州市的9個地區(qū)經(jīng)濟(jì)區(qū)的聚類分析數(shù)據(jù)
說明:1.表中數(shù)據(jù)保留四位小叔;2.小數(shù)點前面的0省略。
3聚類分析
根據(jù)表3數(shù)據(jù),利用統(tǒng)計分析軟件SPSS對貴州省各州市的9個地區(qū)進(jìn)行聚類分析,得出如下結(jié)果,包括表4、5、6和圖1。
3.1解析表1
表4 聚類分析聚結(jié)表
說明:合并前的個案從1-9依次表示貴陽、遵義、安順、黔南、黔東南、銅仁、畢節(jié)、六盤水、黔西南
3.1.1聚類步驟。從1-9表示聚類的先后順序。
3.1.2個案合并。表示在某步中合并的個案,如第一步中個案6銅仁和個案9黔西南合并,合并以后用第一項的個案號表示生成的新類。
3.1.3相似系數(shù)。根據(jù)聚類分析的基本原理,個案之間親密程度最高即相似系數(shù)最接近1的,最先合并。因此該列中的系數(shù)與第一列的聚類步驟相對應(yīng),系數(shù)值從小到大排列。
3.1.4新類首次出現(xiàn)的步驟。對應(yīng)于各聚類步驟參與合并的兩項中,如果有一個是新生的類,則在對應(yīng)列中顯示出該新類在哪一步第一次生成。如第四步中該欄第一列顯示值為2,表示進(jìn)行合并的兩項中第一項是在第二步第一次生成的新類。如果值為0,則表示對應(yīng)項還是個案。
3.2解析表2
表5聚類分析水平冰柱圖表
表4中,如果個案或新類在第n步合并,則表5中倒數(shù)第n步及以前合并項對應(yīng)行之間的行中用X充填,沒有空格。例如表4中第一步為個案6和個案9合并,則表5中對應(yīng)于第8步,個案6和個案9對應(yīng)的行之間在第8步及以前用X充填。表4中第二步為個案4和個案5合并,則表5中對應(yīng)于第7步,這兩個個案對應(yīng)的行之間在第7步及以前用X充填。如此繼續(xù)下去,直至所有個案在最后一步聚為一類。
3.3解析圖1
圖1 貴州地區(qū)9市經(jīng)濟(jì)區(qū)域劃分聚類樹狀圖
圖1 清晰地表示了聚類的全過程。它將實際距離按比例0-25的范圍內(nèi),用逐級連線的方式連結(jié)性質(zhì)相近的個案或新類,直至并為一類(張文彤,2002)。在該圖上部的距離標(biāo)尺上根據(jù)需要選定一個劃分類的距離值,然后垂直標(biāo)尺劃線,該垂線將于水平連線相交,則相交的交點數(shù)即為分類的類別數(shù),相交水平連線所對應(yīng)的個案聚成一類。例如,選標(biāo)尺值為10,則所有個案分為4類,即銅仁、黔西南、黔南、黔東南為一類,安順和六盤水為一類,遵義和畢節(jié)為一類,貴陽為一類。若選標(biāo)尺值為20,則聚為兩類,貴陽為一類,其余為一類。
4結(jié)論
對貴州各市州進(jìn)行經(jīng)濟(jì)區(qū)劃分,究竟化為幾個區(qū)合適,既不是越多越好,也不是越少越好,劃分經(jīng)濟(jì)區(qū)的目的,就是要根據(jù)經(jīng)濟(jì)區(qū)特點的不同,分類指導(dǎo)經(jīng)濟(jì)活動,使人們的經(jīng)濟(jì)活動更加符合當(dāng)?shù)氐膶嶋H,使各經(jīng)濟(jì)區(qū)能充分發(fā)揮各自自然、經(jīng)濟(jì)、社會等方面的優(yōu)勢,做到揚長避短,趨利避害,達(dá)到投入少、產(chǎn)出多,創(chuàng)造良好的經(jīng)濟(jì)效益和社會效益的目的,分區(qū)太多,就失去了分區(qū)的意義,分區(qū)太少,則分類指導(dǎo)很難做到有的放矢。綜合,我認(rèn)為分為四類比較合適。
從聚類分析中看出,銅仁和黔西南相似系數(shù)最大,最早聚合,明顯是一類,遵義和畢節(jié)相似系數(shù)較大,劃為一類;安順和六盤水歸為一類,黔南和黔東南地理位置就靠近,相似系數(shù)較大,作為一類,銅仁和黔西南聚為一類后又與黔南黔東南聚為一類的新類再聚為一類,9個市中,貴陽最為特殊,從經(jīng)濟(jì)發(fā)展水平、發(fā)展速度、產(chǎn)業(yè)結(jié)構(gòu)等各方面都與其他市區(qū)別很大,難以成為一類。因此,我們單獨把貴陽化為一類。根據(jù)以上的分析,把貴州省9個市州的經(jīng)濟(jì)區(qū)劃分概括成表6。
表6 貴州省經(jīng)濟(jì)區(qū)劃分
參考文獻(xiàn):
[1]蘇金明,傅榮華,周建斌,張蓮花.統(tǒng)計軟件SPSS for Windows 實用指南[M].武漢;電子工業(yè)出版社,2000.
[2]貴州省統(tǒng)計局.貴州統(tǒng)計年鑒[M].北京:中國統(tǒng)計出版社,2011.
[3]張?zhí)K江,許宗運.數(shù)據(jù)統(tǒng)計分析軟件SPSS的應(yīng)用.畜牧和獸醫(yī),2003(10):47-51.
[4]張文彤.SPSS11統(tǒng)計分析教程[M].北京:北京希望電子出版社,2002.
SPSS cluster analysis application in economic geography
丁磊1,馮小康2
(1.貴州師范大學(xué)喀斯特研究院,貴州 貴陽 550001;2.蘇州國環(huán)環(huán)境檢測有限公司,江蘇 蘇州 215100)
摘要:對貴州省各市州進(jìn)行經(jīng)濟(jì)地理分區(qū),首先建立分類指標(biāo)體系,然后查得或計算出有關(guān)數(shù)字并進(jìn)行正規(guī)化轉(zhuǎn)化,最后利用SPSS進(jìn)行聚類分析得出結(jié)論。
關(guān)鍵詞:貴州??;分類指標(biāo)體系;SPSS;經(jīng)濟(jì)區(qū)
Abstract:Secri the province by the economic geography partition, classification index system first, and then Chad or calculate the relevant Numbers and regularized transformation, finally using SPSS clustering analysis conclusion.
Key words:Guizhou province; Classification index system; SPSS; Economic zone
中圖分類號:K902
文獻(xiàn)標(biāo)志碼:A
文章編號:1671-1602(2016)08-0077-03
作者簡介:丁磊(1991-),男,江蘇南京人。碩士,主要從事喀斯特生態(tài)建設(shè)與區(qū)域經(jīng)濟(jì)的研究。馮小康(1991-),男,江蘇泰州人,碩士,主要從事環(huán)境工程的研究。