肖 瑤
(安徽大學(xué) 經(jīng)濟(jì)學(xué)院,安徽 合肥 230601)
?
基于聚類(lèi)分析的中國(guó)31省市經(jīng)濟(jì)發(fā)展現(xiàn)狀評(píng)析
肖瑤
(安徽大學(xué) 經(jīng)濟(jì)學(xué)院,安徽 合肥 230601)
根據(jù)多元統(tǒng)計(jì)中的系統(tǒng)聚類(lèi)法和K-均值法,將全國(guó)31個(gè)省市依照其經(jīng)濟(jì)發(fā)展?fàn)顩r大致分成4類(lèi),區(qū)分了經(jīng)濟(jì)發(fā)達(dá)省市和偏遠(yuǎn)落后省市,并在分類(lèi)的基礎(chǔ)上對(duì)不同類(lèi)別的省市作出大體的評(píng)價(jià),這不僅有助于全國(guó)經(jīng)濟(jì)的統(tǒng)籌發(fā)展,也有助于不同省市之間優(yōu)勢(shì)互補(bǔ)、互相借鑒發(fā)展模式。
聚類(lèi)分析;經(jīng)濟(jì)發(fā)展;轉(zhuǎn)型
我國(guó)作為全世界最大的發(fā)展中國(guó)家,仍面臨著經(jīng)濟(jì)發(fā)展不均衡、貧富差距明顯等問(wèn)題??傮w上來(lái)看,我國(guó)近幾年經(jīng)濟(jì)發(fā)展速度放緩,GDP增速由2007年的14.16%逐步下降到2015年的6.9%。失業(yè)率上升、國(guó)際金融危機(jī)、體制改革等原因固然會(huì)影響全國(guó)的經(jīng)濟(jì)運(yùn)行,但分區(qū)域來(lái)看,有的省市產(chǎn)能過(guò)剩有的省市產(chǎn)能不足,有的省市勞動(dòng)力短缺而有的省市勞動(dòng)力過(guò)剩,這些原因并不能籠統(tǒng)而含糊地一帶而過(guò),所以,將全國(guó)31個(gè)省市的經(jīng)濟(jì)發(fā)展?fàn)顩r劃分歸類(lèi)成相應(yīng)的類(lèi)別,將有助于黨中央根據(jù)不同類(lèi)別的經(jīng)濟(jì)發(fā)展特點(diǎn)制定相應(yīng)的發(fā)展政策,統(tǒng)籌規(guī)劃,取長(zhǎng)補(bǔ)短,作出正確的決定。
在對(duì)我國(guó)31個(gè)省市的經(jīng)濟(jì)發(fā)展?fàn)顩r作出類(lèi)別劃分的問(wèn)題上,國(guó)內(nèi)外學(xué)者對(duì)此還未做出過(guò)多研究。不過(guò)就現(xiàn)有資料表明,大多學(xué)者都運(yùn)用聚類(lèi)分析做出了簡(jiǎn)要的分類(lèi)。聚類(lèi)分析是多元統(tǒng)計(jì)分析中如何對(duì)樣品或指標(biāo)進(jìn)行分類(lèi)的一種統(tǒng)計(jì)方法,針對(duì)不同的統(tǒng)計(jì)科研問(wèn)題可以運(yùn)用不同的聚類(lèi)分析方法,各類(lèi)聚類(lèi)分析方法在其特性、算法、可操作性上都有所不同。聚類(lèi)分析的過(guò)程和方法在地區(qū)經(jīng)濟(jì)發(fā)展評(píng)價(jià)方面具有一定的實(shí)用性,可以得出科學(xué)的分析結(jié)果,但王玻、李從東(2009)認(rèn)為,聚類(lèi)分析方法還存在一定的局限性,雖然聚類(lèi)分析法來(lái)解決分析各學(xué)科方方面面的實(shí)際問(wèn)題, 其定量分析的準(zhǔn)確性能是毋庸置疑的, 但是初始指標(biāo)的選擇往往也是影響最終結(jié)果的重要因素,很多人為控制因素對(duì)參數(shù)輸入、停機(jī)條件將有影響,當(dāng)面對(duì)數(shù)據(jù)過(guò)于龐大,維度高度復(fù)雜的情況時(shí),聚類(lèi)分析不能給出一個(gè)很好的操作方法,從而無(wú)法保證得出高質(zhì)量的聚類(lèi)結(jié)果。[1]148-151所以,還有學(xué)者通過(guò)主成分分析、判別分析、因子分析等方法和聚類(lèi)分析相互驗(yàn)證,從而得出更可靠的分析結(jié)果。
從整體經(jīng)濟(jì)規(guī)模、綜合經(jīng)濟(jì)水平來(lái)看,我國(guó)31個(gè)省市一般認(rèn)為可以被分為3到5類(lèi)。梁國(guó)巍、王傳美、童恒慶(2003)運(yùn)用分層聚類(lèi)法將全國(guó)各省市綜合經(jīng)濟(jì)水平分為3類(lèi)。[2]他們的研究顯示,東部省市經(jīng)濟(jì)發(fā)展明顯快于西部,尤其第一類(lèi)別作為直轄市,經(jīng)濟(jì)基礎(chǔ)好,人口密度大,人均受教育水平高,競(jìng)爭(zhēng)力強(qiáng),經(jīng)濟(jì)發(fā)展居于較高水平。第二類(lèi)省市善于利用自身優(yōu)勢(shì),沿海省市貿(mào)易發(fā)達(dá),老工業(yè)地區(qū)實(shí)力雄厚,自然資源豐富地域旅游業(yè)水平高。第三類(lèi)省市多為偏遠(yuǎn)內(nèi)陸或山區(qū),農(nóng)業(yè)為主,工業(yè)落后。王玻,李從東(2009)用譜系聚類(lèi)法,采用歐式距離作為分類(lèi)統(tǒng)計(jì)量。得出結(jié)論認(rèn)為將全國(guó)31個(gè)省市按地區(qū)經(jīng)濟(jì)規(guī)模劃分為4類(lèi)最為合理。[1]148-151得出結(jié)論與前幾年的結(jié)果相比,近年來(lái)有些城市經(jīng)濟(jì)規(guī)模穩(wěn)步前進(jìn)如西部省市云南、廣西等自治區(qū)的綜合經(jīng)濟(jì)規(guī)模有明顯的改進(jìn)。祝新亞、李許堅(jiān)(2011)在對(duì)我國(guó)主要省市綜合實(shí)力評(píng)價(jià)指標(biāo)進(jìn)行選取時(shí),經(jīng)濟(jì)指標(biāo)占了很大一部分,其根據(jù)聚類(lèi)分析得出的2008 年各省綜合實(shí)力發(fā)展層次也可以作為本文按經(jīng)濟(jì)發(fā)展分類(lèi)的依據(jù)。[3]可以看出老牌工業(yè)區(qū)、沿海省市、內(nèi)陸、中部地區(qū)分別對(duì)應(yīng)著不同的經(jīng)濟(jì)發(fā)展水平。
從影響經(jīng)濟(jì)水平的各個(gè)變量看來(lái),金相郁(2004)利用經(jīng)濟(jì)變量和次聚類(lèi)法和對(duì)中國(guó)區(qū)域進(jìn)行劃分,層次聚類(lèi)法的好處就是劃分過(guò)程不受其他因素的影響,只受選定變量的影響,所以他以國(guó)內(nèi)生產(chǎn)總值年增長(zhǎng)率為基準(zhǔn)的區(qū)域聚類(lèi)將全國(guó)分為3個(gè)類(lèi)別,東部地區(qū)的一些省、市明顯地聚成為一類(lèi)區(qū)域,而中西部地區(qū)的劃分并不明顯;按照人均GDP的聚類(lèi)分析,將全國(guó)分為5大類(lèi),東部地區(qū)分成四個(gè)區(qū)域, 中西部地區(qū)聚成一個(gè)區(qū)域;按城鎮(zhèn)居民平均人均可支配收入和各省農(nóng)村居民家庭平均人均純收入的聚類(lèi)分析,將全國(guó)分為5大類(lèi),中西部地區(qū)的區(qū)別不明顯,并且,東部地區(qū)內(nèi)部出現(xiàn)不同類(lèi)型的區(qū)域。[4]陳愛(ài)娟、程雪(2010)按國(guó)際勞務(wù)競(jìng)爭(zhēng)力,將全國(guó)31省市劃分為4類(lèi),沿海省市如上海、浙江、廣東經(jīng)濟(jì)基礎(chǔ)雄厚,人力資源豐富,貿(mào)易口岸多,人口較為集中,對(duì)外貿(mào)易占有一定優(yōu)勢(shì)為第一類(lèi)。而第四類(lèi)多為中部省份以及西部省份,這些省份深居內(nèi)陸,自然條件導(dǎo)致經(jīng)濟(jì)發(fā)展程度和國(guó)際貿(mào)易發(fā)展程度相對(duì)較低,中部省份以及西部省份相對(duì)來(lái)講國(guó)際勞務(wù)競(jìng)爭(zhēng)力比較弱,東部省份和沿海省份國(guó)際勞務(wù)競(jìng)爭(zhēng)力相對(duì)較強(qiáng),各省市之間國(guó)際勞務(wù)競(jìng)爭(zhēng)力差別巨大。[5]朱冰潔,李玉山(2012)按城鎮(zhèn)居民收入,將全國(guó)31省市劃分為4類(lèi),得出結(jié)論東部發(fā)展快于西部。
由于聚類(lèi)分析的指標(biāo)選取在很大程度上影響著分類(lèi)的結(jié)果,所以前人的研究只能給我們的分析作為一種參考,并不能全盤(pán)接納。在制定發(fā)展政策時(shí),不同省市對(duì)經(jīng)濟(jì)發(fā)展的側(cè)重點(diǎn)各不相同,因此有必要在作出政策決策之前選取與經(jīng)濟(jì)發(fā)展目標(biāo)相符合的指標(biāo)作為衡量標(biāo)準(zhǔn),剔除與本省市經(jīng)濟(jì)發(fā)展無(wú)關(guān)的變量,篩選出影響決策的主要變量,從而有針對(duì)性的制定出合理的發(fā)展政策。
全國(guó)31個(gè)省市之間經(jīng)濟(jì)發(fā)展存在著不同程度的相似性,本文采用聚類(lèi)分析法將31個(gè)省市進(jìn)行分類(lèi),使得同一類(lèi)中的對(duì)象之間的相似性比其他類(lèi)中的對(duì)象相似性更強(qiáng)。聚類(lèi)分析法的目的就是使類(lèi)間對(duì)象的同質(zhì)性最大化和類(lèi)與類(lèi)間的對(duì)象的異質(zhì)性最大化。
不同的聚類(lèi)分析方法所得出的結(jié)果也略有不同,為了保證研究的客觀性,我們采用兩種聚類(lèi)分析方法以及進(jìn)行驗(yàn)證,分別是系統(tǒng)聚類(lèi)法和K-均值法。
在系統(tǒng)聚類(lèi)法中,我們先將N個(gè)樣品分成N類(lèi),然后計(jì)算N類(lèi)之間的相互距離,把距離最近的兩類(lèi)合并成一類(lèi),從而得到N-1類(lèi),再?gòu)腘-1類(lèi)中找出距離最近的兩類(lèi)加以合并,從而得到N-2類(lèi),依次進(jìn)行下去,最后,N類(lèi)樣品均歸為一類(lèi),畫(huà)出聚類(lèi)圖則可以決定分為多少類(lèi),每類(lèi)各有哪些樣品。[6]43-44
K-均值法可以事先選定聚類(lèi)個(gè)數(shù),把每個(gè)樣品聚集到其最近均值的類(lèi)中,在修改的過(guò)程中,重新計(jì)算接受新樣品的類(lèi)和失去樣品的類(lèi)的均值,直到各類(lèi)無(wú)元素進(jìn)出。[6]43-44
本文根據(jù)數(shù)據(jù)的可得性,并參考了以往文獻(xiàn)資料,從國(guó)家統(tǒng)計(jì)局網(wǎng)站和各省市2014年統(tǒng)計(jì)年報(bào)中選取了9個(gè)能夠表明各省市經(jīng)濟(jì)運(yùn)行總體情況的指標(biāo)。分別為:年末常住人口、地區(qū)生產(chǎn)總值、消費(fèi)品零售總額、公共財(cái)政預(yù)算收入、公共財(cái)政預(yù)算支出、人均可支配收入、全社會(huì)固定資產(chǎn)投資、居民人均消費(fèi)支出、進(jìn)出口總額。具體指標(biāo)數(shù)據(jù)見(jiàn)表1。
雖然我們有9個(gè)指標(biāo)的數(shù)據(jù)描述出了31個(gè)省市的經(jīng)濟(jì)發(fā)展大體運(yùn)行情況,但是否有必要將這9個(gè)指標(biāo)都作為分類(lèi)變量則需要進(jìn)一步的篩選。先對(duì)這9個(gè)指標(biāo)進(jìn)行降維處理,9個(gè)分類(lèi)變量量綱各自不同,先確定用相似性來(lái)測(cè)度,度量標(biāo)準(zhǔn)選用pearson系數(shù),聚類(lèi)方法選最遠(yuǎn)元素,此時(shí),由于涉及到相關(guān),9個(gè)變量可不用標(biāo)準(zhǔn)化處理,將來(lái)的相似性矩陣?yán)锏臄?shù)字為相關(guān)系數(shù)。如果有某兩個(gè)變量的相關(guān)系數(shù)接近1或-1,說(shuō)明兩個(gè)變量可互相替代。
從表2指標(biāo)相似性矩陣中我們可以看到,社會(huì)消費(fèi)品零售總額、公共財(cái)政預(yù)算收入、公共財(cái)政預(yù)算支出與地區(qū)生產(chǎn)總值的相關(guān)系數(shù)都大于0.9,于是這4類(lèi)沒(méi)有必要都作為聚類(lèi)變量,選出其中一種即可,本文選擇地區(qū)生產(chǎn)總值。
由于各個(gè)指標(biāo)的量綱不同,為了防止指標(biāo)取值的分散程度較大,我們先對(duì)各取值做標(biāo)準(zhǔn)化處理。數(shù)據(jù)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后,再依次用不同聚類(lèi)方法進(jìn)行聚類(lèi)分析。對(duì)于分類(lèi)數(shù)的抉擇,根據(jù)經(jīng)驗(yàn)資料以及文獻(xiàn)整理,我國(guó)31個(gè)省市一般認(rèn)為可以被分為3到5類(lèi),本文中認(rèn)為劃分為4類(lèi)較為合理。分析結(jié)果見(jiàn)表3。
表1 全國(guó)31個(gè)省市各指標(biāo)數(shù)據(jù)
表2 各指標(biāo)相似性矩陣
表3 聚類(lèi)分析結(jié)果
在組內(nèi)聚類(lèi)法中,由于第四類(lèi)中包含浙江省同時(shí)還包含了新疆、西藏、內(nèi)蒙古等省,它們明顯不能歸為一類(lèi),則用組內(nèi)聚類(lèi)法不合理。在最短距離法中,最短距離法有鏈接聚合的趨勢(shì),大部分樣品都被聚集在一類(lèi)中,導(dǎo)致這樣的聚類(lèi)效果并不好,并且第四類(lèi)中,天津、浙江等省明顯不該和新疆、西藏等省歸為一類(lèi),則用最短距離法不合理。最長(zhǎng)距離法和ward法得到了相同的分類(lèi)結(jié)果,但第三類(lèi)中,內(nèi)蒙古和浙江、天津市明顯不該歸為一類(lèi),則用這兩種方法并不合理。重心法和組間聚類(lèi)法得到了相同的分類(lèi)結(jié)果,但第四類(lèi)中天津和內(nèi)蒙古、寧夏等省市明顯不能歸為一類(lèi),則用這兩種方法并不合理。在K-均值法中,第一類(lèi)為經(jīng)濟(jì)發(fā)達(dá)省市,人均消費(fèi)支出均處于全國(guó)領(lǐng)先水平,第二類(lèi)省份外貿(mào)經(jīng)濟(jì)發(fā)達(dá),人均消費(fèi)水平較高,第三類(lèi)多為平原地區(qū),經(jīng)濟(jì)基礎(chǔ)薄弱,但勞動(dòng)力資源豐富。第四類(lèi)地區(qū)多為偏遠(yuǎn)省市,經(jīng)濟(jì)基礎(chǔ)水平受到地理?xiàng)l件限制,社會(huì)經(jīng)濟(jì)資源匱乏,尤其是人力資源缺乏,這構(gòu)成了其經(jīng)濟(jì)發(fā)展的瓶頸。以此看來(lái)采用K-均值法將全國(guó)31個(gè)省市分成相應(yīng)4類(lèi)較為合理。
第一類(lèi)北京、天津、上海、浙江人均消費(fèi)支出均在22000元以上,是全國(guó)貿(mào)易中心城市,北京作為首都,政治、經(jīng)濟(jì)實(shí)力雄厚,上海對(duì)外貿(mào)易發(fā)達(dá),交通便利,跨國(guó)公司和國(guó)際商貿(mào)組織大多坐落在此,天津和浙江作為沿海城市,地理位置優(yōu)越,人口密度大,勞動(dòng)力受教育水平高。
第二類(lèi)江蘇和廣東,在改革開(kāi)放之后,江蘇和廣東發(fā)展迅速,隨著對(duì)外開(kāi)放步伐的加快,2014年江蘇和廣東的進(jìn)出口總額已分別達(dá)5637.6和10767.34億美元,在全國(guó)31個(gè)省市中遙遙領(lǐng)先。但是對(duì)比第一類(lèi)省市,廣東發(fā)展起步晚,經(jīng)濟(jì)實(shí)力沒(méi)有第一類(lèi)城市雄厚。
第三類(lèi)河北、遼寧、安徽、山東、河南、湖北、湖南、四川,勞動(dòng)力資源豐富,但勞動(dòng)力整體教育水平不高,教育投資較少,并且勞動(dòng)力大多流向第一、第二類(lèi)省市。經(jīng)濟(jì)增長(zhǎng)主要依靠?jī)?nèi)需拉動(dòng),由于地理位置的原因,外貿(mào)水平偏低,多以第一產(chǎn)業(yè)、第二產(chǎn)業(yè)為主。這類(lèi)省市若想提高經(jīng)濟(jì)發(fā)展水平,需要得到國(guó)家政策的支持,發(fā)揮人力資源優(yōu)勢(shì),加大教育投資力度,努力發(fā)展服務(wù)業(yè),加快經(jīng)濟(jì)轉(zhuǎn)型。
第四類(lèi)山西、內(nèi)蒙古、吉林、黑龍江、福建、江西、廣西、海南、重慶、貴州、云南、西藏、陜西、甘肅、青海、寧夏、新疆,這些省市地理位置偏遠(yuǎn),物資匱乏,經(jīng)濟(jì)發(fā)展在一定程度上還依賴(lài)于第一產(chǎn)業(yè),但另一方面,這些省市自然資源豐富,應(yīng)大力發(fā)展旅游業(yè),發(fā)揮本省優(yōu)勢(shì),國(guó)家也應(yīng)對(duì)這些省份給予政策扶持。
總的看來(lái),不論是系統(tǒng)聚類(lèi)還是K-均值法我們都可以看出北京、上海這兩個(gè)特大型城市均居于全國(guó)領(lǐng)先水平,它們分別是我國(guó)政治、經(jīng)濟(jì)中心,是中國(guó)規(guī)模最大、綜合實(shí)力最強(qiáng)的兩個(gè)城市,屬于經(jīng)濟(jì)發(fā)達(dá)地區(qū),分別已經(jīng)完成工業(yè)化而進(jìn)入后工業(yè)化時(shí)期。沿海省市經(jīng)濟(jì)較為發(fā)達(dá),在經(jīng)濟(jì)全球化的今天,外貿(mào)出口在很大程度上影響著一個(gè)省市的經(jīng)濟(jì)發(fā)展水平,這些省份充分利用發(fā)達(dá)國(guó)家和地區(qū)調(diào)整產(chǎn)業(yè)結(jié)構(gòu)、轉(zhuǎn)移勞動(dòng)密集型產(chǎn)業(yè)的機(jī)遇,積極吸引外資,大力發(fā)展外向型經(jīng)濟(jì)。而中部地區(qū)和老工業(yè)地區(qū)省份經(jīng)濟(jì)發(fā)展則較為落后,它們主要依靠?jī)?nèi)需拉動(dòng)經(jīng)濟(jì)增長(zhǎng),對(duì)外貿(mào)依存度不高,并且由于受經(jīng)濟(jì)基礎(chǔ)、自然條件等方面的制約,老工業(yè)基地以資源消耗、環(huán)境污染為代價(jià)的粗放型經(jīng)濟(jì)增長(zhǎng)模式已嚴(yán)重威脅其可持續(xù)發(fā)展。這些地區(qū)與率先改革開(kāi)放的東部沿海地區(qū)相比,經(jīng)濟(jì)發(fā)展有相當(dāng)?shù)牟罹唷4蟛糠謨?nèi)陸偏遠(yuǎn)省份,由于地區(qū)開(kāi)放程度較低,吸收外部資金及技術(shù)、人才等促進(jìn)經(jīng)濟(jì)發(fā)展因素能力較弱,導(dǎo)致近年來(lái)經(jīng)濟(jì)增長(zhǎng)緩慢。
[1]王玻,李從東.地區(qū)經(jīng)濟(jì)規(guī)模評(píng)價(jià)的多元統(tǒng)計(jì)分析及其適用性比較[J].經(jīng)濟(jì)與管理,2009(2).
[2]梁國(guó)巍,王傳美.多元統(tǒng)計(jì)方法在分析各地區(qū)綜合經(jīng)濟(jì)水平中的應(yīng)用[J]. 中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2003(9)68-70.
[3]祝新亞,李許堅(jiān).基于聚類(lèi)分析和判別分析的我國(guó)主要省市綜合實(shí)力狀況評(píng)價(jià)[J].北方經(jīng)濟(jì),2011(4)16-18.
[4]金相郁.中國(guó)區(qū)域劃分的層次聚類(lèi)分析[J].城市規(guī)劃匯刊,2004(2)23-28.
[5]陳愛(ài)娟,程雪.我國(guó)各省市國(guó)際勞務(wù)競(jìng)爭(zhēng)力聚類(lèi)分析[R]. Proceedings of 2010 International Conference on Management Science and Engineering (MSE 2010) (Volume 4):161-164.
[6]何曉群.多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2012.
責(zé)任編輯周覓
F061.3
A
1003-8078(2016)05-0019-05
2016-04-07doi:10.3969/j.issn.1003-8078.2016.05.06
肖瑤(1991-),女,安徽安慶人,安徽大學(xué)經(jīng)濟(jì)學(xué)院2014級(jí)碩士研究生。
黃岡師范學(xué)院學(xué)報(bào)2016年5期