国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于模糊聚類的城市經(jīng)濟(jì)發(fā)展水平分類

2014-11-30 08:55:24王宏趙紅
關(guān)鍵詞:聚類事物分類

王宏,趙紅

(河北聯(lián)合大學(xué) 理學(xué)院,河北 唐山 063009)

城市經(jīng)濟(jì)發(fā)展水平受多種因素共同影響,客觀、準(zhǔn)確地對(duì)城市經(jīng)濟(jì)發(fā)展進(jìn)行分類,分析各城市的差異以及造成差異的主要原因,能夠?yàn)楦鞒鞘杏嗅槍?duì)性地制訂相應(yīng)的政策和措施提供理論依據(jù),進(jìn)而促進(jìn)城市社會(huì)經(jīng)濟(jì)協(xié)調(diào)發(fā)展,具有重要的理論和實(shí)踐意義。本文將模糊聚類分析應(yīng)用于指城市經(jīng)濟(jì)發(fā)展水平的分類研究,選取具有代表性的經(jīng)濟(jì)指標(biāo)建立模糊相似矩陣,應(yīng)用模糊聚類法實(shí)現(xiàn)聚類,從而實(shí)現(xiàn)對(duì)城市經(jīng)濟(jì)發(fā)展水平的分類。

一、模糊聚類分析原理及步驟

聚類是根據(jù)一定的要求和規(guī)律,按照事物的某些性質(zhì)、用途等,合理劃分未分類事物的集合,得到確定事物分類的過(guò)程。模糊聚類是采用模糊數(shù)學(xué)方法,依據(jù)客觀事物間的特征、親疏程度和相似性,通過(guò)建立模糊相似關(guān)系,并在此基礎(chǔ)上根據(jù)一定的隸屬度來(lái)確定分類關(guān)系,也就是用模糊數(shù)學(xué)的方法把樣本之間的模糊關(guān)系(相似性)加以定量的確定,從而客觀且準(zhǔn)確地進(jìn)行分類。由于現(xiàn)實(shí)的分類過(guò)程往往伴隨著模糊性,所以用模糊數(shù)學(xué)的方法來(lái)進(jìn)行聚類分析會(huì)顯得更自然、更科學(xué)、更符合客觀實(shí)際。

模糊聚類分析的過(guò)程包括以下四個(gè)步驟:

第一步 選擇統(tǒng)計(jì)指標(biāo)

根據(jù)實(shí)際問(wèn)題,選擇那些具有明確的意義,有較強(qiáng)分辨力和代表性的屬性,作為分類事物的統(tǒng)計(jì)指標(biāo)。統(tǒng)計(jì)指標(biāo)的選取對(duì)聚類有直接的影響。

第二步 數(shù)據(jù)標(biāo)準(zhǔn)化

把代表事物各屬性的統(tǒng)計(jì)指標(biāo)的數(shù)據(jù)進(jìn)行處理,使之消除量綱的影響,便于分析和比較。數(shù)據(jù)標(biāo)準(zhǔn)化可以這樣進(jìn)行:采用最大值規(guī)格化法,對(duì)特性指標(biāo)矩陣U*的第j列,計(jì)算Mj=max(u1j,u2j,...unj),j=1,2,…,m。得到標(biāo)準(zhǔn)化后的數(shù)據(jù)u'ij==1,2,…,n;j=1,2,…,m。

第三步 標(biāo)定

所謂標(biāo)定,就是根據(jù)實(shí)際情況,按某個(gè)準(zhǔn)則或某種方法,給論域U(即待分類的集合)中的元素兩兩之間都賦以[0,1]內(nèi)的一個(gè)數(shù),叫做相似系數(shù)。它的大小表征兩個(gè)元素彼此接近或相似的程度。

設(shè)U={u1,u2,...un}為待分類事物的全體,ui由一組數(shù)據(jù)xi1,xi2,...xim來(lái)表征,用rij來(lái)表示元素ui與uj的相似關(guān)系,0≤rij≤1(i,j=1,2,...n);rij=0表示ui與uj截然不同,毫無(wú)相似之處;rij=1表示它們完全相似或等同;當(dāng)i=j(luò)時(shí),rij就是ui自己與自己的相似程度,恒取為1。rij可根據(jù)實(shí)際情況,選擇合適的方法來(lái)加以確定[1]。

第四步 聚類

選擇一種合適的聚類方法,得到聚類結(jié)果,常用的聚類方法有基于模糊等價(jià)關(guān)系的傳遞閉包法,基于模糊相似關(guān)系的直接聚類法,以及基于模糊c-劃分的模糊聚類方法。在應(yīng)用模糊聚類分析解決實(shí)際問(wèn)題時(shí),根據(jù)具體情況選擇合適的方法進(jìn)行聚類。這里,我們采用基于模糊相似關(guān)系的直接聚類法通過(guò)最大生成樹(shù)來(lái)實(shí)現(xiàn)聚類[2,3]。

二、模糊聚類分析在河北省各市經(jīng)濟(jì)發(fā)展水平的分類中的應(yīng)用

(一)選擇統(tǒng)計(jì)指標(biāo),建立指標(biāo)體系

建立科學(xué)的指標(biāo)體系時(shí),應(yīng)根據(jù)實(shí)際問(wèn)題,選擇那些具有明確的意義,有較強(qiáng)分辨力和代表性的屬性,作為分類事物的統(tǒng)計(jì)指標(biāo)。統(tǒng)計(jì)指標(biāo)的選取對(duì)聚類有直接的影響。

河北省有11個(gè)市,設(shè)11個(gè)市組成一個(gè)分類集合X=x1,x2,…,x11

{},分別代表石家莊市、承德市、張家口市、秦皇島市、唐山市、廊坊市、保定市、滄州市、衡水市、邢臺(tái)市、邯鄲市。每個(gè)市經(jīng)濟(jì)發(fā)展水平均采用人均GDP、城鎮(zhèn)化率、社會(huì)消費(fèi)品零售總額、農(nóng)村居民人均純收入、全社會(huì)固定資產(chǎn)投資5項(xiàng)統(tǒng)計(jì)指標(biāo)來(lái)評(píng)判即有xij=xi1,xi2,xi3,xi4,xi5(),這里xij=表示為第 個(gè)事物的第 項(xiàng)特征指標(biāo)值,i=1,2,…,11;j=1,2,…,5。本文現(xiàn)以這11個(gè)市的建立的5個(gè)科學(xué)指標(biāo)為依據(jù),對(duì)11個(gè)市經(jīng)濟(jì)發(fā)展水平的高低的相關(guān)程度分類,對(duì)這5 個(gè)統(tǒng)計(jì)指標(biāo),為使數(shù)據(jù)更科學(xué),選取2008—2012年5年數(shù)據(jù)的平均值(附錄Ⅰ)以期綜合反映河北省各市的經(jīng)濟(jì)發(fā)展水平。

河北省各市社會(huì)經(jīng)濟(jì)發(fā)展水平評(píng)價(jià)指標(biāo)體系上存在著總量指標(biāo),如國(guó)內(nèi)生產(chǎn)總值、地方財(cái)政收入等。因?yàn)榭偭恐笜?biāo)受到效益好壞、質(zhì)量高低的影響,因此需要選用幾年數(shù)據(jù)的平均值。人均GDP,即人均國(guó)內(nèi)生產(chǎn)總值,它常作為發(fā)展經(jīng)濟(jì)學(xué)中衡量經(jīng)濟(jì)發(fā)展?fàn)顩r的指標(biāo),是重要的宏觀經(jīng)濟(jì)指標(biāo)之一,它是人們了解和把握一個(gè)國(guó)家或地區(qū)的宏觀經(jīng)濟(jì)運(yùn)行狀況的有效工具;城鎮(zhèn)化率,又稱城市化率、城市化度、城市化水平、城市化指標(biāo),城鎮(zhèn)化一方面是人口由農(nóng)村向城市遷移聚集的過(guò)程,同時(shí)又表現(xiàn)為地域景觀的變化、產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)變、生產(chǎn)生活方式的變革,是人口、地域、社會(huì)經(jīng)濟(jì)組織形式和生產(chǎn)生活方式由傳統(tǒng)落后的鄉(xiāng)村型社會(huì)向現(xiàn)代城市社會(huì)轉(zhuǎn)化的多方面內(nèi)容綜合統(tǒng)一的過(guò)程,是一個(gè)國(guó)家或地區(qū)經(jīng)濟(jì)發(fā)展進(jìn)步的主要反映和重要標(biāo)志;社會(huì)消費(fèi)品零售總額指批發(fā)和零售業(yè)、住宿和餐飲業(yè)以及其他行業(yè)直接售給城鄉(xiāng)居民和社會(huì)集團(tuán)的社會(huì)消費(fèi)品零售總額消費(fèi)品零售額,是研究人民生活、社會(huì)消費(fèi)品購(gòu)買力、貨幣流通等問(wèn)題的重要指標(biāo);農(nóng)村居民人均純收入是農(nóng)村居民純收入按照農(nóng)村住戶人口平均的純收入水平,它反映的是全國(guó)或一個(gè)地區(qū)農(nóng)村居民的平均收入水平,能反映其生活富裕程度,以此來(lái)說(shuō)明該地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r;全社會(huì)固定資產(chǎn)投資固定資產(chǎn)投資是社會(huì)固定資產(chǎn)再生產(chǎn)的主要手段,通過(guò)建造和購(gòu)置固定資產(chǎn)的活動(dòng),國(guó)民經(jīng)濟(jì)不斷采用先進(jìn)技術(shù)裝備,建立新興部門,進(jìn)一步調(diào)整經(jīng)濟(jì)結(jié)構(gòu)和生產(chǎn)力的地區(qū)分布,增強(qiáng)經(jīng)濟(jì)實(shí)力,為改善人民物質(zhì)文化生活創(chuàng)造物質(zhì)條件。

因此選取以下5 個(gè)因子,即人均GDP、城鎮(zhèn)化率、社會(huì)消費(fèi)品零售總額、農(nóng)村居民人均純收入、全社會(huì)固定資產(chǎn)投資構(gòu)成一個(gè)指標(biāo)體系進(jìn)行聚類分析,用來(lái)反映河北省各市經(jīng)濟(jì)發(fā)展水平的高低。

(二)對(duì)數(shù)據(jù)作預(yù)處理

1確定分類對(duì)象,抽取相關(guān)的數(shù)據(jù)

首先,由于各類指標(biāo)量綱不同,為了消除量綱的影響,利用SPSS 軟件,對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。得到如下數(shù)據(jù):

表1 標(biāo)準(zhǔn)化處理后的數(shù)據(jù)

2建立模糊相似關(guān)系的矩陣

使用MATLAB軟件,采用絕對(duì)值減數(shù)法計(jì)算標(biāo)準(zhǔn)化后的數(shù)據(jù)[4],以得到模糊相似矩陣 (程序見(jiàn)附錄Ⅱ),即為:R=

(三)用最大樹(shù)法進(jìn)行模糊聚類

x11},E為一相似模糊關(guān)系,其矩陣為E=

已知,X={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,

用Kruskal法求最大樹(shù):

畫(huà)出11個(gè)結(jié)點(diǎn)x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11。由E知模糊相似矩陣的最大元為0.9386=E(x9,x10),再畫(huà)邊(x9,x10);次大元為0.9307=E(x8,x11),再畫(huà)邊(x8,x11);余下的最大元為0.9251=E(x3,x9),次大元為0.241=E(x3,x10),再畫(huà)邊(x3,x9)和(x3,x10),但邊(x3,x10)與上面所畫(huà)的邊產(chǎn)生了回路,故不畫(huà)這一步;余下的最大元為0.9217=E(x8,x10),次大元為0.9207=E(x8,x10),再畫(huà)邊(x8,x10)和(x4,x6);余下的最大元為0.9184=E(x2,x9),次大元為0.9155=E(x2,x3),再畫(huà)邊(x2,x9)和E(x2,x3),但邊(x2,x3)與上面所畫(huà)的邊產(chǎn)生了回路,故不畫(huà)這一步;……由此下去,再找出元0.9151=E(x7,x10),0.8944=E(x3,x4),0.8371=E(x1,x5)和0.8292=E(x1,x11),再畫(huà)出邊(x7,x10)、(x3,x4)、(x1,x5)和(x1,x11),至此所有結(jié)點(diǎn)都被連到,于是求得的最大樹(shù)為圖1

圖1 Kruskal法得到的最大樹(shù)

取λ=1,得11 類{x1},{x2},{x3},{x4},{x5},{x6},{x7},{x8},{x9},{x10},{x11};

取λ=0.9386,得10 類{x1},{x2},{x3},{x4},{x5},{x6},{x7},{x8},{x11}{x9,x10};

取λ=0.9307,得9 類{x1},{x2},{x3},{x4},{x5},{x6},{x7},{x9,x10},{x8,x11};

取λ=0.9251,得8 類{x1},{x2},,{x4},{x5},{x6},{x7},{x8,x11},{x3,x9,x10};

取λ=0.9217,得7 類{x1},{x2},{x4},{x5},{x6},{x7},{x3,x8,x9,x10,x11};

取λ=0.9207,得6 類{x1},{x2},{x5},{x7},{x4,x6},{x3,x8,x9,x10,x11};

取λ=0.9184,得5類{x1},{x5},{x7},{x4,x6},{x2,x3,x8,x9,x10,x11};

取λ=0.9151,得4類{x1},{x5},{x4,x6},{x2,x3,x7,x8,x9,x10,x11};

取λ=0.8944,得3類{x1},{x5},{x2,x3,x4,x6,x7,x8,x9,x10,x11};

取λ=0.8371,得2 類{x1,x5},{x2,x3,x4,x6,x7,x8,x9,x10,x11};

取λ=0.8292,得1類{x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11}。

(四)聚類結(jié)果分析

對(duì)聚類結(jié)果采用F-統(tǒng)計(jì)量方法得其最佳分類。當(dāng)λ=0.8545時(shí),劃分為{1,5},{2,3,4,6,7,8,9,10,11},分類數(shù)c=2,n1=2,n2=9,F(xiàn)的值最大。因此λ=0.8545為最佳闕值,相應(yīng)地得到如下劃分:{1,5},{2,3,4,6,7,8,9,10,11},即石家莊市與唐山市分為一類,承德市、張家口市、秦皇島市、保定市、廊坊市、滄州市、衡水市、邢臺(tái)市與邯鄲市分為一類。從總體上看,石家莊市與唐山市歸為一類,其各項(xiàng)經(jīng)濟(jì)指標(biāo)都要高于其它各城市,因此經(jīng)濟(jì)發(fā)展水平相對(duì)較高,而其它9個(gè)城市歸為一類,其城市經(jīng)濟(jì)發(fā)展水平相對(duì)較低。

四、結(jié)論

本文應(yīng)用模糊聚類分析的方法對(duì)河北省各市經(jīng)濟(jì)發(fā)展水平進(jìn)行分類。采用統(tǒng)計(jì)量法確定最佳闕值。得出河北省11個(gè)市,石家莊市與唐山市經(jīng)濟(jì)發(fā)展水平較高,其余9個(gè)市較低,得出的聚類結(jié)果與實(shí)際情況符合。

[1]高新波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2004.

[2]王秀珍.模糊聚類分析法及其應(yīng)用[J].湖南:長(zhǎng)沙大學(xué)學(xué)報(bào),1992,13(4):46-49.

[3]黃祟福,王家新.模糊信息分析與應(yīng)用[M].北京:北京師范大學(xué)出版社,1992.

[4]李相鎬,李洪興等.模糊聚類分析及其應(yīng)用.貴州:貴州科技出版社,1994.

猜你喜歡
聚類事物分類
分類算一算
美好的事物
文苑(2020年8期)2020-11-22 08:18:12
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
基于DBSACN聚類算法的XML文檔聚類
教你一招:數(shù)的分類
奇妙事物用心看
基于改進(jìn)的遺傳算法的模糊聚類算法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
TINY TIMES 3: A REAL HIT
栖霞市| 清镇市| 江川县| 曲靖市| 永春县| 旬邑县| 阿拉善右旗| 蒲江县| 西昌市| 景东| 凌源市| 兰溪市| 安阳县| 江西省| 太湖县| 周口市| 安庆市| 太仆寺旗| 嘉善县| 怀来县| 西贡区| 湖北省| 文水县| 玉林市| 辽宁省| 榕江县| 抚松县| 双桥区| 阿尔山市| 京山县| 合阳县| 南通市| 晴隆县| 杂多县| 浮山县| 遂川县| 钟祥市| 鄄城县| 淮安市| 台东市| 思南县|