曹 丹,高漢君
(成都紡織高等??茖W(xué)校建筑工程學(xué)院,四川成都 611731)
?
全國10個地區(qū)城市建設(shè)情況的模糊聚類分析
曹 丹,高漢君
(成都紡織高等??茖W(xué)校建筑工程學(xué)院,四川成都 611731)
近幾十年來我國土木工程建設(shè)飛速發(fā)展,全國各地區(qū)城市建設(shè)情況參差不齊,將全國10個具有代表性的地區(qū)城市建設(shè)情況的數(shù)據(jù),通過Excel表格進(jìn)行模糊聚類分析,將這些地區(qū)進(jìn)行分類,找出建設(shè)發(fā)展進(jìn)程相似的地區(qū),為將來城市建設(shè)的進(jìn)一步研究提供理論依據(jù)。
城市建設(shè) 模糊聚類 Excel 計(jì)算
隨著我國經(jīng)濟(jì)的飛速發(fā)展,全國各地區(qū)的城市建設(shè)也在加快腳步進(jìn)行著,但畢竟每個省市的具體情況不同,因此發(fā)展的速度與進(jìn)程都有相當(dāng)大的差異。運(yùn)用模糊聚類的方法,對全國31個省市自治區(qū)中的代表地區(qū)的數(shù)據(jù)進(jìn)行處理,分析之后,再將其分類,便可以對全國各地的建設(shè)發(fā)展情況有一個更加深入的了解,對于今后的建設(shè)規(guī)劃和經(jīng)濟(jì)投資都有一定的指導(dǎo)意義。
1.1 數(shù)據(jù)來源
從中華人民共和國統(tǒng)計(jì)局的統(tǒng)計(jì)年鑒中,收集到了全國31個省市自治區(qū)2011年的建設(shè)情況。
1.2 數(shù)據(jù)說明
如表1所示,相關(guān)參數(shù)有:城區(qū)面積、建成區(qū)面積、城市建設(shè)用地面積、征用土地面積,以及城市人口密度。
該表格根據(jù)地域排序,由于數(shù)據(jù)過多,后面我們會用到Excel進(jìn)行數(shù)據(jù)處理,因此我們抽取每個地域的前1-2個省市自治區(qū),且由于該統(tǒng)計(jì)數(shù)據(jù)中,上海市缺失“城市用地面積”和“征用土地面積”兩項(xiàng)指標(biāo),故去掉上海市。因此我們用來模糊聚類分析的對象最終確定為10個。
表1 全國10個地區(qū)城市建設(shè)情況 (2011年)
設(shè)Z = { x1, x2, …, xn} 是n 個對象集合,每個對象的特征數(shù)據(jù)表示為
xi= ( xi1, xi2, …, xim) , i = 1 ,2 ,…, n ,利用標(biāo)定方法,可以得到2 個對象xi和xj的模相似程序rij,于是就得到模糊相似矩陣
(1)
其中rij= 1 , rij= rji, j = 1 ,2 , …?, n.
定理[1]設(shè)R 是模糊相似矩陣,則存在一個最小自然數(shù)k ≤n ,使t ( R) = Rk ,并且對一切大于k 的自然數(shù)q ,均有Rq=Rk。
該定理說明了從一個Fuzzy 相似矩陣R 通過求R 的傳遞閉包,可構(gòu)造一個Fuzzy 等價矩陣,并且運(yùn)算有限次,即不超過n次.為了提高運(yùn)算速度,可以用平方法R→R2→R4→…R2k→…,經(jīng)過有限次運(yùn)算后,一定有一個自然數(shù)(2k≤n),使R2k=R2k+1,于是t(R)=R2k。利用截關(guān)于對R2k進(jìn)行等價分類,從而得到諸對象的評價結(jié)果[2]。
3.1 計(jì)算均值和標(biāo)準(zhǔn)差
首先,在Excel中運(yùn)用AVERAGE()和STDEV()[3],對各列數(shù)據(jù)計(jì)算其均值與標(biāo)準(zhǔn)差,結(jié)果如表2所示。
表2 全國10個地區(qū)建設(shè)情況均值與標(biāo)準(zhǔn)差
3.2 取得標(biāo)準(zhǔn)化數(shù)據(jù)矩陣
選取A13單元格,輸入公式=(A1-A$11)/A$12,并在全數(shù)據(jù)區(qū)域內(nèi)進(jìn)行數(shù)據(jù)填充,得到表3,即用第1個至第10個地區(qū)的數(shù)據(jù)減去均值再除以標(biāo)準(zhǔn)差。
表3 標(biāo)準(zhǔn)化數(shù)據(jù)矩陣
3.3 求取模糊相似矩陣
(2)
3.3.1 計(jì)算
選取A23單元格,輸入公式=SQRT((A$13-A13)^2+(B$13-B13)^2+(C$13-C13)^2+(D$13-D13)^2+(E$13-E13)^2),得到d12,同樣,選取B23單元格,輸入公式=SQRT((A$14-A13)^2+(B$14-B13)^2+(C$14-C13)^2+(D$14-D13)^2+(E$14-E13)^2),得到d12,以此類推,填充矩陣內(nèi)的所有數(shù)據(jù),將所有的d算出,得到表4。
表4 d值
3.3.2 建立模糊相似矩陣
選取A33單元格,輸入公式=1-A23/MAX($A$23:$J$32),求得 r11,然后在A33至J42區(qū)域中數(shù)據(jù)填充得到模糊相似矩陣R,如表5。
表5 模糊相似矩陣
3.4 求取模糊等價矩陣
在上述模糊相似矩陣的基礎(chǔ)上進(jìn)行模糊等價矩陣的求取。在單元格A43里輸入公式=MAX(MIN($A33,A$33), MIN($B33,A$34),MIN($C33,A$35),MIN($D33,A$36), MIN($E33,A$37),MIN($F33,A$38),MIN($G33,A$39),MIN($H33,A$40), MIN($I33,A$41),MIN($J33,A$42)),然后相應(yīng)地進(jìn)行數(shù)據(jù)填充,得到R2,如表6,重復(fù)執(zhí)行操作,即可得到R4、R8、R16……,直到出現(xiàn)Rk=R2k,則為模糊等價矩陣,即傳遞閉包,如表7。
表6 R2
表7 模糊等價矩陣
(表7為MATLAB軟件得出)
3.5 模糊聚類
由MATLAB進(jìn)行模糊聚類,得到動態(tài)聚類圖,如圖1。
圖1 動態(tài)聚類圖
由圖1可見,最先聚類的是2和4,故根據(jù)2和4最先聚類由大到小選擇閾值λ,進(jìn)行模糊聚類。新建一個表格,在A11單元格中輸入=IF(A53>=λ,1,0),則得到模糊等價矩陣的截距陣。如λ=0.7,則2和4聚為一類,如表8
表8 模糊等價矩陣的截距陣(λ=0.7)
當(dāng)λ=0.5時,則2、4、5聚為一類,如表9
表9 模糊等價矩陣的截距陣(λ=0.5)
當(dāng)λ=0.4時,則2、4、5、7聚為一類,如表10
表10 模糊等價矩陣的截距陣(λ=0.4)
當(dāng)λ=0.38時,則1、2、4、5、7聚為一類,如表11
表11 模糊等價矩陣的截距陣(λ=0.38)
當(dāng)λ=0.354時,則1、2、4、5、7、8聚為一類,如表12
表12 模糊等價矩陣的截距陣(λ=0.354)
當(dāng)λ=0.35時,則1、2、4、5、6、7、8聚為一類,如表13
表13 模糊等價矩陣的截距陣(λ=0.35)
當(dāng)λ=0.28時,則1、2、3、4、5、6、7、8聚為一類,如表14
表14 模糊等價矩陣的截距陣(λ=0.28)
當(dāng)λ=0.2時,則1、2、3、4、5、6、7、8、9聚為一類,如表15
表15 模糊等價矩陣的截距陣(λ=0.2)
當(dāng)λ=0.05時,則全部聚為一類,如表16
表16 模糊等價矩陣的截距陣(λ=0.05)
由上面的各個模糊等價矩陣的截距陣得到以下結(jié)論:
以上聚類的各個地區(qū),在不同λ值范圍內(nèi)分為同一類的地區(qū),為城區(qū)面積,建成區(qū)面積等5個指標(biāo)的情況相似的地區(qū)。
[1] 李洪興,汪培莊. 模糊數(shù)學(xué)[M].北京:國防工業(yè)出版社,1993:86-291.
[2] 寇業(yè)富.大學(xué)生素質(zhì)評價的模糊聚類分析[J].遼寧師范大學(xué)學(xué)報(自然科學(xué)版),2003(6):130-133
[3] 許永安,徐恒玉.用Excel實(shí)現(xiàn)模糊聚類分析[J].安徽農(nóng)業(yè)科學(xué),2005(1):740-742
2015-11-25
曹丹(1987-),女,碩士,助教,研究方向:管理科學(xué)與工程。
C931
A
1008-5580(2016)04-0242-05