關(guān)鳳麗,顧鳳岐
(東北林業(yè)大學理學院,哈爾濱,150040)
?
基于聚類分析法的黑龍江省國有林區(qū)小城鎮(zhèn)建設(shè)評價
關(guān)鳳麗,顧鳳岐
(東北林業(yè)大學理學院,哈爾濱,150040)
摘要:根據(jù)收集到的黑龍江省40個國有林業(yè)局(樣品集)2008—2012的各指標數(shù)據(jù),選取比較主要的14個指標作為考察特征,應(yīng)用系統(tǒng)聚類法對黑龍江省40個國有林業(yè)局小城鎮(zhèn)建設(shè)情況進行了分類;并確認分四類為最優(yōu)聚類方案。根據(jù)聚類結(jié)果,對目前國有林區(qū)小城鎮(zhèn)建設(shè)現(xiàn)狀提出針對性評價。
關(guān)鍵詞:系統(tǒng)聚類法;國有林區(qū);小城鎮(zhèn)建設(shè);分類
黑龍江國有重點林區(qū)總經(jīng)營面積為1 009.8萬hm2,林地面積857萬hm2;活立木總蓄積8.33億m3;森林覆蓋率85%;黑龍江國有林區(qū)現(xiàn)有40個林業(yè)局、627個林場、17個林產(chǎn)工業(yè)、4個林機修造企業(yè)以及公檢法司、科研院所、文教衛(wèi)生、森林調(diào)查、建筑施工等處級以上企事業(yè)單位140個。林區(qū)總?cè)丝跒?60.8萬人,職工72.5萬人。在生態(tài)建設(shè)方面,堅持以營林為基礎(chǔ)的方針,大力進行人工造林,人工造林保存面積達到293.8萬hm2。在經(jīng)濟發(fā)展方面,木材產(chǎn)量最高時占全國33.5%,累計為國家生產(chǎn)木材5.19億m3,占全國產(chǎn)量的21%;上繳利稅119億元。在社會發(fā)展方面,在昔日人跡罕至、基礎(chǔ)設(shè)施幾近于零的原始林區(qū),建起了星羅棋布的小城鎮(zhèn)[1]。
黑龍江省國有林區(qū)小城鎮(zhèn)建設(shè)包括生態(tài)文明、經(jīng)濟發(fā)展、產(chǎn)業(yè)結(jié)構(gòu)、人口就業(yè)、居民生活等方面[2],影響因素眾多,提取出可以評價小城鎮(zhèn)建設(shè)水平的重要的14個指標,分別為人口密度、城鎮(zhèn)登記失業(yè)率、醫(yī)療人員占總?cè)丝诒壤?、在職大中專及其以上學歷比例、人均住房使用面積、人均鋪裝道路里程;經(jīng)濟系統(tǒng)方面的選取GNP、人均GDP、第三產(chǎn)業(yè)產(chǎn)值比重、人均第三產(chǎn)業(yè)產(chǎn)值;生態(tài)系統(tǒng)方面選取的是森林覆蓋率、人均林地面積、綠化覆蓋率。
黑龍江省40個林業(yè)局作為聚類對象,14個指標作為聚類特征。收集黑龍江省四十個國有林業(yè)局2008—2012的數(shù)據(jù)資料,主要包括內(nèi)容如:年度地區(qū)生產(chǎn)總值(GDP)、年度末總?cè)丝凇⒛甓鹊谌a(chǎn)業(yè)總產(chǎn)值、年度住房總面積、年度總道路里程、森林面積、綠化覆蓋面積等數(shù)據(jù)樣本(略)。根據(jù)計算公式整理得14個指標數(shù)據(jù)(見表1)。其中的13個指標計算公式如下:人口密度(人/公頃)=年度總?cè)丝?轄區(qū)面積,人均GDP(元)=本年度地區(qū)生產(chǎn)總值(GDP)/本年度末總?cè)丝?,第三產(chǎn)業(yè)比重(%)=本年度第三產(chǎn)業(yè)總產(chǎn)值/本年度地區(qū)生產(chǎn)總值(GDP),人均第三產(chǎn)值(元/人)=本年度末第三產(chǎn)值/本年度末總?cè)丝?,萬元GDP耗水量(噸/萬元)=耗水量/本年度地區(qū)生產(chǎn)總值(GDP),城鎮(zhèn)登記失業(yè)率(%)=(城鎮(zhèn)登記失業(yè)人口/總?cè)丝冢?00%,醫(yī)療人口比例(%)=(醫(yī)療人口總數(shù)/總?cè)丝冢?00%,在職大中專及其以上學歷比例(%)=(在職大中專及其以上學歷職工總數(shù)/在職職工總數(shù))×100%,人均住房使用面積(m2/人)=本年度住房總面積/本年度末總?cè)丝?,人均鋪裝道路里程(m/人)=本年度總道路里程/本年度末總?cè)丝?,人均林地面積(m2/人)=森林面積/本年度末總?cè)丝?,綠化覆蓋率(m2/人)=綠化覆蓋面積/本年度末總?cè)丝?,森林覆蓋率(%)=(森林面積/轄區(qū)面積)×100%。
4.1樣本數(shù)據(jù)標準化
13個影響指標的數(shù)據(jù)單位口徑各不同,為便于選擇聚類分析的相似度度量方法,在聚類分析前首先對各指標數(shù)據(jù)進行標準化處理,標準化公式為
4.2相似性度量及距離的選取與定義
4.2.1相似性度量選取
本文采用夾角余弦cosθij衡量相似度rij大小,將兩個變量數(shù)據(jù)xi和xj看作為兩空間向量,兩向量的夾角余弦可用下列公式計算,令rij= |cosθij|,顯然,rij≤1。
這里,rij越近似于1時,說明兩變量xi和xj非常相似,可以聚為一類;反之,rij越接近于0時,說明兩變量xi和xj差別很大,不能聚為一類。根據(jù)公式(2)計算得到變量間相似度矩陣R=(rij)40×40。
4.2.2樣品間與類間距離的定義[3]
樣品間距離定義有三大類:閔氏距離、馬氏距離、蘭氏距離,但一般在實際聚類過程中,為了計算方便,我們也常作一個變換
或者
用dij表示變量間的距離遠近,dij小則xi和xj先聚成一類。
類間距離的定義也有8種:最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法。歸類步驟基本一致,差異僅在于計算方法的不同。
設(shè)X={x1,x2,…x40}是樣品集,G1,G2,…Gm是X的非空子集,且滿足
則稱G1,G2,…Gm是X的一個分類。用Drs表示Gr和Gs間的距離,又設(shè)nr和ns分別為Gr和Gs中樣品的個數(shù),dij表示Gr中第i個樣品與Gs中第j個樣品之間的距離。這里用類平均法定義類間距離,公式如下
4.3聚類
應(yīng)用SPSS軟件上選擇系統(tǒng)聚類法中的組間連接的聚類方法,相似性度量選擇余弦值度量法,輸出相似性矩陣R=( rij)40×40與聚類分析樹狀圖(見圖1)。
相似矩陣中的相似度r的選取的不同,分類結(jié)果也發(fā)生變化。簡述即為,r越大,對相似度要求越高,聚得的類別越多,反之,r越小,對相似度要求越低,聚得的類別越少。
聚類結(jié)果為:r=0.971時,{x12,x5}為一類,其他各為一類,聚為三十九類;r=0.969時,{x12,x5}為一類,{x19,x10}為一類,其他各為一類,聚為三十八類;r = 0.966時,{x12,x5}為一類,{x19,x10}為一類,{x32,x35}為一類,其他各為一類,聚為三十七類;……,r=0.744時,{x9,x22}為一類,{x33,x38,x37}為一類,{x5}為一類,其他為一類,聚為四類;r=0.739時,{x9,x22}為一類,{x5}為一類,其他為一類,聚為三類;r =0.687時,{x5}為一類,其他為一類,聚為兩類。
4.4最優(yōu)聚類結(jié)果的選取
4.4.1樹狀圖法
圖1為40個林業(yè)局樣本集聚類分析樹狀圖,樣本相當于最左端的枝葉,依次連接在樹上,樹根在最右邊;頂端尺度表示樣品、類之間的距離[4]。比如樣本6與樣本22的距離最遠,因為從樣本6出發(fā)必須一直下到最右端樹根部,再沿另一枝條到達樣本22;而樣本6與樣本15則無需下到最右端樹根部。由圖形非常直觀地看出,聚類不應(yīng)該多余12類,這樣得到的分類中樣本之間都能有相當?shù)木嚯x。如果分成6類,只需設(shè)想從頂端距離尺度約15~20單位長度中間豎直下切,連接樣本的樹枝就被分割成6個大枝條,同一枝條上的樣本歸屬于同一類;如果分成4類,只需設(shè)想從頂端距離尺度約20~25單位長度中間豎直下切,連接樣本的樹枝就被分割成4個大枝條,同一枝條上的樣本歸屬于同一類。根據(jù)分析問題實際需要選擇方案或者根據(jù)下面的公式法詳細計算選擇。
4.4.2公式法
計算得將40個林業(yè)局聚為四或六類時對應(yīng)的F值進行比較,聚為4類時對應(yīng)的F值較大,F(xiàn) = 15.714。
最優(yōu)聚類方案:樺南和通北兩個林業(yè)局聚為一類,紅星、雙鴨山和林口三個林業(yè)局聚為一類,東方紅林業(yè)局為一類,其余林業(yè)局聚為一類。根據(jù)聚類結(jié)果分析得,東方紅林業(yè)局一直獨自聚為一類的原因在于,其施業(yè)區(qū)面積最大,約58萬hm2,林木種類繁多且野生資源豐富,創(chuàng)造的經(jīng)濟價值極大,是唯一由國家統(tǒng)計局認定為中國100家最大木材采運企業(yè),林區(qū)基礎(chǔ)設(shè)施建設(shè)基本完善,交通便利,人口素質(zhì)普遍較高;樺南和通北兩個林業(yè)局均地處黑龍江省北部,生態(tài)林木資源及經(jīng)濟發(fā)展情況相似,發(fā)展水平較好,與其他林業(yè)局相比交通
運輸情況一般,新型小城鎮(zhèn)建設(shè)情況良好;紅星、雙鴨山和林口三個林業(yè)局,雖經(jīng)濟繁榮,交通便利,但人才素質(zhì)偏低,人才流失現(xiàn)象較多且人口處低增長趨勢;其他林業(yè)局小城鎮(zhèn)建設(shè)各方面穩(wěn)步進行,發(fā)展狀況良好。
參考文獻:
[1]黑龍省人民政府.黑龍江省主體功能區(qū)規(guī)劃[EB/OL].(2012-05- 18)[2015- 12- 18]http://www.chinaneast.gov.cn/c_ 131595917.htm.
[2]國家發(fā)改委,國家林業(yè)局.大小興安嶺林區(qū)生態(tài)保護與經(jīng)濟轉(zhuǎn)型規(guī)劃(2010- 2020)[EB/OL].(2010- 12- 23)[2010- 12- 23]http: //www.gov.cn/zwgk/content_1771668.htm.
[3]朱建平.應(yīng)用多元統(tǒng)計分析[M].北京:科學出版社, 2006.
[4]管宇.實用多元統(tǒng)計分析[M] .杭州:浙江大學出版社. 2011.
[5]常建斌,顧鳳岐,溫廣玉,等.大興安嶺林火氣候的區(qū)劃[J].東北林業(yè)大學學報, 1995(5):98- 102.
[責任編輯:路實]
改革實踐
理論研究
Evaluation of Small Town Construction in State- owned Forest Region of Heilongjiang Province Based on Cluster Analysis
GUANFeng- li, GUFeng- qi
(Northeast Forestry University, Harbin Heilongjiang150040, China)
Abstract:According to the collected index data of forty each state- owned forest bureau in Heilongjiang province (2008- 2012 sample sets), this paper selected the main fourteen indexes as characteristics, application of system clustering method on forty state- owned forest administration in Heilongjiang province (the fortysamples)clustered; it is concluded that the four classes for fortystate- owned forest bureau together is the optimal clustering scheme. According to the result of clustering, this paper put forward the construction situation evaluation and suggestions to.the current state- owned forest region small towns.
Key words:system clustering method; the state- owned forest region; construction of small towns; classification
通訊作者:顧鳳岐(1963-),男,黑龍江五常人,教授,研究方向:生物數(shù)學。
作者簡介:第一關(guān)鳳麗(1991 - ),女,黑龍江龍江縣人,碩士研究生。
收稿日期:2015- 01- 06
DOI:10.13691/j. cnki. cn23- 1539/f. 2016.01.002
中圖分類號:F326.27
文獻標識碼:A
文章編號:1673- 5919(2016)01- 0008- 03