呂欣陽,翟開慎
(1.南京林業(yè)大學林學院,江蘇 南京 210037;2.南京大學地理與海洋科學學院,江蘇 南京210023)
農村居民點在我國農村用地類型中占有重要地位,是農村地區(qū)長期復雜的自然、人文因素相互作用相互影響的產物,其分布情況在一定程度上反映著當?shù)氐淖匀惶卣骱蜕鐣宋那闆r。我國改革開放至今,城市化進程加快,農村居民點地區(qū)普遍存在著量大、布局散、空心村現(xiàn)象嚴重、城鄉(xiāng)住宅容積率嚴重失衡等問題[1-3]。開展農村居民點的分組類型與布局優(yōu)化的研究,能夠使得鄉(xiāng)村公共基礎服務設施獲得集約利用和定向維護,能充分利用農村建設用地,緩解緊張的城鄉(xiāng)用地矛盾,緩解“空心村”現(xiàn)象的進一步擴張。
本文選取位于太湖平原的常州市武進區(qū)農村居民點為研究對象,采用空間分析技術、數(shù)理統(tǒng)計和聚類分析等研究方法,對現(xiàn)有農村居民點進行特征提取并分類,劃分出農村居民點的區(qū)位特征和待優(yōu)化農村居民點的優(yōu)先程度。研究結果可為布局不合理村莊進行優(yōu)化和整治提供整治建議,也可用于農村土地綜合整治實地工作的理論參考。
武進區(qū)(北緯31°20′~31°48′、東經119°40′~120°12′),隸屬于江蘇省常州市,地處江蘇省南部的長江三角洲,位于太湖平原西北,亞熱帶北緣,光溫適宜,雨水充沛,土地肥沃,物產豐富,素有“魚米之鄉(xiāng)”之稱。武進經濟產業(yè)發(fā)達且發(fā)展實力強勁。作為典型“蘇南模式”的發(fā)源地之一,武進民營經濟發(fā)達,被列為全國首批雙創(chuàng)示范基地,中國馳名商標數(shù)量穩(wěn)居全省前列,綜合實力長期穩(wěn)居全國2 800多個縣(市、區(qū))十強。
研究收集了武進區(qū)2015年土地利用調查數(shù)據(jù),Open Street Map(OSM)地圖矢量數(shù)據(jù),“地理空間數(shù)據(jù)云”提供的GDEM 30 m分辨率數(shù)字高程數(shù)據(jù)以及全國1 km×1 km人口密度柵格數(shù)據(jù)。通過Python語言解析高德地圖API的數(shù)據(jù),獲取武進區(qū)范圍內的主要POI興趣點數(shù)據(jù)。
表1 研究數(shù)據(jù)
從2015年武進區(qū)地類圖斑數(shù)據(jù)中分別提取二級類中的村莊用地、公路用地和水面集(水庫、河流、湖泊、坑塘)圖斑[8]。村莊用地即農村居民點單元作為研究的主要對象。
圖1 武進區(qū)鄉(xiāng)鎮(zhèn)級行政區(qū)分布
為能更好的了解農村居民點圖斑的空間分布特征和其所處區(qū)位的優(yōu)劣,研究采用建立漁網(wǎng)單元的方式進行初步分析。使用ArcGIS中創(chuàng)建漁網(wǎng)工具,對武進區(qū)行政區(qū)進行規(guī)則格網(wǎng)化處理,將漁網(wǎng)圖層與武進區(qū)地類圖斑進行疊加分析,獲得每個格網(wǎng)單元的各項地類屬性。使用Python語言從國內地圖導航網(wǎng)站獲取相關POI數(shù)據(jù),選取交通設施服務、科教文化服務、醫(yī)療保健服務和購物及生活服務四類POI興趣點數(shù)據(jù)用于研究[6]。
在ArcGIS中利用DEM數(shù)據(jù)進行地形因子的提取,分別生成武進區(qū)海拔高程圖、坡度圖。為研究村莊圖斑所在區(qū)域內村莊面積及鄰域面積的大小,將矢量格網(wǎng)數(shù)據(jù)按村莊面積作為輸出值,生成村莊面積柵格圖層。使用鄰域分析計算每個格網(wǎng)單元其5×5鄰域內村莊面積大小和人口密度。根據(jù)“中國知網(wǎng)”提供的武進區(qū)統(tǒng)計年鑒(2015-2016年)及相關統(tǒng)計公報等材料,將武進區(qū)各下轄鎮(zhèn)主要經濟指標錄入行政區(qū)各省屬性表中。
2.3.1 GIS空間分析方法
使用矢量幾何計算、矢量疊合分析和空間近鄰分析,以及柵格數(shù)據(jù)空間分析中的數(shù)字地形模型分析、分區(qū)統(tǒng)計、焦點統(tǒng)計等功能。
2.3.2 智能聚類分析方法
聚類分析旨在揭露一個數(shù)據(jù)集中觀測值的子集,最常用的兩種聚類方法是層次聚類和劃分聚類。對于層次聚類來說,最常用的算法是單聯(lián)動、全聯(lián)動、平均聯(lián)動、質心和Ward方法。對于劃分聚類來說,最常用的算法是K均值(K-means)和圍繞中心點的劃分(PAM)。本研究采用K均值聚類分析,算法步驟如下:
(1)隨機地選擇K條數(shù)據(jù),作為初次聚類中心點;
(2)把每條數(shù)據(jù)行對應的數(shù)據(jù)分配到距它最近的中心點;
(3)重新計算K類中各點到其所在類的中心點距離的平均值;
(4)將每個數(shù)據(jù)按最近距離分配到它最近的中心點;
(5)重復步驟(3)和(4)直到所有觀測值不再被分配或達到最大的預設迭代次數(shù)。
通過對2015年武進區(qū)地類圖斑數(shù)據(jù)進行空間分析,獲得農村居民點的用地現(xiàn)狀。運用地形位指數(shù),再結合交通因素,分析農村居民點分布的離散特征以及影響因素的分布特點,最后總結出武進區(qū)農村居民點的空間分布特征。取漁網(wǎng)單元中心點代表對應的漁網(wǎng)單元格區(qū)域,分別計算了單元中心點與POI興趣點和公路的距離。將研究對象抽象為具有相同的面積范圍的格網(wǎng)單元,比較它們之間內部地類構成及各單元格的地理空間特征。
2015年,武進區(qū)村莊用地面積為12 573.6 hm2,占全區(qū)土地總面積的13.80%,占全區(qū)建設用地面積的35.92%,村莊用地較2014年增長109.9 hm2。2015年武進區(qū)地類圖斑包含村莊圖斑數(shù)24 467個,圖斑最小面積為2.5 m2,最大面積為244 162.4 m2。
地形位指數(shù)是一個由海拔和坡度計算出的,分別包括了地區(qū)高程、坡度特征的一個綜合描述性指數(shù),反映某一地區(qū)的地形屬性,地形位指數(shù)計算公式為:
(1)
式(1)中:E為研究區(qū)域內平均高程值;s為空間任一柵格坡度值;S為區(qū)域內平均坡度值。計算各格網(wǎng)單元對應的地形位指數(shù),可綜合描述高程和坡度屬性。高程越低且坡度越小的格網(wǎng)單元,地形位指數(shù)越低。地形位指數(shù)越低,越利于農村居民點的建設和發(fā)展。
相關分析(Correlation Analysis)是研究兩個或兩個以上處于同等地位的隨機變量間的相關關系的統(tǒng)計分析方法,用來定量表述影響因子之間關系的密切程度。使用RStudio軟件對格網(wǎng)單元屬性數(shù)據(jù)進行相關分析和顯著性檢驗。在進行相關分析和檢驗之前,對原始數(shù)據(jù)進行z-Score標準化處理。采用Pearson檢驗計算線性相關系數(shù)(圖2)。
圖2 研究區(qū)數(shù)據(jù)相關分析圖
用于研究農村居民點鄰域的宜居及發(fā)展?jié)摿η闆r的因子分別為:Slope(坡度值)、Elevation(高程值)、Topography(地形位指數(shù))、To Road(靠近公路距離)、To_Service(靠近生活購物服務距離),To_Hospital(靠近醫(yī)療保健服務距離),To_School(靠近科教文化服務距離),To_Station(靠近交通設施服務距離)、Fishnet_Pop(人口密度),Buffer_Pop(鄰域人口密度),F(xiàn)ishnet_RA(村莊用地面積),Buffer_RA(鄰域村莊用地面積)Waters(水域面積),共計13項。圖中所劃×號表示P值大于0.05,未劃×號的相關性值表示兩變量間具有統(tǒng)計學上的顯著意義,從圖中可知:
(1)研究區(qū)高程、坡度及地形位指數(shù)間有非常強的相關性,介于0.83~0.93,但三者與其余屬性的相關性較為微弱,表明在太湖平原地區(qū)地勢相對低平,海拔和坡度對農村居民點的分布及發(fā)展沒有起到太大的影響。
(2)公共基礎服務設施多建在主要公路附近。規(guī)則格網(wǎng)單元靠近公路的距離與靠近醫(yī)療、教育、生活購物POI的距離成較強的相關性,表明這三項主要的公共基礎服務設施多分布在交通便利之處,且相互之間比較集中。
(3)農村居民點多分布在交通便利、服務設施較完善的地方。距離四類POI點的距離與單元格網(wǎng)人口密度及村莊面積存在一定的負相關性。
(4)農村居民點在空間分布上較為零散,人口數(shù)目在空間上分布較為均勻。
綜上所述,一個分布良好、具有長期留存價值和發(fā)展?jié)摿Φ霓r村居民點具有的特征是:所在區(qū)域有較小的地形位指數(shù);交通便利,靠近公共服務設施點,區(qū)域內水域面積較小;農村居民點自身或其一定鄰域內有較大面積村莊。
3.4.1 變量預處理
選擇所有進行相關分析的變量,共計13項。根據(jù)相關分析的結果,為使得研究數(shù)據(jù)各屬性因子都有相同的優(yōu)劣趨向性(值越大表示越有利于農村居民點建設),對地形位指數(shù)、各距離值以及水域面積進行取相反數(shù)處理。聚類分析主要按照數(shù)據(jù)點間的距離來分類。如果在分析中選擇的變量變化范圍很大,那么該變量對結果的影響也是最大的。所以在進行分析之前需進行數(shù)據(jù)縮放處理。最常用的方法是將變量進行z-Score標準化,獲得一組均值為0,標準差為1的變量。
3.4.2 聚類結果
在RStudio中使用K-means聚類,聚類數(shù)目從1遍歷至20,每次聚類結果都會獲得三個統(tǒng)計量totSS、tot.withinSS和betweenSS。在聚類數(shù)目K確定的條件下,betweenSS/totSS越大,tot.withinSS越小,類內相似度越高,聚類效果越好。經過計算,較好的聚類數(shù)目為4類。
確定聚類數(shù)目后,會生成每個數(shù)據(jù)點的最終類別。將這些數(shù)據(jù)點按照規(guī)則格網(wǎng)ID導入ArcGIS中,即獲得聚類分析的可視化效果(圖3),其中白色區(qū)域不含農村居民點。
圖3 K均值聚類(4類)結果
使用ArcGIS分組分析功能,按照4個分組數(shù)目生成相應的分組結果(圖4),為方便比照,后期將分組結果的顏色進行了調整。分組分析也支持評定最佳分組組數(shù),通常為F統(tǒng)計量較大而類數(shù)小的組數(shù)。再按照評定的最佳分組數(shù)進行分組(圖5)。
圖4 ArcGIS分組分析(4類)結果
圖5 ArcGIS分組分析(2類)結果
組類數(shù)目地形位距公路距商店距醫(yī)院距學校距車站人口密度村莊面積水域面積綠2144次小次遠次遠最遠最遠較遠最小次小最大黃1849最小最近最近最近最近最近最大最大次小藍56最大最遠最遠次遠較遠最遠次小最小最小紅3276
結合圖5與表2可知,黃色格網(wǎng)區(qū)域為交通最便利,公共服務設施最完備,村莊用地面積最大,人口居住較為集中的地方,緊靠著武進城區(qū),屬于最有發(fā)展前景的農村居民點范圍;藍色格網(wǎng)區(qū)域數(shù)目最少,其主要特征是地形位指數(shù)最高,處于高海拔地區(qū),附近多有山峰,適宜發(fā)展旅游業(yè);綠色格網(wǎng)區(qū)域,交通狀況最不便利,距離周邊公共服務點也非常遠,區(qū)域內多為小面積村莊,人口分布較為稀疏,為本次農村居民點優(yōu)化布局的重點關注對象。紅色格網(wǎng)區(qū)域,介于黃色區(qū)域與綠色區(qū)域之間,發(fā)展優(yōu)勢與待優(yōu)化劣勢并存,屬于可選的村莊優(yōu)化對象。
在了解研究區(qū)農村居民點分組類型基礎上,將之前K均值聚類與兩次分組分析結果進行匯總,再選擇其中綠色和紅色區(qū)域,進行求交集計算,結果如表3、表4及表5。
表3 三種分類結果
表4 綠色區(qū)域分類結果交集
表5 紅色區(qū)域分類結果交集
根據(jù)格網(wǎng)與村莊地類圖斑的空間關系可知,使用K均值與分四組分析時,綠色優(yōu)先待優(yōu)化區(qū)域交集格網(wǎng)數(shù)有1 918個,對應村莊圖斑個數(shù)有6 246處;紅色可選優(yōu)化區(qū)域交集格網(wǎng)數(shù)有2 979個,對應村莊圖斑個數(shù)有9 518處。四分位數(shù)與均值常用于測量數(shù)據(jù)的分散程度。經統(tǒng)計,紅綠格網(wǎng)區(qū)域邊界處共有397處村莊地類圖斑。研究采用綠色區(qū)域內村莊用地面積第一個四分位值508 m2作為閾值,并選擇數(shù)據(jù)中面積小于閾值的地類圖斑作為最終待優(yōu)化的農村居民點對象,其中綠色區(qū)域內村莊用地具有最高優(yōu)先級,紅色區(qū)域內村莊用地面積普通優(yōu)先級,二者臨界線上的村莊用地具有較高優(yōu)先級。
表6 待優(yōu)化農村居民點統(tǒng)計表
圖6 農村居民點布局優(yōu)化方案
研究結果表明,在地形平坦、含有豐富的河網(wǎng)水系的太湖平原地區(qū),海拔高度與坡度大體較為一致,其與農村居民點面積和空間分布的線性關系微弱,這時到達公路、公共基礎服務點的距離以及河網(wǎng)密度等因素對農村居民點的分布起到很大作用,分布在交通便利、服務設施較完善地方的農村居民點,擁有更好的區(qū)位特征和更大的發(fā)展建設優(yōu)勢。通過對農村居民點其空間分布特征的分析和研究,武進區(qū)的農村居民點空間分布仍較為零散,區(qū)域內格網(wǎng)單元含村莊面積與鄰域內含村莊總面積之間存在中等相關性。使用R語言和ArcGIS對其進行聚類及分組分析,得到的分類結果基本一致。從結果中可看出同級區(qū)位分布較為集中,且區(qū)位特征按農村居民點建設優(yōu)勢性從高到低依次對應距離城區(qū)從近到遠的區(qū)域,呈現(xiàn)出一定程度的圓形或水波形分布。