王卷樂,王曉潔,王明明,姚錦一,王嵐?jié)?,邱叢?/p>
1.中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京100101
2.山東理工大學(xué)建筑工程學(xué)院,山東淄博 255049
3.武漢大學(xué)城市設(shè)計學(xué)院,武漢 430000
數(shù)據(jù)庫(集)基本信息簡介
數(shù)據(jù)庫(集)名稱 中國鄉(xiāng)鎮(zhèn)(街道)人口密度數(shù)據(jù)集(2010年)數(shù)據(jù)作者 王卷樂、王曉潔、王明明、姚錦一、王嵐?jié)?、邱叢叢?shù)據(jù)通信作者 王卷樂(wangjl@igsnrr.ac.cn)數(shù)據(jù)時間范圍 2010年地理區(qū)域安徽省、北京市、福建省、甘肅省、廣東省、廣西省、貴州省、海南省、河北省、河南省、黑龍江省、湖北省、湖南省、吉林省、江蘇省、江西省、遼寧省、內(nèi)蒙古自治區(qū)、寧夏回族自治區(qū)、青海省、山東省、山西省、陜西省、上海市、四川省、天津市、西藏自治區(qū)、新疆維吾爾自治區(qū)、云南省、浙江省、重慶市。空間分辨率 1 km數(shù)據(jù)量 108 MB數(shù)據(jù)格式 *.tif數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址 http://www.sciencedb.cn/dataSet/handle/964基金項目中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(A類)(XDA19040501);中國科學(xué)院“十三五”信息化專項科學(xué)大數(shù)據(jù)工程項目(XXH13505-07)。
?
“100億人在地球上如何生存和分布”被認(rèn)為是21世紀(jì)地理科學(xué)的11個重大戰(zhàn)略方向之一[1]??臻g分布是人口的重要屬性,人口密度則是表現(xiàn)人口空間分布最主要的形式和衡量人口分布地區(qū)差異的主要指標(biāo)[2]。中國擁有世界上最多的國家人口總數(shù),人口分布不平衡,資源環(huán)境承載壓力大[3]。準(zhǔn)確、精細(xì)的人口密度數(shù)據(jù)能夠為區(qū)域規(guī)劃與開發(fā)、災(zāi)害風(fēng)險評估和救援、醫(yī)療資源配置和資源環(huán)境承載力評估等研究和應(yīng)用提供支撐[4]。在全球尺度,美國國家橡樹嶺實驗室完成了LandScan數(shù)據(jù)集[5],哥倫比亞大學(xué)國際地球科學(xué)信息網(wǎng)絡(luò)中心完成了GPW(Gridded Population of the World)數(shù)據(jù)集[6],但這些全球尺度的數(shù)據(jù)集在中國的精度存在顯著的區(qū)域差異[7-8]。在中國區(qū)域,有學(xué)者基于居民地重分類方法獲取長江中游 4省人口空間分布數(shù)據(jù)[9],基于多元回歸方法獲取宣城城區(qū)人口空間數(shù)據(jù)[10],以及基于人口統(tǒng)計數(shù)據(jù)和土地利用關(guān)聯(lián)建模的中國公里網(wǎng)格尺度人口空間分布數(shù)據(jù)集[11-13]。然而,這些數(shù)據(jù)多數(shù)是在縣級人口統(tǒng)計數(shù)據(jù)單元基礎(chǔ)上的產(chǎn)品,缺乏更精細(xì)尺度的表達刻畫。鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)是目前官方公布的最精細(xì)的人口數(shù)據(jù),然而鄉(xiāng)鎮(zhèn)級的人口空間數(shù)據(jù)缺乏。究其原因在于兩點,一是鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)獲取困難,且存在大量的行政區(qū)劃和地名變更問題,難以直接利用。二是鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)的空間關(guān)聯(lián)需要進行大量的涉及鄉(xiāng)鎮(zhèn)地名和行政區(qū)劃的空間數(shù)據(jù)匹配處理工作,工作量大且技術(shù)要求較高。柏中強等人[4]結(jié)合第5次人口普查構(gòu)建2000年中國27省鄉(xiāng)鎮(zhèn)級平均人口密度數(shù)據(jù)集,但尚未見2010年的同類數(shù)據(jù)產(chǎn)品。本文將2010年國家統(tǒng)計局發(fā)布的中國31個省(直轄市、自治區(qū))鄉(xiāng)鎮(zhèn)(街道)單元的人口統(tǒng)計數(shù)據(jù)按鄉(xiāng)鎮(zhèn)行政區(qū)劃建立空間匹配。利用鄉(xiāng)鎮(zhèn)級行政區(qū)劃數(shù)據(jù)的人口屬性和面積屬性計算鄉(xiāng)鎮(zhèn)級平均人口密度,經(jīng)過矢柵轉(zhuǎn)化形成本數(shù)據(jù)集。
統(tǒng)計數(shù)據(jù)來源于中國國家統(tǒng)計局[14],鄉(xiāng)鎮(zhèn)(街道)邊界數(shù)據(jù)來源于地理國情監(jiān)測云平臺[15]、國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心[16]、中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心[17]和部分地圖圖件。
1.2.1 拓?fù)涮幚?/p>
鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)易存在兩種拓?fù)溴e誤:行政區(qū)劃邊界處存在重疊或空隙現(xiàn)象。造成這種錯誤有兩種情況,一種是由鄉(xiāng)鎮(zhèn)(街道)矢量單元發(fā)生偏移造成的有規(guī)律的重疊和空隙,另一種是由鄉(xiāng)鎮(zhèn)(街道)矢量單元存在殘缺或多余造成的不規(guī)律的重疊和空隙。其中第一種情況利用ArcGIS軟件的空間校正(Spatial Adjustment)功能將鄉(xiāng)鎮(zhèn)(街道)矢量單元移回原來的位置,第二種情況利用ArcGIS的建立拓?fù)涔δ苤械摹安荒苤丿B(Must Not Overlap)”和“不能有縫隙(Must Not Have Gaps)”規(guī)則實現(xiàn)對殘缺部分的補充和對多余部分的去除。
1.2.2 屬性關(guān)聯(lián)
鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)與鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)的屬性關(guān)聯(lián)是指人口統(tǒng)計數(shù)據(jù)的鄉(xiāng)鎮(zhèn)(街道)單元的人口總值屬性同行政區(qū)劃矢量數(shù)據(jù)的空間屬性相關(guān)聯(lián),實現(xiàn)鄉(xiāng)鎮(zhèn)級人口統(tǒng)計值在空間上的分布。兩者屬性關(guān)聯(lián)可以通過兩者的公用字段(鍵)來自動關(guān)聯(lián),但往往由于存在以下3種情況導(dǎo)致人口統(tǒng)計數(shù)據(jù)和行政區(qū)劃矢量數(shù)據(jù)不能完全自動關(guān)聯(lián)成功:①鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)的表征時間和鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)的時間不一致,在這段時間差內(nèi)發(fā)生過行政區(qū)劃的調(diào)整;②鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)存在誤差,矢量數(shù)據(jù)的行政區(qū)劃單元多于或少于人口統(tǒng)計數(shù)據(jù)的行政單元;③人口統(tǒng)計數(shù)據(jù)和行政區(qū)劃矢量數(shù)據(jù)對鄉(xiāng)鎮(zhèn)(街道)的命名方式不統(tǒng)一。由以上原因造成自動關(guān)聯(lián)失敗的鄉(xiāng)鎮(zhèn)(街道)單元需要進行手動關(guān)聯(lián)。
本文采用決策樹的思想實現(xiàn)鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)與鄉(xiāng)鎮(zhèn)級行政區(qū)劃矢量數(shù)據(jù)的屬性關(guān)聯(lián),如圖1所示。此決策樹共包含四層。第一層根節(jié)點以鄉(xiāng)鎮(zhèn)(街道)的名稱作為公用字段(鍵)實現(xiàn)矢量數(shù)據(jù)和統(tǒng)計數(shù)據(jù)的自動關(guān)聯(lián),由此會出現(xiàn)自動關(guān)聯(lián)部分和不能自動關(guān)聯(lián)部分兩個有向邊。第二層對這兩部分做進一步處理,其中自動關(guān)聯(lián)部分需要以區(qū)縣為單元檢驗自動關(guān)聯(lián)的準(zhǔn)確性;自動關(guān)聯(lián)失敗的部分以區(qū)縣為單元進行手動關(guān)聯(lián),尋找自動關(guān)聯(lián)失敗的原因,由此產(chǎn)生6個有向邊。第三層包含2個內(nèi)部節(jié)點和4個葉節(jié)點。左邊的內(nèi)部節(jié)點是由行政區(qū)劃調(diào)整導(dǎo)致的自動關(guān)聯(lián)失敗,需要根據(jù)調(diào)整信息統(tǒng)一矢量數(shù)據(jù)和統(tǒng)計數(shù)據(jù)的行政區(qū)劃;右邊的內(nèi)部節(jié)點是自動關(guān)聯(lián)錯誤的情況下,手動尋找統(tǒng)計數(shù)據(jù)中對應(yīng)的人口值,2個內(nèi)部節(jié)點分別產(chǎn)生2個有向邊。中間的4個葉節(jié)點是第二層中間4個有向邊的具體解決方案。第四層是第三層4個有向邊的具體解決方案。具體流程如圖1所示。
圖1 鄉(xiāng)鎮(zhèn)級人口空間數(shù)據(jù)庫建設(shè)流程[18]
1.2.3 平均人口密度計算
根據(jù)公式(1),計算各鄉(xiāng)鎮(zhèn)(街道)平均人口密度:
式中,D為人口密度(人/ km2);P為鄉(xiāng)鎮(zhèn)(街道)人口數(shù)量(人);A為鄉(xiāng)鎮(zhèn)(街道)面積(km2)。
1.2.4 矢量轉(zhuǎn)柵格
利用ArcGIS的Polygon to Raster工具將人口密度矢量圖層轉(zhuǎn)化為柵格圖層,空間分辨率為1 km×1 km。
本數(shù)據(jù)集為柵格數(shù)據(jù)類型,空間分辨率為1 km2,后綴名為tif。本數(shù)據(jù)集包括全國22個省、5個自治區(qū)以及4個直轄市內(nèi)42 122個統(tǒng)計單元的平均人口密度信息。數(shù)據(jù)以Krasovsky橢球為基準(zhǔn),投影方式為Albers投影,最后生成中國2010年鄉(xiāng)鎮(zhèn)街道人口密度。中國31個?。ㄖ陛犑?、自治區(qū))的人口密度由東部地區(qū)至西部地區(qū)總體上呈現(xiàn)出密集到稀疏的分布規(guī)律,人口主要分布在中國的中東部地區(qū),集中表現(xiàn)在京津冀、長三角、珠三角等經(jīng)濟文化較發(fā)達地區(qū)以及山東、河南等地區(qū)。圖2是中國部分城市群2010年分鄉(xiāng)鎮(zhèn)街道人口密度示例圖,圖中將人口密度分為10級,藍色區(qū)域代表人口平均密度小于等于50人/km2,紅色范圍表示人口平均密度大于等于2000人/km2。
圖2 中國部分城市群2010年分鄉(xiāng)鎮(zhèn)街道人口密度分布
利用省級行政區(qū)劃矢量邊界統(tǒng)計柵格數(shù)據(jù)集,得到每個省份的柵格數(shù)據(jù)集人口值,與2010年省級人口統(tǒng)計數(shù)據(jù)進行對比(圖3)。計算全國省級統(tǒng)計人口數(shù)據(jù)與柵格數(shù)據(jù)集人口數(shù)據(jù)之間的相對誤差(圖4),其誤差計算公式(式2)如下所示:
其中,E表示相對誤差;pi1表示第i個省級行政區(qū)柵格數(shù)據(jù)集的值;pi2表示第i個省級行政區(qū)統(tǒng)計人口值。
圖3 柵格數(shù)據(jù)集人口與統(tǒng)計人口對比
由圖3對比可得,數(shù)據(jù)集的人口分布趨勢與省市級統(tǒng)計人口值基本一致,總體精度高達99%,說明本人口數(shù)據(jù)集精度較高。部分省份(例如福建省和浙江?。┮虻乩項l件復(fù)雜、鄉(xiāng)鎮(zhèn)(街道)行政邊界破碎且多變,造成矢柵轉(zhuǎn)換過程中產(chǎn)生誤差略大,但仍然控制在10%以內(nèi),能夠滿足應(yīng)用需求。
圖4 柵格數(shù)據(jù)集人口與統(tǒng)計人口誤差
本數(shù)據(jù)集包括2010年全中國31個省級行政區(qū),其中22個省、5個自治區(qū)和4個直轄市鄉(xiāng)鎮(zhèn)街道單元內(nèi)人口統(tǒng)計數(shù)據(jù)。本數(shù)據(jù)集將全國范圍內(nèi)(不包括港、澳、臺特別行政區(qū))鄉(xiāng)鎮(zhèn)街道級人口統(tǒng)計數(shù)據(jù)與42 122個統(tǒng)計單元矢量邊界進行關(guān)聯(lián),在空間上展示中國最精細(xì)的鄉(xiāng)鎮(zhèn)級人口分布數(shù)據(jù)。中國的全國人口普查數(shù)據(jù)每10年統(tǒng)計一次,因此本數(shù)據(jù)集可以成為鄉(xiāng)鎮(zhèn)(街道)級人口數(shù)據(jù)分布的本底數(shù)據(jù)集,可以在空間尺度上反映我國人口的精細(xì)分布狀況,為經(jīng)濟發(fā)展、城市規(guī)劃、醫(yī)療資源配置、災(zāi)害評估等提供數(shù)據(jù)參考。
本數(shù)據(jù)集可以用能夠處理柵格或矢量數(shù)據(jù)的地理信息系統(tǒng)相關(guān)軟件打開[4],包括開源的QGIS和GRASS GIS軟件、商業(yè)化的ArcGIS、SuperMap、ENVI等。本數(shù)據(jù)集的空間分辨率為1 km,可以直接用來表征中國鄉(xiāng)鎮(zhèn)街道級的人口空間分布,為中國人口、資源、環(huán)境、災(zāi)害、生態(tài)等科學(xué)研究提供重要基礎(chǔ)和本底數(shù)據(jù)。同時也可以結(jié)合同一尺度的土地利用數(shù)據(jù)、居民點數(shù)據(jù)、DEM數(shù)據(jù)、夜間燈光數(shù)據(jù)、道路交通數(shù)據(jù)、社交媒體數(shù)據(jù)等多源數(shù)據(jù)進行融合和綜合分析,進一步揭示中國區(qū)域人口空間化的地理分布特征,為人類活動模擬、區(qū)域規(guī)劃、資源配置、災(zāi)害評估等研究和應(yīng)用提供數(shù)據(jù)產(chǎn)品。