劉治成 肖東升
摘要:針對(duì)已有的人口空間化研究多采用靜態(tài)數(shù)據(jù)、時(shí)空分辨率較低、在應(yīng)急救援等方面實(shí)用性不高的問(wèn)題,提出了一種使用高時(shí)空分辨率數(shù)據(jù),結(jié)合城市圈層結(jié)構(gòu)理論和主成分分析法的建筑物尺度人口估算方法。以成都市為例,利用騰訊位置大數(shù)據(jù),通過(guò)計(jì)算不同城市圈層的定位率,得到了成都市不同時(shí)段1 km×1 km的人口分布數(shù)據(jù)。在此基礎(chǔ)上,以基于建筑物中心點(diǎn)的泰森多邊形為人口分配基本單元,結(jié)合宜出行熱力數(shù)據(jù)和POI數(shù)據(jù),分別計(jì)算其對(duì)人口分布的貢獻(xiàn)值并賦予計(jì)算權(quán)值,得到了成都市青羊區(qū)建筑物尺度人口分布數(shù)據(jù)。街道尺度統(tǒng)計(jì)數(shù)據(jù)回歸分析的決定系數(shù)R2為0.926 4,總體精度較高,模擬人口分布符合實(shí)際情況。
關(guān)鍵詞:應(yīng)急救援;主成分分析;人口分布;POI;建筑物
中圖分類號(hào):P315.94?? 文獻(xiàn)標(biāo)識(shí)碼:A?? 文章編號(hào):1000-0666(2021)02-0251-11
0 引言
人口是自然災(zāi)害最重要的承災(zāi)體,人口分布數(shù)據(jù)是應(yīng)急救援的關(guān)鍵支撐數(shù)據(jù)(郭建興等,2018)。人口分布與城市的經(jīng)濟(jì)發(fā)展、基礎(chǔ)設(shè)施建設(shè)以及生態(tài)環(huán)境保護(hù)等都有著緊密聯(lián)系(李國(guó)平,陳秀欣,2009)。目前,我國(guó)人口統(tǒng)計(jì)是以行政區(qū)劃逐級(jí)統(tǒng)計(jì)和匯總的,最低統(tǒng)計(jì)到鄉(xiāng)鎮(zhèn)街道一級(jí),10年更新一次,不能滿足災(zāi)害應(yīng)急救援等方面的應(yīng)用要求。探究城市內(nèi)部更小尺度的人口空間分布是人口空間化研究的重點(diǎn)之一(李澤宇,董春,2019;賈召亮等,2020)。
隨著移動(dòng)終端及GPS技術(shù)的高速發(fā)展,移動(dòng)終端的位置服務(wù)進(jìn)入了研究者的視野。例如王賢文等(2017)利用騰訊位置服務(wù)相關(guān)數(shù)據(jù)研究了京津冀地區(qū)在短期內(nèi)的人口流動(dòng);潘碧麟等(2019)通過(guò)微博簽到數(shù)據(jù)研究了成渝之間的城際人口流動(dòng)規(guī)律;吳中元等(2019)利用騰訊位置大數(shù)據(jù)對(duì)南京市江寧區(qū)秣陵街道進(jìn)行了小區(qū)級(jí)別的人口數(shù)據(jù)預(yù)測(cè);Sakaki等(2010)通過(guò)提取日本社交軟件用戶在分享信息的同時(shí)攜帶的位置信息,研究了地震對(duì)Twitter用戶時(shí)空行為造成的影響。
在災(zāi)害應(yīng)急救援中,災(zāi)后第一時(shí)間的人口空間分布數(shù)據(jù)可幫助應(yīng)急救援部門快速部署救援力量,為受災(zāi)人員的救援贏得寶貴的時(shí)間(郭建興等,2018)。騰訊位置大數(shù)據(jù)可以實(shí)時(shí)記錄使用騰訊位置服務(wù)用戶的位置信息,空間分辨率為1 km,目前騰訊位置服務(wù)的使用量已突破日均500億人次,所以該數(shù)據(jù)在研究人口空間分布方面具有一定的代表性。該數(shù)據(jù)獲取簡(jiǎn)單,可快速獲取災(zāi)區(qū)震前1 km空間分辨率的使用騰訊位置大數(shù)據(jù)服務(wù)的人口空間分布,為救援力量的初步部署提供輔助數(shù)據(jù)。要更精確地鎖定可能受災(zāi)人群的具體位置,縮小救援人員的搜救范圍,提高搜救效率,則需要分辨率更高的人口空間分布數(shù)據(jù)。宜出行熱力數(shù)據(jù)是騰訊地圖通過(guò)模擬計(jì)算出的人口密度等級(jí),表達(dá)人口密度的相對(duì)大小,具有實(shí)時(shí)更新、實(shí)時(shí)獲取的特性,且該數(shù)據(jù)空間分辨率達(dá)到了27 m,可為更小尺度的人口空間化研究提供一定的參考。所以本文采用微信宜出行熱力數(shù)據(jù),結(jié)合POI興趣點(diǎn)數(shù)據(jù)對(duì)小范圍內(nèi)建筑物尺度的人口空間化進(jìn)行研究。
1 研究方法
1.1 基本原理
1.1.1 主成分分析
主成分分析(Principal Components Analysis,PCA)是通過(guò)將原始、復(fù)雜、多維的變量進(jìn)行線性組合,構(gòu)造互不相關(guān)的綜合變量,來(lái)降低變量維度的一種數(shù)據(jù)降維處理方法。數(shù)據(jù)經(jīng)主成分分析后可在降低數(shù)據(jù)維度的同時(shí)保持原始數(shù)據(jù)的大部分特征,減少數(shù)據(jù)的冗余程度,更利于進(jìn)行后續(xù)處理(賈俊平,2008)。
設(shè)某數(shù)據(jù)集X存在n個(gè)樣本,每個(gè)樣本有m個(gè)變量,則該數(shù)據(jù)集的矩陣如下:
Xm×n=
x11x12…x1n
x21x22…x21
xm1xm2…xmn(1)
由于在實(shí)際問(wèn)題中,矩陣的維度過(guò)大可能會(huì)導(dǎo)致后續(xù)處理復(fù)雜,耗時(shí)過(guò)久,通常需要對(duì)數(shù)據(jù)進(jìn)行主成分分析以降低數(shù)據(jù)維度,其具體步驟為:為了消除由于數(shù)據(jù)量綱不同引起的誤差,對(duì)原始矩陣進(jìn)行標(biāo)準(zhǔn)化處理,得到矩陣X*m×n;計(jì)算矩陣X*m×n的協(xié)方差矩陣;將X*m×n的協(xié)方差矩陣計(jì)算化為相關(guān)系數(shù)矩陣,公式為:
ρij=cov(xi,xj)σii σjj(2)
計(jì)算出特征值λ1,λ2,…,λm,λi≥0,i=1,2,…,m),并從小到大排列,得到相對(duì)應(yīng)的正交單位化特征向量θ1,θ2,…,θm;計(jì)算得到各個(gè)主成分的貢獻(xiàn)率,公式為:
Pi=λi∑mi=1λi (i=1,2,…,m)(3)
則其累計(jì)貢獻(xiàn)率為:
Pi(sum)=∑mi=1Pi (i=1,2,…,m)(4)
主成分提取原則通常按累計(jì)貢獻(xiàn)率達(dá)到約80%以上,或主成分特征值大于1提取主成分。得到提取的主成分后,計(jì)算每個(gè)主成分的得分,公式為:
ωri=θ1X*r1+θ2X*r2,…,+θmX*rm(r=1,2,…,n)(5)
式中:i為主成分提取個(gè)數(shù)。
1.1.2 泰森多邊形
泰森多邊形最初是由荷蘭氣象學(xué)家Thiessen提出的用離散氣象站點(diǎn)數(shù)據(jù)計(jì)算平均降雨量的一種插值分析方法,由其基點(diǎn)周圍的鄰點(diǎn)的垂直平分線組成,具有多邊形內(nèi)任意一點(diǎn)距多邊形控制點(diǎn)的距離小于到其他多邊形控制點(diǎn)距離的特點(diǎn)(閆慶武等,2011a)。
1.2 技術(shù)路線
本文首先通過(guò)騰訊位置大數(shù)據(jù)結(jié)合城市圈層結(jié)構(gòu)理論得到了成都市全域1 km人口空間分布數(shù)據(jù),再結(jié)合宜出行熱力數(shù)據(jù)和建筑物分布數(shù)據(jù)將人口分配至建筑物中,最終得到了青羊區(qū)建筑物尺度人口分布數(shù)據(jù),具體技術(shù)路線如圖1所示。
2 研究區(qū)概況與數(shù)據(jù)
2.1 研究區(qū)概況
成都市位于四川盆地西部、青藏高原東緣,東北與德陽(yáng)市相接、東南與資陽(yáng)市相鄰、南與眉山市相連、西南與雅安市接壤、西北與阿壩藏族羌族自治州鄰接,地理位置處于(30°05′~31°26′N,102°54′~104°53′E)。成都市包括錦江區(qū)、青羊區(qū)、成華區(qū)、武侯區(qū)、金牛區(qū)、雙流區(qū)、龍泉驛區(qū)、新都區(qū)、郫都區(qū)、溫江區(qū)、青白江區(qū)11個(gè)市轄區(qū)和都江堰市、彭州市、崇州市、邛崍市、簡(jiǎn)陽(yáng)市5個(gè)縣級(jí)市以及新津縣、金堂縣、大邑縣、蒲江縣4個(gè)縣。
據(jù)成都市發(fā)布的2018年統(tǒng)計(jì)年鑒數(shù)據(jù),截至2018年年底成都市常住人口數(shù)為1 633萬(wàn),其中城鎮(zhèn)常住人口數(shù)1 194萬(wàn),常住人口城鎮(zhèn)化率達(dá)到了73.12%;截至2018年年底成都市戶籍人口數(shù)為1 478.1萬(wàn),其中城鎮(zhèn)戶籍人口數(shù)為901.6萬(wàn),戶籍人口城鎮(zhèn)化率達(dá)到了61%,在西部地區(qū)城市中達(dá)到了相當(dāng)高的水平(成都市統(tǒng)計(jì)局,2019)。
成都市毗鄰龍門山地震帶,地震等自然災(zāi)害多發(fā),2008年汶川地震造成成都市死亡4 156人,受傷17 802人。成都市作為西部地區(qū)人口最多的市級(jí)行政單位,對(duì)掌握高時(shí)空分辨率人口空間分布情況有現(xiàn)實(shí)需求,所以本文將成都市作為研究區(qū)。
2.2 數(shù)據(jù)來(lái)源及預(yù)處理
為了數(shù)據(jù)的統(tǒng)一,本文所獲取的具有位置信息的坐標(biāo)系數(shù)據(jù)均采用WGS 1984坐標(biāo)系,數(shù)據(jù)單位均為國(guó)際單位制標(biāo)準(zhǔn)單位。本文數(shù)據(jù)來(lái)源如下:
(1)2018年成都市人口統(tǒng)計(jì)數(shù)據(jù)來(lái)源于成都市及各個(gè)區(qū)(縣)的2018年統(tǒng)計(jì)年鑒。2018年成都市行政區(qū)劃圖來(lái)源于GADM網(wǎng)站https://gadm.org/index.html.。
(2)2019年3月11—15日騰訊位置大數(shù)據(jù)及宜出行熱力數(shù)據(jù)來(lái)自騰訊位置大數(shù)據(jù)官網(wǎng)https://heat.qq.com/.及微信宜出行官網(wǎng)http://c.easygo.qq.com.,騰訊位置大數(shù)據(jù)包括經(jīng)度、緯度、定位人數(shù)及定位時(shí)間;宜出行數(shù)據(jù)包括經(jīng)度、緯度、熱力值和采集時(shí)間,采集數(shù)據(jù)格式為Excel表格。將表格數(shù)據(jù)加載到ArcGIS 10.2中轉(zhuǎn)換得到矢量點(diǎn)數(shù)據(jù)。3月11—15日均為工作日,在研究成都市人口分布的普遍規(guī)律時(shí)較具代表性。
(3)成都市建筑物數(shù)據(jù)和POI數(shù)據(jù)在百度地圖開(kāi)放平臺(tái)http://lbsyun.baidu.com/.申請(qǐng)開(kāi)發(fā)秘鑰獲取,數(shù)據(jù)格式為Excel表格,在ArcGIS 10.2中轉(zhuǎn)換為矢量點(diǎn)數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗,篩選出需要的數(shù)據(jù)。
(4)成都市遙感影像來(lái)自于Google地圖,數(shù)據(jù)為2018—2019年的衛(wèi)星影像拼接圖,分辨率為2 m。
3 大范圍人口數(shù)據(jù)空間化
人口數(shù)據(jù)空間化的基本思路是將人口統(tǒng)計(jì)數(shù)據(jù)與其他一些影響人口分布的數(shù)據(jù),如土地利用類型、建筑物空間分布等結(jié)合起來(lái),建立多元回歸等模型,將人口統(tǒng)計(jì)數(shù)據(jù)分配在行政區(qū)劃、格網(wǎng)或其他尺度上(黃益修,2016)。目前已建立的人口空間化模型主要有核密度估計(jì)模型(閆慶武等,2011b;梁亞婷,2015)和多因素融合模型(裴惠娟等,2016;曹偉超等,2012)等。
3.1 研究方法
本文選取騰訊位置大數(shù)據(jù)作為變量,假設(shè)在1小時(shí)內(nèi),在該區(qū)域使用騰訊位置大數(shù)據(jù)服務(wù)的人不重復(fù)且分布較為均勻,則可通過(guò)某一區(qū)域的定位數(shù)量推算出該區(qū)域的定位率,通過(guò)定位率可以算出各計(jì)算單元的人數(shù),得到成都市的人口分布。
由于城市人口密度隨距城市中心的距離呈衰減趨勢(shì)(Clark,1951),按照城市圈層結(jié)構(gòu)理論和各行政區(qū)人口、經(jīng)濟(jì)等原因,可將成都市分成3個(gè)圈層(陳藝,2019),第一圈為金牛區(qū)、成華區(qū)、錦江區(qū)、武侯區(qū)和青羊區(qū);第二圈為雙流區(qū)、龍泉驛區(qū)、青白江區(qū)、新都區(qū)、郫都區(qū)以及溫江區(qū);第三圈為簡(jiǎn)陽(yáng)市、金堂縣、彭州市、都江堰市、崇州市、大邑縣、邛崍市、浦江縣和新津縣。
考慮到后期驗(yàn)證需使用人口統(tǒng)計(jì)數(shù)據(jù),所以選取每晚21—24時(shí)進(jìn)行計(jì)算,因?yàn)樵诔啥际写杭镜脑摃r(shí)間段,人們大都處在居所(肖東升等,2016),人口分布情況與常住人口統(tǒng)計(jì)數(shù)據(jù)較為吻合,另外3個(gè)季節(jié)人員流動(dòng)情況與春季類似,則分圈層計(jì)算每個(gè)圈層定位率的公式為:
lp(i)=tiRPi(6)
式中:lp為定位率;i為圈層數(shù);t為平均每小時(shí)定位次數(shù);RP為常住人口數(shù)。由各圈層的定位率計(jì)算各圈層中1 km分辨率格網(wǎng)中的人數(shù),計(jì)算公式為:
SPj=tjlp(i)=tjRPiTj(7)
式中:SPj為格網(wǎng)j中的模擬人數(shù);tj為格網(wǎng)j定位次數(shù)。
3.2 實(shí)驗(yàn)過(guò)程及結(jié)果分析
2019年3月11—15日成都市騰訊位置大數(shù)據(jù)平均每小時(shí)定位量時(shí)序如圖2所示。從圖中可以看出,在0—5時(shí)定位量呈下降趨勢(shì),大部分人都陸續(xù)進(jìn)入睡眠狀態(tài),但依舊有100萬(wàn)左右的定位次數(shù),原因可能為在夜晚手機(jī)未關(guān)機(jī),軟件自動(dòng)請(qǐng)求定位服務(wù)以及尚有一部分人沒(méi)有進(jìn)入睡眠時(shí)間;5—13時(shí)定位量呈增加趨勢(shì),人們陸續(xù)起床,準(zhǔn)備或進(jìn)入上班、上學(xué)狀態(tài),定位量在13時(shí)達(dá)到峰值,原因可能為午飯后手機(jī)使用量增多;13—15時(shí)定位量急劇下降,多數(shù)人進(jìn)入到午休或準(zhǔn)備上班;15—17時(shí)定位量基本處于平穩(wěn),多數(shù)人回到上班或上學(xué)狀態(tài);18時(shí)定位量增加,多數(shù)人在歸家途中,手機(jī)的使用率增加。19—22時(shí)定位量平穩(wěn),多數(shù)人在家中;22—24時(shí)定位量呈減少趨勢(shì),
人們逐漸進(jìn)入睡眠狀態(tài)。由上可知,定位量的變化基本和當(dāng)?shù)鼐用竦纳钜?guī)律相符。
利用式(6)對(duì)上述定位量式進(jìn)行計(jì)算,可得到各圈層定位率:第一圈層的定位率為22%,第二圈層定位率為21%,第三圈層定位率為8%。說(shuō)明在經(jīng)濟(jì)越發(fā)達(dá)、人口越密集的地區(qū),騰訊位置大數(shù)據(jù)服務(wù)的使用率也越高,定位率也越高,符合實(shí)際情況。再通過(guò)式(2)計(jì)算出每個(gè)格網(wǎng)的人口值,結(jié)果如圖3所示。
從圖3可以看出成都市人口分布總體較為集中,其中人口密度最大的區(qū)域?yàn)槌啥际袔讉€(gè)中心城區(qū),從中心城區(qū)向外,人口密度呈逐漸下降的趨勢(shì),在各個(gè)行政區(qū)的中心城區(qū)人口呈明顯的聚集現(xiàn)象,在非城區(qū)地帶,也存在一些人口密度稍大的區(qū)域,對(duì)比成都市衛(wèi)星影像來(lái)看,主要為鄉(xiāng)鎮(zhèn)的人口聚居區(qū)域,符合實(shí)際情況。
根據(jù)實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)成都市各個(gè)區(qū)(縣)柵格人口總值與常住人口數(shù),見(jiàn)表1。從表中可以得出在區(qū)(縣)級(jí)人口數(shù)據(jù)驗(yàn)證下,本文的人口分布計(jì)算結(jié)果與實(shí)際結(jié)果的平均絕對(duì)誤差為90 392人,平均相對(duì)誤差為12.69%,準(zhǔn)確度較高??傮w來(lái)說(shuō),計(jì)算結(jié)果中人口密度較大的區(qū)(縣)誤差小于人口密度較小的區(qū)(縣),其中絕對(duì)誤差最大的為郫都區(qū),因?yàn)樵搮^(qū)中包含很多工廠,本文計(jì)算郫都區(qū)人口時(shí)包含了工廠的工人,而工人的平均年齡較低,智能手機(jī)使用率高,導(dǎo)致人口估算值偏高。人口估算值與各區(qū)(縣)常住人口統(tǒng)計(jì)數(shù)據(jù)回歸分析如圖4所示。
由圖4可看出,通過(guò)計(jì)算不同圈層的定位率得出的各區(qū)(縣)人口數(shù)與常住人口數(shù)偏差較小,其中線性回歸擬合直線的斜率為0.998 3,R2為0.919 9,說(shuō)明該模型的計(jì)算結(jié)果總體精度較高。
據(jù)上述原理可得各時(shí)間段成都市人口分布情況,如圖5所示。
4 小范圍建筑物尺度人口空間化
在災(zāi)害發(fā)生后,1 km空間分辨率的人口數(shù)據(jù)可幫助救援力量快速到達(dá)待救援區(qū)域,但是在進(jìn)行更細(xì)致搜救時(shí),則需要參考更高空間分辨率的人口分布數(shù)據(jù)。發(fā)生在城市的災(zāi)害中,建筑物的結(jié)構(gòu)損壞、倒塌,是造成人員傷亡的主要因素(李媛媛等,2015),所以建筑物尺度的人口空間分布對(duì)應(yīng)急救援具有一定的現(xiàn)實(shí)意義。在已有的研究中(胡楊等,2020;董春等,2019;趙真等,2019),建筑物尺度的人口分布多是基于建筑物功能分類,將人口分配至居住建筑上。但是在實(shí)際情況中,建筑物功能往往不是單一的,人口并非只分布在居住建筑,所以在進(jìn)行人口分配時(shí),首先要判斷建筑物內(nèi)是否有人口分布。
青羊區(qū)位于成都市中心地帶,面積67.78 km2,常住人口約85萬(wàn),是成都人口密度最大的區(qū)(縣)之一,城鎮(zhèn)化程度高,轄區(qū)內(nèi)建筑類型豐富(成都市統(tǒng)計(jì)局,2019),非常適合進(jìn)行建筑物尺度的人口空間化實(shí)驗(yàn)。
4.1 研究方法
熱力數(shù)據(jù)表示周圍人口密度的相對(duì)大小,假設(shè)人口只分布在存在熱力值的范圍,則可以用熱力值區(qū)分建筑物是否需分配人口。由于建筑物損壞會(huì)影響該建筑物周圍人的安全,所以將建筑物內(nèi)的人口和其周圍的人口均分配至該建筑物。本文采用以建筑物中心點(diǎn)為基準(zhǔn)點(diǎn)建立泰森多邊形,使用泰森多邊形內(nèi)的人口計(jì)入多邊形內(nèi)的建筑的方法將人口全部歸算至建筑物中。由于在實(shí)際計(jì)算中可能會(huì)出現(xiàn)少數(shù)泰森多邊形內(nèi)并沒(méi)有包含熱力數(shù)據(jù)點(diǎn)的情況,會(huì)造成少數(shù)存在人口的建筑沒(méi)有被分配到人口的問(wèn)題。為了減少這類問(wèn)題的影響,本文引入POI(Point of Interest)數(shù)據(jù)進(jìn)行改善,相關(guān)研究表明,POI興趣點(diǎn)數(shù)據(jù)與人口分布數(shù)據(jù)存在顯著的相關(guān)性(邱歌,2019)。由于POI數(shù)據(jù)種類較多,為了減少變量之間的互相影響,需對(duì)POI數(shù)據(jù)進(jìn)行主成分分析,降低數(shù)據(jù)維度。根據(jù)主成分的貢獻(xiàn)率可得到綜合主成分得分,即POI貢獻(xiàn)值:
SPOIj=P1∑ni=1λiPCA1+P2∑ni=1λiPCA2+…+Pn∑ni=1λiPCAn(8)
式(3)可簡(jiǎn)化為:
SPOIj=∑ni=1(pi×PCAij)∑ni=1pi(9)
式中:SPOIj為第j個(gè)泰森多邊形的POI貢獻(xiàn)值;pi為第i個(gè)主成分的貢獻(xiàn)率;PCAij為第j個(gè)泰森多邊形的第i個(gè)主成分的計(jì)算值;n為提取的主成分個(gè)數(shù)。
通過(guò)對(duì)計(jì)算出的興趣點(diǎn)貢獻(xiàn)值與熱力值進(jìn)行聯(lián)合計(jì)算,則可根據(jù)POI密度進(jìn)行分區(qū),計(jì)算出每個(gè)泰森多邊形內(nèi)的人口:
POPl=(a×SPOIl/SPOIk+b×TVl/TVk)×SPl(10)
式中:a、b為兩計(jì)算因子的權(quán)值,滿足a+b=1;POP為泰森多邊形內(nèi)計(jì)算人口值;TV為宜出行熱力值;SP為前文基于騰訊位置大數(shù)據(jù)模擬的人口數(shù)據(jù);l為泰森多邊形序號(hào);k為POI密度分區(qū)編號(hào)。由于POI多分布于街道兩側(cè),為了減少POI對(duì)街道兩側(cè)人口過(guò)高估計(jì),故在確定a、b取值時(shí),令a
4.2 實(shí)驗(yàn)過(guò)程
以宜出行數(shù)據(jù)點(diǎn)為中心建立30 m緩沖區(qū),取與宜出行緩沖區(qū)面有交集的建筑物作為研究時(shí)段有人員分布的建筑物,研究區(qū)局部建筑物分類如圖6所示。
因?yàn)樵谶M(jìn)行人口統(tǒng)計(jì)時(shí)多是對(duì)居住建筑進(jìn)行統(tǒng)計(jì),所以為了實(shí)驗(yàn)的準(zhǔn)確性,避免部分建筑物如公廁、崗?fù)?、變壓器室等干擾實(shí)驗(yàn)結(jié)果,通過(guò)將建筑物數(shù)據(jù)與衛(wèi)星影像疊加分析,發(fā)現(xiàn)城市中少數(shù)小于100 m2的建筑多為公廁、崗?fù)?、變壓器室等非居住建筑及?shù)據(jù)源采集誤差,所以將研究區(qū)內(nèi)有人建筑物的面積閾值設(shè)置為100 m2,則按有人建筑物中心建立的泰森多邊形,如圖7所示。
如圖7所示,本文將基于有人建筑物中心點(diǎn)建立的泰森多邊形作為人口分配基礎(chǔ)單元,統(tǒng)計(jì)多邊形內(nèi)的宜出行熱力值和POI總數(shù),作為人口分配的依據(jù)。根據(jù)百度地圖對(duì)POI數(shù)據(jù)的分類,在百度地圖開(kāi)放平臺(tái)獲取了2019年成都市青羊區(qū)的11類與人類活動(dòng)相關(guān)的興趣點(diǎn)數(shù)據(jù),對(duì)街道尺度上各類興趣點(diǎn)與人口進(jìn)行相關(guān)性分析,結(jié)果見(jiàn)表2。
表2中酒店和金融與人口的相關(guān)性較低,故將其排除。為了減少變量之間的相關(guān)影響以及自變量個(gè)數(shù),對(duì)9類POI數(shù)據(jù)進(jìn)行主成分分析,降低數(shù)據(jù)維度。首先對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn),結(jié)果見(jiàn)表3。表中KMO(Kaise-Meyer-Olkin,檢驗(yàn)統(tǒng)計(jì)量)數(shù)值為0.648,Bartlett檢驗(yàn)對(duì)應(yīng)P值小于0.001,數(shù)據(jù)適合進(jìn)行主成分分析,各變量的方差解釋率見(jiàn)表4。
按照特征根大于1的原則提取得到兩個(gè)主成分,其中主成分1的方差解釋率為70.57%,主成分2的方差解釋率為13.14%,累計(jì)方差解釋率達(dá)到84.09%,保留了大部分變量信息。提取的兩個(gè)主成分得分矩陣見(jiàn)表5。
從表5中可以得到各主成分的得分表達(dá)式,主成分1=0.136×運(yùn)動(dòng)健身+0.135×醫(yī)療+0.145×休閑娛樂(lè)+0.156×生活服務(wù)+0.141×美食-0.017×旅游景點(diǎn)+0.153×培訓(xùn)機(jī)構(gòu)+0.132×交通設(shè)施+0.123×房地產(chǎn);主成分2=-0.236×運(yùn)動(dòng)健身+0.022×醫(yī)療-0.069×休閑娛樂(lè)-0.032×生活服務(wù)-0.143×美食+0.740×旅游景點(diǎn)+0.095×培訓(xùn)機(jī)構(gòu)+0.305×交通設(shè)施+0.179×房地產(chǎn)。結(jié)合公式(9)可得到每個(gè)泰森多邊形的興趣點(diǎn)貢獻(xiàn)值為:
SPOIj=0.843×PCA1+0.157×PCA2(11)
在進(jìn)行POI密度分區(qū)時(shí),計(jì)算出文家街道、黃田壩街道、蘇坡街道、金沙街道、東坡街道、草堂街道、光華街道為低密度區(qū),平均POI密度為549個(gè)/km2;汪家拐街道、府南街道、新華西路街道、西御河街道、草市街街道、少城街道、太升路街道為高密度區(qū),平均POI密度為1 460個(gè)/km2。經(jīng)實(shí)驗(yàn),式(10)中的權(quán)值,當(dāng)a=0.25,b=0.75時(shí),結(jié)果較好,則每個(gè)泰森多邊形內(nèi)的人口計(jì)算公式為:
Pl=(0.25×SPOIl/SPOIk+0.75×TVl/Tk)×SPl(12)
4.3 實(shí)驗(yàn)結(jié)果及分析
按式(12)計(jì)算得到每個(gè)泰森多邊形的人口數(shù),并將其分配至對(duì)應(yīng)的建筑物中,其結(jié)果(局部)如圖8所示。
圖8所示區(qū)域截自府南街道和光華街道,可以看到在21—24時(shí),人口主要分布在居住建筑內(nèi),但是也有少部分人口分布在非居住建筑內(nèi),右下角區(qū)域人口稀少,該區(qū)域?yàn)榻鹆职雿u小區(qū)以及杜甫草堂景區(qū)。金林半島小區(qū)為多為別墅和3層左右的小洋房,人口密度較低,實(shí)驗(yàn)結(jié)果符合實(shí)際情況。
由于本文將所有種類的建筑參與人口分配,且將建筑物周圍的人口都?xì)w算至建筑物內(nèi),單獨(dú)驗(yàn)證某建筑物內(nèi)的人口數(shù)與實(shí)驗(yàn)所得人口數(shù)較為困難,且不準(zhǔn)確,所以筆者在街道尺度上對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行驗(yàn)證,青羊區(qū)街道模擬人口數(shù)與常住人口統(tǒng)計(jì)數(shù)見(jiàn)表6。
從表6可以看出實(shí)驗(yàn)?zāi)M人口數(shù)與常住人口統(tǒng)計(jì)數(shù)基本一致,平均絕對(duì)誤差為0.845 3萬(wàn)人,平均相對(duì)誤差為15.53%,實(shí)驗(yàn)結(jié)果準(zhǔn)確度較高。其中絕對(duì)誤差最大的街道為文家街道,實(shí)驗(yàn)?zāi)M人數(shù)較人口統(tǒng)計(jì)數(shù)少1.617 2萬(wàn)人,絕對(duì)誤差最小的街道為蘇坡街道,誤差僅為0.043 9萬(wàn)人。雖然實(shí)驗(yàn)結(jié)果總體令人滿意,但是部分街道出現(xiàn)了較大誤差,分析原因可能為:
(1)本文計(jì)算的為21—24時(shí)的建筑物內(nèi)人口平均分布情況,與驗(yàn)證的常住人口統(tǒng)計(jì)數(shù)據(jù)可能會(huì)產(chǎn)生一定的差異。
(2)不同的街道,建筑物的類型各有差異,如部分街道主要為居住建筑,因?yàn)楸疚牡难芯繒r(shí)間段大部分人都已回到家中,所以該街道的人口誤差就相對(duì)較小;部分街道分布著大量商業(yè)建筑或工廠等,在夜晚商業(yè)建筑和工廠等對(duì)人口存在一定的吸引力,導(dǎo)致相應(yīng)街道的誤差相對(duì)較大。
通過(guò)統(tǒng)計(jì)實(shí)驗(yàn)得到的各街道建筑物人口數(shù)之和與各街道常住人口統(tǒng)計(jì)數(shù)進(jìn)行線性回歸分析如圖9所示。從圖中可以看出,模擬結(jié)果與人口統(tǒng)計(jì)數(shù)的回歸線斜率為1.024 9,R2為0.926 4,實(shí)驗(yàn)結(jié)果總體可靠性較高,能準(zhǔn)確反映大部分建筑物在研究時(shí)段真實(shí)的人口分布情況。
5 結(jié)論
本文利用多日的騰訊位置大數(shù)據(jù),參考城市圈層結(jié)構(gòu)理論,計(jì)算出成都市各區(qū)(縣)手機(jī)的定位率,通過(guò)定位率得到了不同時(shí)段成都市1 km空間分辨率的人口分布數(shù)據(jù),經(jīng)過(guò)精度驗(yàn)證,其決定系數(shù)R2為0.919 9,總體精度較高?;谝训玫降? km空間分辨率成都市人口分布數(shù)據(jù),利用宜出行熱力數(shù)據(jù)和POI數(shù)據(jù)與人口的相關(guān)性,分別計(jì)算其對(duì)人口的貢獻(xiàn)率,實(shí)現(xiàn)了青羊區(qū)建筑物尺度的人口空間化,并得到了青羊區(qū)21—24時(shí)的建筑物尺度的人口空間分布數(shù)據(jù),在街道尺度的人口統(tǒng)計(jì)數(shù)據(jù)驗(yàn)證下,其決定系數(shù)R2為0.926 4,總體結(jié)果可信度高?;诒疚难芯?,得出以下結(jié)論:
(1)本文研究數(shù)據(jù)獲取簡(jiǎn)單,時(shí)效性高,1 km空間分辨率下的人口分布估算方法簡(jiǎn)單準(zhǔn)確,可提高地震應(yīng)急救援的效率。
(2)使用泰森多邊形作為人口分布的基本單元,可更準(zhǔn)確地將建筑物周邊的人口分配至建筑物內(nèi)。
(3)通過(guò)熱力數(shù)據(jù)范圍而非建筑物類型區(qū)分建筑物是否分配人口,可得到更符合研究時(shí)段實(shí)際人口分布情況。
雖然本文提出的人口空間化模型有較好的效果,但是也存在以下不足:
(1)在進(jìn)行大范圍人口分布估算時(shí),僅從定位數(shù)量因素考慮了定位率的問(wèn)題,人口老齡化率、青少年率及城鎮(zhèn)化率等可能影響定位率的因素暫未加入計(jì)算。
(2)在建筑物尺度沒(méi)有到達(dá)實(shí)時(shí)人口分布的情況下的計(jì)算。
今后的研究中我們會(huì)參考更多影響因素進(jìn)行分析,以達(dá)到高時(shí)空分辨率的建筑物尺度人口分布計(jì)算,為應(yīng)急救援、城市建設(shè)等做出貢獻(xiàn)。
參考文獻(xiàn):
曹偉超,陶和平,譚理,等.2012.基于多源空間數(shù)據(jù)的山區(qū)人口分布模擬[J].國(guó)土資源遙感,24(2):61-67.
陳藝.2009.成都城市經(jīng)濟(jì)圈的區(qū)域特征及其帶動(dòng)效應(yīng)[J].城市發(fā)展研究,16(5):13-17.
成都市統(tǒng)計(jì)局.2019.成都年鑒(2019)[M].成都:成都年鑒社.
董春,尹詩(shī)畫(huà),張玉.2019.多智能體的城市精細(xì)尺度人口估算模型[J].測(cè)繪科學(xué),44(8):113-119.
郭建興,姬建中,和朝霞,等.2018.面向地震應(yīng)急的山區(qū)人口百米格網(wǎng)分布——以麟游縣為例[J].地震地磁觀測(cè)與研究,39(6):150-157.
胡楊,張小詠,肖迪.2020.基于手機(jī)大數(shù)據(jù)的城市建筑物人口時(shí)空估算[J].系統(tǒng)仿真學(xué)報(bào),32(10):1814-1883.
黃益修.2016.基于夜間燈光遙感影像和社會(huì)感知數(shù)據(jù)的人口空間化研究[D].上海:華東師范大學(xué).
賈俊平.2008.統(tǒng)計(jì)學(xué)(第三版)[M].北京:中國(guó)人民大學(xué)出版社.
賈召亮,鄭川,李袁欣,等.2020.面向地震應(yīng)急的人口空間化方法研究——以云南省大理白族自治州為例[J].地震研究,43(4):751-758.
李國(guó)平,陳秀欣.2009.京津冀都市圈人口增長(zhǎng)特征及其解釋[J].地理研究,28(1):191-202.
李媛媛,陳建國(guó),張小樂(lè),等.2015.基于建筑結(jié)構(gòu)破壞的地震傷亡評(píng)估方法及應(yīng)用[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),55(7):803-807,814.
李澤宇,董春.2019.引入興趣點(diǎn)的地理加權(quán)人口空間分布模型研究——以天津市為例[J].遙感信息,34(2):113-117.
梁亞婷.2015.基于遙感和GIS的城市人口時(shí)空分布研究:以上海市靜安區(qū)為例[D].上海:上海師范大學(xué).
潘碧麟,王江浩,葛詠,等.2019.基于微博簽到數(shù)據(jù)的成渝城市群空間結(jié)構(gòu)及其城際人口流動(dòng)研究[J].地球信息科學(xué)學(xué)報(bào),21(1):68-76.
裴惠娟,周中紅,孫艷萍,等.2016.甘肅省人口空間分布特征分析[J].西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版),52(5):95-100.
邱歌.2019.基于隨機(jī)森林模型的高精度人口數(shù)據(jù)空間化——以鄭州市區(qū)為例[D].內(nèi)蒙古:內(nèi)蒙古師范大學(xué).
王賢文,王虹茵,李清純.2017.基于地理位置大數(shù)據(jù)的京津冀城市群短期人口流動(dòng)研究[J].大連理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),38(2):105-113.
吳中元,許捍衛(wèi),胡鐘敏.2019.基于騰訊位置大數(shù)據(jù)的精細(xì)尺度人口空間化:以南京市江寧區(qū)秣陵街道為例[J].地理與地理信息科學(xué),35(6):61-65.
肖東升,常鳴,蘇勇,等.2016.基于時(shí)空菱形的人員在室率評(píng)估方法[J].世界地震工程,32(1):43-49.
閆慶武,卞正富,王紅.2011a.利用泰森多邊形和格網(wǎng)平滑的人口密度空間化研究——以徐州市為例[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),36(8):987-990,1010-1011.
閆慶武,卞正富,張萍,等.2011b.基于居民點(diǎn)密度的人口密度空間化[J].地理與地理信息科學(xué),27(5):95-98.
趙真,郭紅梅,張瑩,等.2019.基于天地圖高精度建筑物的四川寶興縣人口估算[J].地震研究,42(2):204-209.
Clark C.1951.Urban population densities[J].Journal of Royal Statistical Society,114(4):490-496.
Sakaki T,Okazaki M,Matsuo Y.2010.Earthquake shakes twitter users:real-time event detection by social sensors[C]//Proceedings of the 19th International Conference on World Wide Web.New York;ACM:851-860.
Research on Population Distribution with High Spatial Resolution Basedon Multi-source Information
LIU Zhicheng1,XIAO Dongsheng1,2
(1.School of Civil Engineering and Surveying and Mapping,Southwest Petroleum University,Chengdu 610500,Sichuan,China)
(2.Disaster Prevention and Emergency Research Center for Surveying,Mapping and Remote Sensing,Southwest Petroleum University,Chengdu 610500,Sichuan,China)
Abstract
The current spatialized data of population are normally static and of low resolution in time and space,and not so practical for emergency and rescue.To solve this problem,according to the theory of urban circle structure and principal component analysis,we proposed a method of estimating population on building-scale using high resolution data in time and space.Taking Chengdu City as an example,we calculated the location rate of different urban circles using the Tencent Location Big Data,and obtained the population distribution in the grid of 1 km×1 km of Chengdu in different periods of a day.Further,we used the Tyson Polygon based on the center of the building as the basic unit of population distribution,and calculated and weighted the contribution of the data from Tencent Easygo and the POI data from Baidu Map to the population distribution.In this way we obtained the distribution of population on building-scale in Qingyang District of Chengdu.R2,the coefficient of determination for the regression analysis of the street-scale statistics,is 0.926 4.Our results are more accurate and conform to the actual distribution of population in this area.
Keywords:emergency and rescue;principal component analysis;population distribution;POI;buildings
收稿日期:2020-11-03.
基金項(xiàng)目:國(guó)家自然基金(51774250)、四川省軟科學(xué)研究計(jì)劃項(xiàng)目(2019JDR0112)、工程結(jié)構(gòu)安全評(píng)估與防災(zāi)技術(shù)四川省青年科技創(chuàng)新研究團(tuán)隊(duì)(2019JDTD0017)和西南石油大學(xué)測(cè)繪遙感地信青年科技創(chuàng)新團(tuán)隊(duì)(2019CXTD07)聯(lián)合資助.
第一作者簡(jiǎn)介:劉治成(1996-),碩士研究生,主要研究方向?yàn)榈乩硇畔⒐こ?E-mail:2371944224@qq.com.
通訊作者簡(jiǎn)介:肖東升(1974-),教授,主要研究方向?yàn)闇y(cè)繪科學(xué)與技術(shù),城市防災(zāi)減災(zāi)應(yīng)急和油氣遙感.E-mail:xiaodsxds@163.com.