溫廣檳 於志勇 劉 琦 陳羽中 沈 堯
(1.福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 福州 350108) (2.倫敦大學(xué)學(xué)院巴特雷特建筑學(xué)院 倫敦 WC1E 6BT)
利用簽到數(shù)據(jù)的空間互動(dòng)模型
溫廣檳1於志勇1劉 琦1陳羽中1沈 堯2
(1.福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 福州 350108) (2.倫敦大學(xué)學(xué)院巴特雷特建筑學(xué)院 倫敦 WC1E 6BT)
理解空間互動(dòng)(即人們?cè)诔鞘胁煌瑓^(qū)域間的流動(dòng))可以更加智能地輔助交通規(guī)劃、商業(yè)選址等決策??臻g互動(dòng)模型利用開放的社交網(wǎng)絡(luò)用戶簽到數(shù)據(jù),計(jì)算各地區(qū)聯(lián)系指數(shù)、內(nèi)部用戶流動(dòng)指數(shù)、外部用戶流動(dòng)指數(shù)、出行質(zhì)量指數(shù)等四個(gè)維度。聚合了多個(gè)社交網(wǎng)絡(luò)的簽到數(shù)據(jù),進(jìn)行了興趣點(diǎn)匹配和起止點(diǎn)計(jì)算,并可視化了一個(gè)具體城市的模型實(shí)例。結(jié)果表明該空間互動(dòng)模型能夠反映城市的空間動(dòng)態(tài)結(jié)構(gòu),為各行業(yè)用戶提供直觀的咨詢信息。
空間互動(dòng); 計(jì)算模型; 簽到數(shù)據(jù)
Class Number TP311
我國(guó)對(duì)公共空間的規(guī)劃、建設(shè)與管理尤為重視,于2016年2月發(fā)布的《關(guān)于進(jìn)一步加強(qiáng)城市規(guī)劃建設(shè)管理工作的若干意見》第十六條中提出“新建住宅要推廣街區(qū)制,原則上不再建設(shè)封閉住宅小區(qū)。已建成的住宅小區(qū)和單位大院要逐步打開,實(shí)現(xiàn)內(nèi)部道路公共化”。隨著住宅小區(qū)的開放,城市規(guī)劃將迎來(lái)大規(guī)模的調(diào)整和優(yōu)化,如何優(yōu)化城市交通,怎么建設(shè)有科學(xué)依據(jù)的城市道路,這一切工作都需要具體的數(shù)據(jù)和理論的支持,而本文的工作將為其提供真實(shí)有效的參考。
公共空間是城市功能的主要組成部分之一,是城市中為順利進(jìn)行各項(xiàng)經(jīng)濟(jì)活動(dòng)和其他社會(huì)活動(dòng)而建設(shè)的關(guān)鍵,空間互動(dòng)表征的是城市空間中人的行為活動(dòng)以及由此產(chǎn)生的社會(huì)生活與空間的內(nèi)在聯(lián)系??臻g互動(dòng)主要研究由人們?cè)诔鞘锌臻g中的流動(dòng)交互數(shù)據(jù),本文通過(guò)建立一個(gè)空間互動(dòng)模型將其轉(zhuǎn)化為更直觀的表現(xiàn)形式(四個(gè)維度的指數(shù),每個(gè)指數(shù)都有客觀實(shí)際的意義),得出城市的空間性與人們的日常生活的密切聯(lián)系,為交通道路建設(shè)、城市規(guī)劃、商業(yè)選址以及其他與城市公共空間建設(shè)相關(guān)的行業(yè)提供較為直觀且準(zhǔn)確的信息。
本文建立的互動(dòng)空間模型,利用社交網(wǎng)絡(luò)中的簽到數(shù)據(jù),計(jì)算出各地區(qū)聯(lián)系指數(shù)、內(nèi)部用戶流動(dòng)指數(shù)、外部用戶流動(dòng)指數(shù)、出行質(zhì)量指數(shù)等指數(shù),并通過(guò)可視化進(jìn)行展示,提供了對(duì)一個(gè)城市中人口流通,互動(dòng)的有效參照,其中各地區(qū)聯(lián)系指數(shù)可以對(duì)加強(qiáng)對(duì)城市區(qū)域聯(lián)系強(qiáng)度的認(rèn)知,內(nèi)部用戶流動(dòng)指數(shù)可以加強(qiáng)對(duì)小區(qū)域的活動(dòng)強(qiáng)度的認(rèn)知,外部用戶流動(dòng)指數(shù)可以加強(qiáng)對(duì)一個(gè)區(qū)域外部進(jìn)入人流的數(shù)量的認(rèn)知,出行質(zhì)量指數(shù)可以加強(qiáng)對(duì)城市各種土地利用類型(例如商業(yè),餐飲,娛樂(lè)等)在各個(gè)區(qū)域活躍程度的認(rèn)知,這將會(huì)為城市規(guī)劃提供有效的參考。
對(duì)于空間互動(dòng)的計(jì)算,許多學(xué)者針對(duì)此都進(jìn)行了相應(yīng)的研究,并提出了一些計(jì)算模型。
在城市規(guī)劃領(lǐng)域里,文獻(xiàn)[1]定性分析了當(dāng)前蘭州城市生活性街道在空間互動(dòng)存在的問(wèn)題以及建議,但數(shù)據(jù)來(lái)源采用問(wèn)卷調(diào)查的形式,不夠全面,導(dǎo)致收集的數(shù)據(jù)不夠完備,存在一定的片面性。文獻(xiàn)[2]采用衛(wèi)星遙感圖像為數(shù)據(jù)源獲得土地覆蓋情況,從而構(gòu)建相互作用模型以確定城市空間的擴(kuò)展方向,但遙感圖像耗資大,缺乏時(shí)效性,且在建立模型時(shí)沒有將人類活動(dòng)考慮在內(nèi)。
在地理信息系統(tǒng)空間分析中,文獻(xiàn)[3]進(jìn)行了石河子市建筑分布密度統(tǒng)計(jì)與分析,采用2005年Quick bird正射影像為主要數(shù)據(jù)源,但只計(jì)算了空間互動(dòng)中建筑間聯(lián)系強(qiáng)度情況,對(duì)于計(jì)量空間互動(dòng)而言在維度上偏少,不能完全作為依據(jù)進(jìn)行土地決策。文獻(xiàn)[4]對(duì)北京地區(qū)進(jìn)行Voronoi圖空間剖分,收集車載GPS的信息作為數(shù)據(jù),數(shù)據(jù)源單一,且只反映了空間互動(dòng)中的區(qū)域內(nèi)行車用戶流動(dòng)指數(shù)。文獻(xiàn)[5]以上海市為例計(jì)算城區(qū)內(nèi)的空間關(guān)聯(lián)情況,得出老年與外來(lái)人口因子、商服與農(nóng)業(yè)人口因子、住房情況等因子并進(jìn)行分析,但使用的數(shù)據(jù)是采用2000年第五次人口普查的一個(gè)時(shí)間斷面,存在一定的局限性,不能很好地揭示空間關(guān)聯(lián)性的時(shí)空演化。
現(xiàn)今社會(huì)已經(jīng)逐步跨入了全面信息化時(shí)代,越來(lái)越多用戶使用開放的社交網(wǎng)絡(luò)接觸新鮮事物,利用所在的地理位置提供簽到數(shù)據(jù)等,在計(jì)算機(jī)領(lǐng)域里,文獻(xiàn)[6~8]采用了網(wǎng)絡(luò)中用戶提供的簽到數(shù)據(jù)作為人口流動(dòng)指標(biāo),但所計(jì)算的空間互動(dòng)維度指數(shù)只側(cè)重于某一方面(分別為商業(yè)選址、旅游業(yè)),缺乏普遍性,即其他行業(yè)的適用性不大。
本文提出的空間互動(dòng)模型Mi包含四個(gè)指數(shù)〈UCIi,UIIIi,r,UEIIi,r,TQIi,r〉,分別是各地區(qū)聯(lián)系指數(shù)UCIi、內(nèi)部用戶流動(dòng)指數(shù)UIIIi,r、外部用戶流動(dòng)指數(shù)UEIIi,r以及出行質(zhì)量指數(shù)TQIi,r,其中i表示地塊編號(hào)(地塊由路網(wǎng)劃分而成,我們將市內(nèi)道路交通網(wǎng)絡(luò)劃分的區(qū)域作為計(jì)算的基本單元),r表示可達(dá)范圍。各地區(qū)聯(lián)系指數(shù)是量化城市中區(qū)域的外向服務(wù)功能(即各地區(qū)與其他區(qū)域的聯(lián)系強(qiáng)度)的指標(biāo),反映了一個(gè)城市的地區(qū)間人口交叉程度,對(duì)發(fā)展經(jīng)濟(jì)建設(shè)、區(qū)域定位等有重要意義。內(nèi)部用戶流動(dòng)指數(shù)是城市的區(qū)域內(nèi)部人口的自身流移程度,可以觀察到區(qū)域內(nèi)部的活動(dòng)旺盛程度。外部用戶流動(dòng)指數(shù)是指在城市的區(qū)域外人口的流入程度。內(nèi)部、外部用戶流動(dòng)指數(shù)有利于探索人口發(fā)展變化規(guī)律。出行質(zhì)量指數(shù)刻畫了城市居民從一地到另一地的移動(dòng)過(guò)程中,對(duì)從出發(fā)到終止過(guò)程中各個(gè)交通環(huán)節(jié)所提供服務(wù)的滿意程度,是目前宜居城市逐漸看重的指標(biāo)。
得到城市空間互動(dòng)變化情況后,還需將模型結(jié)果轉(zhuǎn)化為一種視覺形式,即可視化,使我們更有效地觀察、操縱、研究、瀏覽、探索、過(guò)濾、對(duì)比與理解大規(guī)模數(shù)據(jù),并與之方便交互,從而可以及其有效地發(fā)現(xiàn)隱藏在信息內(nèi)部的特征和規(guī)律,更直觀地反應(yīng)城市空間的動(dòng)態(tài)結(jié)構(gòu),針對(duì)不同行業(yè)用戶提供更為準(zhǔn)確的咨詢信息與建議。
圖1 空間互動(dòng)模型計(jì)算框架
空間互動(dòng)模型的計(jì)算框架如圖1所示,共分為三個(gè)子系統(tǒng),分別是數(shù)據(jù)子系統(tǒng)、分析子系統(tǒng)和表現(xiàn)子系統(tǒng)。在數(shù)據(jù)子系統(tǒng)中,從各類社交網(wǎng)絡(luò)平臺(tái)獲取數(shù)據(jù)并對(duì)其進(jìn)行處理從而得到結(jié)構(gòu)化的數(shù)據(jù)。在分析子系統(tǒng)中,根據(jù)得到的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行四個(gè)維度的指數(shù)計(jì)算得到空間互動(dòng)的結(jié)果。最終,在表現(xiàn)子系統(tǒng)中,將結(jié)果可視化表現(xiàn)出來(lái)。
本文所用到的簽到數(shù)據(jù)來(lái)源于大眾點(diǎn)評(píng)網(wǎng)和帶有位置信息的新浪微博。通過(guò)城市道路網(wǎng)絡(luò)將城市劃分為若干個(gè)地塊,選取路網(wǎng)距離為可達(dá)半徑(即一個(gè)地點(diǎn)通過(guò)城市道路網(wǎng)絡(luò)能到達(dá)的距離),其中,路網(wǎng)數(shù)據(jù)為各個(gè)城市的道路交通構(gòu)成的網(wǎng)絡(luò),可以很好的和人們?nèi)粘3鲂械牡缆废嗥ヅ?而路網(wǎng)距離則是計(jì)算兩個(gè)POI(Point Of Information)點(diǎn)(在本文中指代城市中具有實(shí)際意義的地點(diǎn))通過(guò)路網(wǎng)連接的距離,這個(gè)數(shù)據(jù)可以很好地模擬來(lái)往于這兩個(gè)POI點(diǎn)的用戶的真正移動(dòng)的路程,可達(dá)半徑是作為指數(shù)計(jì)算的一個(gè)參數(shù),本文認(rèn)為用路網(wǎng)距離代替直線距離更為真實(shí)可靠。
4.1 數(shù)據(jù)介紹
數(shù)據(jù)分為興趣點(diǎn)(POI)數(shù)據(jù)和簽到數(shù)據(jù),POI點(diǎn)數(shù)據(jù)即擁有具體經(jīng)緯度坐標(biāo)的點(diǎn),它具有客觀存在的意義,而簽到數(shù)據(jù)則是基于POI點(diǎn)存在的表明用戶在某時(shí)某刻在該P(yáng)OI點(diǎn)出現(xiàn)的一條信息。將采集到的原始數(shù)據(jù)做了簡(jiǎn)單的格式化處理并存儲(chǔ)在數(shù)據(jù)庫(kù)中,以下是對(duì)采集到的數(shù)據(jù)的舉例說(shuō)明。
1) POI數(shù)據(jù)
大眾點(diǎn)評(píng)網(wǎng)的POI數(shù)據(jù)字段包括〈編號(hào)ID,名稱NAME,歸屬城市CITY,經(jīng)度LONGITUDE,緯度LATITUDE,土地使用類型CLASSIFY,地址ADDRESS,簽到次數(shù)SIGN_COUNT〉。
下面是一條大眾POI點(diǎn)數(shù)據(jù):
{
“ID”:8897212,
“NAME”:青年快捷旅店,
“CITY”:天津,
“LONGITUDE”:117.64352,
“LATITUDE”:39.03744,
“CLASSIFY”:賓館酒店,
“ADDRESS”:濱海新區(qū)車站北路仕嘉花園底商1-1-1129號(hào),
“SIGN_COUNT”:3
}
2) 簽到數(shù)據(jù)
大眾點(diǎn)評(píng)網(wǎng)由于并沒有簽到功能,所以搜集了大眾點(diǎn)評(píng)網(wǎng)用戶的評(píng)論數(shù)據(jù),將每一條評(píng)論數(shù)據(jù)作為一條簽到數(shù)據(jù)。簽到數(shù)據(jù)字段包括〈編號(hào)ID,所屬POI編號(hào)TENANT_ID,所屬POI名稱TENANT_NAME,用戶名USER,簽到時(shí)間SIGN_TIME〉。
下面是一條大眾簽到數(shù)據(jù):
{
“ID”:184952,
“TENANT_ID”:4510942,
“TENANT_NAME”:全明星滑冰俱樂(lè)部,
“USER”:包紫包紫,
“SIGN_TIME”:2014-02-20 21:13:00
}
本文數(shù)據(jù)收集的是大眾點(diǎn)評(píng)網(wǎng)和位置微博的數(shù)據(jù),將兩種不同源的數(shù)據(jù)進(jìn)行整合并以基于路網(wǎng)劃分的地塊為單位進(jìn)行計(jì)算和展示,而不同來(lái)源的數(shù)據(jù)之間存在許多差異,如經(jīng)緯度標(biāo)準(zhǔn)不同,同一個(gè)POI點(diǎn)可能名稱不同等,因此需要進(jìn)行數(shù)據(jù)處理,使其統(tǒng)一起來(lái),其中包括基于名稱和地址不同的數(shù)據(jù)源POI模糊匹配、POI與地塊的模糊關(guān)聯(lián)和OD(Origin-Destination,OD)計(jì)算,即一條有起點(diǎn)和終點(diǎn)的軌跡。基于名稱和地址不同的數(shù)據(jù)源POI模糊匹配,是將POI的名稱和地址相結(jié)合,判斷兩個(gè)數(shù)據(jù)源對(duì)應(yīng)的POI點(diǎn)是否屬于同一個(gè)POI點(diǎn),過(guò)濾重復(fù)的POI。POI與地塊的匹配,是將某個(gè)POI點(diǎn)歸屬到符合條件的一個(gè)地塊中。OD計(jì)算,就是將用戶的連續(xù)不同的兩次簽到分別作為起始點(diǎn)和終點(diǎn),形成起止點(diǎn)關(guān)聯(lián)矩陣。
4.2 不同數(shù)據(jù)源的POI模糊匹配
對(duì)于不同平臺(tái)的數(shù)據(jù),需要對(duì)其進(jìn)行整合,即對(duì)指代意義相同的POI點(diǎn)進(jìn)行匹配,并將整合其所包含的信息(簽到,OD),但是,由于目前在國(guó)內(nèi)GPS標(biāo)準(zhǔn)尚未統(tǒng)一,不同平臺(tái)使用的GPS標(biāo)準(zhǔn)各不相同,國(guó)內(nèi)一般存在的GPS標(biāo)準(zhǔn)有WGS84即GPS設(shè)備獲得的坐標(biāo),GOOGLE地圖坐標(biāo),百度地圖坐標(biāo)等,且不同平臺(tái)創(chuàng)建POI點(diǎn)時(shí)使用的經(jīng)緯度坐標(biāo)可能存在偏差。為了解決這些問(wèn)題,先進(jìn)行數(shù)據(jù)樣本的訓(xùn)練,獲取不同網(wǎng)站相同POI的經(jīng)緯度位置偏差,也就是計(jì)算出兩個(gè)不同源的POI數(shù)據(jù)的大致偏移范圍,然后基于名稱及地址進(jìn)行文本模糊匹配。具體步驟如下:
1) 從兩個(gè)不同的網(wǎng)站中采集同城所有POI信息,其中包括名稱、地址、經(jīng)度、緯度等信息,這兩個(gè)網(wǎng)站的POI數(shù)據(jù)構(gòu)信息構(gòu)成A數(shù)據(jù)集和B數(shù)據(jù)集;
2) 從上述兩個(gè)數(shù)據(jù)集中找出名稱完全匹配,且偏差在正常范圍(經(jīng)過(guò)試驗(yàn)為1km)的POI數(shù)據(jù)作為校準(zhǔn)樣本,計(jì)算數(shù)據(jù)集A和數(shù)據(jù)集B中所有相互對(duì)應(yīng)的POI的位置偏差,計(jì)算平均位置偏差,即偏差的距離和角度,確定匹配范圍,如圖2所示;
圖2 求平均位置偏差圖解
3) 取數(shù)據(jù)集A中的一個(gè)POI作為待匹配點(diǎn),找出數(shù)據(jù)集B中所有在匹配范圍內(nèi)的POI作為待匹配集;
4) 根據(jù)地址分詞[9]字段集合對(duì)采集到的POI數(shù)據(jù)的地址信息建立逐級(jí)的父子關(guān)系,然后根據(jù)地址分詞字段的關(guān)系將待匹配集元素和待匹配點(diǎn)進(jìn)行逐級(jí)地址分詞,并形成地址詞典,根據(jù)地址詞典過(guò)濾待匹配點(diǎn)和待匹配集中POI點(diǎn)的名稱中的地址信息;
地址分詞字段集合F如下:
F=[省,市,區(qū),縣,街道,鎮(zhèn),鄉(xiāng),社區(qū),村,小區(qū),大廈,里,弄,園,支弄,公寓,路,街,巷,號(hào)]。
5) 采用KMP算法[10~11]對(duì)待匹配點(diǎn)和待匹配集元素進(jìn)行匹配,當(dāng)某個(gè)元素使匹配率最大,并且大于某個(gè)閾值時(shí),則該元素與待匹配點(diǎn)屬于同一個(gè)POI。
4.3 POI與地塊模糊關(guān)聯(lián)
每個(gè)POI點(diǎn)對(duì)應(yīng)一個(gè)地塊,當(dāng)POI點(diǎn)沒有落在任何地塊上并且離臨近的地塊距離較遠(yuǎn)時(shí),會(huì)出現(xiàn)某個(gè)POI點(diǎn)不屬于任何地塊的情況。當(dāng)POI點(diǎn)沒有落在任何地塊上,但是離臨近的地塊較近時(shí),可視為該P(yáng)OI點(diǎn)落在兩個(gè)地塊之間的街道上,可劃入最近的一個(gè)地塊。具體步驟如下(如圖3所示):
1) 判斷POI點(diǎn)是否直接落在地塊內(nèi)部,地塊可視為一個(gè)不規(guī)則的多邊形。將POI點(diǎn)的經(jīng)緯度和地塊邊緣點(diǎn)的經(jīng)緯度轉(zhuǎn)換成XY坐標(biāo),然后根據(jù)地塊邊緣點(diǎn)的坐標(biāo)轉(zhuǎn)換成多邊形,再判斷POI點(diǎn)所屬的地塊。
2) 如果POI點(diǎn)沒有直接落在地塊內(nèi)部,那么需要進(jìn)行進(jìn)一步的判斷POI點(diǎn)是否落在兩個(gè)地塊之間的街道上。取POI點(diǎn)周圍1000m內(nèi)的地塊作為POI點(diǎn)可能歸屬的地塊樣本,將每個(gè)地塊內(nèi)部的邊緣點(diǎn)兩兩連接(地塊之間的邊緣點(diǎn)不需要相連),計(jì)算POI點(diǎn)與這些連線的距離,當(dāng)最短距離小于某個(gè)值時(shí),則該P(yáng)OI點(diǎn)屬于擁有這條連線的地塊,如果最短距離大于某個(gè)值,那么該P(yáng)OI點(diǎn)不屬于任何地塊。如圖4所示,該P(yáng)OI點(diǎn)位于街道上并且離箭頭方向的地塊較近,則該P(yáng)OI點(diǎn)屬于箭頭方向的地塊。
圖3 POI與地塊模糊關(guān)聯(lián)步驟流程圖
圖4 街道上POI所屬地塊
4.4 OD計(jì)算
OD計(jì)算是通過(guò)對(duì)某個(gè)用戶在不同時(shí)間在某些POI的簽到數(shù)據(jù)進(jìn)行計(jì)算,假設(shè)在A點(diǎn)簽到,2個(gè)小時(shí)后在B點(diǎn)簽到,并且這兩個(gè)點(diǎn)之間在時(shí)間范圍內(nèi)屬于可達(dá)的,A、B兩點(diǎn)為端點(diǎn)構(gòu)成的邊視為一條有效的軌跡。
軌跡數(shù)據(jù)過(guò)濾,即軌跡計(jì)算時(shí)數(shù)據(jù)過(guò)濾,同一個(gè)用戶,從地點(diǎn)1移動(dòng)到地點(diǎn)2,如果這個(gè)過(guò)程不在同一天內(nèi),那么此處移動(dòng)視為無(wú)效;從地點(diǎn)1移動(dòng)到地點(diǎn)2,如果移動(dòng)速度超過(guò)80km/h,這種情況視為無(wú)效數(shù)據(jù)。
OD計(jì)算流程如算法1所示,把前面處理好的簽到數(shù)據(jù)集{S}作為輸入數(shù)據(jù),將其按用戶名字段(user_id),及簽到時(shí)間字段(sign_time)排序,即先按用戶名排序,同用戶名的按簽到時(shí)間排序。隨后,依次讀取數(shù)據(jù)集中的數(shù)據(jù),若用戶名相同且簽到時(shí)間為同一天,本文則用2個(gè)簽到生成一條OD數(shù)據(jù),然后判斷這條OD的有效性,若有效則將其加入OD集合{T}。重復(fù)這個(gè)過(guò)程,直到遍歷完數(shù)據(jù)集{S}。
Algorithm 1. OD calculate
Input :dataset sign {S}
Output : OD data {T}
Steps :
{T}=?;
|S|=n;
Sort {S} by user_id and sign_time,in ascending order;
k=0;
FOR i=1:n
If((Si-1.username==Si.username)&&
isSameDay(Si,Si-1)&&){
Tk={Si,Si-1};
If(DataIsNormal(Tk)){
Add Tkto {T};
k++;
}
}
END FOR
互動(dòng)指數(shù)計(jì)算公式的公共參數(shù)含義:i為城市中劃分的某個(gè)地塊編號(hào);r為可達(dá)范圍,是以地塊i中心坐標(biāo)為圓心,r為半徑的覆蓋區(qū)域;α為是否在地塊的可達(dá)半徑內(nèi);o為簽到用戶的起始地坐標(biāo);d為簽到用戶的目的地坐標(biāo);T(o,d)為從起始地到目的地的OD數(shù)據(jù);Mi為之于地塊i的可達(dá)范圍,即統(tǒng)計(jì)單元;N為OD數(shù)據(jù)總數(shù);U為統(tǒng)計(jì)單元的個(gè)數(shù),即地塊數(shù);k為土地利用類型總數(shù)。
5.1 城市各地區(qū)聯(lián)系指數(shù)(Urban Connectivity Index-UCI)
UCIi是指i地通過(guò)OD關(guān)系與之相關(guān)的單元數(shù)。比如對(duì)于i地,它與10個(gè)POI有OD聯(lián)系,但是10個(gè)POI分別屬于3個(gè)單元,那i地的UCI就是3。這個(gè)指數(shù)有助于我們了解各個(gè)地區(qū)互相關(guān)聯(lián)的強(qiáng)度。
5.2 內(nèi)部用戶流動(dòng)指數(shù)(Urban Internal Intensity Index,UIII)
O坐標(biāo)必須在i地的半徑r范圍內(nèi),D坐標(biāo)也在其中,UIIIi,r為i地的內(nèi)部用戶流動(dòng)數(shù)。
這里內(nèi)部用戶的判定在于一次出行的OD是否都在統(tǒng)計(jì)范圍內(nèi),在制定計(jì)算單元區(qū)域內(nèi),完整OD都在其中的數(shù)量。即是內(nèi)部用戶一次出行完全在統(tǒng)計(jì)范圍內(nèi)的數(shù)量。這個(gè)指數(shù)有助于了解一個(gè)地區(qū)的活動(dòng)強(qiáng)度。
5.3 外部用戶流動(dòng)指數(shù)(Urban External Intensity Index,UEII)
D坐標(biāo)必須在i地的半徑r范圍內(nèi),而O坐標(biāo)不在其中。
UEIIi,r是在指定的計(jì)算單元區(qū)域內(nèi),外部用戶進(jìn)入其內(nèi)的數(shù)量。即統(tǒng)計(jì)D在統(tǒng)計(jì)范圍,但是與之關(guān)聯(lián)的O不在范圍內(nèi)的數(shù)量。這有助于了解一個(gè)地區(qū)是否有足夠多的外來(lái)人流。
5.4 出行質(zhì)量指數(shù)(Transition Quality Index,TQI)
6.1 實(shí)例化
本文以天津市為例求解空間互動(dòng)模型,通過(guò)路網(wǎng)數(shù)據(jù)將天津市劃分為2754個(gè)地塊,選取1000m的路網(wǎng)距離為可達(dá)半徑。共收集了2014年天津市大眾點(diǎn)評(píng)網(wǎng)和位置微博的簽到數(shù)據(jù),其中大眾點(diǎn)評(píng)網(wǎng)包括13333個(gè)用戶、31496條簽到數(shù),位置微博包括277842個(gè)用戶、796529條簽到數(shù)。將收集到的數(shù)據(jù)以地塊為基本單元進(jìn)行POI匹配和OD計(jì)算,求得的數(shù)據(jù)再分別進(jìn)行城市各地區(qū)聯(lián)系指數(shù)、內(nèi)部用戶流動(dòng)指數(shù)、外部用戶流動(dòng)指數(shù)、出行質(zhì)量指數(shù)這四個(gè)維度的計(jì)算求出天津市區(qū)域內(nèi)的空間流動(dòng)情況。其中,出行質(zhì)量指數(shù)與土地類型相關(guān),模型中指定的土地類型為餐飲、娛樂(lè)、商業(yè),土地利用類型可在采集時(shí)獲得。
6.2 可視化
將用戶的簽到情況根據(jù)實(shí)驗(yàn)步驟進(jìn)行轉(zhuǎn)換后的數(shù)據(jù)可視化,能夠直觀地反映城市的空間互動(dòng)情況,并作為評(píng)估互動(dòng)的標(biāo)準(zhǔn)。如圖5~10所示。
圖5 天津市各地區(qū)聯(lián)系指數(shù)
由圖5可知,其聯(lián)系最密集區(qū)域分布較為分散,但主要在天津中心區(qū),且范圍較小,次密集區(qū)域多分布在周邊,且范圍較廣。
圖6 天津市內(nèi)部用戶流動(dòng)指數(shù)
由圖6可知,天津內(nèi)部人口流動(dòng)不大,中部偏上區(qū)域有小范圍的強(qiáng)流動(dòng),以其為中心的四周零散分布了一些次強(qiáng)流動(dòng),可見天津現(xiàn)在人口多往發(fā)達(dá)區(qū)域流動(dòng),符合城市居民的生活要求。
由圖7可知,天津的外部用戶進(jìn)入流動(dòng)大,中上部仍然為強(qiáng)流動(dòng)區(qū)域,西部和東部都有大范圍的次強(qiáng)流動(dòng),呈現(xiàn)隨機(jī)分布的特點(diǎn)。外部用戶的流動(dòng),與居民的生產(chǎn)生活息息相關(guān),隨機(jī)型分布可以照顧到居住在不同區(qū)域的城市居民,有利于外部用戶在各個(gè)區(qū)域創(chuàng)造自身價(jià)值,并為一方區(qū)域的和諧建設(shè)貢獻(xiàn)一份力。
圖7 天津市外部用戶流動(dòng)指數(shù)
圖8 天津市土地類型為餐飲的出行質(zhì)量指數(shù)
圖9 天津市土地類型為娛樂(lè)的出行質(zhì)量指數(shù)
圖10 天津市土地類型為商業(yè)的出行質(zhì)量指數(shù)
區(qū)域由圖8~10可知,天津作為環(huán)渤海地區(qū)經(jīng)濟(jì)中心,在餐飲業(yè)以及商業(yè)上尤為發(fā)達(dá),在這兩方面的出行質(zhì)量幾乎分布在整個(gè)市區(qū),且顏色較深,可見指數(shù)較大,這種分布既符合城市居民的生活習(xí)慣又能滿足城市居民出行的便利要求。但天津市的娛樂(lè)行業(yè)發(fā)展較為薄弱,最高指數(shù)零散地分布在中部地區(qū),四周有較大范圍的次高指數(shù),可見天津市的人對(duì)娛樂(lè)要求較低,娛樂(lè)活動(dòng)也相對(duì)低頻。
本文提出的空間互動(dòng)模型利用大眾點(diǎn)評(píng)網(wǎng)和位置微博的數(shù)據(jù),以城市劃分的地塊為基本單位,進(jìn)行POI模糊匹配,將不同數(shù)據(jù)源整合,并進(jìn)行OD計(jì)算求用戶連續(xù)兩次簽到的路徑,得到各個(gè)地塊的空間互動(dòng)指數(shù)。通過(guò)實(shí)例化驗(yàn)證,具有一定的合理性,與實(shí)際情況較為符合。利用數(shù)字化、網(wǎng)絡(luò)化的方式進(jìn)行空間互動(dòng)模型的分析高效可靠,可以應(yīng)用于各行各業(yè),適合在將來(lái)加大對(duì)這方面的深入研究。
[1] 李鴻飛,張晶晶.蘭州市生活性街道空間互動(dòng)性研究[J].西部人居環(huán)境學(xué)刊,2015(3):92-95. LI Hongfei, ZHANG Jingjing. A Study on the Interaction of Street Life Space in Lanzhou City[J]. Human Settlements Forum in West China, 2015(3): 92-95.
[2] Christiane, Weber,周彥(譯),等.相互作用模型在城市規(guī)劃中的運(yùn)用[J].國(guó)際城市規(guī)劃,2006,21(3):77-82. Christiane, Weber. Interaction Model Application for Urban Planning[J].Urban Planning Overseas,2006,21(3):77-82.
[3] 劉琳,張正勇,唐澤君.基于GIS石河子市建筑密度空間分布規(guī)律的分析[J].石河子大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,30(1):92-95. LIU Lin, ZHANG Zhengyong, TANG Zejun. Spatial Distribution Pattern of Shihezi City’s Building Density Based on GIS[J]. Journal of Shihezi University(Natural Science),2012,30(1):92-95.
[4] 信睿,艾廷華,楊偉,等.顧及出租車OD點(diǎn)分布密度的空間Voronoi剖分算法及OD流可視化分析[J].地球信息科學(xué)學(xué)報(bào),2015,17(10):1187-1195. XIN Rui, AI Tinghua, YANG Wei, et al. A New Network Voronoi Diagram Considering the OD Point Density of Taxi and Visual Analysis of OD Flow[J].Journal of Geo-Information Science,2015,17(10):1187-1195.
[5] 宣國(guó)富,徐建剛,趙靜.基于ESDA的城市社會(huì)空間研究——以上海市中心城區(qū)為例[J].地理科學(xué),2010(1):22-29. XUAN Guofu, XU Jiangang, ZHAO Jing.An Analysis of Urban Social Space Based on ESDA-A Case Study of the Central Urban District in Shanghai[J]. Scientia Geographica Sinica,2010(1):22-29.
[6] Dmytro Karamshuk, Anastasios Noulas, Salvatore Scellato,et al.Geo-Spotting: Mining Online Location-based Services for Optimal Retail Store Placement[J]. knowledge discovery and data mining,2013(13):793-801.
[7] Yu Liu, Zheng Weisui, Chao Guikang.Uncovering Patterns of Inter-Urban Trip and Spatial Interaction from Social Media Check-In Data[J].Plos One,2014(1):1-11.
[8] Lun Wu, Ye Zhi, Zheng Weisui, et al.Intra-Urban Human Mobility and Activity Transition:Evidence from Social Media Check-In Data[J].Plos One,2014(5):1-13.
[9] 程昌秀,于濱.一種基于規(guī)則的模糊中文地址分詞匹配方法[J]. 地理與地理信息科學(xué), 2011, 27(3):26-29. CHENG Changxiu,YU Bin.A Rule-Based Segmenting and Matching Method for Fuzzy Chinese Addresses[J].Geography and Geo-Information Science,2011,27(3):26-29.
[10] Han Guanghui, Zeng Cheng. Theoretical Research of KMP Arithmetic[J].Microelectronics & Computer,2013(4):30-33.
[11] Knuth D E, Morris J H, Pratt V R. Fast Pattern Matching in Strings.[J]. Siam Journal on Computing,1977,6(2):323-350.
Spatial Interaction Modeling Using Check-in Data
WEN Guangbin1YU Zhiyong1LIU Qi1CHEN Yuzhong1SHEN Yao2
(1. College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350108) (2. Bartlett School of Architecture, University College London, London WC1E 6BT)
The spatial interaction is the human flow through different areas, which can make a more intelligent strategic decision of traffic planning, commercial location and many other industries. The paper aims at proposing a strategic analysis describing spatial interaction, and making an instantiation by check-in datum from some open social networks. There are four dimensions chosen to describe model: regional contact strength, natural flow index of internal users, entry index of external users and trip quality index, which can be estimated by popular check-in datum and have generality. The model firstly put many social networks’ check-in datum together, then matches them and calculates the distance from beginning to the end. After making a instantiation, the model provides data visualization solutions. The result shows that the strategic analysis has the ability of reflecting the cities’ spatial dynamic structure, providies advisory information to users of lots of types of industries.
spatial interaction, computation model, check-in data
2016年8月15日,
2016年9月30日
國(guó)家自然科學(xué)基金(編號(hào):61300103)資助。
溫廣檳,男,碩士研究生,研究方向:移動(dòng)社交網(wǎng)絡(luò)。於志勇,男,博士,副教授,研究方向:普適計(jì)算、移動(dòng)社交網(wǎng)絡(luò)。劉琦,女,研究方向:移動(dòng)社交網(wǎng)絡(luò)。陳羽中,男,博士,教授,研究方向:智能計(jì)算和數(shù)據(jù)挖掘。沈堯,男,博士,研究方向:城市規(guī)劃、智慧城市。
TP311
10.3969/j.issn.1672-9722.2017.02.012