引文格式:JIANG Botao,WANG Yandong,YE Xinyue.Detecting Development Pattern of Urban Business Facilities Using Reviews Data[J]. Acta Geodaetica et Cartographica Sinica,2015,44(9):1022-1028.(蔣波濤,王艷東,葉信岳.使用點評數(shù)據(jù)探測城市商業(yè)服務(wù)設(shè)施的發(fā)展規(guī)律[J].測繪學(xué)報,2015,44(9):1022-1028.) DOI:10.11947/j.AGCS.2015.20140556
使用點評數(shù)據(jù)探測城市商業(yè)服務(wù)設(shè)施的發(fā)展規(guī)律
蔣波濤1,2,王艷東1,葉信岳3
1. 武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北 武漢 430079; 2. 寧波市規(guī)劃與地理信息中心,浙江 寧波 315041; 3. 肯特州立大學(xué)地理系,俄亥俄 肯特 44242
Detecting Development Pattern of Urban Business Facilities Using Reviews Data
JIANG Botao1, 2,WANG Yandong1,YE Xinyue3
1. State Key Laboratory of Information Engineering in Surveying,Mapping & Remote Sensing,Wuhan University,Wuhan 430079,China; 2. Ningbo Planning and Geographic Information Center,Ningbo 315041,China; 3. Department of Geography,Kent State University,Kent, Ohio 44242, USA
Abstract:This paper reveals and utilizes the growing power of online customer reviews in the space and time context. The location of commercial facilities and online customer reviews offered by Dianping.com provide an important data source for the study of spatial and temporal dynamics of urban commercial facilities. The constraints of road network are taken into account towards computing the density of urban commercial facilities and associated online customer reviews, as well as their spatial distribution, temporal trend, and the coupling relationship between facility number and stratification level. This paper maps the spatial distribution of commercial facilities onto the nearby road network, reflecting the influences of the locations, number and satisfaction levels of other commercial facilities across various street types. Because more and more customers tend to make a final shopping decision by sorting through search results by ratings and feedback, the research conducted in this paper can provide the proof for quantitative evaluation of urban planning on commercial facility development.
Key words: commercial facilities;urban street network analysis;quantitative evaluation of urban planning;social network service
Foundation support: The National Natural Science Foundation of China (No.41271399); The National Key Technology Research and Development Program of the Ministry of Science and Technology of China (No.2012BAH35B03); Specialized Research Fund for the Doctoral Program of Higher Education(No.20120141110036);China Special Fund for Surveying,Mapping and Geoinformation Research in the Public Interest (No.201512015)
摘要:大眾點評網(wǎng)提供的商業(yè)設(shè)施及其滿意度評價數(shù)據(jù)為城市商業(yè)設(shè)施的時空分布與發(fā)展規(guī)律研究提供了一個重要的信息源,它們來源于分布在道路兩側(cè)的商業(yè)設(shè)施。根據(jù)此特征,本文設(shè)計了一種基于道路網(wǎng)約束的反映商業(yè)服務(wù)設(shè)施與交通網(wǎng)絡(luò)關(guān)系的密度計算方法,對點評數(shù)據(jù)中蘊含的設(shè)施空間分布、設(shè)施數(shù)量與其滿意度之間關(guān)系進行了分析。它將商業(yè)設(shè)施在空間上的二維分布映射至一維的道路網(wǎng)上,更真實地反映了商業(yè)服務(wù)設(shè)施與所處交通環(huán)境的影響,揭示了商業(yè)服務(wù)設(shè)施位置、數(shù)量及其滿意度之間的關(guān)系,為城市規(guī)劃的定量化研究提供了數(shù)值依據(jù)。
關(guān)鍵詞:商業(yè)服務(wù)設(shè)施;道路網(wǎng)約束分析;城市規(guī)劃定量評價;社交網(wǎng)絡(luò)服務(wù)
中圖分類號:P208
基金項目:國家自然科學(xué)基金(41271399);國家科技支撐計劃(2012BAH35B03);高等學(xué)校博士學(xué)科點專項科研基金(20120141110036);測繪地理信息公益性行業(yè)科研專項經(jīng)費(201512015)
收稿日期:2014-10-29
作者簡介:第一 蔣波濤(1981—),男,博士生,高級工程師,主要從事時空數(shù)據(jù)挖掘及社會化時空大數(shù)據(jù)在城市中的應(yīng)用研究。
1引言
城市是具有商品交換功能的人類生活聚居區(qū)域[1],對城市居民而言,其居住區(qū)除了要提供良好的工作生活空間外,還需具備完善的商業(yè)及交通等服務(wù)設(shè)施。其中商業(yè)服務(wù)設(shè)施除受到城市規(guī)劃布局的影響外,更多以滿足居民工作生活要求為主要目標(biāo),具有很強的屬地性[2-4]。商業(yè)服務(wù)設(shè)施的出現(xiàn)與消失過程,直接反映了城市區(qū)域變化與更新趨勢,因此,對特定區(qū)域中商業(yè)服務(wù)設(shè)施的考察可為其規(guī)劃實施成果的合理性評價提供量化依據(jù),并分析不同因素對其產(chǎn)生的影響。
商業(yè)設(shè)施信息采集可通過工商部門或商業(yè)采集等方式獲得,但在城市發(fā)展較快的地方,激烈競爭會造成商業(yè)設(shè)施生存期較短,而周期較長的傳統(tǒng)調(diào)研方法往往導(dǎo)致樣本量不足、時效性差和附加屬性少等問題[5-6],許多過期信息點(point of interest,POI)無法及時更新,很難有效反映出商業(yè)設(shè)施的時空及服務(wù)滿意度變化,影響了評價的可靠性。人類社會正進入“大數(shù)據(jù)”時代,大數(shù)據(jù)使得社會信息傳播方式發(fā)生了重大改變,如Facebook、Twitter、微博和點評等社交網(wǎng)絡(luò)服務(wù)(social network service,SNS)應(yīng)用又被稱為“社會傳感器(social sensor)”[7-8],它們可產(chǎn)生涉及社交用戶日常生活的海量數(shù)據(jù),擴展了社會信息生產(chǎn)及獲取的深度與廣度[9]。SNS數(shù)據(jù)中也包含了大量含有位置的信息,成為一種眾包地理數(shù)據(jù)源,受到城市規(guī)劃與城市計算領(lǐng)域的廣泛重視,如利用位置簽到數(shù)據(jù)研究城市熱點與商圈變化的規(guī)律[10],使用社交用戶關(guān)系推測用戶個體的位置[11],使用Twitter數(shù)據(jù)探測流感傳播路徑及趨勢[12]等。以點評服務(wù)為例,它提供的商業(yè)設(shè)施評價信息包含了時間、空間和服務(wù)滿意度等屬性,且更新頻率遠高于工商業(yè)登記和實地調(diào)研,能夠有效地反映某個商業(yè)服務(wù)設(shè)施的歷史變化過程。
本文以大眾點評網(wǎng)(www.dianping.com)中采集的北京大上地區(qū)域點評類數(shù)據(jù)為基礎(chǔ),結(jié)合該區(qū)域規(guī)劃方案及問卷調(diào)研情況,使用GeoDaNet[13]在基于道路網(wǎng)絡(luò)約束條件下運用核密度估計法檢測了不同類型服務(wù)設(shè)施的空間分布特征。本文提出了一種基于道路網(wǎng)約束的核密度計算方法,對點評數(shù)據(jù)中蘊含的空間分布、時空演變特征和設(shè)施數(shù)量與設(shè)施滿意度等規(guī)律進行了分析,這對城市商業(yè)布局的引導(dǎo)及規(guī)劃具有重要的參考價值。
2點評數(shù)據(jù)預(yù)處理與分析
大眾點評網(wǎng)提供的點評數(shù)據(jù)以文本形式存在,對其的量化分析必須進行預(yù)處理,即將一個商業(yè)服務(wù)設(shè)施所有的點評文本轉(zhuǎn)換為對應(yīng)的數(shù)值形式的滿意度,從而生成以商業(yè)服務(wù)設(shè)施為核心的POI。此外,對處理獲得的POI還需與原始調(diào)查問卷成果進行比較以確定其可靠性,只有兩者無顯著差異,通過點評數(shù)據(jù)獲得的POI才有被分析的價值。
大眾點評網(wǎng)是目前國內(nèi)最大的點評類SNS網(wǎng)站,它以商戶(商業(yè)服務(wù)設(shè)施)為核心提供社交類點評[14],這些點評數(shù)據(jù)包括美食、休閑娛樂、購物、美容核運動健身等類別,數(shù)量已超過3600萬條。本文對點評數(shù)據(jù)獲取與滿意度處理包括3個步驟:首先獲取研究區(qū)域內(nèi)所需類型包含的商業(yè)服務(wù)設(shè)施,其獲取結(jié)果包括每個設(shè)施的設(shè)施名稱及對應(yīng)的標(biāo)識碼;再根據(jù)該標(biāo)識碼從“大眾點評網(wǎng)”獲取地址進行地理編碼以取得設(shè)施的地理坐標(biāo);最后計算點評文本對應(yīng)的滿意度,其過程如圖1所示。
圖1 點評數(shù)據(jù)處理流程 Fig.1 The processing of online customer reviews
大上地區(qū)域位置如圖2框內(nèi)所示,它位于北京海淀區(qū)中東部,是北京軟件與信息產(chǎn)業(yè)聚集地,同時也是城中村較集中的區(qū)域。目前產(chǎn)業(yè)發(fā)展參差不齊、新舊社區(qū)混雜,生活品質(zhì)差別較大。東部核心區(qū)是大量高新企業(yè)所在地,其余區(qū)域為待改造區(qū)域。圖中的字母顯示了大上地區(qū)域的道路網(wǎng)分級,即高架路(A)、主干道(B)和次干道(C)。本文選擇此區(qū)域為研究對象是因為它具備明顯的新、舊城對比,利于分析城市發(fā)展的不同影響因素,同時可以對相關(guān)傳統(tǒng)調(diào)查材料進行對比分析。
圖2 大上地區(qū)域位置 Fig.2 Location of Dashangdi distrct, Beijing
本文共獲得該區(qū)域13類商業(yè)服務(wù)設(shè)施共計2038個及各自對應(yīng)的點評文本,總數(shù)為35394條,時間跨度從2004年5月至2014年6月,2009年后通過移動設(shè)備發(fā)出的點評數(shù)據(jù)劇增, 具體情況如表1所示。
點評信息是使用自然語言來描述的,將點評文本轉(zhuǎn)換為滿意度實質(zhì)上是進行文本分類。文本分類方法有多種,如支持向量機(support vector machine,SVM)、貝葉斯網(wǎng)絡(luò)和主題模型(topic model)[15-16]分類等。本文使用基于潛在語義索引(latent semantic indexing,LSI)[17-18]的主題模型技術(shù)對文本進行處理,LSI通過向TF-IDF中引入一個主題維度,將TF-IDF矩陣分解為“文本—主題—特征項”矩陣形式,這樣就獲得了新的分類形式,即可以根據(jù)該點評文本的語義內(nèi)容來判斷它屬于哪一類主題,從而確定所對應(yīng)的滿意度。在本文示例中,LSI是通過將文本與其包含的滿意度特征項,即通過分析每一條點評中包含的“很好”、“很差”、“物美價廉”等詞匯的語義,來說明其所屬的滿意主題,從而獲得相應(yīng)的滿意度。
表1 不同類型POI數(shù)量及點評數(shù)量
本文將點評文本的用戶感受分為“很差”、“差”、“一般”、“好”和“很好”5類主題,并分別賦1~5分。如“這家飯店物美價廉,下次還要來光臨?!北磉_的語義是高度贊賞,可評5分;而“飯菜很差,下次不來了”表達的語義是“很差”,可評1分,以此說明用戶對服務(wù)設(shè)施的滿意程度。如一家餐廳的12月份的兩個評論表達的滿意度是“一般”和“好”時,則該餐廳12月份兩個評論的滿意度分別為3分和4分,則其平均滿意度為3.5分。
來自一家服務(wù)設(shè)施的點評信息將成為一個既擁有空間坐標(biāo),也包含了自從2006年以來每個季度滿意度的POI。最后這些數(shù)據(jù)將構(gòu)成一個語義豐富的POI數(shù)據(jù)集。
在大上地區(qū)域規(guī)劃方案制定前,相關(guān)部門以問卷調(diào)查方式發(fā)放了500份問卷,最終收回437份有效問卷。公共設(shè)施居民滿意度的調(diào)查部分涉及日常生活8大類商業(yè)服務(wù)設(shè)施,經(jīng)過整理計算后可以得到這些設(shè)施的平均滿意度;由于從點評數(shù)據(jù)獲得的評價值可以按年或季度進行統(tǒng)計,為保持?jǐn)?shù)據(jù)時效性,選擇的是2013年第4季度的不同類型商業(yè)服務(wù)設(shè)施的平均滿意度,如表2所示,除酒店類設(shè)施傳統(tǒng)調(diào)查問卷沒有提供外,基于點評數(shù)據(jù)的調(diào)查評分方法提供了與傳統(tǒng)方法接近的結(jié)果。
表2 兩種調(diào)查方式結(jié)果
由于類型數(shù)量小于30,本文選擇對兩組數(shù)據(jù)使用SPSS軟件進行T檢驗,計算所得p-level值為0.58907,遠大于檢驗樣本的顯著性差異p值0.05,即兩組數(shù)沒有顯著性差異,因此,點評數(shù)據(jù)可以替代傳統(tǒng)問卷調(diào)查的樣本。
3商業(yè)服務(wù)設(shè)施的空間分布特征
商業(yè)服務(wù)設(shè)施的特征決定了其必然分布于道路兩側(cè)??疾旆植加诘缆肪W(wǎng)兩側(cè)的POI密度分布可以評價一段街道上各類商業(yè)服務(wù)設(shè)施的密集程度,從而判斷其繁榮程度與產(chǎn)業(yè)聚集特征,因此需要考慮其所在的道路。基于道路網(wǎng)約束,本文設(shè)計了一種反映商業(yè)服務(wù)設(shè)施分布于交通網(wǎng)絡(luò)上的道路密度的方法,用于分析商業(yè)服務(wù)設(shè)施的空間分布特征,其具體計算過程如下:①道路網(wǎng)分解,為了分析整條道路的不同部分上的商業(yè)設(shè)施聚集程度,首先將道路網(wǎng)分解為長度固定的線性單元(linear unit),并使用兩個POI間的最短網(wǎng)絡(luò)距離作為度量方式[19],這樣將一條道路切分為多個等長路段后使POI更準(zhǔn)確地映射至道路的某一部分,利于區(qū)分同一條道路上不同路段間的密度;②道路網(wǎng)信息提取,每個POI尋找與自己最近(網(wǎng)絡(luò)距離)的路段,并記錄該POI的信息;③道路核密度計算,當(dāng)全部路段均計算出被映射至自身的POI數(shù)量后,對于單個路段,選擇帶寬r以內(nèi)的路段作為其密度范圍內(nèi)鄰居[20],則核密度值計算可如下式[21]
(1)
式中,dis是兩個線性單元最短網(wǎng)絡(luò)距離;r為帶寬,本文取10m以保證所有POI都能落到最近單元上;k為核函數(shù),由于核函數(shù)類型對整體密度模式影響較小[19],本文選擇了默認(rèn)的Quadratic核函數(shù);ci是單元i擁有的POI數(shù)量;n為單元s的鄰接單元數(shù)量。
經(jīng)試驗,本文在具體核密度估計分析中選擇200m作為線性單元長度,如長度過長會造成核密度普遍較低,此長度可有效地反映道路網(wǎng)間不同部分的對比情況,如過短則會讓計算量劇增,影響處理效率。經(jīng)計算,包括表2中列舉的設(shè)施與醫(yī)院共9種類型商業(yè)設(shè)施,在道路網(wǎng)上的核密度剔除空值與0后的平均值為0.02,本文將所有核密度大于0.02的線性單元渲染為紅色,小于及等于0.02之間的線性單元為綠色,如圖3所示(由于篇幅所限,只展示了9種類型商業(yè)服務(wù)設(shè)施中的4種),它反映了不同商業(yè)服務(wù)設(shè)施由于行業(yè)特點和自身面對的客戶群體的差異表現(xiàn)出的巨大差別。它們可劃分成兩種形態(tài):A類是指主要沿主干道分布且具有高核密度值(>0.02)的較長線性單元,即數(shù)量較多的商業(yè)服務(wù)設(shè)施,如運動健身、美食、娛樂設(shè)施、婚慶和超市等設(shè)施,這些服務(wù)設(shè)施的消費水平較高,消費人群年齡段較為年輕,通常會在交通便捷的醒目位置開設(shè)商鋪,同時服務(wù)設(shè)施往往呈現(xiàn)扎堆效應(yīng),以便于吸引更多的客流;B類是主要分布在次干道且具有高核密度的較短路段,即線性單元較少的商業(yè)服務(wù)設(shè)施,此類設(shè)施包括醫(yī)院、麗人、親子和酒店等類型,通常為居民生活日常所需的大型服務(wù)設(shè)施或常以加盟店形式出現(xiàn)的商業(yè)服務(wù)設(shè)施,與普通市民的日常生活密切相關(guān)。
圖3 商業(yè)服務(wù)設(shè)施的A和B類分布特征 Fig.3 Distributions of commercial facilities class A and class B
與A、B兩類沿道路分布形式對應(yīng)的,9類商業(yè)設(shè)施的空間分布也表現(xiàn)出較大的差異,如運動健身、美食、婚慶、娛樂和超市等A類設(shè)施,在研究區(qū)域內(nèi)呈現(xiàn)較為均勻的聚集狀態(tài),即在該區(qū)域內(nèi)普遍分布但又扎堆聚集;而如醫(yī)院、麗人、酒店和親子類等B類設(shè)施,則呈現(xiàn)出離散分布形態(tài)。這兩類設(shè)施的沿道路及空間分布形態(tài),可以為類似設(shè)施的選址提供依據(jù),也可以為城市規(guī)劃中的設(shè)施分布提供更好的引導(dǎo),即A類設(shè)施應(yīng)盡量在相同商圈內(nèi)開業(yè),而B類設(shè)施則應(yīng)避免扎堆,以便更好地分享人流紅利。
4商業(yè)服務(wù)設(shè)施的滿意度變化趨勢分析
在城市發(fā)展過程中許多商業(yè)服務(wù)設(shè)施都呈現(xiàn)一定的聚集特征,如高級寫字樓、銀行和高檔商店的聚集區(qū)被稱為中央商務(wù)區(qū),在這些商業(yè)中心區(qū)域往往存在一些知名的、滿意度較高的標(biāo)桿性服務(wù)設(shè)施來帶動周圍整體服務(wù)水平的提升。在很多服務(wù)類設(shè)施的發(fā)展過程中,當(dāng)一家設(shè)施出現(xiàn)后如果受到歡迎,其周圍會迅速出現(xiàn)多家類似的服務(wù)設(shè)施,而整條街道上該類型服務(wù)設(shè)施的數(shù)量及滿意度會隨著競爭的激烈化出現(xiàn)上升或衰減的現(xiàn)象[4]。在本節(jié)中以麗人類服務(wù)設(shè)施為例,分別研究了其滿意度時空變化情況及滿意度與設(shè)施數(shù)量之間的關(guān)系。
雖然滿意度可以分為5類,但為了更好地在圖上分析及對比不同商業(yè)服務(wù)設(shè)施的滿意度變化情況,本文將5類滿意度繪制成3種情況,即不滿意(滿意度為1~2分)、一般(3分)和滿意(4~5分)的POI在道路網(wǎng)核密度圖上并進行組合,最終獲得麗人類商業(yè)服務(wù)設(shè)施的滿意度變化趨勢圖。在組合過程中,由于同一條道路上不可避免地出現(xiàn)多種滿意度類型的服務(wù)設(shè)施,此時道路滿意度取其算術(shù)平均值。由于篇幅所限,圖4只展示了2006年至2014年間麗人類設(shè)施的時空變化情況,其中不滿意為藍色(1~2.9分)、一般滿意為綠色(3~3.9分)、滿意為紅色(4~5分)表示。
圖4 麗人類設(shè)施的滿意度變化 Fig.4 Changes of satisfaction levels of Liren POI
從圖4可以看出:①在時序上,麗人類商業(yè)服務(wù)設(shè)施的數(shù)量是沿著主干道逐漸向次干道鋪開,同時逐步向右側(cè)的大上地中心區(qū)域集中,通過查詢中心區(qū)域的地圖,還可知在大型商廈聚集了大量的商業(yè)服務(wù)設(shè)施,它形成了此區(qū)域麗人類設(shè)施的激烈競爭;②在2006年至2012年中,滿意度為“一般”的麗人類商業(yè)服務(wù)設(shè)施始終占據(jù)主流,但中心區(qū)域的麗人類商業(yè)服務(wù)設(shè)施在增長的同時也造成滿意和不滿意兩類對立評價相對集中,它反映出此區(qū)域競爭的異常激烈,這也顯示出服務(wù)設(shè)施的數(shù)量與滿意度之間具有某種相關(guān)性。
本文統(tǒng)計了麗人類商業(yè)服務(wù)設(shè)施在200m長的道路段上的數(shù)量分布及滿意度情況,其結(jié)果如圖5和圖6所示。
圖5 設(shè)施數(shù)量與路段數(shù)量關(guān)系圖 Fig.5 Distribution of facility number across street segments
圖6 設(shè)施數(shù)量與評論關(guān)系圖 Fig.6 Relationship between of facility number and reviews
圖5展示了等距路段上的麗人類商業(yè)服務(wù)設(shè)施的數(shù)量分布。從中可看出,在存在麗人類服務(wù)設(shè)施的路段中,沒有競爭即僅有1家的路段為18家,僅占18.9%;而有2至3家的路段為主流,分別是33家和21家,占56.8%;而有5家和6家設(shè)施的路段也為極少數(shù),僅有5條和2條,它們均為大型商中位于不同樓層的美容、美發(fā)和美甲店。這反映出麗人類商業(yè)服務(wù)設(shè)施基本是以競爭形態(tài)而存在的。
通過考察單條路段上設(shè)施的兩類評論及平均數(shù)量,從圖6可了解其基本變化趨勢:圖中的3條曲線分別反映了單個設(shè)施獲得的不滿意及滿意評論數(shù)量,以及該路段的平均滿意度。本文對圖5和圖6中的設(shè)施數(shù)量、平均滿意度、滿意評論數(shù)量和不滿意評論數(shù)量的數(shù)據(jù)使用SPSS進行了相關(guān)性計算,其結(jié)果為:①在呈激烈競爭的麗人類設(shè)施分布中,單個路段上的設(shè)施數(shù)量與其平均滿意度的相關(guān)系數(shù)為-0.5183,沒有體現(xiàn)出兩者之間具有高線性相關(guān),即整體上路段的平均滿意度與其設(shè)施的數(shù)量之間無直接關(guān)系;②當(dāng)設(shè)施數(shù)量為1~3家時其平均滿意度相關(guān)系數(shù)為0.9177,呈高度相關(guān),即在局部上1~3家設(shè)施的分布可以讓道路平均滿意度區(qū)域最大化;③隨著單個路段上服務(wù)設(shè)施的增加,每家服務(wù)設(shè)施獲得“不滿意”評論的平均數(shù)量呈遞增趨勢,其相關(guān)系數(shù)為0.9042,呈高度相關(guān)。而獲得“滿意”評論的相關(guān)系數(shù)為0.8309,也表現(xiàn)出較強的線性現(xiàn)象,這說明在競爭較為激烈的地段,對于設(shè)施的滿意與否存在較大的爭議。因此,從表面上看,一家商業(yè)服務(wù)設(shè)施的滿意度高低應(yīng)該與其自身的服務(wù)水平相關(guān),但相關(guān)分析結(jié)果顯示,在激烈的商業(yè)競爭環(huán)境中,多家聚集一處的設(shè)施對客源的爭奪會直接影響點評網(wǎng)絡(luò)上出現(xiàn)的設(shè)施滿意度。
在圖6中還可以看到,當(dāng)一條200m的路段中有6家服務(wù)設(shè)施時,其不滿意評論平均數(shù)量出現(xiàn)了顯著增加,而滿意評論平均數(shù)量卻保持穩(wěn)定。通過從大眾點評網(wǎng)中考察這些設(shè)施的點評的內(nèi)容,可將此情況歸咎為兩個因素:一是激烈的競爭會導(dǎo)致一些服務(wù)設(shè)施營業(yè)額的降低從而走向倒閉,在此過程中如由于服務(wù)及辦卡退費等原因,會導(dǎo)致大量的差評出現(xiàn);二是不同店鋪之間的惡意競爭會導(dǎo)致許多人為差評(即無明確時間和事件描述的惡意性評論)來誤導(dǎo)潛在消費者的情況。
在對其余8種設(shè)施使用相同方法分析時,也發(fā)現(xiàn)200 m路段上的設(shè)施數(shù)量與服務(wù)滿意度之間存在較高相關(guān)性,同時也存在一個設(shè)施數(shù)量的平衡點,如美食為8家,超市為4家等。
5結(jié)論
區(qū)域內(nèi)商業(yè)服務(wù)設(shè)施與居民的日常工作生活密切相關(guān),它們可直接反映區(qū)域過去與現(xiàn)在的發(fā)展水平,并揭示未來發(fā)展趨勢。本文以點評類SNS服務(wù)為信息源,研究了從中挖掘商業(yè)服務(wù)設(shè)施滿意度的方法,并通過對不同類型商業(yè)服務(wù)設(shè)施基于道路網(wǎng)的聚集程度分析,揭示了研究區(qū)域商業(yè)設(shè)施在空間上蘊含的兩種分布形態(tài)及在時序上的變化趨勢,分析了單位路段上設(shè)施數(shù)量與路段滿意度、設(shè)施獲得的點評數(shù)量之間的變化規(guī)律,對引導(dǎo)商業(yè)服務(wù)設(shè)施的分布具有一定的參考價值。下一步,將結(jié)合點評數(shù)據(jù)、房價數(shù)據(jù)等社會化信息,進一步分析城市區(qū)域內(nèi)不同商業(yè)設(shè)施發(fā)展的屬地特征與自組織特征,并將進一步細化數(shù)據(jù)時間粒度,將研究深入至月份及季度,揭示作為城市區(qū)域變化信號的商業(yè)服務(wù)設(shè)施的深層規(guī)律。
參考文獻:
[1]PAUL L K, LINDA M. Urbanization[M]. GU Chaolin, TANG Peiyuan, YANG Xingzhu, et al. Trans. Beijing: Science Press, 2009: 1-3. (保羅·諾克斯, 琳達·邁克卡西. 城市化[M]. 顧朝林, 湯培源, 楊興柱, 等譯. 北京:科學(xué)出版社, 2009: 1-3.)
[2]YI Xiaoxiang. A Study on Community Retail and Service Facilities Based on Consumption Theories—The Case of Shanghai[J]. Urban Planning Forum, 2012, 10(3): 44-52. (衣霄翔. 消費視角下的居住區(qū)商業(yè)服務(wù)設(shè)施配建體系研究——以上海市曲陽新村為例[J]. 城市規(guī)劃學(xué)刊, 2012, 10(3): 44-52.)
[3]TANG Zilai. The Formation Demand of the Service Facilities in Real Estate: The Trend Forecast and Practice Test[J]. City Planning Review, 1999, 23(5): 32-36. (唐子來. 居住小區(qū)服務(wù)設(shè)施的需求型態(tài): 趨勢推斷和實證檢驗[J]. 城市規(guī)劃, 1999, 23(5): 32-36.)
[4]XU Xiaoyan. Micro Location Layout of Neighborhood Facilities[J]. Planners, 2011, 27(12): 62-66. (徐曉燕. 城市社區(qū)配套設(shè)施微區(qū)位布局研究[J]. 規(guī)劃師, 2011, 27(12): 62-66.)
[5]YAN Ruogu, ZHOU Suhong, YAN Xiaopei. Studies of Urban Regeneration[J]. Progress in Geography, 2011, 30(8): 947-955. (嚴(yán)若谷, 周素紅, 閆小培. 城市更新之研究[J]. 地理科學(xué)進展, 2011, 30(8): 947-955.)
[6]DAI Fei, ZHANG Junhua. The Survey Methods in Planning and Design 1—Questionnaire Survey(Theory Part)[J]. Chinese Landscape Architecture, 2008, 24(10): 82-87. (戴菲, 章俊華. 規(guī)劃設(shè)計學(xué)中的調(diào)查方法(1)——問卷調(diào)查法(理論篇)[J]. 中國園林, 2008, 24(10): 82-87.)
[7]SAKAKI T, OKAZAKI M, MATSUO Y. Earthquake Shakes Twitter Users: Real-Time Event Detection by Social Sensors[C]∥Proceedings of the 19th International Conference on World Wide Web. Raleigh: ACM,2010: 851-860.
[8]GOODCHILD M F. Citizens as Sensors: the World of Volunteered Geography[J]. GeoJournal, 2007, 69(4): 211-221.
[9]HEIPKE C. Crowdsouring Geospatial Data[J]. ISPR Journal of Photogrammetry and Remote Sensing, 2010, 65(6): 550-557.
[10]HU Qingwu, WANG Ming, LI Qingquan. Urban Hotspot and Commercial Area Exploration with Check-in Data[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(3): 314-321. (胡慶武, 王明, 李清泉. 利用位置簽到數(shù)據(jù)探索城市熱點與商圈[J]. 測繪學(xué)報, 2014, 43(3): 314-321.)
[11]DAVIS JR C A, PAPPA G L, DE OLIVEIRA D R R, et al. Inferring the Location of Twitter Messages Based on User Relationships[J]. Transactions in GIS, 2011, 15(6): 735-751.
[12]LAMPOS V,CRISTIANINI N.Tracking the Flu Pandemic by Monitoring the Social Web[C]∥2010 2nd International Workshop on Cognitive Information Processing (CIP). Elba: IEEE,2010: 411-416.
[13]HWANG M H, WINSLOW A. User Manual for GeoDaNet:Spatial Analysis on Undirected Networks[EB/OL]. [2012-03-22]. https:∥geodacenter.asu.edu/drupal_files/Geodanet_Manual_03_2012.pdf.
[14]Lü Xiuying. The Current Situation of the Development of the Third Party Review Websites in China under the Web2.0—Dianping and Douban[J]. Journal of Southeast University:Philosophy and Social Science, 2011, 13(S1): 87-92. (呂秀瑩. 淺析Web2.0環(huán)境下我國第三方點評網(wǎng)站的發(fā)展現(xiàn)狀——以大眾點評網(wǎng)和豆瓣網(wǎng)為例[J]. 東南大學(xué)學(xué)報: 哲學(xué)社會科學(xué)版, 2011, 13(S1): 87-92.)
[15]BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet Allocation[J]. The Journal of Machine Learning Research, 2003, 3: 993-1022.
[16]BLEI D M, LAFFERTY J D. Dynamic Topic Models[C]∥Proceedings of the 23rd International Conference on Machine Learning. New York:ACM,2006:113-120.
[17]DEERWESTER S, DUMAIS S T, Furnas G W, et al. Indexing by Latent Semantic Analysis[J]. Journal of the American Society for Information Science and Technology, 1990, 41(6): 391-407.
[18]TAO Chao, TAN Yihua, PENG Bifa, et al. A Probabilistic Latent Semantic Analysis Based Classification for High Resolution Remotely Sensed Imagery[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2): 156-162. (陶超, 譚毅華, 彭碧發(fā), 等. 一種基于概率潛在語義模型的高分辨率遙感影像分類方法[J]. 測繪學(xué)報, 2011, 40(2): 156-162.)
[19]XIE Zhixiao, YAN Jun. Kernel Density Estimation of Traffic Accidents in a Network Space[J]. Computers, Environment and Urban Systems, 2008, 32(5): 396-406.
[20]SHE Bing, ZHU Xinyan, GUO Wei, et al. Research on Spatial Pattern of City Events under Road Network Constraints[J]. Application Research of Computers, 2013, 30(8): 2327-2329. (佘冰, 朱欣焰, 咼維, 等. 道路網(wǎng)約束下的城市事件空間點模式分析[J]. 計算機應(yīng)用研究, 2013, 30(8): 2327-2329.)
[21]OKABE A, SATOH T, SUGIHARA K. A Kernel Density Estimation Method for Networks, Its Computational Method and a GIS-based Tool[J]. International Journal of Geographical Information Science, 2009, 23(1): 7-32.
(責(zé)任編輯:宋啟凡)
修回日期: 2015-05-10
First author: JIANG Botao(1981—),male,PhD candidata,senior engineer, majors in spatio-temporal data mining and application of social spatio-temporal big data in urban planning.
E-mail: chiangbt@icloud.com