朱佳貝
摘要:基于2018年兩兩城市間的百度搜索指數(shù)數(shù)據(jù),構(gòu)建了包含358個(gè)城市的中國(guó)城市網(wǎng)絡(luò),利用Louvain算法、D-value分析方法和城市標(biāo)度律方法,分析了中國(guó)城市作為旅游目的地時(shí)在百度引擎搜索行為下的社區(qū)表現(xiàn),探究中國(guó)城市個(gè)體在百度指數(shù)網(wǎng)絡(luò)中涌現(xiàn)出的社區(qū)聚類(lèi),分析城市在網(wǎng)絡(luò)中的地位,并對(duì)社區(qū)內(nèi)的城市要素與人口規(guī)模進(jìn)行定量的測(cè)度。選用5年前的數(shù)據(jù)作為研究樣本,是因?yàn)槭加?019年底的疫情應(yīng)急響應(yīng)會(huì)對(duì)百度引擎搜索行為和城市要素的變化造成較大影響,影響城市間的百度指數(shù)和城市要素與人口規(guī)模的非線(xiàn)性縮放關(guān)系,從而影響本研究2.2部分的社區(qū)劃分結(jié)果和2.3.3部分的標(biāo)度因子表現(xiàn)?;?018年數(shù)據(jù)的研究,其意義是研究疫情時(shí)代前中國(guó)城市的社區(qū)表現(xiàn)。
關(guān)鍵詞:中國(guó)城市;百度搜索指數(shù);復(fù)雜網(wǎng)絡(luò);D-value;城市標(biāo)度律
引言
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的數(shù)據(jù)顯示,截至2022年12月,中國(guó)搜索引擎用戶(hù)規(guī)模達(dá)10.67億,搜索引擎使用率達(dá)75.6%[1]?;ヂ?lián)網(wǎng)的快速發(fā)展與普及,使得城市間的聯(lián)系突破了傳統(tǒng)地理空間的距離限制,衍生出了新的城市地理空間交互模式。
復(fù)雜網(wǎng)絡(luò)是當(dāng)前研究城市交互網(wǎng)絡(luò)的主要方法之一,自1736年歐拉利用圖論解答哥尼斯堡七橋問(wèn)題開(kāi)始,學(xué)者們對(duì)復(fù)雜網(wǎng)絡(luò)理論進(jìn)行了深入探究,從小世界到六度分隔再到無(wú)標(biāo)度網(wǎng)絡(luò)。對(duì)復(fù)雜網(wǎng)絡(luò)深有研究的艾伯特-拉斯洛·巴拉巴西指出,現(xiàn)實(shí)中大部分的聯(lián)系是稀疏的,聯(lián)系緊密的部分會(huì)形成團(tuán)簇,研究團(tuán)簇形成的原因和團(tuán)簇的表現(xiàn)更有意義。為此,后續(xù)學(xué)者們提出了一些針對(duì)復(fù)雜網(wǎng)絡(luò)的社區(qū)探測(cè)方法,例如,Louvain算法和Infomap算法等。
城市間的人流、物質(zhì)流和信息流等地理流的存在,使得城市網(wǎng)絡(luò)中同樣存在團(tuán)簇和社區(qū)?,F(xiàn)有的研究大多是從人流和物質(zhì)流的角度來(lái)研究城市網(wǎng)絡(luò)的社區(qū)分布和網(wǎng)絡(luò)結(jié)構(gòu),以探索城市空間交互模式,并結(jié)合相關(guān)經(jīng)濟(jì)、社會(huì)和科技等指標(biāo)來(lái)揭示城市個(gè)體之間發(fā)展差異和協(xié)同發(fā)展關(guān)系。
本文基于百度搜索指數(shù)數(shù)據(jù),利用復(fù)雜網(wǎng)絡(luò)理論和城市標(biāo)度律方法,對(duì)中國(guó)358個(gè)城市所構(gòu)成的信息流網(wǎng)絡(luò)進(jìn)行了社區(qū)分割與網(wǎng)絡(luò)結(jié)構(gòu)分析,以探索信息流下中國(guó)城市網(wǎng)絡(luò)的社區(qū)分布和網(wǎng)絡(luò)結(jié)構(gòu)特征,并分析不同社區(qū)下城市系統(tǒng)的發(fā)展?fàn)顩r。
1. 數(shù)據(jù)與方法
1.1 數(shù)據(jù)來(lái)源
城市間的搜索指數(shù)數(shù)據(jù)來(lái)源于百度指數(shù)網(wǎng)站(https://index.baidu.com/),以城市名為關(guān)鍵詞,獲取各城市在不同城市范圍的搜索指數(shù),總共采集了358×358個(gè)城市對(duì)在2018年1月1日至2018年12月31日共365天的百度搜索指數(shù)數(shù)據(jù)。新發(fā)明、專(zhuān)利、工資總額、銀行存款總額、GDP、就業(yè)總量、用電總量、家庭用電量、家庭用水量和道路面積10個(gè)城市要素?cái)?shù)據(jù)來(lái)源于《中國(guó)城市統(tǒng)計(jì)年鑒(2018年)》市轄區(qū)口徑的統(tǒng)計(jì)數(shù)據(jù)。城市人口數(shù)據(jù)為《中國(guó)城市建設(shè)統(tǒng)計(jì)年鑒(2018年)》中城區(qū)人口與暫住人口之和。
1.2 Louvain算法
Louvain算法也稱(chēng)Fast unfolding算法[2],其可以對(duì)百萬(wàn)級(jí)節(jié)點(diǎn)的網(wǎng)絡(luò)進(jìn)行快速的社區(qū)劃分,且劃分的社區(qū)不重疊。Louvain算法將節(jié)點(diǎn)作為研究對(duì)象,通過(guò)迭代計(jì)算△Q和模塊度M,最終確定社區(qū)的最優(yōu)劃分。
(1)
(2)
式中,m表示有向網(wǎng)絡(luò)中所有鏈接權(quán)重之和的一半;ki,in表示所有從節(jié)點(diǎn)i指向區(qū)域C的鏈接權(quán)重之和;表示所有指向區(qū)域C的節(jié)點(diǎn)的鏈接權(quán)重之和;ki表示指向節(jié)點(diǎn)i的所有鏈接的權(quán)重之和,在計(jì)算ki時(shí),自環(huán)鏈接的權(quán)重要以?xún)杀队?jì)算;Aij表示原圖的連接矩陣;原圖中i,j連接,則,否則為0。
1.3 D-value分析方法
D-value主要用于分析節(jié)點(diǎn)在網(wǎng)絡(luò)中的主導(dǎo)性,本文利用D-value方法[3]挖掘不同社區(qū)內(nèi)的強(qiáng)主導(dǎo)性城市。
(3)
式中DSI表示城市發(fā)送的百度搜索指數(shù),RSI表示城市接收的百度搜索指數(shù),D是D-value,其值越大,表示該城市在社區(qū)網(wǎng)絡(luò)中的主導(dǎo)性越強(qiáng)。
1.4 城市標(biāo)度律
標(biāo)度律起源于Kleiber定律——生物體積與新陳代謝率間存在3/4的冪律關(guān)系。21世紀(jì)初Bettencourt將標(biāo)度律應(yīng)用于城市研究[4],將城市看作有生命的機(jī)體,其城市要素與人口規(guī)模的非線(xiàn)性關(guān)系遵從城市標(biāo)度律的表現(xiàn),其公式[5]如下:
lgy=βlgn=lgy0(4)
式中,i表示不同的研究單元,Yi表示第i個(gè)研究單元的城市要素的度量,Ni表示第i個(gè)研究單元的人口規(guī)模,Y0為標(biāo)準(zhǔn)化常量,β為標(biāo)度因子。標(biāo)度因子主要有三大類(lèi):①β=1,表示個(gè)人需求方面的社會(huì)要素(用電量、用水量)與人口規(guī)模的線(xiàn)性關(guān)系;②β<1(<0.8),表示基礎(chǔ)設(shè)施方面的要素(道路面積)與人口規(guī)模的次線(xiàn)性關(guān)系;③β>1(>1.2),表示經(jīng)濟(jì)和創(chuàng)新方面的要素(專(zhuān)利、發(fā)明、地區(qū)生產(chǎn)總值)與人口規(guī)模的超線(xiàn)性關(guān)系。
2. 結(jié)果分析
2.1 網(wǎng)絡(luò)構(gòu)建
本文以中國(guó)的358個(gè)城市為節(jié)點(diǎn),以搜索行為所在的城市作為邊的起點(diǎn),被搜索城市作為邊的終點(diǎn)構(gòu)建中國(guó)城市有向網(wǎng)絡(luò)。為了提升研究結(jié)果的嚴(yán)謹(jǐn)性和可信度,本文采集了中國(guó)358個(gè)城市在2018年每天的搜索指數(shù),并使用3sigma原則剔除城市間的異常搜索指數(shù),最后取2018年的日均百度搜索指數(shù)作為中國(guó)城市有向網(wǎng)絡(luò)的邊權(quán)重。
2.2 社區(qū)劃分
使用Louvain算法對(duì)基于百度搜索指數(shù)的中國(guó)城市有向網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,從劃分結(jié)果可知,基于百度搜索指數(shù)的中國(guó)城市有向網(wǎng)絡(luò)被分為了4個(gè)社區(qū),且社區(qū)存在顯著的地域分布特征。最優(yōu)劃分結(jié)果中社區(qū)1包括新疆、甘肅、寧夏、陜西、青海、西藏、四川、重慶、貴州、云南這10個(gè)省級(jí)行政區(qū)的城市,社區(qū)2包括河南、安徽、江蘇、上海、浙江這5個(gè)省級(jí)行政區(qū)的城市,社區(qū)3包括內(nèi)蒙古、黑龍江、吉林、遼寧、北京、河北、天津、山西、山東這9個(gè)省級(jí)行政區(qū)的城市,社區(qū)4包括湖北、湖南、江西、福建、廣西、廣東、海南這7個(gè)省級(jí)行政區(qū)的城市和香港,臺(tái)灣、澳門(mén)不在本次研究?jī)?nèi)。另外,除了阿里、玉樹(shù)藏族自治州、海南藏族自治州、榆林、溫州、張家界、防城港、黃山、阿拉善和海南省的瓊海、五指山、東方、三亞城市外,省內(nèi)的城市均屬同一個(gè)社區(qū)。
2.3 網(wǎng)絡(luò)結(jié)構(gòu)分析
2.3.1 網(wǎng)絡(luò)節(jié)點(diǎn)的主導(dǎo)性分析
圖1為4個(gè)社區(qū)內(nèi)D-value最大和最小的城市。綜合分析發(fā)現(xiàn),4個(gè)社區(qū)內(nèi)D-value最大的3個(gè)城市分別為成都、昆明、重慶、上海、杭州、鄭州、北京、濟(jì)南、沈陽(yáng)、深圳、廣州和武漢,這些城市均為區(qū)域內(nèi)的政治或經(jīng)濟(jì)中心,是人口聚集地,且其作為旅游目的地對(duì)于社區(qū)內(nèi)的其他城市具有很強(qiáng)的知名度和吸引力,因此這些城市在社區(qū)內(nèi)的主導(dǎo)性最強(qiáng)。另外,4個(gè)社區(qū)內(nèi)D-value最小的3個(gè)城市分別為麗江、西雙版納、張家界、蚌埠、舟山、黃山、玉樹(shù)、防城港、東方、北海、香港和海南藏族自治州,除香港和海南藏族自治州外,其他城市均具有濃厚的歷史文化底蘊(yùn)和地方特色,是知名的旅游城市,且城市人口較少,因此這些城市在社區(qū)內(nèi)的主導(dǎo)性最弱。而香港雖然人口較多,但其使用百度搜索引擎的人數(shù)較少,導(dǎo)致D-value較小,也被劃分為主導(dǎo)性最弱的城市。在網(wǎng)絡(luò)上,人們搜索的“海南”通常是指海南省,而根據(jù)數(shù)據(jù)獲取規(guī)則,海南藏族自治州的搜索關(guān)鍵詞也被簡(jiǎn)寫(xiě)為“海南”,導(dǎo)致海南藏族自治州的百度搜索指數(shù)被錯(cuò)誤地增加,再結(jié)合海南藏族自治州的人口較少導(dǎo)致搜索行為較少,因此海南藏族自治州被劃分為了主導(dǎo)性最弱的城市。
2.3.2 社區(qū)網(wǎng)絡(luò)結(jié)構(gòu)及其差異分析
對(duì)4個(gè)社區(qū)內(nèi)的邊權(quán)重進(jìn)行統(tǒng)計(jì)分析,如圖2可知,4個(gè)社區(qū)內(nèi)的日均百度搜索指數(shù)存在較大的差異。其中,社區(qū)2內(nèi)城市位于經(jīng)濟(jì)相對(duì)發(fā)達(dá)的長(zhǎng)江三角洲城市群和河南省,其日均百度搜索指數(shù)相對(duì)較高。而社區(qū)1內(nèi)的城市大多地處經(jīng)濟(jì)相對(duì)落后的西部和西南區(qū)域,其日均百度搜索指數(shù)相對(duì)最低。由此可見(jiàn),經(jīng)濟(jì)越發(fā)達(dá)的區(qū)域,其日均百度搜索指數(shù)越高。此外,由于社區(qū)1、社區(qū)3和社區(qū)4內(nèi)的城市發(fā)展差異較大,因此這些社區(qū)內(nèi)城市日均百度搜索指數(shù)統(tǒng)計(jì)結(jié)果中存在較多的異常。
為進(jìn)一步挖掘中國(guó)城市的網(wǎng)絡(luò)結(jié)構(gòu)特征,本文將社區(qū)內(nèi)日均百度搜索指數(shù)大于社區(qū)中位數(shù)1.5倍IQR的城市間的邊視為強(qiáng)聯(lián)系。分析可知,社區(qū)2的強(qiáng)聯(lián)系網(wǎng)絡(luò)的度分布較為均勻,表明社區(qū)2內(nèi)部的城市聯(lián)系較為緊密。而社區(qū)1、3、4的強(qiáng)聯(lián)系網(wǎng)絡(luò)存在一定的異質(zhì)性,網(wǎng)絡(luò)中的少數(shù)節(jié)點(diǎn)擁有較多的連接,這些少數(shù)節(jié)點(diǎn)對(duì)社區(qū)內(nèi)部起著主導(dǎo)的作用。進(jìn)一步分析發(fā)現(xiàn),4個(gè)社區(qū)網(wǎng)絡(luò)中具備主導(dǎo)地位的節(jié)點(diǎn)分別成都市、上海市、北京市和深圳市,這與D-value的研究結(jié)果相符。
2.3.3 社區(qū)內(nèi)的城市標(biāo)度律分析
利用城市標(biāo)度律分析各社區(qū)內(nèi)城市發(fā)展過(guò)程中新發(fā)明、專(zhuān)利、工資總額、銀行存款總額、GDP、就業(yè)總量、用電總量、家庭用電量、家庭用水量和道路面積10個(gè)城市要素與人口增長(zhǎng)的差異性,結(jié)果如圖4所示。這10個(gè)要素中,新發(fā)明、專(zhuān)利代表城市的產(chǎn)生知識(shí)溢出效應(yīng)能力,是城市創(chuàng)新能力的體現(xiàn);工資總額、銀行存款總額、GDP代表城市的貨幣流通情況,是城市經(jīng)濟(jì)水平的體現(xiàn);就業(yè)總量、用電總量、家庭用電量、家庭用水量代表城市中與人民生活相關(guān)的基礎(chǔ)資源,是城市滿(mǎn)足生活需求能力的體現(xiàn);道路面積代表城市通行面積承載人口的情況,是城市基礎(chǔ)設(shè)施建設(shè)完善度的體現(xiàn)。
從圖3中可知,4個(gè)社區(qū)內(nèi)的城市在新專(zhuān)利、發(fā)明、工資總額、銀行存款總額和GDP共5個(gè)城市要素上的標(biāo)度因子均大于1,表明這些城市要素與人口規(guī)模呈超線(xiàn)性增長(zhǎng)關(guān)系,會(huì)隨著人口規(guī)模的增長(zhǎng)而增加得越來(lái)越快,創(chuàng)新能力和經(jīng)濟(jì)水平表現(xiàn)出集聚效應(yīng)。而用電總量和道路面積在4個(gè)社區(qū)的標(biāo)度因子均小于1,表明道路面積和城市居民用電與人口規(guī)模成次線(xiàn)性增長(zhǎng)關(guān)系,會(huì)隨著人口規(guī)模的增長(zhǎng)而增加得越來(lái)越慢,部分城市面臨的交通擁堵和電力緊缺的情況會(huì)加劇。4個(gè)社區(qū)內(nèi)的就業(yè)總量和家庭用水量接近或等于1,與人口規(guī)模的增長(zhǎng)表現(xiàn)為線(xiàn)性,會(huì)隨著人口規(guī)模的增加而同步增長(zhǎng),表明人口規(guī)模的增加不會(huì)使社區(qū)出現(xiàn)就業(yè)崗位稀缺、人民失業(yè)的情況,能夠滿(mǎn)足人們的就業(yè)需求,并且地方的水利部門(mén)也能夠?yàn)樯鐓^(qū)提供充足的生活用水,城市居民具有良好節(jié)水意識(shí),均屬于資源節(jié)約型社區(qū)。在家庭用電量方面,社區(qū)1的標(biāo)度因子等于1,而其他社區(qū)的標(biāo)度因子均小于1,表明隨著人口的增長(zhǎng),社區(qū)1的家庭用電量會(huì)隨著人口規(guī)模的增加而同步增長(zhǎng),而其他社區(qū)會(huì)隨著人口規(guī)模的增加而增長(zhǎng)得越來(lái)越慢,這是因?yàn)樯鐓^(qū)1位于的西部和西南地區(qū)的水電、風(fēng)電等電力資源豐富,家庭用電相對(duì)較少,電力部門(mén)能夠提供充足的電力資源供家庭使用,而其他社區(qū)的城市相對(duì)發(fā)達(dá),工業(yè)用電和家庭用電相對(duì)較多,因此其增長(zhǎng)會(huì)越來(lái)越慢。
結(jié)論與展望
本文基于百度搜索指數(shù)構(gòu)建中國(guó)城市有向網(wǎng)絡(luò),對(duì)中國(guó)城市作為旅游目的地時(shí)產(chǎn)生的有向網(wǎng)絡(luò)結(jié)構(gòu)特征和空間分布進(jìn)行分析,對(duì)社區(qū)內(nèi)的城市要素與人口規(guī)模進(jìn)行定量測(cè)度,研究結(jié)果表明:在2018年,中國(guó)城市網(wǎng)絡(luò)中高D-value的主導(dǎo)性城市主要集中在直轄市、省會(huì)等主要城市,它們一般是政治或經(jīng)濟(jì)中心,這些城市人口集聚,基于搜索行為的吸引力強(qiáng),在社區(qū)內(nèi)具有主導(dǎo)性。低D-value城市集中在旅游名城和受到社會(huì)廣泛關(guān)注的城市,具有濃厚的歷史文化底蘊(yùn)和地方特色,但通常這些城市的人口較少,主導(dǎo)性弱。社區(qū)間發(fā)展存在較大差異,經(jīng)濟(jì)越發(fā)達(dá),日均百度指數(shù)越高。長(zhǎng)江三角洲城市群的社區(qū)城市間聯(lián)系最緊密、最活躍,4個(gè)社區(qū)的樞紐節(jié)點(diǎn)城市分別是成都市、上海市、北京市、深圳市。4個(gè)社區(qū)中的城市創(chuàng)新能力和經(jīng)濟(jì)水平均表現(xiàn)出集聚效應(yīng),就業(yè)崗位和水資源也充足,而道路面積和城市居民用電與人口增長(zhǎng)成次線(xiàn)性關(guān)系,此外家庭用水量在不同社區(qū)存在差異。社區(qū)內(nèi)的網(wǎng)絡(luò)聯(lián)系促進(jìn)了科技人員交流,促進(jìn)了知識(shí)溢出和擴(kuò)散,這個(gè)現(xiàn)象與Saxenian(2001)[6]在美國(guó)硅谷、波士頓等地的研究結(jié)果相符。
參考文獻(xiàn):
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.CNNIC發(fā)布第51次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[EB/OL].(2023-03-02)[2023-08-14].https://www.cnnic.net.cn/n4/2023/0302/c199-10755.html.
[2]Blondel VD, Guillaume JL,Lambiotte R,et al.Fast unfolding of communities in large networks[J].Journal of Statistical Mechanics: Theory and Experiment,2008,(10):10008.
[3]趙映慧,高鑫,姜博.東北三省城市百度指數(shù)的網(wǎng)絡(luò)聯(lián)系層級(jí)結(jié)構(gòu)[J].經(jīng)濟(jì)地理,2015,35(5):32-37.
[4]Bettencourt LMA.The Origins of Scaling in Cities[J].Science,2013,340(6139): 1438-1441.
[5]焦利民,雷瑋倩,許剛,等.中國(guó)城市標(biāo)度律及標(biāo)度因子時(shí)空特征[J].地理學(xué)報(bào),2020,75(12):2744-2758.
[6]Saxenian A.The Entrepreneurship Dynamic[M].Stanford:Stanford University Press,2001:40-67.
作者簡(jiǎn)介:朱佳貝,本科在讀,研究方向:時(shí)空數(shù)據(jù)挖掘。