国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于移動(dòng)通訊大數(shù)據(jù)的城市人口空間分布統(tǒng)計(jì)

2019-09-20 12:59潘英武
衛(wèi)星電視與寬帶多媒體 2019年8期
關(guān)鍵詞:空間分布大數(shù)據(jù)分析模型

潘英武

【摘要】分析與計(jì)算移動(dòng)通訊空間大數(shù)據(jù),ArcGIS和Hadoop的集成計(jì)算平臺(tái)依據(jù)Geometry API被構(gòu)件起來(lái),其中收集手機(jī)客戶(hù)的位置信息數(shù)據(jù)主要使用的是COO定位技術(shù)。地圖信息模型的建立要采用ArcGIS中的Voronoi;人口密度模型的建立之前需要計(jì)算圈層人口的密度;職住地分布模型的建立要依據(jù)DBSCAN密度聚類(lèi)算法;建立報(bào)警電話(huà)分布模型的時(shí)候主要應(yīng)用的是核密度估算。本文主要與實(shí)際案例相結(jié)合,分析與統(tǒng)計(jì)移動(dòng)通訊大數(shù)據(jù)的城市人口空間分布情況。

【關(guān)鍵詞】移動(dòng)通訊;城市人口;空間分布;模型;大數(shù)據(jù)分析

在二十世紀(jì)七十年代的時(shí)候在國(guó)外就已經(jīng)有學(xué)者通過(guò)GIS技術(shù)研究人口空間分布的應(yīng)用了,較為典型的代表就是美國(guó)。自動(dòng)化技術(shù)在1970年-1980年就已經(jīng)應(yīng)用在了美國(guó)的人口普查之中,并且研發(fā)了與其有關(guān)的相關(guān)文件,使坐標(biāo)地圖編碼系統(tǒng)獨(dú)立的起來(lái)。Lanscan通過(guò)各種因素對(duì)回歸方程系數(shù)進(jìn)行計(jì)算,得出在1km×1km的空間網(wǎng)格上統(tǒng)計(jì)人口數(shù)據(jù)。在連續(xù)的規(guī)則網(wǎng)格中表達(dá)人口分布情況就是這種柵格模擬技術(shù)的含義。在高分辨率的規(guī)則柵格上有效的記錄數(shù)據(jù)和提高人口分布數(shù)據(jù)的準(zhǔn)確性是柵格模擬技術(shù)的主要優(yōu)勢(shì)。

一、收集手機(jī)定位信

在1957年我國(guó)正式開(kāi)始研究人口空間分布統(tǒng)計(jì)。有學(xué)者應(yīng)用多源數(shù)據(jù)融合技術(shù)把可以影響到人口分布的因素模擬某地的人口在柵格上。

在現(xiàn)今的研究成果也有需要進(jìn)行改進(jìn)的地方。人口密度分布可以間接的用自然和社會(huì)經(jīng)濟(jì)特征綜合估計(jì)法進(jìn)行數(shù)據(jù)統(tǒng)計(jì),具體的人口分布來(lái)源情況不能直接的、完整的被表達(dá)出來(lái),統(tǒng)計(jì)結(jié)果的準(zhǔn)確性得不到保證,有關(guān)部門(mén)多需要的人口數(shù)據(jù)也不是很精準(zhǔn);大數(shù)據(jù)處理技術(shù)沒(méi)有完全應(yīng)用到GIS分析之中,也不能及時(shí)更新人口分布的統(tǒng)計(jì)技術(shù)、方法和手段,所以在進(jìn)行人口分布統(tǒng)計(jì)的時(shí)候既要花費(fèi)大量的時(shí)間又需要花費(fèi)較多的成本。

用戶(hù)的時(shí)空信息可以通過(guò)短信發(fā)送、通話(huà)和上網(wǎng)等進(jìn)行獲取。依據(jù)移動(dòng)通訊理論,需要及時(shí)更新小區(qū)切換和周期性地點(diǎn),位置和軌跡數(shù)據(jù)就是通過(guò)隨時(shí)更新這些位置信息而形成的。分析和采集長(zhǎng)時(shí)間不規(guī)則的手機(jī)通話(huà)位置數(shù)據(jù),應(yīng)用ArcGIS獨(dú)有的技術(shù)和大數(shù)據(jù)處理架構(gòu)相結(jié)合,就可以有效的統(tǒng)計(jì)城市人口的空間分布情況。

把可以統(tǒng)計(jì)城市人口空間分布的模型建立在ArcGIS之中,在建立的過(guò)程中需要依據(jù)手機(jī)中的數(shù)據(jù)資源,模型的主要類(lèi)型包括地圖信息、人口密度、供職人員所住的地點(diǎn)以及報(bào)警設(shè)置。在城市人口統(tǒng)計(jì)平臺(tái)構(gòu)建的過(guò)程中需要依據(jù)ArcGIS和Hadoop集成環(huán)境,可以更好的分析與大數(shù)據(jù)的空間有關(guān)的相關(guān)性,也可以表述數(shù)據(jù)的可視化,同時(shí)也需要對(duì)人口的數(shù)量密度分布和職住地分布進(jìn)行相關(guān)的研究與分析,可以使相關(guān)人員更好的管理城市人口和公共安全。

不用依靠GPS并前景較好的技術(shù)就是手機(jī)定位技術(shù),初始蜂窩小區(qū)、TOA和七號(hào)信令定位技術(shù)都是手機(jī)定位技術(shù)所包含的內(nèi)容。以下所采集的數(shù)據(jù)信息主要應(yīng)用的就是初始蜂窩小區(qū)定位技術(shù)。

單基站定位技術(shù)是初始蜂窩小區(qū)定位技術(shù)的表現(xiàn)特征,這種技術(shù)的移動(dòng)坐標(biāo)設(shè)備主要是移動(dòng)設(shè)備所屬基站,基站覆蓋的范圍決定了此定位方法是否精確。在城市中較為集中的基站地點(diǎn),可以有效的控制定位的準(zhǔn)確度。越是城市周邊,基站分布的也就不是那么密集,所以就會(huì)擴(kuò)大定位的準(zhǔn)確度。

手機(jī)接打電話(huà)時(shí)的連接的基站位置信息,都會(huì)被記錄在初始蜂窩小區(qū)定位技術(shù)通話(huà)位置數(shù)據(jù)信息之中,其中用戶(hù)的識(shí)別號(hào)、通話(huà)的長(zhǎng)短和基站經(jīng)緯度等數(shù)據(jù)都是數(shù)據(jù)信息中所記錄的相關(guān)內(nèi)容。為了使用戶(hù)的隱私可以得到有效保護(hù),需要把與手機(jī)有關(guān)的號(hào)碼信息刪除,對(duì)ID帳號(hào)進(jìn)行加密。表一表示的是移動(dòng)用戶(hù)位置數(shù)據(jù)的格式:

二、統(tǒng)計(jì)城市人口空間分布模型

在統(tǒng)計(jì)城市人口空間分布時(shí)需要依靠手機(jī)在通話(huà)過(guò)程中所產(chǎn)生位置信息來(lái)完成,在網(wǎng)格上標(biāo)記城市地圖,采用有關(guān)模型和算法,設(shè)立與其有關(guān)的模型,如地圖信息模型等。

(一)地圖信息模型

點(diǎn)圖層主要是采用ArcGIS軟件把手機(jī)通話(huà)時(shí)的基站地理坐標(biāo)進(jìn)行轉(zhuǎn)化得來(lái)的。手機(jī)基站的覆蓋范圍主要就是通過(guò)構(gòu)件泰森多邊形圖所表示的,構(gòu)件泰森多邊形時(shí)要參照所有的基站點(diǎn)數(shù)據(jù),組成泰森多邊形的因素是連接一組兩相鄰的基站點(diǎn)連線的垂直平分線。

進(jìn)行地圖匹配和和幾何校正某市的地圖矢量數(shù)據(jù)。主要內(nèi)容是:某市行政區(qū)規(guī)劃圖;某市相關(guān)道路地圖;某市小區(qū)交通數(shù)據(jù)信息;某市小區(qū)人群生活分布情況等相關(guān)信息。轉(zhuǎn)換GIS矢量數(shù)據(jù)圖層,保證一樣的地圖矢量數(shù)據(jù)和手機(jī)定位坐標(biāo)數(shù)據(jù)。

可以使用較多的泰森多邊形表達(dá)城市的區(qū)域劃分,參照?qǐng)D一,在把所有的網(wǎng)格進(jìn)行合并??梢园凑沼嘘P(guān)統(tǒng)計(jì)人口需求進(jìn)行網(wǎng)格劃分。

(二)人口密度模型

依照用戶(hù)的ID對(duì)手機(jī)通話(huà)時(shí)的位置數(shù)據(jù)進(jìn)行分組,依照用戶(hù)的ID和使用時(shí)間排列樣本中的所有用戶(hù)數(shù)據(jù)信息。把每一位用戶(hù)的ID連續(xù)一小時(shí)之間的通話(huà)記錄進(jìn)行整合,把整合后的數(shù)據(jù)記錄在基站位置之中。

對(duì)人口密度與城市中心距離之間的關(guān)系進(jìn)行分析的時(shí)候要依據(jù)圈層結(jié)構(gòu)理論,同時(shí)也需要計(jì)算圈層人口密度,這樣就可以有效掌握城市人口的空間分布情況。

(三)職住地居住模型

依據(jù)居家和不同工作時(shí)間段內(nèi)不同的用戶(hù)通話(huà)特征,通過(guò)聚類(lèi)分析識(shí)別出居住地和工作地就是職住地分析的關(guān)鍵所在。由經(jīng)緯度組成的二維向量就是空間聚類(lèi)分析,每個(gè)小點(diǎn)組合在一起組成的多維空間。把這些點(diǎn)分成不同的簇并把較大的點(diǎn)或者是較為相似的點(diǎn)歸為一簇就是聚類(lèi)分析的結(jié)果,這樣就形成了集聚的職住地通話(huà)用戶(hù)的范圍。

基于密度的聚類(lèi)算法的表達(dá)方式是DBBSCAN。在樣本空間中稠密樣本點(diǎn)可以組成所以的目標(biāo)簇,噪聲的低密度區(qū)域分割又可以稱(chēng)作稠密樣本點(diǎn),把低密度地點(diǎn)進(jìn)行過(guò)濾,就可以看見(jiàn)稠密樣本點(diǎn)。比較于其它算法,不被聚類(lèi)數(shù)目所影響是DBBSCAN的優(yōu)勢(shì),如果在聚類(lèi)計(jì)算中出現(xiàn)較多的工作地和居住地的時(shí)候就可以使用DBBSCAN算法進(jìn)行計(jì)算。

(四)報(bào)警電話(huà)分布模型

在對(duì)報(bào)警電話(huà)在空間分布的總體情況進(jìn)行分析的時(shí)候主要應(yīng)用的是核密度分析法,也就是說(shuō)在幾何分布上報(bào)警電話(huà)點(diǎn)集數(shù)據(jù)所具備哪些特征。所有報(bào)警電話(huà)的基站位置上都設(shè)定與其對(duì)應(yīng)的核密度函數(shù)就是核密度估算,報(bào)警電話(huà)的空間分布變化情況就是通過(guò)此地區(qū)所有報(bào)警電話(huà)的密度函數(shù)來(lái)表示的。

需要對(duì)所有報(bào)警電話(huà)的空間分布情況急性細(xì)化與分析,把分析之后的安全事故結(jié)果進(jìn)行數(shù)據(jù)統(tǒng)計(jì),制成表格,把這些表格以獨(dú)有的形式表達(dá)在模型上。

三、統(tǒng)計(jì)城市人口平臺(tái)

如要實(shí)現(xiàn)ArsGIS和Hadoop的交互就需要依靠Geometry,在Hadoop接收到Geometry API傳送的數(shù)據(jù)時(shí),Hadoop就可以對(duì)所有的數(shù)據(jù)進(jìn)行分析。

為了可以使大量的數(shù)量處理得到一定的滿(mǎn)足,就需要設(shè)置與其相應(yīng)的框架,圖二所表達(dá)的就是框架的位置和內(nèi)容:簡(jiǎn)要說(shuō)明數(shù)據(jù)源和計(jì)算層。數(shù)據(jù)源:最原始的所有異構(gòu)通訊數(shù)據(jù)就是數(shù)據(jù)源,語(yǔ)言、用戶(hù)信息以及基站參數(shù)是數(shù)據(jù)源所包含的相關(guān)內(nèi)容,需要隨時(shí)轉(zhuǎn)化和清洗數(shù)據(jù)信息,要做到保護(hù)好用戶(hù)的隱私。計(jì)算層:對(duì)高速數(shù)據(jù)交換組件和同步數(shù)據(jù)組件進(jìn)行相應(yīng)的研究與開(kāi)發(fā),通過(guò)處理ETL,精準(zhǔn)配比所需要的模型,并對(duì)其進(jìn)行計(jì)算。模型層:依靠Geometry完成ArsGIS和Hadoop二者之間的交互,并分析轉(zhuǎn)化完成的各種數(shù)據(jù)信息。應(yīng)用層:在對(duì)其進(jìn)行分析主要采用的ArsGIS中的相關(guān)工具,并且城市人口的數(shù)量情況等信息是通過(guò)可視化的方式變現(xiàn)出來(lái)的。

四、分析結(jié)果

本文為實(shí)驗(yàn)所選取的移動(dòng)通話(huà)數(shù)據(jù)主要來(lái)自某市2017年3月到2017年5月之間的信息,據(jù)有關(guān)數(shù)據(jù)可知,全國(guó)有8.35億的人口都在使用移動(dòng)通訊,占市場(chǎng)份額比例要遠(yuǎn)高于其它通訊用戶(hù),所以在推算人口數(shù)量的時(shí)候可以應(yīng)用此比例來(lái)完成。

(一)分析人口密度

在分析人口分布情況時(shí)可以使用異常分析工具或者是ArcGIS中的聚類(lèi)。通過(guò)分析移動(dòng)通話(huà)數(shù)據(jù)可以知道某市的人口密度,圖三所表達(dá)的是該市的人口密度空間分布圖:如圖三中的數(shù)據(jù)可知,集聚是該市人口分布的主要特點(diǎn)。圖四所表達(dá)的是該市的人口密度圈層分布圖。如圖四中的數(shù)據(jù)可知,核心-邊緣是該市的人口密度圈層分布圖多表現(xiàn)出的空間特點(diǎn)。

(二)分析職住地居住情況

為了確保信息的準(zhǔn)確度,數(shù)據(jù)統(tǒng)計(jì)時(shí)間以三個(gè)月為一個(gè)期限,零點(diǎn)到第二天的六點(diǎn)是居住地用戶(hù)所出現(xiàn)的時(shí)間,九點(diǎn)到十七點(diǎn)是居住地用戶(hù)的工作時(shí)間。

圖五所表示的是該市職住地居住的分布情況。據(jù)圖可知,中心居住圈、次中心居住圈以及郊區(qū)居住圈是該市的三大主要居住圈。

圖六所示的是該市的人口工作分布地情況。人員的工作地點(diǎn)主要分布在該市的各大商圈之中。

(三)分析報(bào)警電話(huà)的分布情況

把核密度函數(shù)設(shè)定在報(bào)警電話(huà)所在的基站空間之上,報(bào)警電話(huà)的空間規(guī)律情況可以通過(guò)報(bào)警電話(huà)的核密度函數(shù)體現(xiàn)出來(lái)。犯罪案發(fā)地的情況可以依據(jù)此方法進(jìn)行識(shí)別。

采集某一階段的數(shù)據(jù)為樣本,分析這一階段的報(bào)警數(shù)目,圖七是對(duì)其進(jìn)行分析后所得的結(jié)果:由圖可知,報(bào)警次數(shù)較多的地點(diǎn)集中在該市的蕭山區(qū),該市的拱野區(qū)緊追其后。其優(yōu)勢(shì)不僅可以利于警方合理的使用資源,升民眾的警惕性也可以由此提升。

五、結(jié)論

通過(guò)分析對(duì)比該市2011年-2016年的人口數(shù)據(jù)情況可知,該市的人口密度情等都符合普查數(shù)據(jù)分析結(jié)果。報(bào)警電話(huà)分布情況也符合該市相關(guān)部門(mén)發(fā)出的治安消息。由此可知如要統(tǒng)計(jì)城市的人口分布情況就可以使用以上模型來(lái)完成,在規(guī)劃城市、疏導(dǎo)城市交通以及公共安全等領(lǐng)域時(shí)都可以應(yīng)用以上模型,并且其發(fā)展前景也是非常好的。

參考文獻(xiàn):

[1] 王雪梅,李新,馬國(guó)明.基于遙感和GIS的人口數(shù)據(jù)空間化研究進(jìn)展及案例分析[J].遙感技術(shù)與應(yīng)用,2004,19(5):320-327.

[2] 陳學(xué)剛,楊兆萍.基于GIS的烏魯木齊市人口空間分布模擬與變化規(guī)律研究[J].干旱區(qū)資源與環(huán)境,2008,22(4):12-16.

[3] 王峰,唐美華.基于移動(dòng)通訊大數(shù)據(jù)的城市人口管理解決方案[J].移動(dòng)通訊,2014,23(13):38-41.

[4] 許寧.基于手機(jī)定位數(shù)據(jù)的居民職住地分布特征研究[D].長(zhǎng)沙:中南大學(xué),2014.

[5] 高碩,王銘楊,魯旭,等.基于大數(shù)據(jù)的城市居民職住瞄點(diǎn)計(jì)算方法研究[J].西部人民環(huán)境學(xué)刊,2017,32(1):31-37.

[6] 周天綺,嚴(yán)奧霞.基于移動(dòng)通訊大數(shù)據(jù)的流動(dòng)人口統(tǒng)計(jì)中Hadoop的應(yīng)用研究[J].軟件導(dǎo)刊,2015,14(3):36-38.

[7] 周天綺.基于移動(dòng)通訊大數(shù)據(jù)的流動(dòng)人口統(tǒng)計(jì)中的Hive優(yōu)化[J].軟件工程師,2015,18(7):58-60.

猜你喜歡
空間分布大數(shù)據(jù)分析模型
自制空間站模型
模型小覽(二)
圓周運(yùn)動(dòng)與解題模型
面向大數(shù)據(jù)遠(yuǎn)程開(kāi)放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
白龜山濕地重金屬元素分布特征及其來(lái)源分析
面向大數(shù)據(jù)分析的信息管理實(shí)踐教學(xué)體系構(gòu)建
傳媒變局中的人口電視欄目困境與創(chuàng)新
江蘇省臭氧污染變化特征
離散型隨機(jī)變量分布列的兩法則和三模型
扶绥县| 太保市| 宝丰县| 勐海县| 浏阳市| 龙泉市| 澎湖县| 揭西县| 冀州市| 荥经县| 娄烦县| 龙泉市| 南雄市| 榆社县| 讷河市| 南康市| 潮州市| 广宁县| 什邡市| 乌什县| 乌鲁木齐市| 中阳县| 洛南县| 广州市| 桐乡市| 清河县| 上思县| 永康市| 观塘区| 雷山县| 扬州市| 舟曲县| 徐汇区| 海南省| 久治县| 江都市| 沂源县| 临湘市| 新田县| 普宁市| 饶平县|