尹克堅(jiān)
【摘要】 隨著時(shí)代的進(jìn)步和社會(huì)經(jīng)濟(jì)的發(fā)展,特別是科學(xué)技術(shù)的革新與應(yīng)用,開(kāi)始逐步興起了社交網(wǎng)絡(luò),那么就從數(shù)據(jù)方面推動(dòng)了城市感知的發(fā)展。但是因?yàn)樗臄?shù)據(jù)復(fù)雜程度較高,那么就增加研究的難度。本文以某城市信息感知平臺(tái)為例,對(duì)面向城市的信息感知技術(shù)進(jìn)行了深入的研究;研究結(jié)果表明,基于社交網(wǎng)絡(luò),對(duì)城市規(guī)模的計(jì)算模型進(jìn)行構(gòu)建,可以對(duì)城市發(fā)展的進(jìn)程進(jìn)行更加有效的感知,將城市運(yùn)行規(guī)律給找出來(lái),促使智能城市的目的得到實(shí)現(xiàn)。
【關(guān)鍵詞】 信息感知 社交網(wǎng)絡(luò) 大數(shù)據(jù)
一、前言
國(guó)外有教授學(xué)者明確指出,在人類發(fā)展過(guò)程中,最為偉大的發(fā)明就是城市,城市的出現(xiàn),促使人們更好的創(chuàng)新,城市化讓人們更加的智慧,可以更加幸福和健康的生存。但是,城市化進(jìn)程的加快,也增加了服務(wù)和管理的難度。如果不將信息技術(shù)及時(shí)應(yīng)用過(guò)來(lái),那么城市化可能會(huì)更多發(fā)揮消極的東西。另外一方面,隨著信息技術(shù)的發(fā)展,如移動(dòng)互聯(lián)網(wǎng)技術(shù)、社交網(wǎng)絡(luò)、云計(jì)算技術(shù)等,在互聯(lián)網(wǎng)上,數(shù)據(jù)的傳播速度以及內(nèi)容量在不斷地提高和增長(zhǎng)。根據(jù)相關(guān)的統(tǒng)計(jì)資料表明,每秒鐘,全球都有超過(guò)300萬(wàn)封電子郵件在發(fā)送,每天有5000萬(wàn)條消息發(fā)布于“推特”中,而谷歌的分布式系統(tǒng),每天需要處理的數(shù)據(jù)達(dá)到了24pb之多;淘寶網(wǎng)有著數(shù)十億的會(huì)員,每天有著千萬(wàn)筆交易誕生。這些海量數(shù)據(jù),已經(jīng)將目前人力處理范疇給超越了過(guò)去,代表著我們已經(jīng)進(jìn)入到了大數(shù)據(jù)時(shí)代。
近些年來(lái),人們?cè)絹?lái)越重視城市計(jì)算技術(shù)。在城市計(jì)算技術(shù)的概念中,在一個(gè)城市級(jí)別的計(jì)算中,可以將計(jì)算單元定義為城市空間的任何車輛、設(shè)備、建筑一級(jí)道路等。近些年來(lái),有著一些比較有代表性的工作涌現(xiàn)出來(lái),如在哥本哈根,人們將傳感器安裝于自行車輪胎上,來(lái)對(duì)城市空氣和質(zhì)量進(jìn)行探測(cè);在美國(guó),研究人員,借助于手機(jī)用戶的通信時(shí)刻和位置,來(lái)對(duì)城市動(dòng)態(tài)信息進(jìn)行深入地研究;而在北京,通過(guò)對(duì)出租車軌跡進(jìn)行分析,達(dá)到城市交通研究的目的。
二、社交網(wǎng)絡(luò)是城市感知的重要途徑
截止到2012年12月底,我國(guó)一共有5.6億互聯(lián)網(wǎng)用戶,有著超過(guò)百分之四十的互聯(lián)網(wǎng)普及率;其中,微博作為一種新型的社交媒體,得到了迅速的發(fā)展,已經(jīng)擁有了超過(guò)了3億的用戶,相較于前幾年,獲得了成倍的增長(zhǎng)。
隨著社交網(wǎng)絡(luò)的興起,出現(xiàn)了大量的活躍用戶,那么大量的記錄城市生活的數(shù)據(jù)就在持續(xù)產(chǎn)生,這些數(shù)據(jù)有著較強(qiáng)的交互性和實(shí)時(shí)性,如果深入研究的話,可以將很多有價(jià)值的信息給找出來(lái),已經(jīng)受到了數(shù)據(jù)科學(xué)家的重視。有科學(xué)家將分層社區(qū)發(fā)現(xiàn)算法應(yīng)用到社交網(wǎng)絡(luò)中的大型用戶關(guān)系網(wǎng)絡(luò)中;我國(guó)專家利用聚類方法來(lái)檢測(cè)了城市熱點(diǎn)話題;還有專家借助于社交網(wǎng)絡(luò)的位置信息,將挖掘頻繁模式應(yīng)用了過(guò)來(lái),對(duì)城市信息進(jìn)行分析。
三、社交網(wǎng)絡(luò)中的城市信息
本文將新浪微博數(shù)據(jù)充分利用了起來(lái),對(duì)某城市信息感知平臺(tái)進(jìn)行了構(gòu)建,具體來(lái)講,深入開(kāi)展這些方面的工作:
一是城市屬性挖掘:我國(guó)有著十分遼闊的地域,既有國(guó)際大都市,如上海、北京等,又有歷史悠久風(fēng)景美麗的旅游城市,如麗江、鳳凰等等。每個(gè)城市在發(fā)展軌跡方面都是獨(dú)特的,存在著較大的差異,在政治、經(jīng)濟(jì)、文化以及地理環(huán)境方面都是不同的,并且在城市生活的各個(gè)方面都有體現(xiàn)。通過(guò)研究發(fā)現(xiàn),本省市的其他地級(jí)市的微博活躍度,會(huì)直接受到人均GDP的影響,通過(guò)微博活躍度,就可以將本城市的經(jīng)濟(jì)地位和政治地位給有效反映出來(lái)。在微博活躍度的基礎(chǔ)上,用戶的位置、言論以及關(guān)系等信息也被涵蓋于微博中,通過(guò)分析這些信息,就可以將更加全面的城市整體以及各個(gè)區(qū)域的屬性特征給得出來(lái),如經(jīng)濟(jì)特征、政治特征以及文化特征等等,這樣就可以促使人們對(duì)城市更好的理解和感知。
二是城市動(dòng)態(tài)性分析:一個(gè)城市,基本特征就是動(dòng)態(tài)性,而城市動(dòng)態(tài)性直接體現(xiàn)于車輛運(yùn)行以及人群移動(dòng)等諸多方面。對(duì)城市中移動(dòng)對(duì)象的移動(dòng)軌跡進(jìn)行感知,并且分析軌跡數(shù)據(jù),可以將人類社會(huì)活動(dòng)的特征給找出來(lái),并且發(fā)現(xiàn)統(tǒng)計(jì)規(guī)律,那么就可以對(duì)復(fù)雜的城市動(dòng)態(tài)進(jìn)行把握和認(rèn)知。通過(guò)分析時(shí)間軸上社交網(wǎng)絡(luò)用戶所發(fā)布的言論或者圖片等信息,可以將空間位置上用戶的變化給找出來(lái),比如簽到功能是社交網(wǎng)絡(luò)所具備的,用戶可以對(duì)地理位置隨時(shí)記錄和分享,這樣就將豐富的空間移動(dòng)軌跡數(shù)據(jù)給提供了出來(lái)。借助于人們提供的位置信息,可以分析城市各個(gè)空間對(duì)象的運(yùn)動(dòng)規(guī)律,這樣人們可以對(duì)城市動(dòng)態(tài)特征進(jìn)行更好的把握,促使城市獲得更好的發(fā)展。
三是社區(qū)發(fā)現(xiàn):人是城市的基本組成單位,而且,有著一定的規(guī)律存在于人類行為中;通過(guò)研究表明,有著較強(qiáng)的時(shí)間和空間相關(guān)性存在于人類的行為軌跡中;并且在社交網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)中,這種小世界特性是依然存在,將人類的共同愛(ài)好,或者在真實(shí)世界中的社會(huì)關(guān)系給有效體現(xiàn)了出來(lái)。要想將人的社交結(jié)構(gòu)給找出來(lái),就可以將社交網(wǎng)絡(luò)中用戶之間的交互信息給利用起來(lái),然后將一系列的技術(shù)給利用起來(lái),如譜圖技術(shù)、動(dòng)態(tài)社區(qū)發(fā)現(xiàn)算法等,提取用戶之間的社區(qū)結(jié)構(gòu),然后借助于其他的技術(shù),來(lái)對(duì)同一社區(qū)的構(gòu)成原因進(jìn)行分析和研究。因?yàn)橛幸?guī)律存在于人類行為中,那么就有著諸多的宏觀特征體現(xiàn)于城市當(dāng)中。在如今的數(shù)據(jù)挖掘中,對(duì)個(gè)性化以及社交化更加重視,將社交網(wǎng)絡(luò)中用戶的生活模式以及社交結(jié)構(gòu)給提取出來(lái),其中,生活模式包括諸多方面的內(nèi)容,如行為、意圖等,都可以在很大程度上推動(dòng)城市規(guī)律研究工作的發(fā)展。
四是異常事件檢測(cè):在城市計(jì)算中,非常重要的一項(xiàng)研究?jī)?nèi)容就是異常事件分析;在城市中,出現(xiàn)了一些異常事件,將會(huì)在較大程度上影響到居民的正常生產(chǎn)和生活,甚至帶來(lái)較為嚴(yán)重的損失,比如流感的出現(xiàn)、暴雨災(zāi)害等等。采用傳統(tǒng)的檢測(cè)手段,異常事件往往無(wú)法及時(shí)發(fā)現(xiàn)。而通過(guò)社交網(wǎng)絡(luò),則可以對(duì)信息數(shù)據(jù)進(jìn)行實(shí)時(shí)的監(jiān)測(cè)。通過(guò)采集、分析社交網(wǎng)絡(luò)中的相關(guān)數(shù)據(jù),可以對(duì)異常事件進(jìn)行實(shí)時(shí)監(jiān)測(cè),還可以對(duì)異常事件的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),然后將一系列有針對(duì)性的措施和方法給應(yīng)用過(guò)來(lái)。社交網(wǎng)絡(luò)有著較強(qiáng)的實(shí)時(shí)性,因此,在異常事件檢測(cè)中,已經(jīng)成為非常重要的一項(xiàng)手段,可以最大限度的降低城市正常運(yùn)行受到異常事件的影響程度。除了流感外,在自然災(zāi)害、群體事件以及交通事件等檢測(cè)中,社交網(wǎng)絡(luò)也可以發(fā)揮較大的作用,這是因?yàn)樯缃痪W(wǎng)絡(luò)具備較強(qiáng)的實(shí)時(shí)性。通過(guò)研究社交網(wǎng)絡(luò)的城市異常事件檢測(cè),可以促使城市正常運(yùn)行不會(huì)在過(guò)大程度上受到異常事件的影響,避免城市居民的正常生產(chǎn)生活受到異常事件的影響,提高了城市的智能化程度。
四、社交網(wǎng)絡(luò)數(shù)據(jù)分析的挑戰(zhàn)
無(wú)數(shù)的人在互聯(lián)網(wǎng)上產(chǎn)生了社交網(wǎng)絡(luò)數(shù)據(jù),這些數(shù)據(jù)比較的復(fù)雜,雖然有規(guī)律存在,但是無(wú)用數(shù)據(jù)以及重復(fù)數(shù)據(jù)也占據(jù)了較大的一部分,它們沒(méi)有利用價(jià)值。因此,在這些豐富的社交網(wǎng)絡(luò)數(shù)據(jù)中,將有價(jià)值的信息給提取出來(lái),就是如今需要重視的一個(gè)方面。
一是對(duì)大規(guī)模多源異構(gòu)數(shù)據(jù)進(jìn)行管理和處理:社交網(wǎng)絡(luò)數(shù)據(jù)屬于多源異構(gòu)數(shù)據(jù),它的產(chǎn)生源是不同的,并且包括著諸多類型的格式,如圖像、文本和聲音等;還有著諸多類型存在于社交網(wǎng)絡(luò)數(shù)據(jù)中,如用戶關(guān)系、移動(dòng)軌跡、地理信息等。同時(shí),社交網(wǎng)絡(luò)中,包括了較大的數(shù)據(jù)量,隨著時(shí)間的推移,還有諸多的實(shí)時(shí)數(shù)據(jù)產(chǎn)生,那么就增加了數(shù)據(jù)管理和處理的難度。
二是對(duì)社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行在線實(shí)時(shí)分析:通過(guò)應(yīng)用智慧城市,如交通流信息等,實(shí)時(shí)性要求比較的高。因此,在分析社交網(wǎng)絡(luò)數(shù)據(jù)時(shí),雖然有著較大的數(shù)據(jù)量,但是要快速高效的進(jìn)行數(shù)據(jù)分析,這樣實(shí)時(shí)應(yīng)用的要求才可以得到滿足。
三是如何在紛繁復(fù)雜的社交網(wǎng)絡(luò)數(shù)據(jù)中將知識(shí)提取出來(lái):社交網(wǎng)絡(luò)數(shù)據(jù)的采集不需要花費(fèi)較高的成本,但是也沒(méi)有較高的質(zhì)量,那么就需要從海量的數(shù)據(jù)中將有價(jià)值的信息和數(shù)據(jù)給提取出來(lái),將大數(shù)據(jù)的典型特征給找出來(lái)。同時(shí),如果數(shù)據(jù)是單個(gè)方面的,那么發(fā)現(xiàn)的信息也是不全面,要想對(duì)更加全面更深層次的知識(shí)進(jìn)行獲取,就需要從多個(gè)方面來(lái)努力。如如今開(kāi)始利用實(shí)時(shí)云計(jì)算平臺(tái)來(lái)獲取處理海量社交網(wǎng)絡(luò)數(shù)據(jù),通過(guò)對(duì)實(shí)時(shí)云計(jì)算平臺(tái)下的數(shù)據(jù)獲取任務(wù)調(diào)度策略以及社交網(wǎng)絡(luò)協(xié)議解析方法進(jìn)行設(shè)計(jì),使用社交網(wǎng)絡(luò)協(xié)議,來(lái)對(duì)社交網(wǎng)絡(luò)產(chǎn)生的原始數(shù)據(jù)進(jìn)行解析。
四是如何從社交網(wǎng)絡(luò)中提取知識(shí),來(lái)指導(dǎo)人們的決策:上文我們已經(jīng)提到,從社交網(wǎng)絡(luò)中,可以將城市生活各個(gè)角度的信息給提取出來(lái),但是我們還需要深入的進(jìn)行研究,以便將這些信息和數(shù)據(jù)給充分利用起來(lái),對(duì)城市管理起到有效的指導(dǎo)作用,將更加便捷和智能的城市生活提供給人們的生存和發(fā)展。
五、結(jié)語(yǔ)
通過(guò)上文的敘述分析我們可以得知,隨著時(shí)代的進(jìn)步和社會(huì)經(jīng)濟(jì)的發(fā)展,特別是社交網(wǎng)絡(luò)的興起,如今已經(jīng)進(jìn)入到了大數(shù)據(jù)時(shí)代;社交網(wǎng)絡(luò)中包含了諸多的數(shù)據(jù)來(lái)源,通過(guò)分析這些數(shù)據(jù)和信息,可以更加有效的進(jìn)行決策,提高城市生活的便捷性和智能化程度。但是,社交網(wǎng)絡(luò)包括著十分豐富的數(shù)據(jù),比較的復(fù)雜;目前的研究工作只是處于起步階段,在未來(lái)的研究中,需要對(duì)傳統(tǒng)的思維模式進(jìn)行革新和轉(zhuǎn)變,將一系列更加先進(jìn)的技術(shù)方法給利用起來(lái),將社交網(wǎng)絡(luò)數(shù)據(jù)中存在的規(guī)律和特征給找出來(lái),促使人們對(duì)城市信息以及發(fā)展軌跡進(jìn)行更好的理解和感知,促使城市獲得更好的發(fā)展,提升人們的生存質(zhì)量。本文主要研究了基于信息感知平臺(tái)的社交網(wǎng)絡(luò)大數(shù)據(jù)分析,希望可以提供一些有價(jià)值的參考意見(jiàn)。
參 考 文 獻(xiàn)
[1] 李文俊,陸建,王橋. 面向城市信息感知的社交網(wǎng)絡(luò)大數(shù)據(jù)分析[J]. 中興通訊技術(shù),2013,2(4):123-125
[2] 李建國(guó),姚良超,張文生. 社交網(wǎng)絡(luò)中感知技術(shù)的研究與應(yīng)用[J]. 計(jì)算機(jī)科學(xué),2009,2(11):55-57
[3] 薛美鳳,葉繼元. 學(xué)術(shù)虛擬社區(qū)知識(shí)共享研究綜述[J]. 圖書(shū)情報(bào)工作,2011,2(13):55-57
[4] 張超旭,劉云. 基于關(guān)系的社交網(wǎng)絡(luò)感知模型研究[J]. 鐵路計(jì)算機(jī)應(yīng)用,2012,2(12):55-57
[5] 于志文,于志勇. 社會(huì)感知計(jì)算:概念、問(wèn)題及其研究進(jìn)展[J]. 計(jì)算機(jī)學(xué)報(bào),2012,2(1):55-56
[6] 周建立,張愛(ài)華. 社會(huì)關(guān)系強(qiáng)度對(duì)社交網(wǎng)絡(luò)中應(yīng)用接受意愿的影響研究[J]. 中國(guó)科技信息,2012,2(23):132-134
[7] 溫忠麟,侯潔泰. 調(diào)節(jié)效應(yīng)與中介效應(yīng)的比較和利用[J]. 心理學(xué)報(bào),2005,2(2):43-45