趙東+馬華東+劉亮
摘要:認為移動群智感知網(wǎng)絡(luò)的感知質(zhì)量包含時空覆蓋質(zhì)量和數(shù)據(jù)質(zhì)量兩個層面,前者關(guān)注是否能采集到足夠多的數(shù)據(jù),而后者關(guān)注數(shù)據(jù)是否足夠準確和可信。分別從這兩個層面討論了感知質(zhì)量度量和保障的方法,對移動群智感知網(wǎng)絡(luò)的部署和應(yīng)用具有一定的指導(dǎo)意義和實用價值。
關(guān)鍵詞: 移動群智感知;感知質(zhì)量度量;感知質(zhì)量保障
目前,物聯(lián)網(wǎng)已經(jīng)進入深度發(fā)展階段,對物理環(huán)境更大規(guī)模、更復(fù)雜、更全面的感知需求越來越強烈。在過去十多年內(nèi),人們主要關(guān)注以無線傳感網(wǎng)為代表的固定部署感知網(wǎng)絡(luò),用來對森林、海洋、火山等自然環(huán)境進行監(jiān)測。然而,這種傳統(tǒng)感知模式的網(wǎng)絡(luò)部署和維護成本很高,不適宜進行大規(guī)模的城市感知。近幾年來,人們開始關(guān)注一種新型物聯(lián)網(wǎng)感知模式,即“移動群智感知[1-3]”,或者叫“以人為中心的感知[4]”、“參與感知[5]”、“機會感知[6]”等。這種感知模式的產(chǎn)生一方面是由于現(xiàn)實世界中存在著大量的移動感知節(jié)點,例如,具有多達十幾種傳感器的智能手機、各種可穿戴設(shè)備(如智能手環(huán)、智能手表、智能眼鏡等)、車載感知設(shè)備(如全球定位系統(tǒng)(GPS)、第2代車載自動診斷系統(tǒng)(OBD-II)、車載二氧化碳傳感器等)或其他便攜式電子設(shè)備(如Intel的空氣質(zhì)量傳感器)。這些感知節(jié)點通常由移動的人或車攜帶,因而更容易實現(xiàn)對整個城市的覆蓋,我們將其稱之為“移動感知”。另一方面,最近學(xué)術(shù)界和工業(yè)界流行一種“眾包”思想,它是一種新的分布式的問題解決模式,就是將一個復(fù)雜的問題分解成很多個簡單的問題,然后外包給大量的普通用戶來協(xié)同完成。于是,移動感知與眾包思想的結(jié)合,就產(chǎn)生了這種新型物聯(lián)網(wǎng)感知模式——移動群智感知,它將普通用戶的移動設(shè)備作為基本感知單元,通過移動互聯(lián)網(wǎng)進行有意識或無意識的協(xié)作,實現(xiàn)感知任務(wù)分發(fā)與感知數(shù)據(jù)收集,完成大規(guī)模的、復(fù)雜的社會感知任務(wù)[3]。
與傳統(tǒng)的固定部署感知模式相比,移動群智感知有三大優(yōu)點:網(wǎng)絡(luò)部署成本更低、網(wǎng)絡(luò)維護更容易、系統(tǒng)更具有可擴展性[7],因此更適合完成一些大規(guī)模的、復(fù)雜的感知任務(wù),可應(yīng)用于城市環(huán)境監(jiān)測、智能交通、城市管理、公共安全等領(lǐng)域。
然而,很少有人關(guān)注移動群智感知網(wǎng)絡(luò)的感知質(zhì)量問題。我們認為,移動群智感知網(wǎng)絡(luò)的感知質(zhì)量包含時空覆蓋質(zhì)量和數(shù)據(jù)質(zhì)量兩個層面,前者關(guān)注是否能采集到足夠多的數(shù)據(jù),而后者關(guān)注數(shù)據(jù)是否足夠準確和可信。
然而,在移動群智感知模式下,用戶的屬性、位置、情境等方面的動態(tài)變化性使得我們很難對時空覆蓋質(zhì)量進行度量和保障;而用戶感知設(shè)備、感知方式、主觀認知能力、參與態(tài)度等方面的異構(gòu)性也使得我們很難對感知數(shù)據(jù)的質(zhì)量進行相關(guān)的度量和保障。
因此,文章分別從時空覆蓋質(zhì)量和數(shù)據(jù)兩個層面討論感知質(zhì)量度量與保障的問題以及對應(yīng)的解決方法,對移動群智感知網(wǎng)絡(luò)的部署和應(yīng)用具有一定的指導(dǎo)意義和實用價值。
1 時空覆蓋質(zhì)量度量與保障
隨著移動感知設(shè)備的持有者隨機地到達城市的各個地方,這些節(jié)點即可隨時隨地進行感知。這種移動性對許多應(yīng)用的感知質(zhì)量起著重要的作用。以城市空氣質(zhì)量監(jiān)測為例,假定我們計劃使用大量的出租車攜帶空氣質(zhì)量傳感器,對北京的五環(huán)內(nèi)區(qū)域進行監(jiān)測,構(gòu)建每天早上6點到晚上12點時間段的空氣質(zhì)量感知地圖。事實上,有兩個基本問題有待解決:怎樣度量這些出租車提供的感知機會以及它們能達到的感知質(zhì)量?需要部署多少輛出租車能達到所需的感知質(zhì)量?
首先,我們從時間維度來考慮。在傳統(tǒng)的固定部署的傳感網(wǎng)中,研究者常常使用覆蓋率來度量感知質(zhì)量,通常需要監(jiān)測區(qū)域內(nèi)每個點總是被至少一個傳感器節(jié)點覆蓋,這種網(wǎng)絡(luò)的覆蓋質(zhì)量一般不會隨著時間而改變。然而,由于人的移動性,移動群智感知網(wǎng)絡(luò)的覆蓋質(zhì)量是動態(tài)變化的??紤]到感知覆蓋的時空變化因素,我們將整個監(jiān)測區(qū)域劃分為多個網(wǎng)格單元,將每個網(wǎng)格單元被連續(xù)覆蓋兩次的間隔時間作為一個新的度量指標,稱之為覆蓋間隔時間,用來描述每個網(wǎng)格單元被覆蓋的機會。通過對北京和上海兩個城市的出租車移動軌跡數(shù)據(jù)集進行分析,我們發(fā)現(xiàn)覆蓋間隔時間服從截斷的帕累托分布。進一步地,我們提出一個稱作“機會覆蓋率”的度量指標來表示城市監(jiān)測區(qū)域的整體感知質(zhì)量與節(jié)點個數(shù)之間的關(guān)系,其定義為在特定時間間隔內(nèi)能被覆蓋的網(wǎng)格單元占所有網(wǎng)格單元的比例的期望值,可以表示成關(guān)于覆蓋間隔時間分布的函數(shù)。圖1顯示基于北京和上海兩個出租車移動軌跡數(shù)據(jù)集的機會覆蓋率與節(jié)點個數(shù)和時間間隔呈單調(diào)遞增關(guān)系。于是,我們可以推導(dǎo)出至少需要多少節(jié)點能使在特定的時間間隔內(nèi)機會覆蓋率不小于指定的閾值。例如,根據(jù)對兩個出租車移動軌跡數(shù)據(jù)集的分析,我們需要分別在北京和上海900平方千米的區(qū)域內(nèi)至少部署1 700輛和1 900輛出租車,才能保證其在1個小時的時間間隔內(nèi)機會覆蓋率不小于50%。更詳細的分析方法和結(jié)果請見文獻[8]。盡管不同城市可能需要不同的節(jié)點個數(shù)滿足所需的機會覆蓋率,我們提出的模型和方法可以對網(wǎng)絡(luò)規(guī)劃問題提供一般性的指導(dǎo)。
其次,我們從空間維度考慮。一個監(jiān)測區(qū)域的環(huán)境現(xiàn)象(如PM 2.5濃度、二氧化碳濃度、噪音等)可以表示為一個二維信號,類似于一個圖像。在大部分環(huán)境監(jiān)測應(yīng)用中,移動感知節(jié)點將采集到的感知數(shù)據(jù)發(fā)送到數(shù)據(jù)中心,然后數(shù)據(jù)中心匯集現(xiàn)有數(shù)據(jù),并利用空間插值技術(shù)估計未知數(shù)據(jù),從而得到一個完整的感知地圖,相當于一個感知圖像。如圖2所示,移動群智感知網(wǎng)絡(luò)就像一個“城市攝像機”,而每個移動感知節(jié)點就相當于這個攝像機的每個“像素”。在傳統(tǒng)的圖像系統(tǒng)中,分辨率是度量圖像質(zhì)量的一個重要指標。從這個概念得到啟發(fā),我們利用群智感知分辨率作為指標來度量感知圖像的質(zhì)量。分辨率越高,則代表所部署的移動群智感知網(wǎng)絡(luò)越能準確地捕獲到環(huán)境現(xiàn)象的變化。然而,與傳統(tǒng)數(shù)字圖像系統(tǒng)中的分辨率定義不同,我們不能簡單地將像素數(shù)(即移動感知節(jié)點個數(shù))看做群智感知分辨率。這是因為,數(shù)字攝像機的像素會形成一個精細的網(wǎng)格,而城市攝像機的像素在城市中則呈現(xiàn)分散化的動態(tài)化分布。為了解決這個問題,我們首次提出“城市分辨率”這一新的指標來度量城市感知圖像的質(zhì)量。簡單地說,我們分別基于移動群智感知網(wǎng)絡(luò)和[n×n]網(wǎng)格化部署的感知網(wǎng)絡(luò)采集到的部分感知數(shù)據(jù),利用空間插值技術(shù)來估計未知數(shù)據(jù),得到兩個完整的監(jiān)測區(qū)域感知數(shù)據(jù)矩陣,然后利用相關(guān)系數(shù)來評估兩個矩陣的相似性,如果它們的相似性足夠高,則認為該移動群智感知網(wǎng)絡(luò)的城市分辨率是[r=n×n]。我們分別使用3種不同變化度的二維信號,通過蒙特卡羅仿真研究了分辨率r與移動感知節(jié)點個數(shù)[s]之間的關(guān)系,發(fā)現(xiàn)它們之間存在一個近似的線性關(guān)系:[r=α2s],其中,在真實的人或車移動模型下,[α]的參考值范圍是[0.5,0.6]。一方面,基于該線性關(guān)系,我們就可以根據(jù)移動群智感知網(wǎng)絡(luò)的節(jié)點個數(shù)推出所能達到的感知質(zhì)量;另一方面,我們也可以反過來推出,需要部署多少移動感知節(jié)點能達到所需的城市分辨率需求。同樣以北京和上海兩個出租車移動軌跡數(shù)據(jù)集為例,圖3顯示了其城市分辨率分布情況??梢钥闯?,人或車密集分布的區(qū)域具有更高的城市分辨率,例如北京的中心和東部區(qū)域,以及上海的中心和西南區(qū)域。更詳細的介紹請見文獻[9]。
上面提到的方法主要適用于城市環(huán)境監(jiān)測、交通擁堵狀況和道路健康狀況監(jiān)測等需要對整個城市的每個區(qū)域進行連續(xù)監(jiān)測的大規(guī)模城市感知應(yīng)用。與此不同,Chon等人則研究了“以地方為中心”的移動群智感知應(yīng)用的覆蓋質(zhì)量[10]。所謂以地方為中心的應(yīng)用,就是自動識別或跟蹤用戶每天訪問的不同地方(如咖啡館、超市、辦公室、家、學(xué)校等),來幫助用戶認識和分析自己的日常行為模式,或者獲取基于位置的搜索和信息推薦等服務(wù)。構(gòu)建和部署這些應(yīng)用的前提是對用戶訪問的每個地方采集足夠的感知數(shù)據(jù)(如GPS位置、聲音、圖像、光照、Wi-Fi信號指紋等)來建立各種模型。這里的覆蓋問題就是:多長時間內(nèi)多少用戶采集數(shù)據(jù)能覆蓋到多少人們經(jīng)常訪問的地方?為此,Chon等人在韓國招募了85人并在兩個月時間內(nèi)收集了大約4.8萬次用戶訪問不同地方的感知數(shù)據(jù)然后進行分析,得到了一些有趣的結(jié)果:僅僅利用少量的用戶(85人),就能對人們常去的地方提供高覆蓋率(最流行的地方的15%);用戶訪問地方的個數(shù)服從冪律分布,基于該模型可估計出需要多少用戶能達到所需的地方覆蓋率;用戶對泄露個人隱私的擔心并沒有帶來太大的影響,例如,用戶允許在93%的食物相關(guān)的地方收集聲音數(shù)據(jù),在82%的所有類型的地方收集聲音數(shù)據(jù)。
以上方法主要用來度量時空覆蓋質(zhì)量,而保障時空覆蓋質(zhì)量則需要綜合利用多種方法:(1)可以將固定部署感知模式和移動群智感知模式相結(jié)合,在移動用戶很難到達的空白區(qū)域,通過優(yōu)化部署固定的感知網(wǎng)絡(luò)來保障時空覆蓋質(zhì)量;(2)利用空間插值、壓縮感知等方法來彌補感知數(shù)據(jù)的缺失,也可以利用感知現(xiàn)象的時空相關(guān)性,或者天氣、交通、重大事件等外部因素與感知現(xiàn)象的關(guān)聯(lián)性,采用機器學(xué)習(xí)的方法來實現(xiàn)未知數(shù)據(jù)的準確估計;(3)設(shè)計合適的激勵機制來鼓勵更多的用戶來參與這些感知活動。
2 感知數(shù)據(jù)質(zhì)量度量與保障
感知數(shù)據(jù)質(zhì)量受很多方面因素的影響,主要包括:
·用戶所使用的感知設(shè)備類型。例如,價格高昂的高端手機的傳感器一般比那些價格低廉的低端手機的傳感器精度要高。
·用戶采集數(shù)據(jù)的環(huán)境和方式。例如,把手機拿在手里采集環(huán)境噪聲的數(shù)據(jù)質(zhì)量比把手機放在衣服口袋或手提包里采集環(huán)境噪聲的數(shù)據(jù)質(zhì)量高。
·用戶的主觀認知能力。例如,基于移動群智感知的圖像搜索應(yīng)用依賴用戶對圖像的識別能力,而不同用戶對同一圖像的認知可能是不一樣的。
·用戶的參與態(tài)度。例如,有的用戶會嚴格按照要求來采集數(shù)據(jù),而有些用戶會比較隨意,甚至有些惡意用戶會上傳虛假偽造的數(shù)據(jù)。
以上因素都會造成感知數(shù)據(jù)質(zhì)量的參差不齊。下面,我們首先根據(jù)感知任務(wù)或?qū)ο蟮念愋蛠斫榻B幾種典型的感知數(shù)據(jù)的質(zhì)量度量和保障的方法:
·面向二進制型任務(wù)的方法。二進制型任務(wù)的結(jié)果只有兩種。事件檢測是一種典型的二進制型任務(wù),即判斷某種事件是否發(fā)生。最簡單的方法是投票,即當判定事件發(fā)生的用戶數(shù)量超過特定閾值的時候,才最終確定事件發(fā)生。
·面向多類別型任務(wù)的方法。多類別型任務(wù)的結(jié)果多于兩種,例如,用戶對某個事物的評價可以打分為1~5的某個分數(shù)。投票法雖然也可以用來度量結(jié)果的不確定性,但還不夠準確。最大期望法是一種常用的更準確的方法,它采用迭代的方式工作,即首先根據(jù)用戶的感知數(shù)據(jù)來估計用戶的可靠性,然后根據(jù)用戶的可靠性來估計最終的任務(wù)結(jié)果,并不斷重復(fù)上述過程。
·面向連續(xù)信號型任務(wù)的方法。對區(qū)域環(huán)境現(xiàn)象的連續(xù)監(jiān)測屬于連續(xù)信號型任。Koutsopoulos針對這類任務(wù)提出了一種感知數(shù)據(jù)質(zhì)量度量方法,即計算某個用戶提交的歷史數(shù)據(jù)與所有用戶數(shù)據(jù)的平均值之間的累積誤差作為該用戶的感知數(shù)據(jù)質(zhì)量指標[11]。
以上3種方法的基本思想都是發(fā)揮集體的智慧來抵御個人數(shù)據(jù)不準確的影響,從而提高整體數(shù)據(jù)的可靠性。然而,這些方法并不能充分應(yīng)對惡意用戶的攻擊。Mousa等人總結(jié)了串謀攻擊、女巫攻擊、GPS欺騙等11種可能的惡意用戶攻擊方式[12]。面對這些攻擊,一般有兩類方法解決感知數(shù)據(jù)的可信性問題:
·可信平臺模塊。這類方法是在用戶的移動感知設(shè)備設(shè)置專門的硬件模塊,保證用戶感知和上報到數(shù)據(jù)中心的數(shù)據(jù)是由真實的、授權(quán)的感知設(shè)備所采集,還可以采用簽名和硬件加密機制來保護感知數(shù)據(jù)只能由授權(quán)用戶訪問。與此類似,我們基于“安全數(shù)碼相機”的思想,利用MD5算法和基于隨機數(shù)的加密算法設(shè)計了一個圖像篡改檢測方法來保障用戶上傳圖像數(shù)據(jù)的真實性[13]。
·信譽系統(tǒng)。這類方法是評估和記錄用戶的歷史感知數(shù)據(jù)的可信性,并將其用在未來的系統(tǒng)交互過程中,對于信譽度低的用戶感知數(shù)據(jù)采用的可能性也比較低,同時也會采用相應(yīng)的激勵或懲罰措施。貝葉斯系統(tǒng)是一種常用的具體方法[14]。
3 結(jié)束語
作為物聯(lián)網(wǎng)的新型感知模式,移動群智感知促進了大量創(chuàng)新應(yīng)用的出現(xiàn),同時也面臨一系列新的問題與挑戰(zhàn)。文章分別從時空覆蓋質(zhì)量和數(shù)據(jù)質(zhì)量兩個層面分析了移動群智感知網(wǎng)絡(luò)中感知質(zhì)量度量和保障的各種問題,并提供了一些對應(yīng)的解決方法。隨著相關(guān)技術(shù)的不斷進步和成熟,移動群智感知質(zhì)量度量與保障將對移動群智感知網(wǎng)絡(luò)的快速發(fā)展和廣泛應(yīng)用提供重要的支撐作用。
參考文獻
[1] GANTI R K, YE F, and LEI H. Mobile Crowdsensing: Current State and Future Challenges [J]. IEEE Communications Magazine, 2011, 49 (11): 32-39
[2] MA H D, ZHAO D, and YUAN P. Opportunities in Mobile Crowd Sensing [J]. IEEE Communications Magazine, 2014, 52(8): 29-35
[3] 劉云浩. 群智感知計算[J]. 中國計算機學(xué)會通訊, 2012, 8 (10): 38-41
[4] CAMPBELL A, EISENMAN S, LANE N, et al. The Rise of People-Centric Sensing [J]. IEEE Internet Computing, 2008, 12 (4): 12-21
[5] BURKE J, ESTRIN D, HANSEN M, et al. Participatory Sensing [C] // Workshop on World-Sensor-Web, Co-Located with ACM SenSys, Boulder, Colorado, USA, 2006: 1-5
[6] LANE N, EISENMAN S, MUSOLESI M, et al. Urban Sensing Systems: Opportunistic or Participatory? [C] // in Proceedings of HotMobile, Silverado Resort, Napa Valley, USA, 2008: 11-16
[7] 趙東,馬華東. 群智感知網(wǎng)絡(luò)的發(fā)展及挑戰(zhàn)[J]. 信息通信技術(shù), 2014(05): 66-70
[8] ZHAO D, MA H D, LIU L, and LI X Y. Opportunistic Coverage for Urban Vehicular Sensing [J]. Computer Communications, 2015: 71-85. doi:10.1016/j.comcom.2015.01.018
[9] LIU L, WEI W, ZHAO D, and MA H D. Urban Resolution: New metric for Measuring the Quality of Urban Sensing [J]. IEEE Transation on Mobile Computing, 2015(09): 21-25. doi:10.1109/TMC.2015.2404786
[10] CHON Y, LANE N, KIM Y, et al. Understanding the Coverage and Scalability of Place-Centric Crowd Sensing[C]// in Proceedings of ACM UbiComp, Zurich, Switzerland, 2013: 3-12
[11] KOUSOPOULOS I. Optimal Incentive-Driven Design of Participatory Sensing Systems[C]// Proceedings of IEEE INFOCOM, Turin, Italy, 2013: 1402-1410
[12] MOUSA H, MOKHTAR S B, HASAN O, et al. Trust Management and Reputation Systems in Mobile Participatory Sensing Applications: A Survey [J]. Computer Networks, 2015, 90. doi:10.1016/j.comnet.2015.07.011
[13] QIN T, MA H D, ZHAO D, et al. Crowdsourcing Based Event Reporting System Using Smartphones with Accurate Localization and Photo Tamper Detection[C]// in Proceedings of BIGCOM, Taiyuan, China, 2015: 141-151
[14] TANAS C, HERRERA- JOANCOMARTI J. When Users Become Sensors: Can We Trust Their Readings? [J]. International Journal of Communication Systems, 2015, 28 (4): 601-614