朱孟杰
摘要:隨著移動定位技術(shù)和無線通信技術(shù)的發(fā)展,位置大數(shù)據(jù)已成為社會各界關(guān)注的熱點問題,它給人們的生產(chǎn)、生活等方面帶來了積極的影響,但也帶來了信息泄露的風(fēng)險。如何在享受其帶來便利的同時做好隱私保護是值得研究的內(nèi)容。文章簡要介紹了位置大數(shù)據(jù),指出了其在隱私保護中面臨的挑戰(zhàn),并給出了位置大數(shù)據(jù)隱私保護的對策。
關(guān)鍵詞:大數(shù)據(jù);位置大數(shù)據(jù);隱私保護
在大數(shù)據(jù)時代,隨著移動定位技術(shù)和無線通信技術(shù)的發(fā)展,利用這些技術(shù)進行相關(guān)的位置服務(wù),產(chǎn)生了極為驚人的包含空間和時間信息的數(shù)據(jù)。這些包含了位置信息且規(guī)模宏大、產(chǎn)生速度快、蘊含價值高等滿足了被普遍認可的大數(shù)據(jù)的特點的數(shù)據(jù)被稱為位置大數(shù)據(jù)。位置大數(shù)據(jù)在車聯(lián)網(wǎng)、移動社交網(wǎng)絡(luò)等方面有廣泛的應(yīng)用,為企業(yè)的商業(yè)化運作提供了科學(xué)的研究方法,為人們提供了各種便捷的服務(wù)。其在給人們帶來具有誘惑力服務(wù)的同時,也帶來了個人信息泄露的危險。這類既直接包含用戶的隱私信息,又隱含了個人的生活習(xí)慣、健康狀況、社會關(guān)系等其他敏感信息的位置大數(shù)據(jù)。如果應(yīng)用不當(dāng),會給用戶的隱私帶來嚴重的挑戰(zhàn)。例如,從匿名的GPS數(shù)據(jù)中能推斷出個人的家庭地址、工作單位和社會關(guān)系,預(yù)測出用戶過去、現(xiàn)在和將來的位置,推斷出個人的行蹤。甚至可以利用室內(nèi)位置信息推斷出個人的工作角色、年齡、愛好等。因此,對于位置大數(shù)據(jù),如何在享受服務(wù)的同時做好隱私保護是值得研究的方向。
1 位置大數(shù)據(jù)分類與特征
位置大數(shù)據(jù)包含了空間位置和時間標(biāo)識的地理和人類社會信息的數(shù)據(jù)。位置大數(shù)據(jù)具有大量性(volume)、高速性(velocity)、多樣性(variety)、價值(value)和真實性(veracity)的特征。根據(jù)來源的不同可以分為地理數(shù)據(jù)、軌跡數(shù)據(jù)和空間媒體數(shù)據(jù)。
地理數(shù)據(jù),是表示地理位置、分布特點的自然現(xiàn)象和社會現(xiàn)象的要素文件,包括自然地理數(shù)據(jù)和社會經(jīng)濟數(shù)據(jù)。自然地理數(shù)據(jù),包括地覆蓋類型、地貌、土壤、水文、植被、居民地、河流、行政境界及社會經(jīng)濟方面的數(shù)據(jù)等,一般按矢量數(shù)據(jù)結(jié)構(gòu)或網(wǎng)格數(shù)據(jù)結(jié)構(gòu)進行存儲。社會經(jīng)濟數(shù)據(jù)一般在計算機按統(tǒng)計圖表形式,是地理分析的基礎(chǔ)數(shù)據(jù)。地理數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)存儲相對較為規(guī)則、數(shù)據(jù)變化相對較慢的特點。
軌跡數(shù)據(jù),是指一個或多個移動對象運動過程的采樣所獲得的數(shù)據(jù)信息,包括采樣點位置、采樣時間、速度等,這些采樣點數(shù)據(jù)信息根據(jù)采樣先后順序構(gòu)成了軌跡數(shù)據(jù)。如具有定位功能的手機,軌跡數(shù)據(jù)反映了設(shè)備持有者某段時間內(nèi)的行動狀況。軌跡數(shù)據(jù)包括軌道交通數(shù)據(jù),車聯(lián)網(wǎng)數(shù)據(jù),出租車,微博簽到數(shù)據(jù)等。其特點是數(shù)據(jù)量大,信息呈現(xiàn)碎片化,準(zhǔn)確性較低,存貯半結(jié)構(gòu)化。
空間媒體數(shù)據(jù),是指文字、圖形、圖像、聲音、視頻及動畫等包含位置信息的數(shù)據(jù)。其主要有移動社交網(wǎng)絡(luò)、微信、微博、在線電子商務(wù)數(shù)據(jù)等新型互聯(lián)網(wǎng)應(yīng)用。Facebook每天生成300TB以上與位置有關(guān)的日志數(shù)據(jù),淘寶網(wǎng)每天千萬筆均包含物流位置信息的交易數(shù)據(jù),均可稱空間媒體數(shù)據(jù),具有數(shù)據(jù)來源多樣、數(shù)據(jù)差異性大、數(shù)據(jù)有較低的價值密度、有較強實時性和時空標(biāo)識定義欠嚴格或欠精確的特點。
位置大數(shù)據(jù)根據(jù)來源不同雖具有不同的分類,但其具有的共同特征是具有時空標(biāo)識,使用坐標(biāo)、語言文本等來描述。這節(jié)簡單的論述了位置大數(shù)據(jù)的分類及特點,下面將對位置大數(shù)據(jù)的隱私保護方面的內(nèi)容進行論述。
2 位置大數(shù)據(jù)隱私保護的挑戰(zhàn)
隱私,又稱私人生活秘密或生活秘密,是指私人生活安寧不受到他人非法干擾私人信息保密不受到他人非法搜集、刺探和公開。個人隱私一般是指數(shù)據(jù)擁有者不愿意披露的私人敏感信息。一般來說,個人不愿意披露的信息都可以認為是個人隱私。隨著技術(shù)的進步,人們的日常生活被記錄、被跟蹤、被傳播、被數(shù)字化的進程不斷加快,海量的數(shù)據(jù)在被重新整合、分析和挖掘之后迸發(fā)出了巨大的經(jīng)濟效益和社會效益,但是數(shù)據(jù)在給社會帶來巨大的效益的同時也暴露出許多關(guān)于數(shù)據(jù)安全和隱私的問題。
對于位置大數(shù)據(jù)來說,訪問控制策略、位置匿名化方法、軌跡匿名化等經(jīng)典的位置隱私保護技術(shù)已不能有效地保護用戶隱私。因為在大數(shù)據(jù)時代,隱私已經(jīng)被數(shù)據(jù)化的特點,使得用戶的位置數(shù)據(jù)或非位置數(shù)據(jù)相互交叉、排列、組合,這些數(shù)據(jù)可以直接或者間接地挖掘出個人的隱私。包含了大量用戶位置信息的數(shù)據(jù)被二次使用,或被私下買賣,轉(zhuǎn)變?yōu)橹苯拥慕?jīng)濟利益,從而使得隱私變成了買賣的商品,位置大數(shù)據(jù)隱私也就具有了價值的特點。位置大數(shù)據(jù)可以提供精準(zhǔn)營銷,如在淘寶網(wǎng)的個人賬號中的商品推薦,亞馬遜中的專利“預(yù)判發(fā)貨”。這些個性化的服務(wù)能給人們的生活帶來方便與快捷,但是人們的購物習(xí)慣、瀏覽習(xí)慣、商品喜好等等隱私因大數(shù)據(jù)分析而完全被暴露出來。因此位置大數(shù)據(jù)隱私保護中面臨著,如何準(zhǔn)確地度量用戶隱私的披露風(fēng)險,如何選擇有效的隱私保護機制全面保護用戶的隱私,如何兼顧隱私保護的程度和基于位置服務(wù)的可用性的問題。
對于位置大數(shù)據(jù)來說,對隱私的侵犯主要表現(xiàn)在以下幾個方面:在采集過程中對隱私的侵犯?!?013移動應(yīng)用隱私安全測評》報告顯示,超半數(shù)手機應(yīng)用存在“隱私越軌”行為,未經(jīng)使用者同意,獲取本機號碼的比例為60.5%,訪問個人通信的比例則為38%。商家為了提供優(yōu)質(zhì)的服務(wù),私自采集沒有經(jīng)過用戶許可的數(shù)據(jù),是一種純粹的商業(yè)行為,也是對用戶隱私的侵犯。在存貯過程中對隱私的侵犯。2014年的蘋果“隱私泄露門”事件引發(fā)了人們對個人信息被儲存的擔(dān)憂,其泄露的位置信息,通過挖掘分析可以確定個人的身份,工作地點等隱私,其泄露給個人和國家?guī)砹藝乐赜绊?。在使用過程中對隱私的侵犯。在現(xiàn)實中商業(yè)公司在使用個人數(shù)據(jù)時侵犯用戶隱私,如出賣個人隱私信息等。政府由于手中掌握著最大的與個人有關(guān)的數(shù)據(jù),在開展各種日常事務(wù)時也往往忽略用戶隱私安全。
3 位置大數(shù)據(jù)隱私保護對策
對于位置大數(shù)據(jù),曾在全世界范圍內(nèi)達成共識的“告知與許可”隱私保護政策正面臨失效。此外各種侵犯隱私的手段層出不窮,對位置大數(shù)據(jù)的進一步挖掘與應(yīng)用加深了人們的擔(dān)憂。各國政府也開始制定專門的法律法規(guī)來應(yīng)對位置大數(shù)據(jù)下的個人隱私泄露問題,企業(yè)通過研發(fā)新的大數(shù)據(jù)隱私保護技術(shù)和提高行業(yè)自律標(biāo)準(zhǔn)來確保個人隱私安全。
通過新技術(shù)的研發(fā),完善位置大數(shù)據(jù)隱私的保護。現(xiàn)己研究出了多項隱私保護技術(shù):基于政策法的隱私保護技術(shù),其具有實現(xiàn)簡單,服務(wù)質(zhì)量高,其隱私保護程度不高的特點。基于扭曲法隱私保護技術(shù),其具有實現(xiàn)簡單,能較好的平衡隱私保護和服務(wù)質(zhì)量,位置數(shù)據(jù)失真,容易受特征推測攻擊的特點?;诩用芊ǖ碾[私保護技術(shù),其具有服務(wù)質(zhì)量高,隱私保護好,服務(wù)開銷大的特點。隱私保護不僅僅是一個技術(shù)問題,而是一個復(fù)雜的社會問題,隱私保護技術(shù)僅僅解決了問題的一個方面,識別和克服在部署隱私保護技術(shù)時面臨的非技術(shù)問題,如平衡服務(wù)質(zhì)量、計算開銷、通信開銷、有價值信息等方面的問題也同樣重要。因此,跨學(xué)科研究是解決這一問題的關(guān)鍵,迫切需要隱私保護領(lǐng)域的計算機科學(xué)家與心理學(xué)、社會學(xué)、公共政策研究等方面的社會科學(xué)家一起進行跨學(xué)科研究。
法規(guī)是隱私保護技術(shù)之外的隱私保障手段。在隱私保護過程中,僅依靠技術(shù)是不夠的,純技術(shù)代替不了法律和社會道德對侵害隱私的制裁和約束。全世界有許多國家制定了專門保護個人隱私的法律。美國、歐盟等還專門針對大數(shù)據(jù)時代特征完善了隱私方面的法規(guī)來規(guī)范個人數(shù)據(jù)在收集、使用與傳播等方面的行為。而中國這方面的法律相對薄弱,因此中國應(yīng)加快完善相應(yīng)的法律法規(guī)。另外位置大數(shù)據(jù)從業(yè)者應(yīng)加強行業(yè)自律。行業(yè)自律的及時性和效益性以行業(yè)自律的形式預(yù)防侵犯隱私的行為發(fā)生。對個人而言,加強正確的隱私觀,消除狹隘的隱私保護意識,科學(xué)合理的分享個人數(shù)據(jù)。根據(jù)不同的情況,選擇數(shù)據(jù)公開的范圍及數(shù)據(jù)的敏感度,使用戶既能享受到大數(shù)據(jù)帶來的便利,又能維護個人信息的安全。
4 結(jié)語
大數(shù)據(jù)時代,位置大數(shù)據(jù)給個人帶來便利的同時也帶來隱私泄露的威脅,許多研究者在位置大數(shù)據(jù)的隱私保護方面做了大量的工作。本文簡單的介紹了位置大數(shù)據(jù),并討論了位置大數(shù)據(jù)隱私所具備的特點及隱私保護面臨的挑戰(zhàn),最后給出了位置大數(shù)據(jù)保護隱私的對策,以期對位置大數(shù)據(jù)的發(fā)展及個人隱私保護盡個人的微薄之力。位置大數(shù)據(jù)隱私保護屬于大數(shù)據(jù)的新興研究領(lǐng)域,有許多關(guān)鍵問題需要深入而細致的研究。