王彩玲
摘 ? 要:通過挖掘位置大數(shù)據(jù)中所蘊(yùn)含的個(gè)人信息可以形成各種屬性畫像,給商業(yè)智慧、疫情防控、案件偵辦等提供重要的價(jià)值參考。但是,位置大數(shù)據(jù)的蓬勃發(fā)展也帶來一系列的安全問題,因個(gè)人隱私泄露所引發(fā)的欺詐、侵權(quán)等犯罪行為日益嚴(yán)重。文章針對(duì)位置大數(shù)據(jù)的隱私保護(hù)進(jìn)行研究,通過分析相關(guān)的數(shù)據(jù)加密技術(shù),提出了保護(hù)數(shù)據(jù)隱私的加密方法具體設(shè)計(jì),實(shí)現(xiàn)了位置標(biāo)示和定位,利用模糊加密理論設(shè)計(jì)算法,并對(duì)該研究方向進(jìn)行了展望。
關(guān)鍵詞:位置大數(shù)據(jù);隱私保護(hù);位置標(biāo)示和定位;模糊加密理論
中圖分類號(hào): TP391 ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:J
1 引言
隨著移動(dòng)互聯(lián)網(wǎng)、智能穿戴設(shè)備、社交網(wǎng)絡(luò)應(yīng)用等位置感知技術(shù)的快速發(fā)展,用戶位置數(shù)據(jù)大量產(chǎn)生并被收集,如微信中的“位置”、釘釘中的“簽到”等。這些數(shù)據(jù)信息具有產(chǎn)生速度快、價(jià)值信息高、數(shù)據(jù)規(guī)模大等特點(diǎn)。
由于位置大數(shù)據(jù)蘊(yùn)含有描述人們行為特征的信息,通過對(duì)其進(jìn)行挖掘分析可以形成各種屬性畫像,從而在商業(yè)智慧、生活服務(wù)、疫情防控、案件偵辦等方面提供重要的價(jià)值參考。與此同時(shí),位置大數(shù)據(jù)的不當(dāng)使用也給用戶帶來了個(gè)人隱私泄露的嚴(yán)重威脅,甚至造成不可預(yù)估和控制的嚴(yán)重后果。因此,在云計(jì)算和大數(shù)據(jù)時(shí)代,如何提高位置大數(shù)據(jù)的利用價(jià)值同時(shí),又確保用戶個(gè)人隱私不泄露,已成為位置大數(shù)據(jù)隱私保護(hù)研究的熱點(diǎn)問題之一。
本文針對(duì)位置大數(shù)據(jù)的隱私保護(hù)進(jìn)行了研究探討,介紹相關(guān)的數(shù)據(jù)加密技術(shù),在確保隱私保護(hù)的同時(shí)分析敏感數(shù)據(jù),重點(diǎn)提出了保護(hù)數(shù)據(jù)隱私的具體加密設(shè)計(jì)。
2 位置大數(shù)據(jù)隱私保護(hù)技術(shù)
2.1 位置大數(shù)據(jù)中的隱私威脅
位置大數(shù)據(jù)服務(wù)具有四個(gè)特點(diǎn):(1)位置信息與用戶的身份信息相綁定;(2)用戶的請(qǐng)求信息與位置有關(guān);(3)用戶提交的位置信息越精確,獲得的位置數(shù)據(jù)服務(wù)質(zhì)量就越高;(4)高精度的位置信息一旦發(fā)生泄漏,就會(huì)給用戶帶來一定的威脅或?yàn)?zāi)難。
基于這些特點(diǎn),位置大數(shù)據(jù)的隱私安全問題不容忽視。當(dāng)用戶向服務(wù)器端發(fā)送位置信息時(shí),惡意攻擊者可能會(huì)截取用戶的位置數(shù)據(jù);當(dāng)服務(wù)器端向用戶返回處理后的結(jié)果時(shí),惡意攻擊者也有可能會(huì)根據(jù)背景知識(shí)分析出用戶的位置信息[1]。
位置大數(shù)據(jù)中的隱私包括位置隱私和查詢隱私兩種。位置隱私是用戶提出查詢請(qǐng)求的位置數(shù)據(jù);查詢隱私則是用戶提出查詢請(qǐng)求的內(nèi)容數(shù)據(jù)。不管是哪種隱私泄露都可能導(dǎo)致對(duì)用戶行為模式、身體狀況、業(yè)余愛好、交友信息等方面的畫像分析,犯罪分子甚至偽裝身份向用戶推送各種惡意廣告、詐騙信息等。近幾年發(fā)生的多起案件表明,用戶在享受位置服務(wù)便利的同時(shí)也面臨著位置隱私安全的威脅,比如Google收集用戶位置信息所引發(fā)的爭論、各類手機(jī)APP的定位功能侵犯個(gè)人隱私等。
位置大數(shù)據(jù)隱私保護(hù)的方法很多,有位置隱私策略保護(hù)法、位置加密保護(hù)法、位置模糊匿名保護(hù)法等。本文主要研究基于數(shù)據(jù)加密技術(shù)的隱私保護(hù)方法,因?yàn)榧用芗夹g(shù)是最直接、最有效的隱私保護(hù)手段。
2.2 研究現(xiàn)狀分析
當(dāng)前,基于隱私保護(hù)的位置大數(shù)據(jù)加密技術(shù)研究已經(jīng)取得了一定的成果。
2008年,IBM公司的研究人員Gentry發(fā)明出一種無需對(duì)數(shù)據(jù)解密的數(shù)學(xué)運(yùn)算方法,這是同態(tài)加密的首個(gè)應(yīng)用案例。同態(tài)加密是具有特殊代數(shù)結(jié)構(gòu)的一種加密方案,其特點(diǎn)是在具體計(jì)算過程中不需要使用解密密鑰,就可以直接對(duì)加密數(shù)據(jù)執(zhí)行操作。2016年,微軟的技術(shù)人員突破了同態(tài)加密速度的障礙,其應(yīng)用領(lǐng)域也越來越廣泛。在醫(yī)療系統(tǒng)中,醫(yī)護(hù)人員可以根據(jù)數(shù)千萬病患的醫(yī)療記錄,來識(shí)別基于地理位置和人口結(jié)構(gòu)的疾病態(tài)勢,這些醫(yī)療記錄在存儲(chǔ)過程中,使用同態(tài)加密技術(shù)來實(shí)現(xiàn)對(duì)病患隱私信息的有效保護(hù)。
此外,差分隱私也是一種比較先進(jìn)的數(shù)據(jù)加密技術(shù)。
差分隱私是2006年被Dwork等人首次提出的,利用密碼統(tǒng)計(jì)計(jì)算來提高數(shù)據(jù)查詢的準(zhǔn)確性,同時(shí)實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的保護(hù)[2]。與同態(tài)加密技術(shù)不同,差分隱私是對(duì)數(shù)據(jù)分析算法的一種屬性設(shè)置,通過數(shù)據(jù)計(jì)算權(quán)限標(biāo)準(zhǔn)的設(shè)計(jì),讓不具備計(jì)算標(biāo)準(zhǔn)的外部計(jì)算方式無法對(duì)該數(shù)據(jù)進(jìn)行計(jì)算或獲取,從而達(dá)到數(shù)據(jù)保護(hù)的目的。差分隱私技術(shù)應(yīng)用在位置大數(shù)據(jù)服務(wù)中,一是能夠?yàn)槲恢貌樵兎?wù)提供準(zhǔn)確率更高的數(shù)據(jù),二是能夠有效地抵御基于背景知識(shí)的惡意攻擊所導(dǎo)致的隱私泄露。美國計(jì)劃在2020年的人口普查中,使用差分隱私技術(shù)對(duì)公民的身份數(shù)據(jù)進(jìn)行保密,從而更好地保護(hù)個(gè)人隱私。
3 位置大數(shù)據(jù)隱私保護(hù)的加密設(shè)計(jì)
伴隨著定位技術(shù)及位置信息內(nèi)容的逐漸擴(kuò)充,相關(guān)的技術(shù)專家已逐漸將更多的加密技術(shù)應(yīng)用到位置大數(shù)據(jù)的隱私保護(hù)中,具體的設(shè)計(jì)方法主要有三個(gè)方面。
3.1 位置大數(shù)據(jù)隱私保護(hù)的位置標(biāo)示和定位
在位置大數(shù)據(jù)隱私保護(hù)中,對(duì)位置的獲取和定位是首要的環(huán)節(jié)。
當(dāng)前,對(duì)位置的獲取主要采用GPS技術(shù)。GPS是目前定位系統(tǒng)中效率最高、精準(zhǔn)性最強(qiáng)的技術(shù),主要應(yīng)用在移動(dòng)設(shè)備或其他定位設(shè)備中。用戶發(fā)出獲取位置信息的指令,指令符合相關(guān)權(quán)限后對(duì)位置信息進(jìn)行獲取,經(jīng)過衛(wèi)星和移動(dòng)設(shè)備的數(shù)據(jù)信號(hào)連接,從而獲取和訪問到使用者的定位數(shù)據(jù)。定位數(shù)據(jù)的內(nèi)容主要包括三個(gè)方面:(1)對(duì)獲取權(quán)限時(shí)間段內(nèi)用戶的經(jīng)度位置進(jìn)行定位;(2)對(duì)獲取權(quán)限時(shí)間段內(nèi)用戶的緯度進(jìn)行定位;(3)對(duì)獲取權(quán)限時(shí)間信息進(jìn)行校準(zhǔn)。
在數(shù)據(jù)隱私保護(hù)設(shè)計(jì)中,這三方面數(shù)據(jù)可表示為(x、y、t)。
通過對(duì)這三項(xiàng)數(shù)據(jù)的定位測量,再利用當(dāng)前的三角測量方法,計(jì)算出精準(zhǔn)的位置信息。最后,移動(dòng)設(shè)備和互聯(lián)網(wǎng)相連接,對(duì)用戶定位數(shù)據(jù)信息完成有效地儲(chǔ)存處理及關(guān)聯(lián)數(shù)據(jù)的搜索。
根據(jù)當(dāng)前我國定位數(shù)據(jù)的獲取原理,對(duì)位置大數(shù)據(jù)進(jìn)行有效保護(hù)的主要措施是針對(duì)性地采取切斷設(shè)備信號(hào)的方式,來提高定位數(shù)據(jù)信息獲取的安全性。當(dāng)GPS移動(dòng)設(shè)備發(fā)出具體的定位請(qǐng)求時(shí),經(jīng)過數(shù)據(jù)保護(hù)系統(tǒng)的權(quán)限同意,加密保護(hù)裝置會(huì)立即獲取移動(dòng)設(shè)備的信號(hào)基站,并同時(shí)向其他關(guān)聯(lián)設(shè)備發(fā)出求救信號(hào),其他關(guān)聯(lián)設(shè)備對(duì)該設(shè)備的位置數(shù)據(jù)信息進(jìn)行保護(hù),并重新建立一個(gè)IP地址,這個(gè)IP地址就是對(duì)用戶位置信息的映射。加密設(shè)備和技術(shù)的應(yīng)用使攻擊者無法正常獲取信息信號(hào),客戶則通過自身的映射位置信息可以安全地了解自身的位置信息,達(dá)到了位置數(shù)據(jù)保護(hù)的目的。
除從獲取渠道保護(hù)位置數(shù)據(jù)信息外,還可以從位置信息的保護(hù)層面防止用戶的位置數(shù)據(jù)信息不受攻擊[3]。加密技術(shù)對(duì)位置數(shù)據(jù)的基礎(chǔ)模式進(jìn)行識(shí)別和保護(hù),即位置信息的(x、y、t)數(shù)據(jù)可以進(jìn)入使用者的移動(dòng)設(shè)備中,而惡意攻擊者使用其他數(shù)據(jù)入侵定位系統(tǒng),加密技術(shù)會(huì)自動(dòng)進(jìn)行非位置屬性的數(shù)據(jù)銷毀,從而達(dá)到對(duì)定位數(shù)據(jù)信息的保護(hù)。
3.2 位置大數(shù)據(jù)隱私保護(hù)的模糊加密理論
目前,模糊加密理論具體包括兩個(gè)層面:第一層是位置數(shù)據(jù)信息中的空間信息模糊;第二層是位置數(shù)據(jù)信息中的時(shí)間信息模糊。通過對(duì)這兩層信息進(jìn)行模糊加密,實(shí)現(xiàn)位置數(shù)據(jù)的保護(hù)。在具體加密的過程中,模糊加密工作是數(shù)據(jù)保護(hù)計(jì)算的重要前提[4]。
首先,通過對(duì)位置數(shù)據(jù)信息的空間模糊來完成對(duì)位置數(shù)據(jù)信息的有效保護(hù)。當(dāng)使用者想獲取位置信息時(shí),必然會(huì)發(fā)出信號(hào)獲?。▁、y、t)三項(xiàng)數(shù)據(jù)。從反向研究方法來看,如果想保護(hù)用戶的位置數(shù)據(jù)信息,則可以利用模糊理論將(x、y、t)三項(xiàng)數(shù)據(jù)進(jìn)行模糊和隱蔽,當(dāng)竊取者想要獲取信息數(shù)據(jù)時(shí),得到的信息有可能是不完整的,也有可能是錯(cuò)誤的,這樣就起到了定位數(shù)據(jù)信息保護(hù)的作用。
根據(jù)模糊理論,還可以設(shè)計(jì)隱蔽妨礙區(qū)域,通過妨礙區(qū)域的建立對(duì)數(shù)據(jù)進(jìn)行更全面地保護(hù)。例如,圖(a)設(shè)置有五個(gè)模擬位置 A、B、C、D、E,圖(b)反映出這五個(gè)位置的空間聯(lián)系關(guān)系,圖(a)中的陰影部分表示當(dāng)前使用模糊理論模糊的區(qū)域。如圖1所示,除A用戶本身之外,其他四個(gè)位置的用戶想要獲取A的位置信息,都會(huì)受到模糊區(qū)域的影響。通過位置模糊技術(shù)的應(yīng)用,能夠快速實(shí)現(xiàn)位置數(shù)據(jù)信息的隱私加密保護(hù)。
其次,模糊理論應(yīng)用還涉及到時(shí)間模糊加密理論。時(shí)間模糊理論是指通過增加使用者位置信息獲取時(shí)間的不確定性,來擾亂信息竊取者的數(shù)據(jù)計(jì)算進(jìn)度,從而實(shí)現(xiàn)位置數(shù)據(jù)信息的保護(hù)和加密。其主要的應(yīng)用原理也是對(duì)(x、y、t)三項(xiàng)數(shù)據(jù)進(jìn)行模糊和隱藏,空間模糊中隱藏和模糊的是x、y兩項(xiàng)數(shù)據(jù),而時(shí)間模糊中隱藏和模糊的則是t項(xiàng)數(shù)據(jù)。在位置數(shù)據(jù)信息獲取的過程中,如果時(shí)間信息錯(cuò)誤,就會(huì)導(dǎo)致實(shí)際的計(jì)算精度失準(zhǔn)。
例如,圖2為位置數(shù)據(jù)時(shí)間模糊示意圖,表1則為時(shí)間模糊理論應(yīng)用后的時(shí)間數(shù)據(jù)狀態(tài)。如表1所示可得,在進(jìn)行時(shí)間模糊之后,加密保護(hù)技術(shù)對(duì)設(shè)備獲取的位置信息進(jìn)行增加模糊,從外層增加了許多的模糊時(shí)間信息,當(dāng)竊取者想入侵到數(shù)據(jù)系統(tǒng)中時(shí),位置信息非常復(fù)雜且具有干擾性,這就影響到竊取者的數(shù)據(jù)分析和思考。由于位置信息竊取所獲得的信息都是模糊的、不準(zhǔn)確的,據(jù)此計(jì)算得出的信息結(jié)果也都不準(zhǔn)確,從而實(shí)現(xiàn)了位置數(shù)據(jù)信息的保護(hù)。
3.3 位置大數(shù)據(jù)隱私保護(hù)的加密算法實(shí)現(xiàn)
位置數(shù)據(jù)信息的保護(hù)主要是以相關(guān)數(shù)據(jù)精準(zhǔn)計(jì)算為基礎(chǔ),通過精準(zhǔn)計(jì)算才能實(shí)現(xiàn)對(duì)數(shù)據(jù)的模糊,其中位置數(shù)據(jù)的敏感度計(jì)算能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)信息的模糊處理。具體計(jì)算公式為:
在公式(2)中,e2表示在位置加密過程的使用函數(shù),Rk則表示數(shù)據(jù)敏感的程度。Rk越大,則表示當(dāng)前加密系數(shù)越大,加密保護(hù)功能越高[6]。
為驗(yàn)證上述加密算法的準(zhǔn)確度,進(jìn)行了仿真實(shí)驗(yàn)。實(shí)驗(yàn)環(huán)境:Win10操作系統(tǒng),ADM Athlon64 FX處理器,8GB內(nèi)存。搭建Python 3.6.8平臺(tái),利用 Geolife Trajectories 1.3獲取用戶的軌跡數(shù)據(jù)和標(biāo)簽。通過圖3的對(duì)比可得,使用本文的加密方法比傳統(tǒng)的加密方法計(jì)算誤差值要小3個(gè)點(diǎn),證明本文的加密計(jì)算方法十分有效。
4 ?結(jié)束語
由于位置大數(shù)據(jù)中含有用戶的位置和標(biāo)識(shí)信息,通過對(duì)這些信息的分析處理就可以掌握用戶的隱私信息和行為習(xí)慣,這就涉及到位置大數(shù)據(jù)的隱私保護(hù)問題。本文通過分析相關(guān)的數(shù)據(jù)加密技術(shù),提出保護(hù)數(shù)據(jù)隱私的加密方法,利用模糊加密理論設(shè)計(jì)算法進(jìn)行計(jì)算和驗(yàn)證,比較發(fā)現(xiàn)誤差值變小,該計(jì)算方法有效。由于位置大數(shù)據(jù)的隱私保護(hù)屬于新興領(lǐng)域,如何完善提升位置信息的隱私保護(hù)技術(shù)還需要人們進(jìn)行更深入的探索和研究。
基金項(xiàng)目:
河南警察學(xué)院一般項(xiàng)目:多源大數(shù)據(jù)融合平臺(tái)的研究與實(shí)現(xiàn)(項(xiàng)目編號(hào):HNJY-2019-YL-01)。
參考文獻(xiàn)
[1] 周勝利,陳光宣,吳禮發(fā),等.大數(shù)據(jù)隱私保護(hù)中基于可信鄰居選擇的用戶網(wǎng)絡(luò)行為匿名技術(shù)研究[J].計(jì)算機(jī)科學(xué), 2016,43(12):136-139.
[2] 林青.大數(shù)據(jù)背景下隱私保護(hù)方法研究[J].信息與電腦, 2018(7):50-51.
[3] 童威,黃啟萍,王堂志.基于隱私保護(hù)的位置大數(shù)據(jù)加密方法研究[J].安徽電氣工程職業(yè)技術(shù)學(xué)院學(xué)報(bào), 2019,24(01):122-126.
[4] 秦曉江.物聯(lián)網(wǎng)環(huán)境中占用空間較小的隱私保護(hù)加密算法研究[J].科技通報(bào),2018(4):150-153.
[5] 李超零,陳越,譚鵬許,等.基于分解與加密的云數(shù)據(jù)庫隱私保護(hù)機(jī)制研究[J].信息工程大學(xué)學(xué)報(bào),2012,13(3):376-384.
[6] 李沛諭,張治學(xué).基于可擴(kuò)展加密的傳感器網(wǎng)絡(luò)數(shù)據(jù)隱私保護(hù)研究[J].計(jì)算機(jī)與現(xiàn)代化,2015(07):37-42.