孫洪山 陸雪 徐嶸 程孝泗 吳佩敏
摘 要:隨著移動設備的普及,群智感知真值發(fā)現(xiàn)應用蓬勃發(fā)展,同時也使得數(shù)據(jù)隱私問題日益突出。然而,現(xiàn)有的隱私保護群智感知真值發(fā)現(xiàn)機制都需要較大的計算開銷和通信開銷。因此提出一種采用對稱加密算法的隱私保護群智感知真值發(fā)現(xiàn)方法,能夠很好地保護隱私,同時開銷較低,能夠滿足實際應用需求。
關(guān)鍵詞:群智感知系統(tǒng);真值發(fā)現(xiàn);隱私保護;高效
中圖分類號:TP39;TN79 文獻標識碼:A 文章編號:2095-1302(2018)07-00-02
0 引 言
隨著科技的發(fā)展,傳感器的應用越來越普遍,這使得通過匯聚傳感器的感知數(shù)據(jù)挖掘真實信息變成可能,群智感知真值發(fā)現(xiàn)系統(tǒng)由此誕生。由于傳感器質(zhì)量的差異及周邊噪音的不同,用戶上傳的感知數(shù)據(jù)與真值之間存在差別,因此需通過一定的算法得到真值。群智感知真值發(fā)現(xiàn)機制是利用移動設備所攜帶的傳感器收集所處環(huán)境的感知數(shù)據(jù),并將這些數(shù)據(jù)上傳到云服務器,再由云服務器進行相關(guān)計算。由于移動設備的感知數(shù)據(jù)可能涉及用戶隱私,因此用戶并不希望上傳自己的真實數(shù)據(jù)。為解決該矛盾,保護隱私的群智感知系統(tǒng)應運而生,該系統(tǒng)可在保護用戶隱私的前提下發(fā)現(xiàn)真值。首個保護隱私的群智感知系統(tǒng)是由Miao 等人[1]設計的PPTD協(xié)議,但該協(xié)議采用了復雜的公鑰加密算法[2],使得系統(tǒng)開銷較大。
為解決現(xiàn)有隱私保護群智感知真值發(fā)現(xiàn)系統(tǒng)效率較低的問題,本文基于文獻[3],采用對稱加密算法提出了一種高效的隱私保護群智感知真值發(fā)現(xiàn)方法。實驗結(jié)果表明,該方法比PPTD具有更高的計算效率和更低的通信開銷。
1 問題描述
系統(tǒng)包含三個實體,即云服務器、用戶及可信第三方。其中,用戶是感知數(shù)據(jù)的擁有者,使用自己的移動設備執(zhí)行感知任務;云服務器是收集用戶數(shù)據(jù)并執(zhí)行真值發(fā)現(xiàn)算法的平臺;可信第三方是為所有參與方提供私鑰的機構(gòu)。此外,對象表示由云服務器分配的實體或問題,而觀察值表示由用戶提供的感知數(shù)據(jù)。
在該群智感知系統(tǒng)中,安全威脅來自云服務器和用戶。例如,云服務器可能會嘗試推斷每個用戶的觀察值。另一方面,每個用戶也可能嘗試推斷其他用戶的觀察值。因此,保護用戶觀察值的隱私至關(guān)重要。
假設系統(tǒng)有K個用戶,一個云服務器和可信第三方TA,TA為每個用戶Uk生成Kc份任意不同的秘密值s1,…,sKc。Sk表示用戶Uk隨機得到的一組秘密值,dk表示其觀測值xk和初始化真值x*的距離,pk表示TA為每個用戶生成的私鑰,p0表示TA給云服務器的私鑰,wk表示用戶Uk的權(quán)重。真值發(fā)現(xiàn)算法的目標是讓云服務器準確地計算真值x*。這個過程中,每個用戶的觀察值(如xk)不向任何一方公開。此外,私鑰信息pk和權(quán)重信息wk也不應向系統(tǒng)中的任何一方透露。
2 算法構(gòu)造
2.1 算法基本流程
在真值發(fā)現(xiàn)算法中,每個用戶都有一個權(quán)重,所以算法流程包括權(quán)重更新過程和真值更新過程。本文采用文獻[4]的權(quán)重計算公式,即:
真值發(fā)現(xiàn)算法的一般過程可用真值發(fā)現(xiàn)算法描述。該算法的輸入是一個隨機給定的初始化真值,不斷更新用戶權(quán)重和估計真值,直到滿足所設定的收斂準則。例如,設定收斂準則為兩個連續(xù)迭代中估計的基本真值變化范圍在1%以內(nèi)或重復次數(shù)超過1 000次。
真值發(fā)現(xiàn)算法:
輸入:K個用戶的觀測值{xk}Kk=1。
輸出:真值x*。
(1)生成隨機初始化真值;
(2)基于初始化真值,對每一個用戶Uk根據(jù)式(1)進行權(quán)重更新;
(3)基于當前的權(quán)重,云服務器根據(jù)式(2)進行真值更新;
(4)重復步驟(2)和(3),直到滿足所設定的收斂準則;
(5)返回得到的真值x*。
2.2 高效的隱私保護真值發(fā)現(xiàn)算法
算法中常用系統(tǒng)參數(shù)的含義見表1所列:
首先可信第三方TA產(chǎn)生Kc份隨機且不同的秘密值s1,…,sKc。TA將這些秘密值分成K份隨機且不相交的子集,每個子集有c個秘密值。用S代表所有秘密值的集合,Sk代表第k個秘密值子集。顯然,。TA將Sk發(fā)送給用戶Uk,將S發(fā)送給云服務器。最后,云服務器和每個用戶按照下列方法生成自己的私鑰:云服務器計算,用戶Uk計算。
由于云服務器并不知道用戶和這些子集之間的映射關(guān)系,因此不知道任何用戶的加密密鑰,同時沒有用戶知道所有的數(shù),所以云服務器的解密密鑰也相對安全。
令m表示所要加密的信息,p是一個密鑰,則本文的加密方式為:c=(m+p)mod N。
在權(quán)重更新階段,首先每個用戶Uk計算其觀測值與上一輪真值(初始情況下是云服務器發(fā)送的隨機真值)的距離,并用其加密密鑰pk根據(jù)上述加密方式將數(shù)據(jù)加密,并把密文Ck傳送給云服務器。當收到數(shù)據(jù)后,云服務器利用私鑰p0解密求得所有用戶距離之和:
下式表明,所以云服務器解密成功。
在真值更新階段,云服務器首先將上述過程得到的值發(fā)給每個用戶。用戶分別計算其權(quán)重以及權(quán)重與觀測值的乘積,再用上述方法將兩值分別加密上傳給云服務器。同樣地,云服務器解密得到所有用戶權(quán)重之和,以及用戶權(quán)重和觀測值乘積的總和,云服務器通過計算得到新的真值。
重復上述兩階段,直到滿足收斂準則為止,最后云服務器輸出真值。
3 效率分析
3.1 計算開銷
在華碩A455L I5-5200U型號4 GB內(nèi)存系統(tǒng)和CodeBlocks編譯環(huán)境下,使用C++語言編寫兩種算法程序,并進行運行時間比較。在同樣128 bit的安全參數(shù)下,對于PPTD算法,取大素數(shù)p=15 900 608 684 421 836 191和q=17 374 055 105 574 471 319,g=17 180 200 816 613 291 879,r=46 043 008 582 553 496 776 380 884 709 008 233 070,舍入?yún)?shù)L=107。對于秘密分片算法,將MD5作為哈希函數(shù)控制輸入字符串的長度,rand()作為偽隨機函數(shù),產(chǎn)生安全私鑰。
此外,隨機函數(shù)rand()產(chǎn)生每個用戶的觀測值,并且假設用戶傳送的數(shù)據(jù)都是連續(xù)型整數(shù)。當連續(xù)兩次真值更新的結(jié)果收斂程度在1%以內(nèi),即可認為該值為真值。
圖1所示為使用time()函數(shù)得到的兩種算法的運行時間比較。結(jié)果顯示,本算法比PPTD具有更高的時間效率。
3.2 通信開銷
假設每傳送一份數(shù)據(jù)就是一個數(shù)據(jù)包,每份數(shù)據(jù)的大小都為1 k,則兩個算法的具體通信開銷如圖2所示。結(jié)果表明,與PPTD協(xié)議相比,本算法具有較少的通信開銷。
4 結(jié) 語
本文采用對稱密碼技術(shù)設計了一種高效的保護用戶隱私的真值發(fā)現(xiàn)算法。該算法與已有算法相比,具有更少的計算開銷和通信開銷,更適用于群智感知真值發(fā)現(xiàn)系統(tǒng)。
參考文獻
[1] MIAO C,JIANG W,SU L,et al. Cloud-Enabled privacy-preserving truth discovery in crowd sensing systems[C]//Proceedings of the 13th ACM Conference on Embedded Networked Sensor Systems. 2015:183-196.
[2] RONALD C,DAMGARD I,NIELSEN J B. Multiparty computation from threshold homomorphic encryption[C]//Proceedings of the International Conference on the Theory and Applications of Cryptographic Techniques(EUROCRYPT),2001:280-300.
[3] LI Q,CAO G. Efficient and privacy-preserving data aggregation in Mobile Sensing[C]// Proceedings of the 20th IEEE International Conference on Network Protocols(ICNP)2012:1-10.
[4] LI Q,LI Y,GAO J,et al. Resolving conicts in heterogeneous data by truth discovery and source reliability estimation[C]// Proceedings of the 2014 ACM SIGMOD International Conference on Management of Data(SIGMOD),2014:1187-1198.
[5]黃海輝,汪翔.無線體域網(wǎng)數(shù)據(jù)傳輸安全策略研究[J].物聯(lián)網(wǎng)技術(shù),2016,6(2):37-39.
[6]王卓偉.基于關(guān)聯(lián)規(guī)則混合算法并行化的隱私保護方法研究[J].物聯(lián)網(wǎng)技術(shù),2016,6(7):97-98.
[7]譚磊.面向雙向隱私保護的群智感知技術(shù)研究[D].合肥:中國科學技術(shù)大學,2017.
[8]陳朋飛.移動群智感知中基于弱安全網(wǎng)絡編碼的隱私保護機制[D].蘇州:蘇州大學,2016.