国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于差分隱私的線性回歸分析

2016-06-06 13:41:36王寶楠方賢進(jìn)
電腦知識(shí)與技術(shù) 2016年6期
關(guān)鍵詞:線性回歸隱私保護(hù)回歸分析

王寶楠++方賢進(jìn)

摘要:隨著數(shù)據(jù)分析和發(fā)布等應(yīng)用需求的出現(xiàn)和發(fā)展,如何保護(hù)隱私數(shù)據(jù)和防止敏感信息泄露成為當(dāng)前面臨的重大挑戰(zhàn)。文中對(duì)差分隱私保護(hù)技術(shù)的基本原理和特征進(jìn)行了闡述,重點(diǎn)介紹差分隱私下拉普拉斯機(jī)制的線性回歸分析技術(shù),它既保護(hù)了用戶的隱私信息,又不影響數(shù)據(jù)的可用性,達(dá)到了研究目的。在對(duì)已有技術(shù)深入對(duì)比分析的基礎(chǔ)上,指出了差分隱私保護(hù)技術(shù)的未來發(fā)展方向。

關(guān)鍵詞:差分隱私;隱私保護(hù),回歸分析,線性回歸

中圖分類號(hào):TP309 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)06-0026-04

Based on Differential Privacy of Linear Regression Analysis

WANG Bao-Nan,F(xiàn)ANG Xian-jing

(Department of computer,Anhui University of Science and Technology ,Huainan 232001 ,China)

Abstract: With the emergence and development of data analysis and publishing applications, and how to protect the privacy of data and prevent sensitive information leaks has become a major challenge currently facing. In this paper the basic principles and characteristics of differential privacy protection technologies are described, linear regression analysis focuses on privacy under Laplace differential mechanism, both to protect the user's privacy, without affecting the availability of data, to achieve the purpose .In contrast to the prior art in-depth analysis, based on the difference it pointed out the future direction of development of privacy-enhancing technologies.

Key words: differential privacy; privacy protection; regression analysis; linear Regression

1 引言

信息化社會(huì)的發(fā)展進(jìn)步使得部分機(jī)構(gòu)可以獲得大量個(gè)人和組織的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)挖掘與分析研究,從而帶來商業(yè)價(jià)值和科研價(jià)值。例如各大商場(chǎng)的顧客購物數(shù)據(jù)和證券公司個(gè)人交易數(shù)據(jù)的分析與統(tǒng)計(jì)等。但是,這些數(shù)據(jù)涉及的大量個(gè)人隱私信息的數(shù)據(jù)發(fā)布和分析都面臨著隱私泄露問題。因此, 隱私保護(hù)問題已成為重要的研究課題。隱私保護(hù)技術(shù)可以解決個(gè)人和組織的數(shù)據(jù)發(fā)布和數(shù)據(jù)分析帶來的隱私安全問題。如何發(fā)布數(shù)據(jù)而又不泄露隱私信息是隱私保護(hù)技術(shù)的主要目的。

當(dāng)前,差分隱私成為一種新的隱私保護(hù)技術(shù),差分隱私保護(hù)是通過添加特定的噪聲使得數(shù)據(jù)失真來達(dá)到隱私保護(hù)的目的。與傳統(tǒng)的隱私保護(hù)技術(shù)相似,差分隱私保護(hù)技術(shù)的實(shí)施主要考慮兩個(gè)因素:(1)怎樣保證算法的設(shè)計(jì)符合差分隱私的定義,從而確保隱私數(shù)據(jù)不被泄露;(2)怎樣減少噪聲帶來的誤差,從而提高數(shù)據(jù)的可靠性。

文獻(xiàn)[13]借鑒基于差分隱私下拉普拉斯機(jī)制與邏輯回歸方法提出一種[ω*]的計(jì)算方法 LP Log,此方法先求出[ω*]。然后再往數(shù)據(jù)中添加拉普拉斯噪音,然而由于回歸分析的輸入與輸出有緊密的關(guān)聯(lián)性,使得敏感度非常高,最后導(dǎo)致預(yù)測(cè)精度比較低。文獻(xiàn)[14]提出了一種對(duì)目標(biāo)函數(shù)直接擾動(dòng)的方法,該方法是對(duì)元組目標(biāo)函數(shù)的均值添加噪音。

上述2種回歸分析方法均存在各自的不足。第一種回歸分析方法,它的回歸分類精確度比較低,噪音誤差比較高;第二種方法缺陷在于,基于擾動(dòng)機(jī)制的回歸分析方法目前只適用于特定的目標(biāo)函數(shù),存在一定的局限性。針對(duì)這些缺陷,本文提出基于拉普拉斯機(jī)制的線性回歸分析。

2 差分隱私保護(hù)

2.1 差分隱私

差分隱私保護(hù)通過向數(shù)據(jù)中添加噪聲使敏感數(shù)據(jù)失真,而部分?jǐn)?shù)據(jù)或數(shù)據(jù)屬性保持不變。差分隱私保護(hù)技術(shù)可以達(dá)到這樣一個(gè)效果,即在用戶數(shù)據(jù)中增加或減少一個(gè)記錄數(shù)據(jù),不會(huì)影響數(shù)據(jù)的輸出結(jié)果,不影響數(shù)據(jù)的有效性與可靠性。即使在最壞的情況下,如果攻擊者知道數(shù)據(jù)中除一條記錄數(shù)據(jù)之外的所有數(shù)據(jù)信息,仍可以做到保證這一條數(shù)據(jù)信息不被泄露的效果。

5 結(jié)論

本文介紹差分隱私的相關(guān)概念以及隱私保護(hù)的重要性。重點(diǎn)研究了差分隱私保護(hù)下拉普拉斯機(jī)制的線性回歸分析。首先,設(shè)計(jì)相關(guān)算法; 其次,給每一個(gè)多項(xiàng)式系數(shù)添加[Lap(2(d+1)2/ε)]噪音,最后在運(yùn)行噪音目標(biāo)函數(shù)中優(yōu)化[ω]。最后,發(fā)布噪音數(shù)據(jù)。實(shí)驗(yàn)運(yùn)行結(jié)果顯示,隨著隱私預(yù)算增加,誤差率越小,數(shù)據(jù)可用性較好,實(shí)現(xiàn)了數(shù)據(jù)的隱私保護(hù)。線性回歸分析比較簡(jiǎn)單,因?yàn)槟繕?biāo)函數(shù)就是[ω]多項(xiàng)式本身。差分隱私將是未來一個(gè)長(zhǎng)期研究的課題,將其應(yīng)用到回歸分析中,尚有很多需要改進(jìn)的地方,這是筆者下一步研究的方向。

參考文獻(xiàn):

[1] 李楊,溫雯,謝光強(qiáng).差分隱私保護(hù)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(9) : 3201.

[2] DWORK C.A firm foundation for private data analysis[J].Communications of the ACM,2011,54( 1) : 86-95.

[3] Dwork C,McSherry F,Nissim K,Smith A. Calibrating Noise to Sensitivity in Private Data Analysis[C]/ /Proceedings of the 3th Theory of Cryptography Conference ( TCC) . New York,USA,2006: 363-385.

[4] DWORK C.The differential privacy frontier[C]/ /Proc of the 6th International Conference on Theory of Cryptography Conference.Berlin: Springer - Verlag,2009: 496-502.

[5] J. Zhang, X. Xiao, Y. Yang, and et al.. PrivGene: differentially private model fitting using genetic algorithms. SIGMOD, 2013.

[6] Zhang J, Zhang Z, Xiao X, et al. Functional mechanism: Regression analysis under differential privacy[C]/ /Proceedings of the 38th Conference of Very Large Databases(VLDB).Istanbul,Turkey,2012:1364-1375.

[7] C. Dwork. A firm foundation for private data analysis.Commun.ACM,2011,54(1) : 86 – 95.

[8] B. Fung,K. Wang,R. Chen,et al. Privacy - preserving data publishing: A survey of recent developments[J].ACMi.Computing Surveys ( CSUR) ,2010,42(4) : 18.

[9] DWORK C.Differential privacy: a survey of results[C]/ / Proc of the 5th International Conference on Theory and Applicationa of Models of Computation. Berlin: Springer -Verlag,2008: 1-9.

[10] DWORK C.The promise of differential privacy: a tutorial on algorithmic techniques [C]/ /Proc of the 52nd Annual IEEE Symposium on Foundation of Computer Science.Washington DC: IEEE Computer Society,2011:1-2.

[11] Dwork C,McSherry F,Nissim K,Smith A. Calibrating Noise to Sensitivity in Private Data Analysis[C]/ /Proceedings of the 3th Theory of Cryptography Conference ( TCC) . New York,USA,2006: 363-385.

[12] McSherry F,Talwar K. Mechanism Design via Differential Privacy[C]/ /Proceedings of the 48th Annual IEEE Symposium on Foundations of Computer Science ( FOCS) .Providence,RI,USA,2007: 94 -103.

[13] Smith A. Privacy-preserving statistical estimation with optimal convergence rate[C].Proceedings on the 43th Annual ACM Symposium on Theory of Computing(STOC).2011:813-822.

[14] Chaudhuri K,Monteleoni C. Privacy-preserving logistic regression[C].Proceedings of the 20th Annual Conference on Neural Information ProcessingSystem(NIPS).Vancouver,British Columbia,Canada,2008:289-296.

猜你喜歡
線性回歸隱私保護(hù)回歸分析
國(guó)道公路養(yǎng)護(hù)管理與規(guī)劃研究
大數(shù)據(jù)環(huán)境下用戶信息隱私泄露成因分析和保護(hù)對(duì)策
大數(shù)據(jù)安全與隱私保護(hù)的必要性及措施
基于變形監(jiān)測(cè)的金安橋水電站壩體穩(wěn)定性分析
社交網(wǎng)絡(luò)中的隱私關(guān)注及隱私保護(hù)研究綜述
大數(shù)據(jù)時(shí)代的隱私保護(hù)關(guān)鍵技術(shù)研究
森林碳匯影響因素的計(jì)量模型研究
河北省城鎮(zhèn)居民人均可支配收入與消費(fèi)統(tǒng)計(jì)分析
商(2016年27期)2016-10-17 05:53:09
河南省經(jīng)濟(jì)增長(zhǎng)質(zhì)量與創(chuàng)新能力關(guān)系的實(shí)證分析
影響上市公司股票價(jià)格的微觀因素分析
商(2016年13期)2016-05-20 09:12:44
博湖县| 建宁县| 宁武县| 鲜城| 三门县| 伊金霍洛旗| 舞钢市| 兴山县| 潮州市| 阿鲁科尔沁旗| 敦化市| 台北市| 浠水县| 康保县| 鹤壁市| 广宁县| 松潘县| 大洼县| 石城县| 青神县| 赫章县| 淮滨县| 兴国县| 株洲县| 漯河市| 云和县| 庆安县| 珲春市| 中宁县| 肇庆市| 庆元县| 格尔木市| 巨野县| 霍州市| 泾阳县| 图们市| 镇平县| 芒康县| 莎车县| 金湖县| 曲阳县|