◆李乃權(quán)
基于區(qū)塊鏈的隱私數(shù)據(jù)安全綜述
◆李乃權(quán)
(青島科技大學(xué)信息學(xué)院 山東 266110)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和應(yīng)用,網(wǎng)絡(luò)空間每時(shí)每刻都流通著大量數(shù)據(jù),這其中就包含最重要的可以威脅網(wǎng)絡(luò)用戶信息安全的隱私數(shù)據(jù),所以隱私數(shù)據(jù)安全性的保證顯得尤其重要。具有去中心化、不可篡改、可追溯、高可信和高可用特性的區(qū)塊鏈技術(shù)就可以比較好地保證這些重要數(shù)據(jù)的安全傳輸和存儲(chǔ)。本文通過對(duì)區(qū)塊鏈的原理和發(fā)展歷史的分析,研究了區(qū)塊鏈對(duì)于保護(hù)隱私數(shù)據(jù)安全的可行性。
區(qū)塊鏈;隱私;安全;大數(shù)據(jù);云網(wǎng)絡(luò)
隨著互聯(lián)網(wǎng)與物聯(lián)網(wǎng)技術(shù)的發(fā)展,部分應(yīng)用程序?yàn)榱讼蛴脩籼峁└珳?zhǔn)的服務(wù),需要采集各種用戶數(shù)據(jù)[1]。而且采集的用戶信息越來越私密,涉及隱私的部分越來越多,而在大數(shù)據(jù)橫行的互聯(lián)網(wǎng)環(huán)境之下,每個(gè)人都可以利用這些信息去做一些可以獲取利益的事,比如根據(jù)個(gè)人商品的買賣記錄推廣商品,根據(jù)網(wǎng)站或者APP注冊(cè)的手機(jī)號(hào)進(jìn)行電話推銷或者詐騙等等。目前現(xiàn)有的框架結(jié)構(gòu)融合了大量具有“所有權(quán)”特征的數(shù)據(jù),這些數(shù)據(jù)往往牽扯到個(gè)人隱私權(quán)限,雖然平臺(tái)也對(duì)此采取了一些安全措施,但只要中心服務(wù)器一旦被攻破,破壞者就可以訪問到所有數(shù)據(jù)。同時(shí),為了方便統(tǒng)一管理,在中心化服務(wù)器上集中了所有的關(guān)系權(quán)限隱私的數(shù)據(jù),這樣一來,用戶也必須依賴于這一模式,依賴于第三方的中心服務(wù)器,第三方機(jī)構(gòu)大量收集和控制個(gè)人隱私數(shù)據(jù)已威脅到其信息安全,在大數(shù)據(jù)時(shí)代下,這樣的體系結(jié)構(gòu)存在著太多不穩(wěn)定因素。而去中心化的區(qū)塊鏈技術(shù)就很好地解決了這一問題,既是分布式且可驗(yàn)證的公共賬本,還有著去可信、匿名性等特性,可以作為網(wǎng)絡(luò)安全的重要技術(shù)。其中比較關(guān)鍵的就是對(duì)隱私數(shù)據(jù)的安全保護(hù),這是重點(diǎn)也是基礎(chǔ)。
區(qū)塊鏈?zhǔn)鞘裁??這個(gè)對(duì)于大部分人來說,提到區(qū)塊鏈就會(huì)想到比特幣,因?yàn)楸忍貛攀菂^(qū)塊鏈技術(shù)的第一個(gè)成熟且一直到今天都在使用的應(yīng)用,并且一直到現(xiàn)在還非?;钴S。而區(qū)塊鏈最早的定義是來自于中本聰在 2008年發(fā)表的論文[7](《比特幣:一種點(diǎn)對(duì)點(diǎn)電子現(xiàn)金系統(tǒng)區(qū)塊鏈》[4])。最初定義了區(qū)塊鏈就是一套全新的、去中心化的、不需要信任基礎(chǔ)的點(diǎn)到點(diǎn)交易體系的方法[7]。在2009年1月,中本聰創(chuàng)建了區(qū)塊鏈的第一個(gè)區(qū)塊,這個(gè)區(qū)塊也被稱為“創(chuàng)世區(qū)塊”,在此后10年間,規(guī)模龐大的比特幣系統(tǒng)沒有出現(xiàn)過一次錯(cuò)誤,也沒有停止運(yùn)轉(zhuǎn)。不得不說這是一次偉大且新奇的技術(shù)變革,足以證明區(qū)塊鏈的安全性和可實(shí)現(xiàn)性。
其實(shí)區(qū)塊鏈并不是只能用于比特幣的技術(shù),而是一系列現(xiàn)有技術(shù)的集合體,其中包括各種概念和算法集合,還有一些非對(duì)稱加密技術(shù)、時(shí)間戳、共識(shí)機(jī)制等。隨著區(qū)塊鏈在比特幣中的成功應(yīng)用被越來越多的人熟知和認(rèn)可,區(qū)塊鏈的內(nèi)涵和技術(shù)也慢慢地被演化豐富起來。
在2019年10月24日習(xí)近平總書記發(fā)表的關(guān)于加快推動(dòng)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展的重要講話中就提到了要強(qiáng)化區(qū)塊鏈技術(shù)的基礎(chǔ)研究。由此可見雖然區(qū)塊鏈已經(jīng)存在了十幾年,但它的潛能還是沒能完全開發(fā),所以國(guó)家也抓住了這個(gè)機(jī)遇,鼓勵(lì)區(qū)塊鏈的基礎(chǔ)研究和其應(yīng)用技術(shù)的研究。
區(qū)塊鏈就是一個(gè)分布式的數(shù)據(jù)庫(kù)系統(tǒng),具有去中心化、不可篡改、去信任、可匿名的等特點(diǎn)。由于區(qū)塊鏈的分布式分布,所以它也可以作為一個(gè)共享數(shù)據(jù)庫(kù),存儲(chǔ)于其中的數(shù)據(jù)或信息,都有更好的安全性,而且公開透明,因?yàn)槊總€(gè)節(jié)點(diǎn)都會(huì)備份并存在驗(yàn)證,個(gè)人甚至一部分人的數(shù)據(jù)造假是行不通的。區(qū)塊鏈技術(shù)可以作為一種去中心化的數(shù)據(jù)庫(kù)技術(shù)或者說分布式賬本技術(shù)。
以下介紹區(qū)塊鏈的幾個(gè)特點(diǎn):
(1)去中心化。傳統(tǒng)存儲(chǔ)結(jié)構(gòu)會(huì)有中心節(jié)點(diǎn),權(quán)限和數(shù)據(jù)信息都必須通過這個(gè)中心節(jié)點(diǎn)才能獲取,換言之,一旦中心節(jié)點(diǎn)被攻破,那么所有的數(shù)據(jù)都可能被篡改。而區(qū)塊鏈則不同,它是一種分布式數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),區(qū)塊鏈所有的節(jié)點(diǎn)依賴于共同的共識(shí)算法(目前區(qū)塊鏈主流的有三種共識(shí)算法,分別是POW[10](工作量證明)、POS[11](股權(quán)證明)、DPOS(委托權(quán)益證明)),每個(gè)節(jié)點(diǎn)都保存全部完整且相同的節(jié)點(diǎn)信息,沒有了中心節(jié)點(diǎn)的約束,這樣就基本確保了區(qū)塊鏈數(shù)據(jù)庫(kù)的公開透明、不可篡改等特性。
(2)不可篡改性。區(qū)塊鏈中的每一個(gè)節(jié)點(diǎn)或者說區(qū)塊中的記賬信息都對(duì)應(yīng)了唯一的哈希值(例如在比特幣中,使用哈希算法把交易生成數(shù)據(jù)摘要,也就是哈希值),由于區(qū)塊鏈獨(dú)特的時(shí)間戳和哈希算法(哈希算法又稱為哈希函數(shù)、散列算法、散列函數(shù),這種算法只能加密不能解密,而算法得到的稱為哈希值,其來源就是通過將任意長(zhǎng)度的信息轉(zhuǎn)換成一段固定長(zhǎng)度的字符串)的特殊性,如果有人想篡改某一條信息,那么同時(shí)也需要篡改之后的每一條信息還有后續(xù)每一個(gè)區(qū)塊的哈希值,根據(jù)區(qū)塊鏈中的驗(yàn)證方式,至少需要篡改整個(gè)區(qū)塊鏈系統(tǒng)中百分之五十一的區(qū)塊才能真正篡改成功,如果區(qū)塊足夠多,鏈條足夠長(zhǎng),這種篡改方式是不可能實(shí)現(xiàn)的。
(3)去信任。由于區(qū)塊鏈的去中心化,它的數(shù)據(jù)庫(kù)對(duì)于區(qū)塊鏈內(nèi)部上所有節(jié)點(diǎn)都是完全公開透明的(這并不意味著我們可以隨意窺視他人信息,因?yàn)樾枰荑€才行),在系統(tǒng)規(guī)則和時(shí)間范圍內(nèi)節(jié)點(diǎn)無法互相欺騙,所以區(qū)塊鏈中的所有節(jié)點(diǎn)不需要信任也可以進(jìn)行交易,也可以認(rèn)為是節(jié)點(diǎn)之間去信任。
(4)匿名性。由于節(jié)點(diǎn)之間的交流溝通有著固定的算法[12-17](哈希算法),所以節(jié)點(diǎn)之間的交易無需公開身份,即使在其他節(jié)點(diǎn)上都能看到交易信息,但都是經(jīng)過算法加密過的信息,別人無法知道你在區(qū)塊鏈上有多少資產(chǎn),以及和誰進(jìn)行了交易,甚至是對(duì)隱私的信息進(jìn)行匿名加密,只要滿足算法規(guī)則,就可以產(chǎn)生信任,這就是匿名性。
綜上特點(diǎn)可以看出,區(qū)塊鏈不僅僅是在隱私數(shù)據(jù)的保護(hù)上有優(yōu)勢(shì),而且在所有數(shù)據(jù)的保護(hù)方面都有著獨(dú)特優(yōu)勢(shì),但隱私數(shù)據(jù)的安全是所有交易和通信的基礎(chǔ),因此區(qū)塊鏈只有在隱私數(shù)據(jù)的保護(hù)上發(fā)揮足夠作用才能以此為基礎(chǔ)繼續(xù)延伸擴(kuò)展。
隱私保護(hù)是對(duì)用戶身份信息或者利益相關(guān)信息等用戶不愿公開的重要且敏感信息的保護(hù)。隱私保護(hù)技術(shù)就是利用密碼學(xué)保護(hù)區(qū)塊鏈網(wǎng)上的用戶和交易不受侵害,其中比較重要的隱私信息主要是用戶的身份信息和交易信息兩部分內(nèi)容[2]。
身份隱私保護(hù)[17-20]:通常情況下,用戶的身份信息和許多其他固定信息都會(huì)產(chǎn)生一定的聯(lián)系,例如用戶姓名住址和網(wǎng)絡(luò)ID的綁定。這種相互之間的聯(lián)系可以通過電腦IP地址的泄露或者其他方式間接導(dǎo)致用戶信息的泄露。
交易隱私保護(hù):這就要求不能通過非授權(quán)節(jié)點(diǎn)看到甚至破解交易本身的數(shù)據(jù)信息,也就是說,交易數(shù)據(jù)本身要加密并且不能暴露給非授權(quán)節(jié)點(diǎn)。
拿醫(yī)療行業(yè)舉例來說,存在著很多的隱私數(shù)據(jù),例如身份隱私數(shù)據(jù)有病人的姓名、身份證號(hào)、年齡、住址,工作等等,交易數(shù)據(jù)有掛號(hào)次數(shù)、住院次數(shù)、大病種類、繳費(fèi)金額和日期等等。由于醫(yī)療數(shù)據(jù)存儲(chǔ)方式的特殊性,多為內(nèi)部局域網(wǎng),如果內(nèi)部人員或者數(shù)據(jù)庫(kù)出了問題,那后果可能比外部威脅還要可怕,讓人防不勝防。而醫(yī)療管理系統(tǒng)和醫(yī)保管理系統(tǒng)互通性較差,這給患者的隱私信息管理帶來很大難度,因?yàn)榛ネㄐ暂^差就意味著需要反復(fù)確認(rèn)認(rèn)證信息,而頻次一旦多了,風(fēng)險(xiǎn)也隨之而來,信息泄露的可能性也隨之增大。
患者的個(gè)人信息、掛號(hào)記錄,消費(fèi)信息還有病例記錄很容易通過后臺(tái)中心數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行泄露或者篡改,而且可以不經(jīng)過患者確認(rèn),相當(dāng)于用戶沒有私鑰或者說私鑰并不“私”。雖然醫(yī)院會(huì)采取多重手段進(jìn)行數(shù)據(jù)庫(kù)的保護(hù)和監(jiān)管,可是這種中心集群的數(shù)據(jù)存儲(chǔ)的弊端異常明顯,一旦堡壘被攻破,那所有的數(shù)據(jù)都會(huì)暴露無遺。數(shù)據(jù)易泄露、難共享、易篡改,讓醫(yī)療數(shù)據(jù)管理和安全成為難題。而擁有去中心化、可追溯、不可篡改等優(yōu)勢(shì)的區(qū)塊鏈則很有希望在醫(yī)療數(shù)據(jù)管理中發(fā)揮重要作用。
如果運(yùn)用區(qū)塊鏈技術(shù),則可以在每個(gè)節(jié)點(diǎn)保存全部完整且相同的節(jié)點(diǎn)信息,這些信息都有著獨(dú)特的時(shí)間戳和哈希算法的加密,只有拿到經(jīng)過授權(quán)的密鑰才能去查看解密后的信息,而且不可篡改,可以真正將患者的隱私信息掌握在自己的手中。
由區(qū)塊鏈的特殊特點(diǎn)可以解決很多傳統(tǒng)的中心化服務(wù)器所存在的隱私泄露問題,當(dāng)然區(qū)塊鏈也不是萬能的,在某些方面也有缺憾,下面就來列舉一下區(qū)塊鏈應(yīng)用在隱私保護(hù)中的優(yōu)缺點(diǎn)。
(1)首先是加密上的優(yōu)勢(shì)。區(qū)塊鏈節(jié)點(diǎn)的哈希算法的應(yīng)用可以有效地避開隱私信息的直接暴露,再加上對(duì)數(shù)據(jù)的非對(duì)稱加密,其他人即使截取到了公鑰,以現(xiàn)在的技術(shù)也沒法由公鑰推算出私鑰,從而在很大程度上降低了信息中隱私數(shù)據(jù)的泄露風(fēng)險(xiǎn)。
(2)其次對(duì)于網(wǎng)絡(luò)上的竊聽也能夠在一定程度上避免。因?yàn)閰^(qū)塊鏈的去中心化特性,使得兩個(gè)節(jié)點(diǎn)進(jìn)行通訊時(shí)都是通過相鄰節(jié)點(diǎn)進(jìn)行中繼轉(zhuǎn)發(fā),而不是兩個(gè)節(jié)點(diǎn)之間直接通信,即使被截取竊聽到也無法確定是哪兩個(gè)節(jié)點(diǎn)進(jìn)行通信。這也是因?yàn)閰^(qū)塊鏈有匿名性的特點(diǎn),用戶可以為交易創(chuàng)建地址,而且不用第三方參與進(jìn)來,這樣就能在一定程度上削弱地址和用戶信息的關(guān)聯(lián)性。
(3)算法的優(yōu)勢(shì)。區(qū)塊鏈一般不會(huì)直接保存交易記錄或者原始數(shù)據(jù),而是保存其哈希函數(shù)值,即將原始數(shù)據(jù)通過哈希算法進(jìn)行加密處理,編碼為特定長(zhǎng)度的由數(shù)字和字母組成的字符串后記入?yún)^(qū)塊鏈。這樣即使信息被截取或者破解也不一定能會(huì)泄露原本的信息,對(duì)于隱私數(shù)據(jù)的可靠傳輸和保存十分有利。
(4)去中心化的特點(diǎn)更容易應(yīng)對(duì)網(wǎng)絡(luò)上的網(wǎng)絡(luò)攻擊。傳統(tǒng)的中心化服務(wù)器一旦遭到攻擊,那么存在其中的個(gè)人用戶信息密碼等都會(huì)泄露,而區(qū)塊鏈的去中心化特點(diǎn)使得這種直接的網(wǎng)絡(luò)攻擊有了更高的成本,在很大程度上避免了大規(guī)模的網(wǎng)絡(luò)攻擊。
(1)區(qū)塊鏈的分布式記賬方式雖然有去中心化、不可篡改等特點(diǎn),對(duì)隱私數(shù)據(jù)的保護(hù)也很有優(yōu)勢(shì),但分布式存儲(chǔ)隨之帶來的是存儲(chǔ)空間增大,這就必須依賴于云空間存儲(chǔ)技術(shù),也就是說要運(yùn)用區(qū)塊鏈技術(shù),這不僅僅是一方面的革新,是多方面的協(xié)調(diào)更新。同時(shí)區(qū)塊鏈中對(duì)密碼學(xué)技術(shù)的應(yīng)用,對(duì)計(jì)算機(jī)的運(yùn)算能力也提出了新要求。
(2)區(qū)塊鏈的去中心化雖然避免了用戶信息被集體攻擊泄露的危險(xiǎn),但同時(shí)也將風(fēng)險(xiǎn)均攤到了每個(gè)節(jié)點(diǎn)上,但每個(gè)小節(jié)點(diǎn)不如之前的中心服務(wù)器的防護(hù)周全,更容易遭到攻破,也就是說薄弱的區(qū)塊鏈節(jié)點(diǎn)變成不定時(shí)炸彈。
(3)區(qū)塊鏈采用的加密算法雖然以現(xiàn)有的技術(shù)很難破解,但是隨著技術(shù)的不斷更新發(fā)展,難保不會(huì)留下隱患,這也是一個(gè)亟待解決的問題。
本文先概括了區(qū)塊鏈技術(shù)在國(guó)內(nèi)外發(fā)展的不同時(shí)期,我們可以看到區(qū)塊鏈的應(yīng)用層面很寬,不僅僅是在數(shù)字貨幣領(lǐng)域,在其他領(lǐng)域也很有潛力,從政府和學(xué)者民眾的重視程度中就能看出,區(qū)塊鏈技術(shù)在未來的幾年中可能會(huì)被更多地運(yùn)用和突破。通過對(duì)區(qū)塊鏈在保護(hù)隱私數(shù)據(jù)安全方面的優(yōu)劣的分析,可以發(fā)現(xiàn)區(qū)塊鏈的發(fā)展還存在各種瓶頸,因?yàn)閰^(qū)塊鏈單獨(dú)存在可能會(huì)有許多弊端,需要更多的新興技術(shù)來輔助支撐。無論是在互聯(lián)網(wǎng)還是大型局域網(wǎng),區(qū)塊鏈對(duì)于隱私數(shù)據(jù)的保護(hù)作用都是可以預(yù)見的,現(xiàn)階段有了政策的大力扶持和諸多學(xué)者的密切關(guān)注,區(qū)塊鏈的前景一片光明。
[1]XIAO L,LI HAN G eta1.A secure mobile crowdsensing game with deep reinforcement learning[J].IEEE Transactions on Information Forensics& Security,2017,136(1):35-47.
[2]韓璇,袁勇,王飛躍. 區(qū)塊鏈安全問題:研究現(xiàn)狀與展望[J]. 自動(dòng)化學(xué)報(bào),2019,45(1):206-225.
[3]袁勇,王飛躍.區(qū)塊鏈技術(shù)發(fā)展現(xiàn)狀與展望[J].自動(dòng)化學(xué)報(bào),2016,42(4):481-494.
[4]李倩,程剛,王夫琴. 基于隱形知識(shí)共享的企業(yè)知識(shí)創(chuàng)新模型研究[J]. 情報(bào)理論與實(shí)踐,2014(6):77-80,92.
[5]劉雅輝,張鐵贏,靳小龍,等.大數(shù)據(jù)時(shí)代的個(gè)人隱私保護(hù)[J].計(jì)算機(jī)研究與發(fā)展,2015,52(1):229-247.
[6]肖亮,李強(qiáng)達(dá),劉金亮.云存儲(chǔ)安全技術(shù)研究進(jìn)展綜述[J].?dāng)?shù)據(jù)采集與處理,2016,31(3):464,472.
[7]Nakamoto S.Bitcoin:A peer-to-peer electronic cash system[EB/OL].[2017-08-01].http:/www .bitcoin.org/bitcoin.pdf.
[8]劉明輝,張尼,張?jiān)朴拢龋骗h(huán)境下的敏感數(shù)據(jù)保護(hù)技術(shù)研究[J].電信科學(xué),2014,30(11):2-8.
[9]邵奇峰,金澈清,張召,等.區(qū)塊鏈技術(shù):架構(gòu)及進(jìn)展[J].計(jì)算機(jī)學(xué)報(bào),2017:1-20.
[10]Dwork C,NaorM. Pricing via processing or combatting Junk Mail [C] /j Proc of the 12th Annual Int Cryptology Conf Proceedings. Piscataway,NJ:IEEE,1992:139-147.
[11]Larimer D. Transactions as proof-of-stake [EB/OL]. [2017--06-10]. https://bravenewcoin.com/assets/Uploads/Transactions AsProofOfStake10.pdf.
[12]吳儒忠. 科學(xué)神教的前世今生[J]. 百科知識(shí),2012(018).
[13]Hon M T W K,Palfreyman J,Tegart M. Distributed ledger technology & Cybersecurity [Online]. available:https://ec.europa.eu/futurium/en/content/distributedledger-technology-cybersecurity,October 5,2018.
[14]Yaga D,Mell P,Roby N,Scarfone K. Blockchain technology overview [Online]. available:https://csrc.nist. gov/publications/detail/nistir/8202/draft,October 5,2018.
[15]De Prisco R,Lampson B,Lynch N. Revisiting the Paxos algorithm. In:Proceedings of the 11th International Workshop on Distributed Algorithms. Saarbr¨ ucken,Germany: Springer 1997. 111-125.
[16]Lamport L. The part-time parliament. ACM Transactions on Computer Systems,1998,16(2):133-169.
[17]Castro M,Liskov B. Practical Byzantine fault tolerance. In:Proceedings of the 3rd Symposium on Operating Systems Design and Implementation. New Orleans,USA:OSDI,1999. 173-86.
[18]Ongaro D,Ousterhout J K. In search of an understandable consensus algorithm. In:Proceedings of the USENIX Annual Technical Conference. Philadelphia,PA,USA: USENIX ATC,2014. 305-119.
[19]Oki B M,Liskov B H. Viewstamped replication:a new primary copy method to support highly-available distributed systems In:Proceedings of the 7th Annual ACM Symposium on Principles of Distributed Computing. Toronto,Ontario,Canada: ACM,1988:8-17.
[20]王帥,汪來富,金華敏,等.網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用[J]. 電信科學(xué),2015,31(7):14.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2022年1期