陳智罡,宋新霞,鄭夢策,劉天成
1.浙江萬里學(xué)院 信息與智能工程學(xué)院,浙江 寧波315100
2.浙江萬里學(xué)院 基礎(chǔ)學(xué)院,浙江 寧波315100
同態(tài)加密最初是由Rivest、Adleman 和Dertouzos[1]在1978 年提出的。同態(tài)加密是在不知道密鑰的情況下,能夠?qū)γ芪倪M(jìn)行計(jì)算,其結(jié)果與解密之后明文計(jì)算的效果相同,這保護(hù)了數(shù)據(jù)的隱私性。自從1978 年以來,全同態(tài)加密一直被認(rèn)為是密碼學(xué)界的“密碼學(xué)圣杯”[2]。40多年以來,人們也提出一些同態(tài)加密方案,但是他們要么滿足加法同態(tài),要么滿足乘法同態(tài)[3-13],在此基礎(chǔ)上還提出了能同時(shí)滿足有限次乘法與加法的同態(tài)加密[14-18],直到2009年Gentry首次提出了第一個(gè)全同態(tài)加密方案[19],解決了這個(gè)困擾了密碼學(xué)界40 多年的難題,摘取了這頂“圣杯”。
全同態(tài)加密在多個(gè)領(lǐng)域中如云計(jì)算、電子商務(wù)、物聯(lián)網(wǎng)上有著很多的應(yīng)用,具有很高的研究與應(yīng)用價(jià)值[20-29]。盡管已有一些全同態(tài)加密的文獻(xiàn)綜述從技術(shù)角度對其進(jìn)行了分析和總結(jié),Acar等[30]列出了全同態(tài)加密方案的理論與典型的應(yīng)用,從算法的速度與簡潔性上對多個(gè)全同態(tài)加密方案進(jìn)行了對比,著重介紹了構(gòu)造全同態(tài)加密方案的方法,但是對研究方向與所涉及的基礎(chǔ)領(lǐng)域討論較少。Martins 等[31]從工程實(shí)現(xiàn)的角度回顧了全同態(tài)加密方案的研究,針對各個(gè)方案的性能進(jìn)行了分析。Rocha 等[32]介紹了關(guān)于同態(tài)加密的一些概念,并給出一些機(jī)器學(xué)習(xí)應(yīng)用案例。Vaikuntanathan[33]介紹了全同態(tài)加密方案的發(fā)展。近期的全同態(tài)加密綜述見文獻(xiàn)[34-35]。此外,近三年也有大量關(guān)于全同態(tài)加密的理論設(shè)計(jì)方案,參見文獻(xiàn)[36-58]。上述都是重點(diǎn)關(guān)注于全同態(tài)加密的方案研究和具體應(yīng)用。當(dāng)前全同態(tài)加密領(lǐng)域仍缺少基于文獻(xiàn)計(jì)量分析的研究工作?;谖墨I(xiàn)計(jì)量分析的研究工作能夠推進(jìn)同態(tài)加密領(lǐng)域的系統(tǒng)發(fā)展,幫助研究人員把握科研工作的方向,因此對這一領(lǐng)域相關(guān)的學(xué)術(shù)論文進(jìn)行統(tǒng)計(jì)研究是必要的。本文從文獻(xiàn)的角度出發(fā),不限制于特定的應(yīng)用領(lǐng)域來討論全同態(tài)加密的發(fā)展。
本文的主要目的是系統(tǒng)地分析已被Web of Science(WoS)核心合集索引和中國知網(wǎng)(CNKI)檢索的全同態(tài)加密的研究論文,并對它們加以分類。為了達(dá)到預(yù)期的目的,對有關(guān)全同態(tài)加密的文章進(jìn)行了文獻(xiàn)計(jì)量的研究,采用CiteSpace進(jìn)行輔助分析,為全同態(tài)加密的研究者們提供一些有價(jià)值的信息,包括引文趨勢、全同態(tài)加密領(lǐng)域最有影響力的論文、基礎(chǔ)領(lǐng)域分布、最頂級的基金資助機(jī)構(gòu)及應(yīng)用方向,這將反映出同態(tài)加密發(fā)展的現(xiàn)況和當(dāng)前的研究方向。
選擇WoS 和中國知網(wǎng)兩個(gè)數(shù)據(jù)庫作為數(shù)據(jù)來源。WoS和知網(wǎng)是世界上領(lǐng)先的科學(xué)論文數(shù)據(jù)庫,有一系列嚴(yán)格的篩選過程,為研究人員提供了一些有用的分析功能。并且WoS涵蓋了20 300多種著名的期刊、會議、書籍,中國知網(wǎng)也正式收錄了9 000多種自然科學(xué)、社會科學(xué)學(xué)術(shù)期刊。
Gentry在2009年提出了第一個(gè)全同態(tài)加密方案,本文選擇2009—2020 年的時(shí)間跨度進(jìn)行搜索。在WoS中,首先將“fully homomorphic encryption”作為主題進(jìn)行搜索,文獻(xiàn)類型選擇“Proceedings Paper or Article”,即對每篇論文的標(biāo)題、摘要、關(guān)鍵字三部分都進(jìn)行檢索,再對只是提到全同態(tài)加密關(guān)鍵字的論文進(jìn)行過濾,最終確定的數(shù)據(jù)是WoS 包含了826 篇文獻(xiàn)。在知網(wǎng)中,將“主題”或“關(guān)鍵詞”或“篇名”作為檢索條件,同時(shí)進(jìn)行同義詞擴(kuò)展并且將文獻(xiàn)類型選為“期刊或會議”,同樣對只是提到全同態(tài)加密的論文進(jìn)行篩選,確定知網(wǎng)中包括了175篇文獻(xiàn)。
CiteSpace 軟件自開發(fā)以來借助知識圖譜分析在科學(xué)計(jì)量中得到了廣泛運(yùn)用,本文采用CiteSpace5.5.R2對數(shù)據(jù)的主要研究國家及機(jī)構(gòu)進(jìn)行分析,并且利用Excel統(tǒng)計(jì)歷年的發(fā)文量,借助WoS自帶可視化分析進(jìn)行輔助。
自2009 年以來,有關(guān)全同態(tài)加密研究的發(fā)文量如圖1所示??傮w上來看,WoS索引收錄的全同態(tài)加密文章增長趨勢明顯,其中在2014—2015 年迎來了數(shù)量增長的爆發(fā)期,2015年增長量是前一年的88%,并且2015年以后每年的發(fā)文量一直穩(wěn)定在100篇以上,其中2016、2017年有小幅度下滑。相對而言,知網(wǎng)關(guān)于全同態(tài)加密論文的數(shù)量也是穩(wěn)步提升,但是增長幅度低。根據(jù)圖1,WoS 與知網(wǎng)的全同態(tài)加密論文的增長曲線趨勢基本一致。這說明全同態(tài)加密在國內(nèi)外受到了廣泛的關(guān)注,可以預(yù)測全同態(tài)加密的文章數(shù)量應(yīng)該還會繼續(xù)保持增長趨勢。
圖1 2009—2019年WoS與知網(wǎng)全同態(tài)加密研究領(lǐng)域文獻(xiàn)數(shù)量統(tǒng)計(jì)Fig.1 Statistics on paper number in full homomorphic encryption in WoS and CNKI from 2009 to 2019
在全同態(tài)加密發(fā)展過程中具有開創(chuàng)性的文章就是Gentry 的“Fully Homomorphic Encryption Using Ideal Lattices”[19]。這篇文章發(fā)表自2009年,是一個(gè)將具有自舉性質(zhì)的有限次同態(tài)加密轉(zhuǎn)換成全同態(tài)加密的方案,是密碼學(xué)界的一個(gè)突破。從表1可以看出它獲得了最多的引用次數(shù),早期的全同態(tài)加密方案[59,61,73-77]都依照Gentry的方法,但是這些方案實(shí)用性很低。文獻(xiàn)[59]在Gentry方法的基礎(chǔ)上提出了基于整數(shù)的全同態(tài)加密,但是依然存在效率過低的缺點(diǎn)。Brakerski 和Vaikuntanathan 在2011 年提出了基于LWE(learning with errors)全同態(tài)加密方案[60],將全同態(tài)加密建立在格上標(biāo)準(zhǔn)困難問題LWE 之上。這篇文章有效地降低了電路的復(fù)雜性,但是仍然需要自舉來完成全同態(tài)加密。2011年,Brakerski、Gentry 和Vaikuntanathan 提出BGV 全同態(tài)加密方案[78],該方案無需自舉就可以獲得層次性全同態(tài)加密方案,為全同態(tài)加密方案走向?qū)嵺`奠定了基礎(chǔ)。在2013 年,Gentry 等人發(fā)表了一篇利用近似特征向量設(shè)計(jì)全同態(tài)加密的論文即GSW 方案[66],使得全同態(tài)加密方案變得非常簡單。在此基礎(chǔ)上全同態(tài)加密理論研究又得到進(jìn)一步發(fā)展,這也是圖1中論文數(shù)量在2014年迅速增加的原因。
表1 前15引用的全同態(tài)加密論文Table 1 Top 15 fully homomorphic encryption articles with highest citations
研究全同態(tài)加密形勢的一個(gè)重要途徑是了解它被哪些國家和科研機(jī)構(gòu)所重視,將WoS 中整理出的數(shù)據(jù)導(dǎo)入CiteSpace,根據(jù)發(fā)文數(shù)量列出排在前10 的國家及其重要因子,如表2所示。
表2 發(fā)文量前10的國家及其重要性Table 2 Top 10 countries in terms of number of articles published and their importance
從表2 中可以看出,美國的發(fā)文量比中國多出12篇,位居首位,而第二名中國比法國多出了142篇,說明我國和美國在全同態(tài)加密的研究中占據(jù)了重要的地位,也表明了我國學(xué)者在全同態(tài)加密領(lǐng)域展開了深入的研究,活躍程度很高。重要因子表示了一個(gè)國家在這個(gè)領(lǐng)域的重要程度,美國以0.53 位居首位,我國雖然發(fā)文量與美國只有12篇的差距,但是重要因子比美國低了0.18之多,這說明美國在同態(tài)加密領(lǐng)域的研究影響力是最高的。法國的總發(fā)文量只有中國的30.7%,但其重要因子僅比中國低0.07,這說明在全同態(tài)加密領(lǐng)域中國雖然文章數(shù)量很多,但是還要加強(qiáng)創(chuàng)新性的研究。
在本節(jié)中通過CiteSpace對研究機(jī)構(gòu)進(jìn)行分析。圖中節(jié)點(diǎn)越大,機(jī)構(gòu)名稱越大,表明發(fā)表的文章越多,而連線表明了機(jī)構(gòu)間的合作關(guān)系。從知網(wǎng)中數(shù)據(jù)形成的機(jī)構(gòu)合作看出,主要形成了以中國科學(xué)院信息工程研究所信息安全國家重點(diǎn)實(shí)驗(yàn)室、信息工程大學(xué)及南京郵電大學(xué)計(jì)算機(jī)學(xué)院為中心的合作網(wǎng)絡(luò),證明了他們與其他研究機(jī)構(gòu)之間有良好的合作關(guān)系。而武警工程大學(xué)密碼工程學(xué)院雖然論文也較多,但是合作機(jī)構(gòu)太少,這是圖中普遍的現(xiàn)象。對圖2進(jìn)一步觀察發(fā)現(xiàn),知網(wǎng)數(shù)據(jù)中的研究機(jī)構(gòu)連線較少,說明各個(gè)機(jī)構(gòu)在全同態(tài)加密領(lǐng)域還沒有形成一個(gè)整體,還有很多機(jī)構(gòu)是在獨(dú)立地進(jìn)行研究。因此國內(nèi)各個(gè)研究機(jī)構(gòu)之間要加強(qiáng)合作,加強(qiáng)交流,集思廣益地推動全同態(tài)加密算法的創(chuàng)新發(fā)展。
圖2 知網(wǎng)中全同態(tài)加密領(lǐng)域研究機(jī)構(gòu)合作圖Fig.2 Collaboration chart of research institutions on full homomorphic encryption in CNKI
由于WoS 中文獻(xiàn)數(shù)據(jù)較多,將顯示機(jī)構(gòu)名稱的閾值設(shè)置為4。從圖3 中可以看出,WoS 文獻(xiàn)數(shù)據(jù)中各個(gè)機(jī)構(gòu)間的連線非常繁多,表明他們之間合作緊密。為了進(jìn)一步地分析WoS 中各個(gè)研究機(jī)構(gòu)的文章數(shù)目,論文數(shù)量前10 的機(jī)構(gòu)如表3 所示。在發(fā)文量前10 中,美國有4所研究機(jī)構(gòu),中國有2家研究機(jī)構(gòu),其中西安電子科技大學(xué)發(fā)表文章數(shù)量最多,有27篇。
圖3 WoS中全同態(tài)加密領(lǐng)域研究機(jī)構(gòu)合作Fig.3 Collaboration chart of research institutions on full homomorphic encryption in WoS
表3 WoS中發(fā)文量前10的研究機(jī)構(gòu)Table 3 Top 10 research institutions in terms of number of articles in WoS
本文根據(jù)WoS 索引所覆蓋的不同領(lǐng)域?qū)λ袡z索到的全同態(tài)加密論文進(jìn)行了分類。圖4 顯示了WoS 根據(jù)每個(gè)研究領(lǐng)域的全同態(tài)加密論文的總數(shù)排名。圖4所示全同態(tài)加密覆蓋最多的學(xué)科是計(jì)算機(jī)科學(xué)有705篇論文,其次是工程學(xué)有277 篇論文,超過50 篇以上的還有數(shù)學(xué)和電信,分別有143 篇和62 篇。從中可以看出,計(jì)算機(jī)科學(xué)是全同態(tài)加密覆蓋最多也是最重要的領(lǐng)域。當(dāng)然,每篇論文可能涵蓋一個(gè)以上的研究領(lǐng)域。在知網(wǎng)當(dāng)中所覆蓋的領(lǐng)域基本與WoS 索引所覆蓋的類似,計(jì)算機(jī)科學(xué)占比最大,達(dá)到111次,但是排第二的是信息通信領(lǐng)域,有71 次,第三的是電氣工程,僅有3 次。具體情況見圖5。
圖4 WoS索引全同態(tài)加密論文所覆蓋的研究領(lǐng)域Fig.4 Research areas covered by fully homomorphic encryption articles in WoS
圖5 知網(wǎng)索引全同態(tài)加密論文所覆蓋的研究領(lǐng)域Fig.5 Research areas covered by fully homomorphic encryption articles in CNKI
表4 列出了WoS 索引中發(fā)表全同態(tài)加密論文最多的出版物。在發(fā)表至少10篇論文以上的重要期刊與會議中,其中Lecture Notes in Computer Science(LNCS)是收錄最多的,有239 篇。而在LNCS 中,發(fā)表論文最多的是Advances in Cryptology Eurocrypt,有48 篇。而LNCS中發(fā)表文章最多的5個(gè)會議或期刊在表5中也已列出。為了衡量它們對全同態(tài)加密研究領(lǐng)域的影響,還根據(jù)一些其他的因素評估了這些刊物與會議,比如引用數(shù),結(jié)果表明LNCS 依然是最優(yōu)的。表6 顯示了在知網(wǎng)中的同態(tài)加密領(lǐng)域發(fā)表超過7 篇論文的重要期刊,《密碼學(xué)報(bào)》的數(shù)量有12 篇,是最多的,而《計(jì)算機(jī)應(yīng)用研究》是引用次數(shù)最多的,有190 次。從中可以看出知網(wǎng)論文的引用次數(shù)比WoS中要少。
表4 WoS索引中全同態(tài)加密發(fā)表最多的出版物Table 4 Most published publications for fully homomorphic encryption in WoS
表5 LNCS中發(fā)表文章最多的前5名Table 5 Top 5 most published in LNCS
表6 知網(wǎng)索引中全同態(tài)加密發(fā)表最多的刊物Table 6 Most published journals for fully homomorphic encryption in CNKI
圖6 顯示了有關(guān)的基金資助機(jī)構(gòu)的詳細(xì)信息。在WoS分析研究的826篇論文中,中國國家自然科學(xué)基金委員會(National Natural Science Foundation of China)資助的論文最多,有143 篇論文,另外的69 篇論文得到了美國NSF 的資助。本文還根據(jù)每個(gè)基金資助機(jī)構(gòu)的論文引用總數(shù)來對這些資助機(jī)構(gòu)進(jìn)行評估。從圖6 可以看出,與其他機(jī)構(gòu)支持的論文相比,由DARPA(美國國防高級研究計(jì)劃局)資助的論文獲得了更高的引用比,為90%,被引用文章數(shù)最多的是中國國家自然科學(xué)基金委員會,有88篇。
圖6 WoS中主要資助機(jī)構(gòu)發(fā)文數(shù)與被引用文章數(shù)比較Fig.6 Comparison of number of articles published and cited by major funding institutions in WoS
在知網(wǎng)查詢中發(fā)現(xiàn),同樣是中國國家自然科學(xué)基金資助的論文最多,有88篇,其余如國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)、浙江省自然科學(xué)基金等與之相比差距都過大。具體情況如圖7所示。
圖7 知網(wǎng)中主要資助機(jī)構(gòu)發(fā)文數(shù)與被引用文章數(shù)比較Fig.7 Comparison of number of articles published and cited by major funding institutions in CNKI
全同態(tài)加密在不同的領(lǐng)域中都有廣泛的應(yīng)用,在對WoS 與知網(wǎng)中的文獻(xiàn)進(jìn)行篩選后,根據(jù)它們應(yīng)用的方向,將其分為七類,即機(jī)器學(xué)習(xí)、大數(shù)據(jù)、物聯(lián)網(wǎng)、智能電網(wǎng)、電子醫(yī)療健康、生物特征、基因組數(shù)據(jù),見表7。如表8~表14,列出了對應(yīng)的應(yīng)用領(lǐng)域在WoS 數(shù)據(jù)庫中的代表性文章。
表7 WoS與知網(wǎng)索引中全同態(tài)加密的主要應(yīng)用方向Table 7 Main application directions of fully homomorphic encryption in WoS and CNKI
表8 WoS中全同態(tài)加密在大數(shù)據(jù)應(yīng)用中的代表文章Table 8 Representative articles on full homomorphic encryption for big data applications in WoS
表9 WoS中全同態(tài)加密在物聯(lián)網(wǎng)應(yīng)用中的代表文章Table 9 Representative articles on full homomorphic encryption for Internet of things applications in WoS
表10 WoS中全同態(tài)加密在基因組數(shù)據(jù)中的代表文章Table 10 Representative articles on full homomorphic encryption for genomic data applications in WoS
表11 WoS中全同態(tài)加密在智能電網(wǎng)應(yīng)用中的代表文章Table 11 Representative articles on full homomorphic encryption for smart grid applications in WoS
表12 WoS中全同態(tài)加密在機(jī)器學(xué)習(xí)應(yīng)用中的代表文章Table 12 Representative articles on full homomorphic encryption for machine learning applications in WoS
表13 WoS中全同態(tài)加密在醫(yī)療健康應(yīng)用中的代表文章Table 13 Representative articles on full homomorphic encryption for medical health applications in WoS
表14 WoS中全同態(tài)加密在生物特征應(yīng)用中的代表文章Table 14 Representative articles on full homomorphic encryption for biological characteristics applications in WoS
從表7中可以看出,隨著近幾年來人工智能領(lǐng)域的發(fā)展與大數(shù)據(jù)時(shí)代的到來,需要收集大量的數(shù)據(jù),而用戶對個(gè)人的資料、隱私很敏感。因此全同態(tài)加密在機(jī)器學(xué)習(xí)和大數(shù)據(jù)領(lǐng)域有廣泛的應(yīng)用需求。文獻(xiàn)[79-80]探討相關(guān)問題并給出了解決方案。與此同時(shí),世界各地的許多數(shù)據(jù)庫都存儲著大量的基因組數(shù)據(jù),自愿提供基因組數(shù)據(jù)的患者隱私也是需要保護(hù)的,同樣包括醫(yī)療數(shù)據(jù)的隱私保護(hù),文獻(xiàn)[81-82]探討相關(guān)問題的解決方案。目前,物聯(lián)網(wǎng)在各個(gè)行業(yè)比如供應(yīng)鏈、智能家居、智能電網(wǎng)等方面應(yīng)用廣泛,對數(shù)據(jù)隱私的處理提出高要求,全同態(tài)加密是處理相關(guān)問題的有效方法。
本文采用了WoS 數(shù)據(jù)庫和知網(wǎng)數(shù)據(jù)庫,對全同態(tài)加密的文獻(xiàn)進(jìn)行了深度的文獻(xiàn)計(jì)量分析。從文獻(xiàn)計(jì)量研究中提取的結(jié)果分析表明,自從2014 年以來全同態(tài)加密的論文快速增長,研究成果豐富,這種趨勢還會繼續(xù)保持下去。我國已經(jīng)是全同態(tài)加密領(lǐng)域發(fā)文量最多的國家,但是文章的影響力相對較弱,各個(gè)機(jī)構(gòu)的聯(lián)系不夠緊密,需要加強(qiáng)合作。
全同態(tài)加密論文主要包涵了計(jì)算機(jī)科學(xué)、工程學(xué)、通信和數(shù)學(xué)這四個(gè)基礎(chǔ)研究領(lǐng)域,本文的研究結(jié)果為學(xué)術(shù)界和工業(yè)界提供了一個(gè)觀察前沿發(fā)展的視角。那些高引用的論文為年輕的研究人員提供了進(jìn)一步研究全同態(tài)加密的路徑,比如研究方法,有哪些研究的熱點(diǎn)和成果等。
從世界范圍上來看,中國和美國是全同態(tài)加密研究領(lǐng)域最活躍的國家。中國已經(jīng)是發(fā)表全同態(tài)加密文章最多的國家,大量的全同態(tài)加密研究受到了國家和各級政府部門的支持,中國國家自然科學(xué)基金委員會資助了大量的SCI索引和知網(wǎng)檢索中的論文,對全同態(tài)加密的研究提供了良好的支持,為學(xué)術(shù)界和工業(yè)界提供了技術(shù)積累。但是我國在全同態(tài)加密領(lǐng)域發(fā)表的高引用論文卻很少,文章的質(zhì)量與影響力還需提高。最后,從各個(gè)領(lǐng)域中的研究趨勢來看,機(jī)器學(xué)習(xí)、大數(shù)據(jù)、電子醫(yī)療健康以及物聯(lián)網(wǎng)是國內(nèi)外的全同態(tài)加密應(yīng)用的主要領(lǐng)域。