隨著大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,人工智能已廣泛滲透到科學(xué)研究、數(shù)字經(jīng)濟、健康與醫(yī)療衛(wèi)生等各大領(lǐng)域,給人類生產(chǎn)生活帶來了極大的便利.機器學(xué)習的模型訓(xùn)練和推理預(yù)測都依賴于大規(guī)模數(shù)據(jù)集,而這些數(shù)據(jù)中可能包含著用戶的敏感或隱私信息.針對人工智能中日益加劇的數(shù)據(jù)安全與隱私保護需求,國內(nèi)外學(xué)者獲得了一系列重要研究成果.然而,如何在保護用戶數(shù)據(jù)安全的同時,實現(xiàn)人工智能技術(shù)的高可用性和高效性仍然是學(xué)術(shù)界和工業(yè)界廣泛關(guān)注的具有挑戰(zhàn)性的研究課題.
為進一步推動我國學(xué)者在數(shù)據(jù)安全與智能隱私保護領(lǐng)域的研究,及時報道我國學(xué)者在數(shù)據(jù)安全與智能隱私保護方面的最新研究成果,我們組織策劃了“數(shù)據(jù)安全與智能隱私保護研究”專題.本專題通過公開征文共收到2篇特邀投稿和78篇普通投稿,論文分別從多個方面闡述了數(shù)據(jù)安全理論基礎(chǔ)與應(yīng)用及智能隱私保護關(guān)鍵支撐技術(shù)研究領(lǐng)域具有重要意義的研究成果.本專題的審稿嚴格按照《計算機研究與發(fā)展》期刊的審稿要求進行,特邀編委先后邀請了近百位相關(guān)領(lǐng)域的專家參與評審,每篇論文邀請至少3~4位專家進行評審,歷經(jīng)初審、復(fù)審、終審等階段,整個流程歷經(jīng)一個半月,最終共錄用文章20篇(含2篇特邀稿件).這20篇文章分別涵蓋數(shù)據(jù)安全、智能隱私保護等研究內(nèi)容,在一定程度上反映了當前國內(nèi)各單位在數(shù)據(jù)安全與智能隱私保護領(lǐng)域的主要研究方向.由于刊物單期容量所限,本專題將刊登在2022年第10期(16篇)和第11期(4篇).
本部分共收錄了4篇綜述.
在萬物互聯(lián)的智能時代下,以深度學(xué)習為代表的人工智能技術(shù)正全方位改變?nèi)祟惖纳a(chǎn)和生活方式.與此同時,云邊端計算架構(gòu)的成熟和發(fā)展使得邊緣計算正在日益走向智能時代的舞臺中央,輕量化模型在計算資源受限的嵌入式和物聯(lián)網(wǎng)設(shè)備大規(guī)模部署和運行.雖然人工智能技術(shù)日益流行,但算法的魯棒脆弱性及易受對抗攻擊等特點也給人工智能系統(tǒng)的廣泛應(yīng)用帶來了極大的安全隱患.針對此問題,國內(nèi)外學(xué)術(shù)界和工業(yè)界已經(jīng)開展了人工智能安全的相關(guān)研究,其中針對深度學(xué)習的對抗攻御研究已成為了當前的熱點研究.李前等人的綜述文章“云邊端全場景下深度學(xué)習模型對抗攻擊和防御”一文聚焦于云邊端全場景下的人工智能技術(shù)安全問題,分別整理歸納了針對大型網(wǎng)絡(luò)和輕量化網(wǎng)絡(luò)的對抗攻防御技術(shù),對相關(guān)理論與研究方法進行了系統(tǒng)性的綜述研究.首先,論文介紹了幾類主流的對抗攻擊生成方法.其次,論文從魯棒先驗視角出發(fā),將現(xiàn)有對抗防御工作分為基于對抗訓(xùn)練的防御、基于正則化的防御、基于對抗樣本檢測和去噪的防御以及基于模型結(jié)構(gòu)的防御四大類.論文對現(xiàn)有的研究工作進行了系統(tǒng)總結(jié)和科學(xué)歸納,分析了當前研究的優(yōu)勢和不足.最后,論文探討了在云邊端全場景下深度學(xué)習模型對抗攻擊和防御研究當前所面臨的挑戰(zhàn)以及未來潛在的研究方向.論文旨在為后續(xù)深度學(xué)習模型對抗魯棒性領(lǐng)域的研究者提供幫助,并進一步推動該領(lǐng)域的研究和發(fā)展.
隨著全球數(shù)字化進程逐漸加快,數(shù)據(jù)已經(jīng)成為當今社會重要的生產(chǎn)要素.數(shù)據(jù)的流動為社會創(chuàng)造了無窮的價值,但也潛藏著巨大的隱私風險.隨著歐盟通用數(shù)據(jù)保護條例(GDPR)的出臺,個人數(shù)據(jù)安全成為了大數(shù)據(jù)時代下的敏感話題,也越來越受到研究人員的重視.趙景欣等人的綜述文章“基于通用數(shù)據(jù)保護條例的數(shù)據(jù)隱私安全綜述”一文對數(shù)據(jù)隱私安全發(fā)展歷程進行了回顧,介紹了歐盟數(shù)據(jù)保護條例GDPR及其應(yīng)用領(lǐng)域和影響.歸納分析了近幾年國內(nèi)外相關(guān)研究文獻,將GDPR合規(guī)問題劃分為3個方面:GDPR違規(guī)行為分析、隱私政策分析、GDPR模型框架,并分析了這3個方面的研究現(xiàn)狀.總結(jié)分析了基于GDPR的數(shù)據(jù)技術(shù),包括數(shù)據(jù)保護影響評估、數(shù)據(jù)分類分級和數(shù)據(jù)跨境流動3個方面,并分別探討了GDPR在區(qū)塊鏈、物聯(lián)網(wǎng)等具體領(lǐng)域的應(yīng)用.最后,根據(jù)對現(xiàn)有研究工作存在的不足與問題,指出了基于GDPR的數(shù)據(jù)隱私安全研究面臨的主要挑戰(zhàn)和機遇,并針對中國數(shù)據(jù)隱私保護提出了5點啟示.
近年來,以深度學(xué)習為代表的人工智能技術(shù)在金融安防、自動駕駛、醫(yī)療診斷等領(lǐng)域取得了較為成功地應(yīng)用.然而,圖像分類作為上述應(yīng)用中的一項基礎(chǔ)視覺任務(wù),正接受著對抗攻擊等技術(shù)手段帶來的巨大安全隱患.提高深度學(xué)習模型抵御對抗攻擊的能力(即對抗魯棒性)成為有效緩解該問題的可行技術(shù)途徑.為了科學(xué)、全面地提升深度學(xué)習模型的對抗魯棒性,眾多學(xué)者從基準評估和指標評估2個角度圍繞對抗魯棒性評估開展了大量研究.李自拓等人的綜述文章“面向圖像分類的對抗魯棒性評估綜述”一文著重對上述指標評估相關(guān)研究進行綜述.首先,介紹對抗樣本相關(guān)概念以及存在的原因,總結(jié)提出進行對抗魯棒性評估時需要遵循的評估準則;其次,從被攻擊模型和測試數(shù)據(jù)2個維度,重點梳理和對比分析現(xiàn)有的主要對抗魯棒性評估指標;而后,分析總結(jié)現(xiàn)階段主流的圖像分類數(shù)據(jù)集和對抗攻防集成工具,為后續(xù)開展對抗魯棒性評估奠定基礎(chǔ);最后,探討當前研究的優(yōu)勢和不足,以及未來潛在的研究方向.
近年來物聯(lián)網(wǎng)安全事件頻發(fā),物聯(lián)網(wǎng)安全得到了廣泛的關(guān)注,物聯(lián)網(wǎng)訪問控制作為物聯(lián)網(wǎng)生態(tài)系統(tǒng)中重要的安全機制發(fā)揮著舉足輕重的作用.但物聯(lián)網(wǎng)架構(gòu)復(fù)雜、設(shè)備多樣且存儲與計算性能較低,難以建立統(tǒng)一的訪問控制體系,現(xiàn)有的互聯(lián)網(wǎng)訪問控制策略無法直接應(yīng)用在物聯(lián)網(wǎng)中.目前已經(jīng)有研究人員提出了諸多物聯(lián)網(wǎng)訪問控制方案,但并未重視其中的安全性問題,由于物聯(lián)網(wǎng)與人類生產(chǎn)生活息息相關(guān),其訪問控制一旦被打破,將造成隱私數(shù)據(jù)泄露、權(quán)限濫用等嚴重后果,亟需對物聯(lián)網(wǎng)訪問控制的安全性問題與解決方案進行綜合研究.劉奇旭等人的綜述文章“物聯(lián)網(wǎng)訪問控制安全性綜述”一文根據(jù)物聯(lián)網(wǎng)的特性,梳理了物聯(lián)網(wǎng)訪問控制中的信任關(guān)系,論述了信任鏈中的風險傳遞規(guī)律.并圍繞信任鏈,從感知層、網(wǎng)絡(luò)層、應(yīng)用層分別綜述了現(xiàn)有的訪問控制攻擊面,分析了存在的安全風險.針對這些安全風險,提出了應(yīng)有的訪問控制安全性要求,并總結(jié)了現(xiàn)有的安全性解決方案.論文在最后討論了物聯(lián)網(wǎng)訪問控制設(shè)計中所面臨的挑戰(zhàn),指出了未來的研究方向.
本部分共收錄了8篇論文,主要圍繞區(qū)塊鏈隱私保護、云安全審計、隱私集合求交、可搜索加密、差分隱私等研究方向展開.
在基于區(qū)塊鏈的群智感知系統(tǒng)中構(gòu)建數(shù)據(jù)真值估計機制和用戶激勵機制受到了越來越多的關(guān)注.與傳統(tǒng)的群智感知系統(tǒng)依賴一個集中平臺來承載數(shù)據(jù)感知任務(wù)不同,該系統(tǒng)利用區(qū)塊鏈分布式結(jié)構(gòu)和操作透明不可抵賴的特性,使其具有更好的安全性和交互性.但是目前的研究總是獨立分離設(shè)計數(shù)據(jù)真值估計機制和參與者激勵機制,這導(dǎo)致2類機制在實際應(yīng)用時往往具有局限性.應(yīng)臣浩等人的文章“區(qū)塊鏈群智感知中基于隱私數(shù)據(jù)真值估計的激勵機制”一文在綜合考慮了數(shù)據(jù)真值估計精確度與用戶激勵后,提出了一類基于隱私保護數(shù)據(jù)真值估計的用戶激勵機制.該機制由2個模塊組成,即具有隱私保護的數(shù)據(jù)真值估計模塊PATD和具有隱私保護的用戶激勵模塊PFPI,這2個模塊都是通過利用同態(tài)加密機制CKKS來構(gòu)建的.論文進行了大量實驗來驗證所提的基于隱私保護數(shù)據(jù)真值估計的用戶激勵機制的各種特性.實驗結(jié)果表明,該機制與最新方法相比具有更好的性能.
支付通道網(wǎng)絡(luò)作為區(qū)塊鏈的擴容手段受到廣泛關(guān)注.然而,目前對支付通道網(wǎng)絡(luò)的路由研究主要集中在路徑連通性、通道利用率等方面,缺乏對節(jié)點信譽引起的路由安全風險及可能支付的高昂跨鏈服務(wù)中間手續(xù)費用影響小額支付發(fā)起者擇路偏好的具體考量.張謙等人的文章“多因素反向拍賣的跨鏈支付路由方案”一文定義了節(jié)點質(zhì)量評價函數(shù),包括節(jié)點手續(xù)費報價、網(wǎng)絡(luò)距離和歷史信譽,設(shè)計了多因素反向Vickrey拍賣(multi-factor reverse auction, MFRA)的路由方案,以實現(xiàn)跨鏈支付路由過程中基于候選中間節(jié)點質(zhì)量的綜合選擇.建立了候選節(jié)點的等價投標函數(shù),用于將節(jié)點質(zhì)量中的非價格屬性因素轉(zhuǎn)化為價格屬性,并引入了以2為基數(shù)的指數(shù)機制實現(xiàn)對于等效投標價格的差分隱私,保障了參與節(jié)點的報價不被泄露.安全性分析和性能評估表明,MFRA路由方案在降低節(jié)點手續(xù)費開銷的同時,可以有效保障交易參與節(jié)點的報價隱私,實現(xiàn)快速高效的多跳跨鏈支付.
云存儲提供數(shù)據(jù)托管服務(wù),解決了本地端數(shù)據(jù)管理與分享受限問題.但現(xiàn)有用于確保云存儲數(shù)據(jù)完整性的審計方案面臨一個重要的安全問題:簽名密鑰一旦泄露,依賴于該密鑰產(chǎn)生簽名的審計方案將無法提供完整性保護.此外,現(xiàn)有審計方案均默認在整個審計期間僅有一個審計者,然而審計者可能由于被攻陷、被賄賂或資源不足不能再提供審計代理服務(wù).周磊等人的文章“支持密鑰更新與審計者更換的云安全審計方案”一文提出一個支持密鑰更新與審計者更換的審計方案AKUAR.針對密鑰暴露導(dǎo)致簽名無效的問題,AKUAR結(jié)合雙線性對與代理重簽名思想設(shè)計了高效安全的密鑰與標簽更新機制,并且由云端承擔計算復(fù)雜的標簽更新操作,僅在本地端引入了少量的開銷.此外,當充當審計者的霧節(jié)點退出審計時,新的霧節(jié)點可以代替其繼續(xù)進行完整性審計工作,在保證新簽名密鑰不被泄露給舊霧節(jié)點的同時實現(xiàn)了審計服務(wù)的可持續(xù)性.安全分析證明了AKUAR是安全的,性能評估也證實了AKUAR在標簽生成與密鑰更新階段僅引入了少量可接受的計算開銷與通信開銷.
本地差分隱私具有不需要可信第三方、交互少、運行效率高等優(yōu)點,近年來受到了廣泛關(guān)注.然而,現(xiàn)有本地差分隱私集合數(shù)據(jù)頻率估計機制未能考慮數(shù)據(jù)的隱私敏感度差異,將所有數(shù)據(jù)同等對待,這會對非敏感數(shù)據(jù)保護過強,導(dǎo)致估計結(jié)果準確度低.曹依然等人的文章“效用優(yōu)化的本地差分隱私集合數(shù)據(jù)頻率估計機制”一文定義了集合數(shù)據(jù)效用優(yōu)化本地差分隱私(set-valued data utility-optimized local differential privacy, SULDP)模型,考慮了原始數(shù)據(jù)域同時包含敏感值和非敏感值的情況,在不減弱對敏感值保護的前提下,允許降低對非敏感值的保護.進一步,提出了符合SULDP模型5種頻率估計機制suGRR,suGRR-Sample,suRAP,suRAP-Sample和suWheel,理論分析證實,相對于現(xiàn)有的本地差分隱私機制,所提方案能夠?qū)γ舾袛?shù)據(jù)實現(xiàn)完全相同的保護效果,并通過降低非敏感數(shù)據(jù)的保護效果,實現(xiàn)了頻率估計結(jié)果的準確度提升.
整體結(jié)構(gòu)是分組密碼的重要特征,也是首要的研究對象,對于分組密碼的輪數(shù)選取、軟硬件實現(xiàn)性能都有非常大的影響.對于類AES算法的設(shè)計,當選用非最優(yōu)分支數(shù)的矩陣作為列混淆操作時,向量置換(即字換位操作)的選擇可有效提高整體結(jié)構(gòu)的安全性.李曉丹等人的文章“uBlock類結(jié)構(gòu)最優(yōu)向量置換的高效搜索”一文通過研究uBlock類結(jié)構(gòu)的特點及其擴散性,給出了其全擴散輪數(shù)的下界及等價類劃分準則,提出了一種uBlock類結(jié)構(gòu)最優(yōu)向量置換的搜索策略.依據(jù)全擴散輪數(shù)最優(yōu)、超級擴散層的分支數(shù)最優(yōu)及uBlock類結(jié)構(gòu)擴散層的特殊性質(zhì),證明了左右向量置換都不能是恒等變換,給出了uBlock類結(jié)構(gòu)的一系列最優(yōu)向量置換.該搜索策略大幅度減少了需要測試的置換對,為后續(xù)uBlock類算法的設(shè)計提供技術(shù)支持.
隱私集合交集(private set intersection, PSI)允許持有私有集合的參與方安全地獲得集合的交集,而不會泄露除交集之外任何元素的信息.現(xiàn)有的兩方/多方PSI協(xié)議大多基于不經(jīng)意傳輸(oblivious transfer, OT)協(xié)議,具有很高計算效率的同時,也帶來了巨大通信開銷.在很多場景中,擴展網(wǎng)絡(luò)帶寬是非常昂貴甚至不可行的,而目前不依賴于OT設(shè)計且計算高效的多方PSI協(xié)議仍然較少.張蕾等人的文章“高效且惡意安全的三方小集合隱私交集計算協(xié)議”一文基于一輪密鑰協(xié)商構(gòu)造了三方參與的PSI計算協(xié)議,分別在半誠實模型和惡意安全性模型下,證明了協(xié)議的安全性且允許任意兩方的合謀攻擊.通過實驗仿真,在大集合場景,相比現(xiàn)有基于OT的多方PSI協(xié)議,本協(xié)議具有最優(yōu)的通信輪數(shù)且通信量降低了89%~98%;在小集合場景(500個元素或更少),相比適用弱通信網(wǎng)絡(luò)的同類PSI協(xié)議,具有最優(yōu)運行時間和通信負載,比依賴于同態(tài)加密的PSI協(xié)議快10~25倍.
基于混合整數(shù)線性規(guī)劃(MILP)的自動化搜索方法被廣泛用于搜索密碼算法的差分特征,已形成一套完整的框架.該框架采用的基本原理是用線性不等式來刻畫密碼算法的各個操作,該框架適用于搜索采用4-bit S盒的密碼算法的差分特征.對于采用8-bit S盒的密碼算法,基于該框架的搜索模型計算量很大,以致無法高效地找到差分特征.SM4算法是2006年由中國政府發(fā)布,于2012年成為國家密碼行業(yè)標準,于2016年成為國家標準的迭代分組密碼算法,其分組狀態(tài)為128比特,每輪包含4個8-bit的S盒.為了高效地搜索SM4算法的差分特征,潘印雪等人的文章“基于MILP尋找SM4算法的差分特征”一文研究了對8-bit S盒進行MILP建模的問題,對于采用8-bit S盒的密碼算法,改進了搜索高概率差分特征的方法.對于19輪SM4算法,不僅找到了概率為2-124的差分特征,而且找到了概率為2-123的差分特征,這是目前基于MILP建模找到的SM4算法輪數(shù)最多、概率最高的差分特征.
近年來,滿足前后向安全的動態(tài)對稱可搜索加密(dynamic symmetric searchable encryption, DSSE)一直備受關(guān)注,它可以抵抗文件注入攻擊,同時限制服務(wù)器學(xué)習已刪除文檔的相關(guān)信息.不過大多數(shù)滿足前后向安全的DSSE方案僅支持單關(guān)鍵詞搜索,Patranabis等人在NDSS 2021會議上提出了一種支持聯(lián)合搜索且滿足前后向安全的動態(tài)可搜索加密方案,但該方案在某些情況下不能得到準確的查詢結(jié)果,同時不能支持多用戶查詢.針對以上問題,張藍藍等人的文章“一種支持聯(lián)合搜索的多用戶動態(tài)對稱可搜索加密方案”一文改進了不經(jīng)意交叉索引(oblivious cross tags, OXT)協(xié)議,提出了一種支持聯(lián)合搜索的多用戶動態(tài)對稱可搜索加密方案.該方案利用有限域中元素具有乘法逆元的性質(zhì),引入了一次性盲因子,并結(jié)合數(shù)字信封技術(shù)實現(xiàn)了多客戶端查詢的功能.方案分析與實驗表明,論文所提方案滿足了前向安全與后向安全,不僅可以提供準確的聯(lián)合查詢功能,而且支持多客戶端查詢,同時計算效率僅與更新次數(shù)最低的關(guān)鍵詞更新次數(shù)有關(guān).
本部分共收錄了8篇論文,主要圍繞隱私保護機器學(xué)習、智能網(wǎng)絡(luò)入侵檢測、聯(lián)邦學(xué)習、深度學(xué)習等研究方向展開.
開放網(wǎng)絡(luò)下分布式深度學(xué)習的興起帶來潛在數(shù)據(jù)泄露風險.作為分布式模型構(gòu)建中的重要信息載體,訓(xùn)練梯度是模型和端側(cè)數(shù)據(jù)共同計算的產(chǎn)物,包含參與計算的私密用戶數(shù)據(jù)信息.因此,近年的研究工作針對訓(xùn)練梯度提出一系列新型攻擊方法,尤以數(shù)據(jù)重建攻擊(data reconstruction attack)所造成的攻擊效果為最.然而,已有數(shù)據(jù)重建攻擊大多僅停留在攻擊方法設(shè)計和實驗驗證層面,對重要實驗現(xiàn)象缺乏深層機理分析.盡管有研究發(fā)現(xiàn),滿足特定神經(jīng)元激活獨占性(exclusivity)條件的任意大小訓(xùn)練數(shù)據(jù)批次能被攻擊者從訓(xùn)練梯度中像素級重建,然而,潘旭東等人的文章“基于神經(jīng)元激活模式控制的深度學(xué)習訓(xùn)練數(shù)據(jù)泄露誘導(dǎo)”一文實證研究表明在實際訓(xùn)練數(shù)據(jù)中滿足該條件的訓(xùn)練數(shù)據(jù)批次比例較少,難以造成實際泄露威脅,并提出基于線性規(guī)劃的神經(jīng)元激活模式控制算法,為給定訓(xùn)練批次生成微小擾動,從而滿足神經(jīng)元激活獨占性,以增強后續(xù)數(shù)據(jù)重建攻擊效能.在實際中,通過在端側(cè)節(jié)點部署該算法,半誠實(honest-but-curious)分布式訓(xùn)練服務(wù)能誘導(dǎo)本地訓(xùn)練批次的訓(xùn)練梯度具有理論保證的可重建性.在5個涵蓋人臉識別、智能診斷的數(shù)據(jù)集上的實驗結(jié)果表明,提出方法在與原始攻擊算法重建效果持平的情況下,將可重建訓(xùn)練批次大小從8張?zhí)嵘翆嶋H應(yīng)用大小,并提升攻擊效率10倍以上.
近幾年數(shù)據(jù)安全和隱私泄露事件不斷增加,使得目前的機器學(xué)習面臨著嚴重的隱私泄露問題,結(jié)合密碼學(xué)工具設(shè)計高效的隱私保護機器學(xué)習方案成為廣受關(guān)注的研究領(lǐng)域.目前相關(guān)的Trident和Swift方案中,前者為了提高方案的在線階段的效率,需要額外引入一個誠實參與方,但當參與方中存在惡意行為時協(xié)議就會中止,用戶就會得不到任何的輸出,不適用于外包環(huán)境.后者提出的方案可以選出一個誠實方作為可信第三方繼續(xù)進行計算,保證協(xié)議一定有輸出結(jié)果,但是所有的參與方都會將自己的信息發(fā)送給該參與方,這樣該參與方將會擁有所有用戶的敏感數(shù)據(jù).閻允雪等人的文章“基于秘密分享的高效隱私保護四方機器學(xué)習方案”一文設(shè)計了基于秘密分享的隱私保護四方機器學(xué)習的高效協(xié)議,方案中的4個參與方基于誠實大多數(shù)的原則,不需要額外引入一個誠實方.在協(xié)議的執(zhí)行過程中會選擇出2個參與方作為可信的參與方,并將計算任務(wù)委托給它們來實現(xiàn),不僅能夠更好地保護用戶隱私,而且保證協(xié)議有正確的輸出.通過實驗分析本文提出的方案具備一定的實用性和可行性.
人工智能已被廣泛應(yīng)用于網(wǎng)絡(luò)入侵檢測系統(tǒng),由于流量樣本存在概念漂移現(xiàn)象,系統(tǒng)模型必須頻繁更新以適應(yīng)新的特征分布,更新后模型的有效性依賴新增訓(xùn)練樣本的質(zhì)量.然而目前流量樣本的污染過濾工作仍依賴專家經(jīng)驗,這導(dǎo)致在模型更新過程中存在樣本篩選工作量大、模型準確率不穩(wěn)定、系統(tǒng)易受投毒攻擊等問題.現(xiàn)有工作無法在保證模型性能的同時實現(xiàn)污染過濾或模型修復(fù),為解決上述問題,劉廣睿等人的文章“基于邊緣樣本的智能網(wǎng)絡(luò)入侵檢測系統(tǒng)數(shù)據(jù)污染防御方法”一文為智能網(wǎng)絡(luò)入侵檢測系統(tǒng)設(shè)計了一套支持污染數(shù)據(jù)過濾的通用模型更新方法.其中,所設(shè)計的EdgeGAN算法利用模糊測試使生成對抗網(wǎng)絡(luò)快速擬合模型邊緣樣本分布,并通過檢查新增訓(xùn)練樣本與原模型的MSE值,識別出誤差樣本子集,保證模型平穩(wěn)更新;通過檢查新模型對舊邊緣樣本的Fβ分數(shù),識別出中毒樣本子集,保證分類邊界不因投毒偏斜;通過讓模型學(xué)習惡意邊緣樣本,抑制投毒樣本對模型的影響,保證模型在中毒后快速復(fù)原.在5種典型智能網(wǎng)絡(luò)入侵檢測系統(tǒng)上進行實驗測試,對比現(xiàn)有最先進的算法,該方法對投毒樣本的檢測率平均提升12.50%,對中毒模型的修復(fù)效果平均提升6.38%.
完整性度量框架是可信計算平臺的重要組成部分之一,之前研究工作所提出的完整性度量框架設(shè)計在實際應(yīng)用于嵌入式設(shè)備場景時,往往體現(xiàn)出不同程度的局限性.賈巧雯等人的文章“一種嵌入式Linux系統(tǒng)上的新型完整性度量架構(gòu)”一文提出了DIMAK,一種針對嵌入式Linux操作系統(tǒng)的實用化完整性度量架構(gòu),以期為基于Linux的嵌入式設(shè)備提供有效且高性能的運行時完整性驗證能力.該架構(gòu)支持對映射至系統(tǒng)內(nèi)核空間及用戶進程的可執(zhí)行文本、靜態(tài)數(shù)據(jù)以及動態(tài)鏈接信息等關(guān)鍵內(nèi)容實施即時(Just-In-Time)完整性校驗.利用Linux內(nèi)核的進程/內(nèi)存/頁面管理機制,DIMAK實現(xiàn)了對被度量內(nèi)容所駐留物理頁面的運行時校驗,避免了基于文件的靜態(tài)度量方法可能存在的檢查與使用時差(time-of-check to time-of-use, TOCTTOU)漏洞.通過首次引入對位置無關(guān)代碼的重定位/動態(tài)鏈接信息的完整性基線預(yù)測方法,DIMAK在面對包括基于hooking的控制流劫持、惡意代碼運行時載入等攻擊威脅時具有較之現(xiàn)存同類技術(shù)更強的完備性.另外,通過引入對軟件熱補丁功能的可信驗證支持,DIMAK在系統(tǒng)完整性度量問題中將該應(yīng)用場景與惡意攻擊行為正確地加以區(qū)分.根據(jù)各種被度量實體的不同類型,DIMAK在離線階段、系統(tǒng)啟動時、進程加載時和代碼動態(tài)加載時等時機分別為生成其對應(yīng)的完整性基線,確保其完整性驗證行為的正確性.真機測試顯示,DIMAK架構(gòu)所產(chǎn)生的性能開銷完全可以滿足嵌入式設(shè)備場景下的實際應(yīng)用要求.
隨著企業(yè)、政府以及私人等圖像數(shù)據(jù)資產(chǎn)的不斷增加,機器學(xué)習領(lǐng)域?qū)τ趫D像等分類應(yīng)用需求也隨之不斷增漲.為了應(yīng)對各種實際的需求,機器學(xué)習即服務(wù)(machine learning as a service, MLAAS)的云服務(wù)部署思想逐漸成為主流.然而,基于云服務(wù)實現(xiàn)的應(yīng)用往往會帶來嚴重的數(shù)據(jù)隱私安全問題,金歌等人的文章“FPCBC:基于眾包聚合的聯(lián)邦學(xué)習隱私保護分類系統(tǒng)”一文將分類任務(wù)眾包給多個邊緣參與方并借助云計算來完成,不過我們不再使用聯(lián)合訓(xùn)練理想模型的方式來得到可信度高的分類結(jié)果,而是讓參與方先根據(jù)本地有限數(shù)據(jù)訓(xùn)練出的模型進行推理,然后我們再使用成熟的算法對推理結(jié)果聚合得到較高準確率的分類.重要的是,我們保證了數(shù)據(jù)查詢方不會泄露任何隱私數(shù)據(jù),很好地解決了傳統(tǒng)MLAAS的隱私安全問題.在系統(tǒng)實現(xiàn)中,我們使用同態(tài)加密來對需要進行機器學(xué)習推理的圖像數(shù)據(jù)進行加密;改善了一種眾包的聯(lián)邦學(xué)習分類算法,并通過引入雙服務(wù)器機制來實現(xiàn)整個系統(tǒng)的隱私保護計算.通過實驗和性能分析表明了該系統(tǒng)的可行性,且隱私保護的安全程度得到了顯著提升.
深度學(xué)習技術(shù)的快速發(fā)展給我們帶來了極大的便利,但同時也導(dǎo)致大量隱私數(shù)據(jù)的泄露.聯(lián)邦學(xué)習允許客戶端在只共享梯度的情況下聯(lián)合訓(xùn)練模型,這看似解決了隱私泄露問題,但研究表明聯(lián)邦學(xué)習框架中傳輸?shù)奶荻纫廊粫?dǎo)致隱私信息泄露.并且,聯(lián)邦學(xué)習的高通信代價的特點難以適用于資源受限的環(huán)境.為此,陳律君等人的文章“基于秘密共享和壓縮感知的通信高效聯(lián)邦學(xué)習”一文提出了2個通信高效且安全的聯(lián)邦學(xué)習算法,算法使用Top-K稀疏及壓縮感知等技術(shù)以減少梯度傳輸造成的通信開銷,另外利用安全多方計算中的加法秘密共享對重要的梯度測量值加密,以實現(xiàn)在減少通信開銷的同時進一步增強其安全性.2個算法的主要區(qū)別是客戶端與服務(wù)器通信時傳遞的分別為梯度測量值與梯度測量值的量化結(jié)果.在MNIST及Fashion-MNIST數(shù)據(jù)集上的實驗表明,與其他算法相比,論文所提的算法在保證通信代價較低的情況下進一步增加了安全性,同時在模型準確性上也有較好的性能.
聯(lián)邦學(xué)習通過用上傳模型參數(shù)的方式取代了數(shù)據(jù)傳輸,降低了隱私泄露的風險.傳統(tǒng)的聯(lián)邦學(xué)習方法通?;诳蛻舳四P徒y(tǒng)一的假設(shè),且為單層聯(lián)邦學(xué)習.然而,在云邊端框架下,存在邊緣和終端2層分布式框架,且終端節(jié)點因資源異構(gòu)問題難以達成訓(xùn)練模型的統(tǒng)一.鐘正儀等人的文章“一種面向云邊端系統(tǒng)的分層異構(gòu)聯(lián)邦學(xué)習方法”一文從云邊端系統(tǒng)的隱私安全問題出發(fā),結(jié)合聯(lián)邦學(xué)習技術(shù),設(shè)計了分層部署模型的聯(lián)邦學(xué)習方案,考慮到終端節(jié)點資源異構(gòu)性,通過在終端模型插入分支的方式,將大模型拆分為不同復(fù)雜度的小模型適配不同客戶端資源狀態(tài),從而實現(xiàn)分層異構(gòu)聯(lián)邦學(xué)習.同時,考慮到終端存在大量無標簽數(shù)據(jù),論文提出了針對聯(lián)邦框架的半監(jiān)督學(xué)習方法,實現(xiàn)對無標簽數(shù)據(jù)的有效利用.以MNIST和FashionMNIST數(shù)據(jù)集為例進行了驗證,實驗結(jié)果表明,在有效避免隱私泄露的前提下,相比于其他學(xué)習方法,其提出的方法最大可提升22%的模型準確率;在計算、通信、存儲等資源開銷上均有明顯降低.
聯(lián)邦學(xué)習作為一種分布式機器學(xué)習框架,可以有效保護各參與方的數(shù)據(jù)隱私.然而,傳統(tǒng)的聯(lián)邦學(xué)習依賴一個中央服務(wù)器,模型訓(xùn)練過程易受單點故障和節(jié)點惡意攻擊的影響;明文傳遞的中間參數(shù)也可能被用來推斷出數(shù)據(jù)中的隱私信息,其在加強用戶數(shù)據(jù)安全和隱私保護上受到越來越多的挑戰(zhàn).此外,聯(lián)邦學(xué)習沒有提供合適的激勵機制吸引更多的訓(xùn)練數(shù)據(jù)和計算資源.為解決上述挑戰(zhàn),周煒等人的文章“基于區(qū)塊鏈的隱私保護去中心化聯(lián)邦學(xué)習模型”一文提出了一種基于區(qū)塊鏈的去中心化、安全、公平的聯(lián)邦學(xué)習模型,利用同態(tài)加密技術(shù)保護協(xié)同訓(xùn)練方的中間參數(shù)隱私,通過選舉的聯(lián)邦學(xué)習委員會進行模型聚合和協(xié)同解密.解密過程通過秘密共享方案實現(xiàn)安全的密鑰管理,并利用雙線性映射累加器為秘密份額提供正確性驗證.模型還引入信譽值作為評估參與方可靠性的指標,利用主觀邏輯模型實現(xiàn)不信任增強的信譽計算作為聯(lián)邦學(xué)習委員會的選舉依據(jù),信譽值作為激勵機制的參考還可以保障參與公平性.模型信息和信譽值通過區(qū)塊鏈實現(xiàn)數(shù)據(jù)的防篡改和不可抵賴.實驗表明,模型在訓(xùn)練精度相比中心化學(xué)習模型略有損失的情況下,能夠保障在多方協(xié)作的環(huán)境下以去中心化的方式訓(xùn)練模型,有效實現(xiàn)了各參與方的隱私保護.
承蒙各位作者、審稿專家和編輯部等方面的全力支持,本專題得以順利出版.目前數(shù)據(jù)安全與智能隱私保護研究涉及領(lǐng)域十分廣泛,這給審稿人及特邀編委的審稿、選稿工作帶來了巨大挑戰(zhàn).由于投稿數(shù)量大、主題廣泛、時間安排緊張、專題容量有限等原因,本專題僅選擇了部分有代表性的研究工作予以發(fā)表,無法全面體現(xiàn)該領(lǐng)域所有的最新研究工作.部分優(yōu)秀稿件無法列入專題發(fā)表,敬請諒解.我們要特別感謝《計算機研究與發(fā)展》編委會和編輯部,從專題的立項到征稿啟事的發(fā)布,從審稿專家的邀請到評審意見的匯總,以及最后的定稿、修改和出版工作,都凝聚了他們辛勤的汗水.本專題的出版期望能給廣大相關(guān)領(lǐng)域研究人員帶來啟發(fā)和幫助.在審稿過程中難免出現(xiàn)不盡人意之處,希望各位作者和讀者包容諒解,同時也請各位同行不吝批評指正.最后,再次衷心感謝各位作者、審稿專家、特邀編委和編輯部的辛勤工作.
曹珍富 華東師范大學(xué)
徐秋亮 山東大學(xué)
張玉清 中國科學(xué)院大學(xué)
董曉蕾 華東師范大學(xué)
2022年9月