楊 晶
(上海儀電集團有限公司,上海 200233)
隱私計算技術(shù)是包含密碼學、安全芯片、數(shù)據(jù)科學等眾多領(lǐng)域的交叉技術(shù),在滿足保護數(shù)據(jù)安全的基礎(chǔ)上,確保原始數(shù)據(jù)不出庫,數(shù)據(jù)價值和知識出庫,真正做到數(shù)據(jù)“可用不可見”。隱私計算技術(shù)主要包括:多方安全計算、可信執(zhí)行環(huán)境、聯(lián)邦學習等。
多方安全計算由一系列基于密碼學的隱私增強技術(shù)協(xié)議棧組成,至少兩方持有私密數(shù)據(jù)的參與者,聯(lián)合計算一個安全函數(shù),得到各自預定輸出、保證計算結(jié)果正確的同時,不泄漏任何參與方的原始數(shù)據(jù)。多方安全計算技術(shù)具有正確性、隱私性、公平性等安全特性,主要包括:秘密分享、不經(jīng)意傳輸、混淆電路等。
(1)秘密分享:把數(shù)據(jù)拆散分割成多個無意義的碎片,并將數(shù)據(jù)碎片分發(fā)給參與方,每個參與方僅能拿到原始數(shù)據(jù)的一部分,只有把足夠數(shù)量的數(shù)據(jù)碎片拼接在一起,才能還原出原始數(shù)據(jù)。
(2)不經(jīng)意傳輸:數(shù)據(jù)發(fā)送方持有多條數(shù)據(jù),數(shù)據(jù)接收方只接收其中一條數(shù)據(jù),并且不能獲取其他數(shù)據(jù),同時發(fā)送方并不知道接收方選擇接收的是哪一條數(shù)據(jù)。
(3)混淆電路:將多方安全計算協(xié)議的計算邏輯編譯成布爾電路,并對電路中每個門的所有可能輸入生成對應(yīng)秘鑰,使用該秘鑰加密整個真值表,并打亂加密真值表順序完成數(shù)據(jù)混淆。
可信執(zhí)行環(huán)境是基于硬件特性與系統(tǒng)軟件安全架構(gòu)的隱私計算技術(shù),能夠在計算機中構(gòu)建多個安全運算環(huán)境。每個可信執(zhí)行環(huán)境內(nèi)部都能運行通用算法邏輯,并對數(shù)據(jù)實現(xiàn)機密計算??尚艌?zhí)行環(huán)境技術(shù)可確保任何外部攻擊者,包括系統(tǒng)管理員,無法竊取運算環(huán)境內(nèi)部的機密數(shù)據(jù),也無法惡意控制運算環(huán)境算法的執(zhí)行,充分保證了機密數(shù)據(jù)的隱私性、完整性與計算正確性。
聯(lián)邦學習是通過一個中央服務(wù)器協(xié)調(diào)眾多結(jié)構(gòu)松散的智能終端實現(xiàn)模型更新,由至少兩個數(shù)據(jù)方共同參與,保證各自原始數(shù)據(jù)不出其安全控制范圍,協(xié)作構(gòu)建并使用機器學習模型的隱私計算技術(shù)。聯(lián)邦學習以數(shù)據(jù)收集最小化為原則,確保訓練數(shù)據(jù)分布式存儲,實現(xiàn)參與方數(shù)據(jù)隱私保護的特殊分布式機器學習架構(gòu)。聯(lián)邦學習分為三類:橫向聯(lián)邦學習、縱向聯(lián)邦學習和聯(lián)邦遷移學習[1]。
(1)橫向聯(lián)邦學習:兩個參與方的用戶重疊部分很少,但是兩個數(shù)據(jù)集的用戶特征重疊部分比較多。
(2)縱向聯(lián)邦學習:兩個參與方的用戶重疊部分很多,但是兩個數(shù)據(jù)集的用戶特征重疊部分比較少。
(3)聯(lián)邦遷移學習:兩個參與方的用戶重疊部分很少,并且兩個數(shù)據(jù)集的用戶特征重疊部分比較少,個別數(shù)據(jù)還存在標簽缺失。
十九屆四中全會決議通過《中共中央關(guān)于堅持和完善中國特色社會主義制度推進國家治理體系和治理能力現(xiàn)代化若干重大問題的決定》,數(shù)據(jù)被增列為生產(chǎn)要素,國家高度肯定數(shù)據(jù)的價值和地位[2]?!吨腥A人民共和國數(shù)據(jù)安全法》經(jīng)十三屆全國人大常委會第二十九次會議表決通過,要求加強全社會對數(shù)據(jù)安全防護的重視,這為國內(nèi)數(shù)據(jù)應(yīng)用行業(yè)提供了新的行為準則。
隱私計算為數(shù)據(jù)安全應(yīng)用提供了有力的技術(shù)支撐,運用隱私計算技術(shù),能夠合理解決和高效處理數(shù)據(jù)安全領(lǐng)域的難題與痛點。作為數(shù)據(jù)協(xié)作過程中隱私保護的重要工具,隱私計算對保障數(shù)據(jù)安全具有積極意義,有助于降低數(shù)據(jù)協(xié)作風險、保護公共數(shù)據(jù)機密、落實數(shù)據(jù)安全責任。
利用隱私計算技術(shù),在無需轉(zhuǎn)移數(shù)據(jù)物理存儲服務(wù)器的情況下,可實現(xiàn)數(shù)據(jù)建模分析,減少數(shù)據(jù)協(xié)作過程中的潛在安全風險。多方安全計算、聯(lián)邦學習等隱私計算技術(shù)秉承“數(shù)據(jù)可用不可見、數(shù)據(jù)不動模型動”的理念,確保原始數(shù)據(jù)不流通,只傳輸數(shù)據(jù)計算模型,實現(xiàn)數(shù)據(jù)價值安全出庫。通過隱私計算技術(shù)可有效保證加密算法強度、加密密鑰長度、密鑰管理的安全性,繼而實現(xiàn)數(shù)據(jù)合法匿名化。在隱私計算技術(shù)的助力下,能夠?qū)崿F(xiàn)數(shù)據(jù)合作雙方或多方的建模分析,不需要將原始數(shù)據(jù)共享或存儲到某一方服務(wù)器,極大降低數(shù)據(jù)協(xié)作風險。
我國《個人信息保護法》與歐盟《通用數(shù)據(jù)保護條例》規(guī)定,保證數(shù)據(jù)最小化、完整性、機密性是處理個人數(shù)據(jù)的重要原則,這是國際社會公認的公共數(shù)據(jù)收集與處理要求[3]。隱私計算技術(shù)可充分滿足這三項原則:數(shù)據(jù)最小化要求,對數(shù)據(jù)的處理數(shù)量以滿足業(yè)務(wù)需要的最小數(shù)量為限;數(shù)據(jù)完整性和機密性要求,避免數(shù)據(jù)被非法處理、篡改、毀損或者不當泄漏。利用隱私計算技術(shù),可保證公共數(shù)據(jù)的真實性與準確性,有效防止數(shù)據(jù)被無權(quán)限人員隨意訪問、修改、導出等,從而保障數(shù)據(jù)的完整性和機密性,高度契合當前國內(nèi)外關(guān)于公共數(shù)據(jù)安全保護的立法目的與實施原則。
通過隱私計算技術(shù),可證明企業(yè)是否履行數(shù)據(jù)安全義務(wù),企業(yè)履行法定數(shù)據(jù)安全義務(wù)需要制定周密的數(shù)據(jù)安全管理制度、執(zhí)行嚴格的國際規(guī)范與標準、采取有效的數(shù)據(jù)安全保障措施等。利用隱私計算技術(shù),可以清晰地反映企業(yè)是否履行數(shù)據(jù)安全保障、預防數(shù)據(jù)泄漏的法定義務(wù)。如果發(fā)生數(shù)據(jù)泄漏,能夠及時提出相應(yīng)證據(jù),確定數(shù)據(jù)在哪個環(huán)節(jié)遭到泄漏,以及哪個主體泄漏了數(shù)據(jù),從而避免發(fā)生因為難以查清泄漏原因和主體,導致企業(yè)可能承擔舉證責任倒置義務(wù),實際又無法證明數(shù)據(jù)是否由該企業(yè)泄漏而承擔相應(yīng)法律責任。
隱私計算技術(shù)面向隱私保護與數(shù)據(jù)安全,涵蓋數(shù)據(jù)的生產(chǎn)、存儲、計算、應(yīng)用等信息傳輸全過程,保證原始數(shù)據(jù)隱私與安全的同時,實現(xiàn)對數(shù)據(jù)的計算和分析。多方數(shù)據(jù)流通融合中,隱私計算技術(shù)在保護數(shù)據(jù)安全層面具備顯著優(yōu)勢,金融征信、智慧城市、醫(yī)療健康等行業(yè)存在典型應(yīng)用場景。
在金融領(lǐng)域,數(shù)據(jù)的渠道聯(lián)合與風險控制是業(yè)務(wù)實施的重要環(huán)節(jié)。互聯(lián)網(wǎng)數(shù)字時代,傳統(tǒng)金融需要不斷與新興數(shù)字化技術(shù)融合,外界數(shù)據(jù)的流通需求日益增加,跨領(lǐng)域的融合應(yīng)用不斷強化,數(shù)據(jù)的共享與開放正成為金融行業(yè)發(fā)展新趨勢。隱私計算技術(shù)作為數(shù)據(jù)安全的重要保障,在金融領(lǐng)域中應(yīng)用前景廣闊,尤其是在征信系統(tǒng)中能發(fā)揮關(guān)鍵作用。
征信系統(tǒng)的生態(tài)圈層較為復雜,一般涉及到數(shù)據(jù)流通方、數(shù)據(jù)加工方、數(shù)據(jù)使用方三方數(shù)據(jù)融合,商業(yè)銀行需要通過多個信息渠道對歷史數(shù)據(jù)進行多維度計算。單個金融機構(gòu)往往無法實現(xiàn)足夠安全可靠的綜合信息傳輸管控技術(shù),自身的隱私性功能也有限,無法保證對外信息傳輸?shù)陌踩耘c真實性。征信系統(tǒng)通過引入多方安全計算與聯(lián)邦學習等隱私計算技術(shù),針對性解決多方數(shù)據(jù)流通、價值交換、隱私保護、操作授權(quán)等問題,促使海量金融數(shù)據(jù)得以高效利用[4]。
近年來,城市數(shù)字化轉(zhuǎn)型加速推進,智慧城市規(guī)劃與政務(wù)大數(shù)據(jù)建設(shè)不斷完善,全國多省市設(shè)立大數(shù)據(jù)發(fā)展局、大數(shù)據(jù)管理局、大數(shù)據(jù)中心等管理單位,不斷加強基于大數(shù)據(jù)的智慧城市規(guī)劃與設(shè)計,完善管理制度體系。由于智慧城市涉及范圍的廣泛性與管理權(quán)屬的分散性,在多部門數(shù)據(jù)協(xié)同過程中,容易因信息不對稱與不共享形成政務(wù)數(shù)據(jù)孤島。
智慧城市建設(shè)需要通過以互聯(lián)網(wǎng)技術(shù)為基礎(chǔ)的新一代信息技術(shù)應(yīng)用,實現(xiàn)全面感知、泛在互聯(lián)、普適計算與融合應(yīng)用,涉及安保、能源、交通、規(guī)劃、環(huán)保、文旅等各個領(lǐng)域,業(yè)態(tài)復雜多變,需要大量跨部門、跨行業(yè)、跨時空的政務(wù)數(shù)據(jù)流通與安全共享[5]。政務(wù)大數(shù)據(jù)平臺通過引入多方安全計算與可信執(zhí)行環(huán)境等隱私計算技術(shù),切實保證司法、社保、公積金、稅務(wù)等方面的數(shù)據(jù)隱私性與安全性,為智慧城市建設(shè)提供可信任的數(shù)據(jù)安全基礎(chǔ),結(jié)合傳統(tǒng)的數(shù)據(jù)脫敏和加密手段,可以有效打破信息壁壘,在多方協(xié)同的情況下,保證數(shù)據(jù)的真實性、完備性與安全性。
隨著醫(yī)療健康行業(yè)的快速發(fā)展,目前已建立一定規(guī)模的大數(shù)據(jù)應(yīng)用,通過對大規(guī)模病例數(shù)據(jù)與病情數(shù)據(jù)進行深入挖掘、機器學習、模型訓練,能夠有效提高醫(yī)學研究與病情診斷的工作效率,促進醫(yī)療服務(wù)精確度有效提升。隱私計算技術(shù)在醫(yī)療健康領(lǐng)域的應(yīng)用會越來越廣泛,通過多方安全計算與可信執(zhí)行環(huán)境等隱私計算能力,可以在醫(yī)療數(shù)據(jù)不離開私有域的條件下,完成高效數(shù)據(jù)統(tǒng)計分析,保障隱私數(shù)據(jù)的安全性。
采用聯(lián)邦學習技術(shù),醫(yī)療數(shù)據(jù)可以進行安全可信聯(lián)合分析,基因組數(shù)據(jù)、醫(yī)學影像數(shù)據(jù)、臨床數(shù)據(jù)可以被安全可靠地分享和計算。利用多方安全計算技術(shù),能夠?qū)崿F(xiàn)患者電子病歷數(shù)據(jù)跨域安全共享,有效解決醫(yī)療健康數(shù)據(jù)孤島問題。
當前全球數(shù)字經(jīng)濟快速發(fā)展,我國已進入大數(shù)據(jù)時代,對數(shù)據(jù)要素的掌控和利用能力,已成為衡量國家之間科技競爭力的核心要素[6]。數(shù)據(jù)安全是數(shù)字經(jīng)濟的零因子,建設(shè)數(shù)據(jù)安全應(yīng)用意義深遠。利用多方安全計算、可信執(zhí)行環(huán)境、聯(lián)邦學習等隱私計算技術(shù),實現(xiàn)原始數(shù)據(jù)不出本地,只交換數(shù)據(jù)計算結(jié)果,安全傳輸數(shù)據(jù)價值,有效解決數(shù)據(jù)安全與隱私保護等難題,流動的數(shù)據(jù)成為驅(qū)動數(shù)字經(jīng)濟發(fā)展的新動能。
“十四五”規(guī)劃綱要指出,加快數(shù)字化發(fā)展,建設(shè)數(shù)字中國。為了進一步發(fā)展數(shù)字經(jīng)濟,數(shù)據(jù)安全產(chǎn)業(yè)已經(jīng)在政策層面被確定為國家安全戰(zhàn)略的重要組成部分。隨著“十四五”規(guī)劃綱要的逐步落地,數(shù)據(jù)資源會迸發(fā)出更強的經(jīng)濟活力,數(shù)據(jù)安全必將成為社會數(shù)字化發(fā)展的重中之重。通過隱私計算技術(shù)賦能數(shù)據(jù)安全應(yīng)用,有效實現(xiàn)數(shù)據(jù)“可用不可見”的安全目標,持續(xù)為數(shù)字經(jīng)濟發(fā)展貢獻力量。 (文責自負)