付吉菊
(滁州城市職業(yè)學(xué)院 管理與信息學(xué)院, 安徽 滁州239000)
在當(dāng)今數(shù)據(jù)高度共享的時(shí)代,數(shù)字版權(quán)管理(Digital Rights Management,DRM)環(huán)境帶給人們便利的同時(shí),也存在很多安全隱患。在利益的驅(qū)動(dòng)下,很多不法分子開始盜取個(gè)人隱私敏感數(shù)據(jù)。雖然這是互聯(lián)網(wǎng)高速發(fā)展的一個(gè)必然階段,但是個(gè)人敏感數(shù)據(jù)信息的泄露會(huì)給用戶帶來巨大損失[1-3]。
現(xiàn)階段的安全保護(hù)技術(shù),暫時(shí)還不能滿足保證互聯(lián)網(wǎng)敏感數(shù)據(jù)安全的要求。為此,張玉磊等[4]為了提高網(wǎng)絡(luò)敏感數(shù)據(jù)的安全性,提出了一種基于身份密碼格式的敏感數(shù)據(jù)加密保護(hù)方案。該方案比傳統(tǒng)的方案安全系數(shù)更高,在進(jìn)行互聯(lián)網(wǎng)訪問過程中,通過密鑰派生函數(shù)進(jìn)行信息訪問,跳過密鑰傳遞過程。這種混合加密的方式,比傳統(tǒng)的格式保留加密方案具有更高的安全性能,并證明了該方案具有更高的身份偽裝技術(shù),對于網(wǎng)絡(luò)非法訪問具有更好的規(guī)避性能,但是網(wǎng)絡(luò)攻擊對敏感數(shù)據(jù)的成功率仍然較高。賈春福等[5]通過對同態(tài)加密數(shù)據(jù)集的研究,提出了一種基于機(jī)器學(xué)習(xí)的互聯(lián)網(wǎng)數(shù)據(jù)加密方案。首先,對互聯(lián)網(wǎng)敏感數(shù)據(jù)進(jìn)行預(yù)處理,保證其可以滿足同態(tài)加密數(shù)據(jù)的基本要求。然后,構(gòu)建互聯(lián)網(wǎng)同態(tài)加密數(shù)據(jù)集,并通過互聯(lián)網(wǎng)協(xié)議實(shí)現(xiàn)排序和加密上傳等功能。最后,獲得加密的結(jié)果。為了保證在同態(tài)加密過程中互聯(lián)網(wǎng)終端不會(huì)獲取敏感數(shù)據(jù),利用加密算法使服務(wù)器終端無法對密文進(jìn)行訪問操作。結(jié)果表明,該方案對于敏感數(shù)據(jù)加密安全性較高,但是魯棒性較差。
基于以上研究背景,本文提出了一種在干擾條件下針對可檢索DRM 環(huán)境敏感數(shù)據(jù)的加密方法。通過設(shè)置加密約束條件,計(jì)算DRM 環(huán)境敏感數(shù)據(jù)值占比,設(shè)計(jì)了檢索DRM 環(huán)境敏感數(shù)據(jù)的加密算法,從而優(yōu)化攻擊成功率和信息損失率,保證敏感數(shù)據(jù)的安全性。
對DRM 環(huán)境敏感數(shù)據(jù)進(jìn)行檢索的過程中,存在鏈路加密過程的病毒侵害、節(jié)點(diǎn)加密過程的外在因素干擾、對稱加密過程的密碼計(jì)算方式復(fù)雜、非對稱加密過程的身份驗(yàn)證困難等4個(gè)方面的安全性影響因子。這些因子是雜亂無章的,且權(quán)值不一。因此,首先要對互聯(lián)網(wǎng)敏感數(shù)據(jù)按照順序存儲(chǔ),然后結(jié)合關(guān)鍵詞出現(xiàn)的概率[6],計(jì)算出敏感數(shù)據(jù)的偏移量,其檢索的核心設(shè)計(jì)步驟如下:
步驟1將DRM 環(huán)境敏感數(shù)據(jù)q i進(jìn)行文檔轉(zhuǎn)換,轉(zhuǎn)換后敏感數(shù)據(jù)的數(shù)據(jù)層次表示為
式中:f為敏感數(shù)據(jù)的語義狀態(tài);b f為敏感數(shù)據(jù)語義狀態(tài)的映射集;s f為敏感數(shù)據(jù)參數(shù)集的映射集合;K為敏感數(shù)據(jù)占正常文檔數(shù)據(jù)的比例。
步驟2進(jìn)行文檔轉(zhuǎn)換后,對當(dāng)前的敏感數(shù)據(jù)進(jìn)行分類處理,首先中文和英文要分開處理[7],然后構(gòu)建檢索格式,其計(jì)算公式為
式中:φ(k)為在文檔中存在k種敏感數(shù)據(jù)的概率;E i為敏感數(shù)據(jù)中文和英文之間的分隔函數(shù)。
步驟3根據(jù)上述構(gòu)建的DRM 環(huán)境敏感數(shù)據(jù)檢索格式,構(gòu)建敏感數(shù)據(jù)檢索的序列,表示為
式中:?(t,b)為DRM 環(huán)境敏感數(shù)據(jù)在檢索過程中的時(shí)間序列為敏感數(shù)據(jù)檢索的時(shí)間間隔。
步驟4以DRM 環(huán)境敏感數(shù)據(jù)的檢索序列為基礎(chǔ),構(gòu)建DRM 環(huán)境敏感數(shù)據(jù)集,表示為
由于DRM 環(huán)境敏感數(shù)據(jù)具有獨(dú)立唯一的安全檢索辦法,所以可根據(jù)不同的敏感數(shù)據(jù)檢索關(guān)鍵詞,檢索到相關(guān)的敏感數(shù)據(jù),完成DRM 環(huán)境敏感數(shù)據(jù)的檢索。
在設(shè)定可檢索DRM 環(huán)境敏感數(shù)據(jù)的加密約束條件時(shí),首先要根據(jù)干擾環(huán)境下的轉(zhuǎn)換因素,對互聯(lián)網(wǎng)敏感數(shù)據(jù)所處的位置進(jìn)行排序[8];然后對已排序好的互聯(lián)網(wǎng)敏感數(shù)據(jù)進(jìn)行分類,保證每一個(gè)互聯(lián)網(wǎng)敏感數(shù)據(jù)的閾值不低于設(shè)定值,并對加密條件進(jìn)行約束。具體步驟如下:
步驟1DRM 環(huán)境敏感數(shù)據(jù)在可檢索加密過程中,為了準(zhǔn)確地描述敏感數(shù)據(jù),將單位設(shè)置為度、分、秒,再對DRM 環(huán)境敏感數(shù)據(jù)Si進(jìn)行描述,通過度、分、秒代表描述的原始數(shù)值,得到下式:
式中:B、C、D分別表示度、分、秒。
步驟2把排列好的DRM 環(huán)境敏感數(shù)據(jù)進(jìn)行分類,假設(shè)原始空間的敏感數(shù)據(jù)為v,那么將v劃分成v i={R1,R2,…,R n},保證其滿足任何兩個(gè)數(shù)據(jù)類的劃分。
步驟3假設(shè)DRM 環(huán)境敏感數(shù)據(jù)R n的劃分函數(shù)為SPlit(R n),那么劃分函數(shù)的作用是將R n劃分為2個(gè)類別[9],保證最終每個(gè)類別的數(shù)值都不低于初始設(shè)定的閾值。設(shè)定線性劃分的期望值為v j(v j∈R n),則通過下式進(jìn)行計(jì)算:
式中:(v s-v i)為DRM 環(huán)境檢索過程中的范疇參數(shù);i為需要加密的敏感數(shù)據(jù)方位向量;s為敏感數(shù)據(jù)的數(shù)據(jù)值。
步驟4為了對劃分后的DRM 環(huán)境敏感數(shù)據(jù)進(jìn)行實(shí)時(shí)加密,并保證加密后的敏感數(shù)據(jù)與原始數(shù)據(jù)一樣[10],假設(shè)加密函數(shù)為Δ(q),敏感數(shù)據(jù)密文空間F={f1,f2,…,f m}在H={h1,h2,…,h m}的明文空間上提取,同時(shí)敏感數(shù)據(jù)劃分的類別滿足
假設(shè)通過φfj對可檢索敏感數(shù)據(jù)進(jìn)行加密,那么得到約束式為
式中:ˉωj為加密后的可檢索敏感數(shù)據(jù)線性劃分期望值。
步驟5通過v i對敏感數(shù)據(jù)類別φj進(jìn)行描述,進(jìn)行檢索加密的密文為
步驟6令?(y)表示加密函數(shù)的計(jì)算,則平衡式?(y)的分布可表示為
按照上述步驟進(jìn)行加密約束條件的設(shè)定,降低了互聯(lián)網(wǎng)敏感數(shù)據(jù)被入侵的危險(xiǎn)。
若最終每個(gè)類別的數(shù)值皆低于初始設(shè)定的閾值,則表明存在干擾條件。為了降低DRM 環(huán)境敏感數(shù)據(jù)信息的損失,通過碼元同步找到正交頻分復(fù)用技術(shù)(Orthogonal Frequency D ivision Multiplexing,OFDM)碼元的起始位置后,進(jìn)行OFDM 信號(hào)的解調(diào),將時(shí)域數(shù)據(jù)變換到頻域。將DRM 環(huán)境敏感數(shù)據(jù)集M中的所有元組進(jìn)行聚類劃分,得到聚類集B。在聚類集B中任意選取2個(gè)聚類中心C1和C2進(jìn)行合并[11-12],生成新的聚類集C,C的質(zhì)心向量計(jì)算公式為
式中:Ω為可檢索DRM 環(huán)境敏感數(shù)據(jù)加密的向量值;ix v為敏感數(shù)據(jù)的元組標(biāo)識(shí);jy v為敏感數(shù)據(jù)加密的字符值。
假設(shè)u代表C1中敏感數(shù)據(jù)的任一幅值,則u與聚類中心的距離為
式中:ix i為C1中的i個(gè)敏感數(shù)據(jù)元組中的可檢索加密符值,字符值越多,敏感數(shù)據(jù)的屬性越復(fù)雜,需要加密的數(shù)據(jù)量越大,敏感數(shù)據(jù)元組越大;jy i為C2中第j個(gè)元組中的可檢索加密元組標(biāo)識(shí)。
將C1和C2進(jìn)行合并,得到聚類C的可檢索加密信息為
L(C1,C2)=L(C1)+L(C2) (13)
式中:L(C1)為C1中i個(gè)敏感數(shù)據(jù)元組所產(chǎn)生的可檢索加密信息值;L(C2)為C2中j個(gè)敏感數(shù)據(jù)被檢索加密的數(shù)值,假設(shè)可檢索加密敏感數(shù)據(jù)集C由j個(gè)敏感數(shù)據(jù)元組構(gòu)成,則敏感數(shù)據(jù)的屬性具有不同的取值[13]。
計(jì)算可檢索加密的DRM 環(huán)境敏感數(shù)據(jù)值占比為
式中:p(s i)表示可檢索加密敏感數(shù)據(jù)集C中的敏感數(shù)據(jù)占比。
因?yàn)镺FDM 系統(tǒng)對載波頻偏非常敏感,所以經(jīng)過頻率校正后,頻率誤差應(yīng)小于0.01倍子載波間隔。假設(shè)2個(gè)聚類中心C1和C2由敏感數(shù)據(jù)元組c1和c2構(gòu)成,得到復(fù)雜度為ψ(C1)和ψ(C2)的增益比例為
式中:λ1、λ2分別為2次功率調(diào)節(jié)的系數(shù)。
為了在干擾條件下對可檢索DRM 環(huán)境敏感數(shù)據(jù)的加密可以滿足上述條件,對不同的聚類合并[14],對可檢索加密指數(shù)進(jìn)行定義
從上述公式中可知,敏感數(shù)據(jù)的增益值越小,在干擾條件下,DRM 環(huán)境敏感數(shù)據(jù)信息的損失越大,而經(jīng)過聚類中心合并與優(yōu)化后,增益值增加,可檢索加密指數(shù)越大[15]。由此完成檢索DRM 環(huán)境敏感數(shù)據(jù)的加密算法的設(shè)計(jì),實(shí)現(xiàn)了可檢索DRM環(huán)境敏感數(shù)據(jù)的加密。
為了驗(yàn)證干擾條件下可檢索DRM 環(huán)境敏感數(shù)據(jù)的加密方法在實(shí)際應(yīng)用中的性能,設(shè)計(jì)仿真實(shí)驗(yàn)。
采用DRM 系統(tǒng)作為測試平臺(tái),平臺(tái)界面如圖1所示。
圖1 測試平臺(tái)界面
實(shí)驗(yàn)測試過程中,選擇Windows 7操作系統(tǒng),敏感數(shù)據(jù)可檢索加密算法通過Java進(jìn)行檢索實(shí)現(xiàn)。利用時(shí)間導(dǎo)頻信息找到DRM 系統(tǒng)的傳輸幀起始碼元;應(yīng)用OFDM 調(diào)制方式和高級音頻編碼技術(shù)(Advanced Audio Coding Plus,AACPlus),獲得數(shù)模同播的匹配方案;將模擬信號(hào)與數(shù)字信號(hào)同時(shí)以同一載波頻率輸出;使用正交調(diào)制器將低頻的基帶信號(hào)調(diào)制為適合在信道中傳輸?shù)男盘?hào),利用頻率導(dǎo)頻信息計(jì)算并校正頻率偏差。
以某一公司DRM 環(huán)境中存放員工敏感數(shù)據(jù)的數(shù)據(jù)庫作為實(shí)驗(yàn)測試對象。數(shù)據(jù)庫包含2 000份員工敏感數(shù)據(jù)樣本,本文隨機(jī)選擇100份作為測試樣本,其余1 900份作為訓(xùn)練樣本。表1給出了測試樣本中的部分?jǐn)?shù)據(jù)。
表1 實(shí)驗(yàn)數(shù)據(jù)樣本
在表1的樣本數(shù)據(jù)中,員工的姓名、郵箱、電話以及月工資等均屬于敏感數(shù)據(jù),整合所有敏感數(shù)據(jù),計(jì)算其統(tǒng)計(jì)學(xué)p值為0.2,說明具有統(tǒng)計(jì)學(xué)意義。以此類數(shù)據(jù)為實(shí)驗(yàn)樣本,對其進(jìn)行加密處理。
實(shí)驗(yàn)測試分安全性測試和魯棒性測試兩部分進(jìn)行,先利用入侵軟件模擬網(wǎng)絡(luò)攻擊行為,對該公司DRM 環(huán)境中的敏感數(shù)據(jù)進(jìn)行攻擊。
利用攻擊成功率衡量敏感數(shù)據(jù)可檢索加密方法的安全性計(jì)算公式為
式中:Cz為存放敏感數(shù)據(jù)的數(shù)據(jù)庫中的總數(shù)據(jù)量;Cp為破解成功后得到的敏感數(shù)據(jù)量。
在魯棒性測試中,利用敏感數(shù)據(jù)遭受攻擊時(shí)的信息損失率作為評價(jià)指標(biāo),計(jì)算公式為
式中:X為敏感信息遭受攻擊之前的信息量;Xg為敏感信息遭受攻擊之后的信息量。
在噪聲干擾下和濾波干擾下,采用文中方法對DRM 環(huán)境敏感數(shù)據(jù)進(jìn)行加密,利用DRM 系統(tǒng)給出了攻擊成功率測試結(jié)果,如圖2所示。
圖2 攻擊成功率測試結(jié)果
圖2顯示,當(dāng)DRM 環(huán)境敏感數(shù)據(jù)遭受攻擊后,濾波干擾的攻擊成功率始終低于噪聲干擾。無論是在噪聲干擾下還是濾波干擾下,攻擊加密后敏感數(shù)據(jù)的成功率都在30%以下,可以保證敏感數(shù)據(jù)的安全性。
當(dāng)DRM 環(huán)境敏感數(shù)據(jù)遭受攻擊之后,測試了敏感數(shù)據(jù)經(jīng)過文中方法加密后的信息損失率,結(jié)果如圖3所示。
圖3 敏感數(shù)據(jù)的信息損失率測試結(jié)果
根據(jù)圖3的結(jié)果可知,在DRM 環(huán)境中,遭受攻擊的敏感數(shù)據(jù)經(jīng)過文中方法的加密之后,敏感數(shù)據(jù)的信息會(huì)損失一部分。當(dāng)敏感數(shù)據(jù)量低于60份時(shí),噪聲干擾下的信息損失率高于濾波干擾下的信息損失率。當(dāng)敏感數(shù)據(jù)量大于60份時(shí),濾波干擾下的信息損失率高于噪聲干擾下的信息損失率。在兩種干擾條件下,敏感數(shù)據(jù)的信息損失率都在允許的范圍內(nèi),說明文中方法在敏感數(shù)據(jù)可檢索加密中具有魯棒性。
本文提出了干擾條件下可檢索DRM 環(huán)境敏感數(shù)據(jù)的加密方法,經(jīng)過實(shí)驗(yàn)測試發(fā)現(xiàn),該方法在加密DRM 環(huán)境中的敏感數(shù)據(jù)時(shí),可以保證敏感數(shù)據(jù)的安全性,并提高敏感數(shù)據(jù)加密的魯棒性。但是本文的研究還存在很多不足,在今后的研究中,希望可以引入同態(tài)加密算法,以提高敏感數(shù)據(jù)可檢索加密的安全性。