朱響斌, 趙佳英
(浙江師范大學 數(shù)學與計算機科學學院,浙江 金華 321004)
隨著網(wǎng)絡(luò)復雜程度的增加和網(wǎng)絡(luò)攻擊頻率的增多,網(wǎng)絡(luò)安全信息共享成為積極防御復雜性網(wǎng)絡(luò)攻擊的有效手段之一[1-3].國內(nèi)外政府均頒布了相關(guān)法律政策,鼓勵組織企業(yè)共享他們的網(wǎng)絡(luò)安全信息,例如2015年美國參議院通過的《網(wǎng)絡(luò)安全信息共享法案》(CISA),2017年6月我國實施的《中華人民共和國網(wǎng)絡(luò)安全法》等.
然而,在實際應(yīng)用過程中,組織企業(yè)通常不愿意共享真實的安全信息,這是由于:1)共享信息可能會泄露一些其他漏洞或威脅數(shù)據(jù),會造成攻擊者或其他組織濫用共享數(shù)據(jù);2)組織報告被攻擊的情況會影響組織建立的安全形象[4-5].這兩方面的風險大大增加了組織進行信息共享的成本,嚴重影響了安全信息共享政策的施行.針對網(wǎng)絡(luò)信息共享中存在的欺騙或惡意服務(wù)節(jié)點,眾多學者設(shè)計了不少避免與此類節(jié)點交互或其他節(jié)點使用此偽造或誤導性信息的信譽激勵機制[6-9].Vakilinia等[10]提出的網(wǎng)絡(luò)安全信息交換框架(CYBEX),在用戶權(quán)衡隱私信息暴露和共享收益之間加入了機制費用,使得用戶作出最佳響應(yīng)以應(yīng)對真實的信息共享;Khouzani等[11]通過調(diào)查研究安全漏洞和共享策略之間的關(guān)系,提出了無貨幣的輕量級調(diào)解機制,鼓勵用戶進行真實的信息共享;文獻[12]提出了將信譽引入LBS匿名保護的激勵機制,用戶通過提供協(xié)助信息累積信譽,并拒絕向低信譽者提供幫助,通過用戶積極參與到k-匿名集的建立,有效地激勵用戶進行可靠的信息共享;文獻[13]結(jié)合微觀經(jīng)濟學提出了理性秘密重構(gòu)協(xié)議模型,每個用戶在決策制定時,考慮任意時刻的行動計劃,探求每個用戶的真實信息.但是,上述絕大多數(shù)激勵機制太過依賴于驗證機制,會造成博弈次數(shù)增加后,某些機制數(shù)據(jù)不容易收集.針對網(wǎng)絡(luò)信息共享中的同伴預測機制,在沒有任何客觀基礎(chǔ)和驗證機制的情況下,根據(jù)真相對報告進行評分,試圖利用信號之間的相關(guān)性使激勵與真實報告保持一致[14-15].Witkowski等[16]為改善網(wǎng)絡(luò)用戶對先驗知識的過分依賴,提出了魯棒的同伴預測,降低了對共同知識的依賴程度,并允許用戶的先驗知識是主觀且彼此不同的;Agarwal等[17]提出了異構(gòu)用戶的同伴預測機制,對機制魯棒性作了進一步改善;Naghizadeh等[18]考慮分布式多用戶系統(tǒng)中的用戶可以觀察和感知其他用戶,分析了多種信譽機制激勵用戶報告真值,并提出了交叉報告的概念.
本文從交叉報告的激勵機制設(shè)計方法出發(fā),即讓網(wǎng)絡(luò)中用戶共享信息的同時,對相鄰的其他用戶作一個交叉預測報告,這樣用戶報告的信息就會受到相似安全環(huán)境的鄰接用戶的檢測.這些報告值之間的差異間接影響用戶收益,如果二者之間差距過大,就會導致收益迅速降低,從而鼓勵用戶報告真實信息.經(jīng)典的同行預測方法的主要缺點是太過依賴于公共知識,即所有參與者的先驗知識被認為是已知的,在實際應(yīng)用中,機制必須收集這些數(shù)據(jù)以便計算收益規(guī)則.交叉報告不同于同伴預測,是在同伴預測方法的基礎(chǔ)上加入了用戶對其他用戶的預測報告,降低了對用戶經(jīng)驗知識的依賴性.且它不直接依靠同伴自身報告檢驗用戶報告的真實性,而是利用其他用戶的交叉報告對收益的影響,激勵用戶報告真實情況.本文模擬網(wǎng)絡(luò)病毒傳播,將病毒感染程度作為用戶的共享信息,利用鄰接用戶網(wǎng)絡(luò)病毒感染程度的相似性,引入交叉報告激勵機制,并通過仿真實驗,檢驗設(shè)計的交叉報告機制對用戶報告真實信息的激勵作用.
Witkowski等[16]提出不同的網(wǎng)絡(luò)狀態(tài)會引起不同的信號分布.設(shè)用戶的共享信息為每個用戶的安全狀態(tài),即網(wǎng)絡(luò)某節(jié)點被攻擊并攜帶病毒后,經(jīng)過多輪的傳播與感染,直到穩(wěn)定狀態(tài)為止,網(wǎng)絡(luò)中每個用戶的病毒感染程度將在后文具體說明.設(shè)在整個網(wǎng)絡(luò)中,由n個理性自私、風險中立的用戶組成的集合為C,每個用戶i有一個真實信號ri∈[0,1],即自身的病毒感染程度.且每個用戶i根據(jù)自身病毒感染程度向網(wǎng)絡(luò)安全中心提供一個報告信號xi∈[0,1].由于網(wǎng)絡(luò)用戶自私而理性的特征,絕大多數(shù)情況下xi≠ri.隨后,網(wǎng)絡(luò)安全中心會綜合各用戶報告,對網(wǎng)絡(luò)攻擊情況作出安全評估.同時,網(wǎng)絡(luò)安全中心對每個用戶的報告情況進行評價,給出每個用戶的收益或獎懲.對用戶報告的信息作出如下假設(shè):
假設(shè)1用戶的報告值不會太過于偏離用戶本身的真實值,滿足均值為μ=ri的正態(tài)分布Ν(ri,σ2).
Miller等[15]基于參與者自身的經(jīng)驗與其他參與者經(jīng)驗之間存在的正相關(guān)關(guān)系,提出了同伴預測的方法.交叉報告是在同伴預測機制基礎(chǔ)上加入用戶對同伴的交叉報告,由于每個用戶的病毒都是被鄰居用戶感染的,且感染程度類似,所以在滿足同伴預測的前提條件下,可以進行交叉報告.將每個用戶i的鄰接用戶集合定義為Ii,在共享信息的基礎(chǔ)上,用戶i報告集合Ii內(nèi)所有鄰接用戶j的同伴病毒感染預測值xij.交叉報告激勵機制的目標是保證每個用戶報告的信息盡可能地接近真實值.基于同伴交叉報告的激勵機制,通過同伴對用戶的預測值與用戶自身真實值之間的差異對用戶收益造成的影響,鼓勵用戶報告真實值.針對用戶報告鄰居用戶的預測值提出如下假設(shè):
假設(shè)2根據(jù)鄰居用戶之間感染程度的相似性,用戶j對用戶i的估計值服從正態(tài)分布Ν(rj,σ2).
綜合交叉報告評估值[18]為
(1)
在安全信息共享的復雜網(wǎng)絡(luò)中,每個用戶的目標是獲得利益關(guān)聯(lián)用戶盡可能真實的信息,以此獲得自身的高收益,即獲得鄰居用戶的真實信息和其他用戶對自身的高評價收益.下面定義用戶i的收益函數(shù)為
(2)
不難發(fā)現(xiàn),前者越小,用戶的收益越大,即用戶i對其鄰居關(guān)聯(lián)利益用戶的信息掌握的真實性越高,對自身提高收益越有利,反之,則不利于收益提高.后者是其他用戶對它的交叉報告影響的收益部分,在安全信息共享博弈中,某個用戶受到其他用戶的高評價報告,一方面說明用戶所在的鄰居環(huán)境比較安全,這是因為其他用戶都是根據(jù)自身情況進行交叉報告的;另一方面表示該用戶可能具有良好的信譽,這都有利于用戶收益的提高.
定理1交叉報告機制符合激勵兼容約束(個人利益與集體利益目標一致),即用戶報告真實值是獲取最優(yōu)收益的最佳選擇.
因此,用戶的綜合交叉報告評估值(式(1))變換為
(3)
3)假設(shè)用戶i報告真值,則xi=ri.
(4)
式(4)中:w是步長設(shè)定的一個參數(shù);?·」表示向下取整.加入交叉報告激勵機制后,用戶更新報告值的算法如下:
第1步:根據(jù)網(wǎng)絡(luò)病毒傳播模型的仿真結(jié)果,設(shè)用戶的真實值為ri,且每個用戶根據(jù)自身的真實值,提交一個初始報告值xi;
第2步:根據(jù)網(wǎng)絡(luò)相鄰用戶的感染程度相似性,每個用戶提交對所有鄰接同伴的交叉報告值xij;
第3步:網(wǎng)絡(luò)安全中心依據(jù)收益公式,返回給每個用戶自身的收益和其相鄰用戶的收益;
第4步:根據(jù)網(wǎng)絡(luò)安全中心返回的收益,每個用戶隨機選擇一個相鄰用戶進行收益比較,若自身收益小于被比較用戶的收益,則根據(jù)步長調(diào)整自身報告值;
第5步:重復步驟2~步驟4,直到收斂.
設(shè)網(wǎng)絡(luò)用戶的共享信息為穩(wěn)定時的網(wǎng)絡(luò)病毒感染程度值.下面參考流行病傳播模型,利用Gillespie算法,模擬網(wǎng)絡(luò)病毒傳播[19].步驟如下:
第1步:設(shè)有一個感染源,即網(wǎng)絡(luò)中第1個被攻擊成功、并攜帶傳染病毒的用戶,其感染程度為1;
第3步:計算感染發(fā)生的時間間隔為Δt=-ln(1-u)/λ(t),其中u∈[0,1)是一個隨機數(shù);
第5步:重復步驟2~步驟4,直到網(wǎng)絡(luò)用戶的感染程度不再變化或到達設(shè)定的時間點為止.
設(shè)網(wǎng)絡(luò)中用戶數(shù)量n=10 000,病毒傳播源為用戶i=1且其感染程度為1,用戶每輪成功感染單個鄰居的概率r=0.05,每輪感染力度下降值ζ=0.02.仿真結(jié)果如圖1所示.
圖1 網(wǎng)絡(luò)用戶病毒感染程度分布圖
根據(jù)網(wǎng)絡(luò)病毒傳播仿真實驗結(jié)果獲得網(wǎng)絡(luò)用戶的安全信息,即用戶共享的信息真實值,進行進一步的仿真實驗,觀察機制對用戶報告真實值的激勵作用.
實驗參數(shù)說明:用戶的自我報告值服從方差σ2=1的正態(tài)分布;交叉報告的報告值服從方差σ2=0.5的正態(tài)分布;用戶綜合交叉報告評估值參數(shù)ε=0.001;設(shè)每輪用戶調(diào)整的步長w=0.2.
(a)傳染源節(jié)點情況 (b)除傳染源外的某任意節(jié)點情況
圖2中,曲線表示用戶收益;帶有圓點符號的曲線表示用戶的自我報告值;虛線曲線表示用戶的真值,即網(wǎng)絡(luò)病毒感染程度.從圖2可以看到,隨著博弈的進行,傳染源用戶和網(wǎng)絡(luò)中任意某用戶的收益都是先升高,然后不同程度地下降,之后是波動性地穩(wěn)定.根據(jù)交叉報告激勵機制的設(shè)計機制分析,博弈初,用戶收益迅速上升的主要原因是用戶為提高自身收益,快速讓報告值接近真實值.但隨著時間的推移,用戶報告值已接近真實值,對收益的影響逐漸減少,影響占比較大的因素轉(zhuǎn)變?yōu)橥橹g的交叉預測報告.對收益下降部分曲線與用戶接近真值的曲線進行比較,這段曲線下降是由于用戶自我報告和同伴對用戶預測報告的共同作用.最后,用戶收益的波動主要受到其他用戶的交叉預測報告的影響,但是相較于初始收益有大的提高.
為了進一步統(tǒng)計整個網(wǎng)絡(luò)用戶報告真值的情況,引入皮爾遜相關(guān)系數(shù).皮爾遜相關(guān)系數(shù)是2個變量之間的協(xié)方差和標準差的商.根據(jù)皮爾遜相關(guān)系數(shù)判斷用戶真實值ri和實際報告信號xi之間的差異大小.
(5)
通常情況下,通過如表1所示的取值范圍判斷變量的相關(guān)強度.
表1 皮爾遜相關(guān)系數(shù)對應(yīng)變量強度表
根據(jù)數(shù)據(jù)特點,皮爾遜相關(guān)系數(shù)越接近于1,表明報告值與真實值之間的差距就越小;否則,差距就越大.
圖3 皮爾遜相關(guān)系數(shù)變化情況 圖4 步長參數(shù)w對機制的影響
圖3是實驗測評指標——皮爾遜相關(guān)系數(shù)隨博弈進行的變化情況.隨著博弈的進行,用戶真值與報告值的相關(guān)性增加,最后接近于1.這種現(xiàn)象進一步證實了圖2中用戶報告值隨時間變化的情況.在引入交叉報告機制之后,用戶報告值逐步接近真實值.
步長參數(shù)w對機制的影響如圖4所示.從用戶的報告值和真實值的皮爾遜相關(guān)系數(shù)的收斂情況來看,最后的收斂狀態(tài)幾乎相同.w越大,收斂速度越快,即用戶對收益的差距越敏感,越迫切需要提交接近真值的報告值以增加自身收益.但是這種對收益差的敏感程度不影響機制對用戶報告真值的有效作用.
本文設(shè)計了基于信息共享的交叉報告激勵機制,鼓勵用戶報告真實的信息.首先利用Gillespie算法模擬網(wǎng)絡(luò)用戶受攻擊的病毒傳播感染程度;然后,設(shè)定網(wǎng)絡(luò)用戶的共享信息為穩(wěn)定狀態(tài)時用戶的病毒感染程度值.信息共享要求每個用戶報告一個病毒感染程度,由于受信息泄露和共享信息成本的影響,用戶可能不會報告一個真值.設(shè)計交叉報告的激勵機制,通過用戶報告值與同伴交叉報告之間的差異間接影響用戶收益,激勵用戶報告真實的安全信息.實驗中利用皮爾遜相關(guān)系數(shù),比較用戶的報告值與真實值之間的差異.實驗仿真結(jié)果很好地說明了交叉報告機制對激勵用戶報告真值的明顯作用.對于用戶在博弈過程中的步長調(diào)整,發(fā)現(xiàn)不同的步長表示了用戶對收益不同程度的敏感性,但對最后的穩(wěn)定報告值并沒有太大的影響.