陳曉燕+唐年慶
摘 要: 針對傳統(tǒng)大數(shù)據(jù)評(píng)估過程中的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)評(píng)估結(jié)果不精準(zhǔn)并且速度較慢的問題,提出一種大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法。采用特定的風(fēng)險(xiǎn)評(píng)估因子進(jìn)行有效的評(píng)估,避免了傳統(tǒng)方法中評(píng)定項(xiàng)目繁雜、計(jì)算量大等因素造成的評(píng)估不準(zhǔn)的問題。評(píng)估過程中使用了特定的評(píng)估模型,把傳統(tǒng)的加權(quán)平均的風(fēng)險(xiǎn)估計(jì)方法轉(zhuǎn)變成為非線性映射評(píng)估方法,這樣能夠更加準(zhǔn)確的進(jìn)行風(fēng)險(xiǎn)評(píng)估。為了驗(yàn)證設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)的有效性,設(shè)計(jì)了對比仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法能夠有效地解決風(fēng)險(xiǎn)評(píng)估過程中的評(píng)估結(jié)果不準(zhǔn)確問題。
關(guān)鍵詞: Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì); 大數(shù)據(jù)環(huán)境; 風(fēng)險(xiǎn)評(píng)估因子; 評(píng)估模型
中圖分類號(hào): TN711?34; TP469 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)24?0056?03
Abstract: In view of the inaccurate results and slow rate of Web network risk estimation in the traditional big data estimation process, a method of Web network risk estimation in the big data environment is proposed. The specific risk estimation factors are utilized to perform effective estimation, which avoids inaccurate estimation caused by the complexity of the estimation item and big amount of computation in the traditional method. In the evaluation process, the specific estimation model is used to transform the traditional weighted average risk estimation method into the nonlinear mapping estimation method so that the risk estimation can be more accurate. In order to verify the validation of the designed Web network risk estimation in big data environment, the contrast simulation experiment was designed. The experimental results show that the designed Web network risk estimation in big data environment can effectively resolve the problem of inaccurate estimation results in the risk estimation process.
Keywords: Web network risk estimation; big data environment; risk estimation factor; estimation model
伴隨著現(xiàn)代科技的不斷推進(jìn)革新,現(xiàn)代科技的項(xiàng)目也越來越多,能夠涵蓋的領(lǐng)域也越來越廣泛[1]。在進(jìn)行科技領(lǐng)域的研發(fā)過程中,會(huì)使用許多沒有經(jīng)過完善體系認(rèn)證的現(xiàn)代技術(shù)以及新興技術(shù),在使用過程中會(huì)存在許多未知的可能性,這些可能性會(huì)造成一定的系統(tǒng)失誤以及系統(tǒng)偏離,或者是達(dá)不到預(yù)想的使用效果。有時(shí)候會(huì)造成工期延誤,或者是資金的浪費(fèi),這些情況給研制過程帶來了極大的不便[2?3]。
采用傳統(tǒng)的評(píng)估方法進(jìn)行Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)過程中,使用數(shù)據(jù)模型綜合判斷法和引入特征因子參數(shù)法進(jìn)行大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)評(píng)估是最簡單、直接、有效的方法[4]。數(shù)據(jù)模型綜合判斷法需要進(jìn)行一定的數(shù)據(jù)測量,在測量過程中數(shù)據(jù)量極其龐大,并且調(diào)查時(shí)間較長,還受到一定的條件限制,但是數(shù)據(jù)模型綜合判斷法的數(shù)據(jù)處理能力很強(qiáng)[5?6]。引入的特征因子參數(shù)法是方便進(jìn)行數(shù)據(jù)測量的方法,這種方法的數(shù)據(jù)測量采集的準(zhǔn)確度高,但是計(jì)算能力較弱,并且不能進(jìn)行自我檢驗(yàn)[7]。本文設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法,把上述的兩種方法有機(jī)的進(jìn)行融合,這樣既能夠進(jìn)行快速的數(shù)據(jù)分析又能夠進(jìn)行準(zhǔn)確的數(shù)據(jù)采集,降低了影響評(píng)估風(fēng)險(xiǎn)的因素,提高了在大數(shù)據(jù)下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)準(zhǔn)確度[8]。
1 Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)模型設(shè)計(jì)
1.1 數(shù)據(jù)快速采集
Web網(wǎng)絡(luò)是一種雙線記錄的網(wǎng)絡(luò),Web網(wǎng)絡(luò)是通過反饋以及應(yīng)答法方式對數(shù)據(jù)進(jìn)行記錄的。所以在大型數(shù)據(jù)下的網(wǎng)絡(luò)風(fēng)險(xiǎn)評(píng)估是必須通過特定因子進(jìn)行數(shù)據(jù)的采集,否則很難在網(wǎng)絡(luò)的一端進(jìn)行全數(shù)據(jù)的采集。特定風(fēng)險(xiǎn)特征因子法使用流程如圖1所示。
進(jìn)行數(shù)據(jù)采集前需要進(jìn)行屬性的定量分析,對大量數(shù)據(jù)的屬性認(rèn)定能夠更加適合Web網(wǎng)絡(luò)的結(jié)構(gòu)模型如下:
式中:x,y分別為數(shù)據(jù)的集中屬性以及數(shù)據(jù)的次屬性;j,k分別表示W(wǎng)eb網(wǎng)絡(luò)模型和屬性節(jié)點(diǎn);w和Q是對應(yīng)的關(guān)系,分別是數(shù)據(jù)的輸入以及輸出非線性傳輸函數(shù)。通過式(1)便可以對數(shù)據(jù)進(jìn)行屬性的衡量。針對大量的數(shù)據(jù)還需要進(jìn)行一定的數(shù)據(jù)標(biāo)記,這樣才能更加快速地進(jìn)行數(shù)據(jù)采集,標(biāo)記過程為:
Web網(wǎng)絡(luò)通過命令篩選進(jìn)行標(biāo)記,P為標(biāo)記過程值,當(dāng)屬性滿足一定條件時(shí),進(jìn)行標(biāo)記。通過標(biāo)記后的數(shù)據(jù)為示意串符號(hào)字符,需要轉(zhuǎn)化為能被識(shí)別的十六進(jìn)制代碼,公式為:endprint
式中:T表示統(tǒng)計(jì)序列的編號(hào)數(shù);η表示限定的條件;r是序列值。為了能夠進(jìn)行快速的風(fēng)險(xiǎn)評(píng)估,還需要進(jìn)行最大連接授權(quán)與最小連接授權(quán)的計(jì)算,計(jì)算公式為:
式中:d表示授權(quán)能力;H表示數(shù)據(jù)的屬性指標(biāo),這樣便于進(jìn)行識(shí)別,保證風(fēng)險(xiǎn)評(píng)估過程的準(zhǔn)確性;是最大的授權(quán)值,最小授權(quán)值為1。
通過鑒定屬性的H平均識(shí)別率進(jìn)行屬性的大量采集,平均識(shí)別過程為:
式中:pej為Web網(wǎng)絡(luò)的第j個(gè)模板屬性中第k標(biāo)記元素;u是一個(gè)限制的值域方便數(shù)據(jù)的采集;k只能進(jìn)行1和2的取值,當(dāng)k為2時(shí),風(fēng)險(xiǎn)評(píng)估的數(shù)據(jù)是0,當(dāng)k為1時(shí),對應(yīng)的屬性提取值為:
Web網(wǎng)絡(luò)進(jìn)行風(fēng)險(xiǎn)評(píng)估是需要進(jìn)行數(shù)據(jù)的特征提取,本文使用的是特定因子數(shù)據(jù)采集方法,通過上述標(biāo)記過后便可進(jìn)行快速的提取,如下:
Web網(wǎng)絡(luò)主要的作用是進(jìn)行數(shù)據(jù)聯(lián)想寄存,相當(dāng)于服務(wù)器中的一個(gè)運(yùn)存模塊,想要對其進(jìn)行系統(tǒng)的風(fēng)險(xiǎn)評(píng)估,需要對采集的數(shù)據(jù)進(jìn)行評(píng)估運(yùn)算。本文通過對Web網(wǎng)絡(luò)進(jìn)行特征因子的采集,能夠輔助之后的風(fēng)險(xiǎn)評(píng)估模型的運(yùn)算,為風(fēng)險(xiǎn)評(píng)估模型提供充足的理論數(shù)據(jù)。
1.2 使用風(fēng)險(xiǎn)估計(jì)模型進(jìn)行風(fēng)險(xiǎn)評(píng)估
在使用風(fēng)險(xiǎn)評(píng)估模型之前需要進(jìn)行供應(yīng)數(shù)據(jù)的選擇,選定的供應(yīng)鏈方便進(jìn)行屬性匹配和估值,其計(jì)算公式為:
式中:表示風(fēng)險(xiǎn)影響因子數(shù);E表示理想因子數(shù);A表示數(shù)據(jù)的充分性因子數(shù)。在大數(shù)據(jù)的情況下,進(jìn)行風(fēng)險(xiǎn)評(píng)估還要考慮到進(jìn)度風(fēng)險(xiǎn)影響因子,因?yàn)閿?shù)據(jù)本身不是沒有變化的。進(jìn)度風(fēng)險(xiǎn)影響因子數(shù):
式中:e為進(jìn)度風(fēng)險(xiǎn)影響因子參數(shù);b為數(shù)據(jù)使用進(jìn)度;a表示本質(zhì)系數(shù)。通過式(8)可反映出數(shù)據(jù)的流動(dòng)程度,方便進(jìn)行數(shù)據(jù)風(fēng)險(xiǎn)評(píng)估。
影響風(fēng)險(xiǎn)評(píng)估結(jié)果的還有準(zhǔn)確性因子數(shù),準(zhǔn)確性因子數(shù)計(jì)算式為:
式中:λ=5.86是一個(gè)常值;Q和M分別代表數(shù)據(jù)的基本屬性和非基本屬性;e為進(jìn)度風(fēng)險(xiǎn)因子參數(shù);P為影響風(fēng)向因子數(shù)。通過函轉(zhuǎn)變系數(shù)可以得到:
式中:L為風(fēng)險(xiǎn)評(píng)估精準(zhǔn)系數(shù);D為不確定因子。其是對風(fēng)險(xiǎn)評(píng)估的結(jié)果進(jìn)行檢驗(yàn),在確定上述能夠影響風(fēng)險(xiǎn)結(jié)果的因素時(shí),還存在一些不確定因素,通過式子可以進(jìn)行不確定因數(shù)的評(píng)估,使結(jié)果更加的精準(zhǔn)。通過上述計(jì)算完成整體的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)。
2 試驗(yàn)驗(yàn)證
2.1 參數(shù)的設(shè)定
為了方便進(jìn)行大數(shù)據(jù)環(huán)境下Web網(wǎng)絡(luò)的風(fēng)險(xiǎn)評(píng)估,需要對參數(shù)進(jìn)行一定的設(shè)置。設(shè)置屬性指標(biāo)H值為6;標(biāo)記坐標(biāo)系數(shù)x,y分別取100,150;平均識(shí)別率的k值選擇1。為了使計(jì)算結(jié)果更佳準(zhǔn)確,k值參數(shù)如下,選擇不同系數(shù)對應(yīng)不同關(guān)聯(lián)數(shù):
2.2 風(fēng)險(xiǎn)評(píng)估過程
本文使用的是用特定風(fēng)險(xiǎn)特征因子法進(jìn)行數(shù)據(jù)的采集,由于設(shè)置的標(biāo)記參數(shù)為100,150,因此使用公式進(jìn)行標(biāo)記的過程會(huì)非常迅速。試驗(yàn)時(shí)間對比見圖2。
本文使用的特定風(fēng)險(xiǎn)特征因子法進(jìn)行數(shù)據(jù)的標(biāo)記,這樣的標(biāo)記方式可以使用式(6)進(jìn)行實(shí)際計(jì)算。其中i≠j∈{0,1,2,…,9}, 由于Web網(wǎng)絡(luò)采用編碼算子進(jìn)行網(wǎng)絡(luò)運(yùn)行,結(jié)合本文設(shè)計(jì)其錯(cuò)誤率減小、識(shí)別能力得到了很大提升。
為了驗(yàn)證試驗(yàn)的有效性,選定三種方案同時(shí)進(jìn)行試驗(yàn):第一種方案使用傳統(tǒng)方法的專家評(píng)估方法;第二種方法采用統(tǒng)計(jì)的方法進(jìn)行風(fēng)險(xiǎn)評(píng)估;第三種使用本文設(shè)計(jì)的方法進(jìn)行風(fēng)險(xiǎn)評(píng)估。表1為三種風(fēng)險(xiǎn)評(píng)估結(jié)果。
2.3 試驗(yàn)結(jié)果分析
通過圖2可以看出本文設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法能夠在大數(shù)據(jù)下使用較少的時(shí)間進(jìn)行數(shù)據(jù)的采集。通過表1結(jié)果可以看出,本文對Web網(wǎng)絡(luò)平均風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確度更好,同時(shí)不需要修正。綜上所述,本文設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法能夠解決傳統(tǒng)方法中評(píng)估結(jié)果不精確以及速度慢的問題。
3 結(jié) 語
本文設(shè)計(jì)的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)方法能夠有效地解決傳統(tǒng)方法中評(píng)估精準(zhǔn)度不足以及速度慢的問題。通過本文的設(shè)計(jì),希望能夠?qū)Υ髷?shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風(fēng)險(xiǎn)估計(jì)領(lǐng)域提供更好的評(píng)估方法。
參考文獻(xiàn)
[1] 趙星,李石君,余偉,等.大數(shù)據(jù)環(huán)境下Web數(shù)據(jù)源質(zhì)量評(píng)估方法研究[J].計(jì)算機(jī)工程,2017(2):48?56.
[2] 鄭宏,蔡宇翔.大數(shù)據(jù)環(huán)境下入侵風(fēng)險(xiǎn)評(píng)估優(yōu)化模型仿真分析[J].計(jì)算機(jī)仿真,2016,33(9):292?295.
[3] 杜永紅,石買紅,史慧敏.大數(shù)據(jù)環(huán)境下P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn)評(píng)估與防范[J].會(huì)計(jì)之友,2016(22):90?92.
[4] 王閃,譚良.Web大數(shù)據(jù)環(huán)境下的相似重復(fù)數(shù)據(jù)清理[J].計(jì)算機(jī)工程與設(shè)計(jì),2017,38(3):646?651.
[5] 林漢川,張萬軍,楊柳.基于大數(shù)據(jù)的個(gè)人信用風(fēng)險(xiǎn)評(píng)估關(guān)鍵技術(shù)研究[J].管理現(xiàn)代化,2016,36(2):95?97.
[6] 李勇,孟小峰,劉繼,等.基于小數(shù)據(jù)的在線用戶興趣長程演化研究[J].計(jì)算機(jī)研究與發(fā)展,2015,52(4):779?788.
[7] 胡亞慧,李石君,余偉,等.大數(shù)據(jù)環(huán)境下的電子商務(wù)商品實(shí)體同一性識(shí)別[J].計(jì)算機(jī)研究與發(fā)展,2015,52(8):1794?1805.
[8] 林海倫,楊曉剛,熊錦華,等.Deep Web數(shù)據(jù)采集查詢構(gòu)造方法研究[J].計(jì)算機(jī)科學(xué)與探索,2015,9(9):1025?1033.
[9] 李廣水,鄭滔,宋丁全.面向服務(wù)數(shù)據(jù)挖掘的關(guān)鍵技術(shù)在.NET下的實(shí)現(xiàn)研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(20):4654?4657.endprint