国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的龐氏騙局合約檢測方法①

2022-11-22 10:50政,斌,
關(guān)鍵詞:龐氏騙局合約

袁 政, 葛 斌, 任 萍

(安徽理工大學(xué)計算機科學(xué)與工程學(xué)院,安徽 淮南 232001)

0 引 言

隨著區(qū)塊鏈技術(shù)的發(fā)展,智能合約[1]數(shù)量爆發(fā)式增長,同時帶來諸多安全問題,龐氏騙局合約就是其中之一[2]。龐氏騙局合約以高回報為噱頭騙取后入投資者資金用于回報先前投資者,該類型騙局合約已造成上千萬美元資金的流失[3],嚴重影響區(qū)塊鏈環(huán)境健康。眾多學(xué)者針對此類型合約的檢測展開研究,Massimo Bartoletti等人[3]以待檢測合約與龐氏騙局合約字節(jié)碼的相似度來判斷其是否為龐氏騙局合約。該方法以歸一化萊文斯坦距離作為判斷依據(jù),但是閾值設(shè)置未經(jīng)過科學(xué)證明,說服力不足,檢測精度不高。龐氏騙局合約賬戶具有區(qū)別于普通合約賬戶的明顯特征,為更加精準檢測龐氏騙局合約,更多學(xué)者開始結(jié)合賬戶特征對合約進行檢測。Weili Chen等人[4]通過將提取操作碼特征和賬戶特征相結(jié)合的方法,利用極端梯度提升(eXtreme Gradient Boosting,XGBoost)檢測龐氏騙局合約。Weili Chen等人[4]為進一步提升檢測精度,采取相同的特征提取方法,而后通過訓(xùn)練隨機森林(Random Forest,RF)檢測合約。Shuhui Fan[6]通過有序目標統(tǒng)計處理賬戶和操作碼特征,結(jié)合有序增強思想基于決策樹(Decision Tree,DT)構(gòu)造一個無偏殘差模型,用來檢測合約?,F(xiàn)有方法大多結(jié)合代碼特征和賬戶特征,通過訓(xùn)練傳統(tǒng)機器學(xué)習(xí)模型進行檢測合約。該方法結(jié)合賬戶特征提升檢測精度,對不存在賬戶特征的初步部署合約檢測效果一般。對此,提出一種新的檢測方法。首先,將合約操作碼作為唯一數(shù)據(jù)源;改進合成少數(shù)類過采樣技術(shù),解決現(xiàn)存數(shù)據(jù)集的正常合約與龐氏合約分布不均衡問題。然后,創(chuàng)新性引入卷積神經(jīng)網(wǎng)絡(luò)檢測龐氏騙局合約,改進卷積神經(jīng)網(wǎng)絡(luò),更加充分提取操作碼的特征,提升檢測精度。仿真實驗表明,該方法較現(xiàn)有龐氏騙局合約檢測方法具有更高檢測精度。

1 數(shù)據(jù)處理

1.1 數(shù)據(jù)獲取

實驗采用的數(shù)據(jù)來自中山大學(xué)團隊的以太坊龐氏騙局智能合約公開數(shù)據(jù)集[4]。

1.2 改進合成少數(shù)類過采樣技術(shù)

數(shù)據(jù)集中龐氏騙局合約樣本占樣本總數(shù)比例較小,采用樣本類分布不均衡數(shù)據(jù)集訓(xùn)練模型,少數(shù)類檢測準確率較低。

傳統(tǒng)合成少數(shù)類過采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)存在合成樣本質(zhì)量問題,合成樣本有概率分布在樣本邊界及正常多數(shù)類樣本范圍,破壞數(shù)據(jù)集正確性,影響檢測精度。

改進SMOTE算法,提出小范圍合成少數(shù)類過采樣技術(shù),用于生成高質(zhì)量樣本。

數(shù)據(jù)集s={(xi,yi)|i=1,2,…,n},xi為合約操作碼,yi為標簽。yi=0,xi則為正常樣本;yi=1,xi為龐氏合約樣本。sn為正常樣本集,sf龐氏合約樣本集。

對sf中所有樣本,利用k鄰近(k-Nearest Neighbor)算法得到該樣本的k個最鄰近樣本。

利用公式(1),判斷xi屬性為safe或danger,用所有xi=safe構(gòu)造小范圍安全少數(shù)類樣本集ss.

(1)

從ss中隨機選擇xi,按照采樣倍率j,選擇j個xi的最鄰近樣本xij,利用公式(2)合成yi=1的樣本xnew.

xnew=xi+rand(0,1)×(xij-xi)

(2)

式(2)中,rand(0,1)為范圍零至一的隨機數(shù)。

1.3 實驗數(shù)據(jù)及預(yù)處理

智能合約的操作碼由操作指令和操作數(shù)據(jù)構(gòu)成,操作指令為官方定義指令集中指令,具有一定的規(guī)范性,操作數(shù)據(jù)由地址等數(shù)據(jù)組成沒有規(guī)律性,需要對智能合約操作碼進行數(shù)據(jù)清洗。合約操作碼沒有固定長度,需要對其進行統(tǒng)一化處理,將超過指定長度的合約進行截取,對長度不足的合約進行補零。對處理后的合約樣本進行詞頻統(tǒng)計,共計64種操作指令,構(gòu)建詞典和詞頻矩陣。

2 檢測龐氏騙局合約的卷積神經(jīng)網(wǎng)絡(luò)模型

2.1 改進卷積神經(jīng)網(wǎng)絡(luò)

創(chuàng)新性引入卷積神經(jīng)網(wǎng)絡(luò)[7](Convolutional Neural Network,CNN)用于龐氏騙局合約的檢測。

傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),采用單一通道對數(shù)據(jù)進行特征提取,數(shù)據(jù)特征獲取不夠充分。

為更充分獲取合約操作碼特征,提升檢測精度,改進卷積神經(jīng)網(wǎng)絡(luò)。改變傳統(tǒng)單通道卷積,使用不同尺寸卷積核,采用不平衡雙路卷積,對操作碼進行更加充分的特征提取。雙通道特征提取后在融合層使用系列特征融合。

圖1為改進卷積神經(jīng)網(wǎng)絡(luò)圖,C1,C2一維卷積核,P1,P2為池化層。

2.2 檢測龐氏騙局合約方法的框架

圖2為檢測龐氏騙局合約方法的框架。

首先通過以太坊瀏覽器(etherscan.io)對合約字節(jié)碼進行獲取,通過以太坊虛擬機反匯編規(guī)則,將合約的字節(jié)碼反匯編成操作碼。根據(jù)改進SMOTE方法解決樣本不均衡分布問題。對完善后的數(shù)據(jù)集進行劃分,以一比三的比例劃分后,分別用于測試和模型的訓(xùn)練。改進CNN模型經(jīng)訓(xùn)練后對測試集合約進行檢測,得到檢測結(jié)果。

3 實驗結(jié)果及分析

3.1 實驗環(huán)境

計算機處理器為AMD R7 4800H,顯卡RTX2060(6G),內(nèi)存16G,操作系統(tǒng)WIN10,開發(fā)工具為Anaconda3,深度學(xué)習(xí)框架為TensorFlow。

3.2 實驗結(jié)果與分析

分別選用尺寸為3和4的一維卷積核,池化層選擇最大池化,選擇ReLU作為神經(jīng)元激活函數(shù),批尺寸為128,隨機失或率為0.2,二元交叉熵作為損失函數(shù),sigmoid作為輸出層激活函數(shù),采用k折驗證對改進的模型進行訓(xùn)練。

圖3為訓(xùn)練、驗證準確率和迭代次數(shù)關(guān)系,圖4為訓(xùn)練、驗證的損失和迭代次數(shù)關(guān)系。初始設(shè)置訓(xùn)練輪數(shù)為40。由圖,在訓(xùn)練20輪后,訓(xùn)練準確率和損失趨于穩(wěn)定,驗證準確率緩慢下降,損失逐漸增加,出現(xiàn)過擬合現(xiàn)象,訓(xùn)練輪數(shù)定為20輪。

將訓(xùn)練20輪后的模型作為最終的合約檢測模型,用于后續(xù)的合約檢測。

在相同實驗環(huán)境下,分別使用支持向量機、決策樹、極端梯度提升和模型在原始數(shù)據(jù)集以及模型在改進數(shù)據(jù)集上進行訓(xùn)練和測試。每組實驗進行十次,取平均值,作為最終實驗結(jié)果。評標指標為查準率(Precision),查全率(Recall),F(xiàn)-score三項。

表1為五組實驗的最終實驗結(jié)果。

表1 實驗對比圖

從實驗結(jié)果來看,實驗?zāi)P驮谠紨?shù)據(jù)集上,傳統(tǒng)模型支持向量機和本文模型的準確率都達到0.94,對合約的檢測都有較高的準確率,極端梯度提升略低,決策樹最低只有0.64,表現(xiàn)較差。有較高查準率的支持向量機模型的查全率最低為0.43,有大量龐氏騙局合約未能檢測出,F(xiàn)-score同樣最低為0.59整體表現(xiàn)較差。本文模型相比支持向量機、決策樹和極端梯度提升在查準率等三項指標上均更高表現(xiàn)更好,有更好的檢測精度。

模型在改進數(shù)據(jù)集的表現(xiàn)上相比原始數(shù)據(jù)集,查準率提升1%,查全率提升4%,對合約檢測具有更高的精度。

4 結(jié) 語

針對現(xiàn)有方法對初步部署龐氏騙局合約檢測精度低問題,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的龐氏騙局合約檢測方法。首先,考慮到初步部署合約不存在賬戶特征,選擇操作碼作為唯一特征提取源。然后,改進SMOTE算法,生成人工樣本解決樣本類不均衡問題;創(chuàng)新性引入卷積神經(jīng)網(wǎng)路用于檢測合約,改進采用雙路不均衡卷積后特征融合,提升檢測精度。最后,通過仿真實驗表明,該方法對初步部署龐氏騙局合約有較好檢測精度。

猜你喜歡
龐氏騙局合約
別被騙局牢牢關(guān)??!
轉(zhuǎn)盤騙局
那些永不過時的“騙局”
二十四孝之涌泉躍鯉
天上不會掉餡餅 地下不會長黃金 “龐氏”金融騙局啟示錄:天下沒有無風(fēng)險的高收益
涌泉躍鯉
騙局
亦賢亦悲演龐氏
阿拉善左旗| 离岛区| 黎川县| 施秉县| 崇信县| 友谊县| 利辛县| 五家渠市| 清涧县| 简阳市| 绥芬河市| 尚志市| 子长县| 青州市| 安多县| 漳浦县| 铜川市| 江西省| 柞水县| 康平县| 仪征市| 云安县| 桃园市| 花莲县| 乐东| 疏附县| 西盟| 长寿区| 县级市| 安阳市| 固镇县| 林西县| 凤山市| 来凤县| 宁安市| 奉节县| 洛浦县| 亳州市| 望城县| 呈贡县| 金昌市|