左黎明 ,胡凱雨 ,張夢麗
(1.華東交通大學,江西 南昌 330013;2.江西省經(jīng)濟犯罪偵查與防控技術(shù)協(xié)同創(chuàng)新中心,江西 南昌 330103;3.華東交通大學系統(tǒng)工程與密碼學研究所,江西 南昌 330013)
2008年,日本學者中本聰在metzdowd的密碼學郵件組列表中發(fā)表了一篇名為“比特幣:一種點對點的電子現(xiàn)金系統(tǒng)”的論文,[1]并引入了區(qū)塊鏈這個重要概念來解決去中心化、無信任的交易系統(tǒng)。由于基于區(qū)塊鏈的數(shù)字貨幣在交易上具有安全性、實時性、匿名性等特性,“區(qū)塊鏈+行業(yè)”的業(yè)務(wù)場景成為業(yè)界追逐的焦點,企業(yè)通過首次代幣發(fā)行(ICO),[2]在場外交易平臺向不特定對象發(fā)行以區(qū)塊鏈形式承載的代幣,募集投資人的比特幣。但部分組織和個人打著金融創(chuàng)新的旗號,以ICO為“資本運作”,吸引廣大民參與代幣炒作,逐漸發(fā)展成為一種新型的網(wǎng)絡(luò)傳銷。[3]相比于傳統(tǒng)傳銷,ICO傳銷活動手段多變,擴張速度更快,隱蔽性、欺騙性更強,且危害更嚴重。2015年5月,時代周報曝光一種數(shù)字貨幣“克拉幣”屬于金字塔式詐騙活動,受騙者已達2646人,涉案金額約1.5個億人民幣。[4]2016年7月,中國警方破獲以非法虛構(gòu)“亞歐幣”為名的“跨亞歐公司”特大金融傳銷案,該案涉及外盤會員47000余人、涉及資金約40.6億人民幣。[5]同年8月,中國公安抓獲金融傳銷組織萬福會的劉寧,該傳銷組織吸納會員高達13萬人,傳銷資金約20億人民幣。[6]2017年12月,美國證券交易委員會對PlexCorps發(fā)行的代幣PlexCoin發(fā)起訴訟,該公司涉嫌違法融資,證券發(fā)行未經(jīng)SEC注冊。[7]ICO傳銷不僅威脅著合法企業(yè)和投資者的切身利益,而且嚴重影響著國家經(jīng)濟的發(fā)展。2016年,為了對ICO進行嚴格監(jiān)管,我國出臺法律文件將ICO界定為非法融資行為。2017年7月,美國證券交易監(jiān)督委員會指出對于ICO是否涉及證券違法發(fā)行和銷售,取決于具體事實和情形。同年9月,加拿大魁北克金融監(jiān)管機構(gòu)確定了ICO代幣發(fā)行屬于合法證券發(fā)行,并將該ICO納入監(jiān)管。而英國、澳大利亞和俄羅斯等國家對ICO仍處于觀望狀態(tài),并未對ICO定性問題出臺相關(guān)法律。因此,對于ICO定性問題,各國政府監(jiān)管態(tài)度和采取的方式各不相同。
由于ICO作為創(chuàng)新事物,法學界和產(chǎn)業(yè)界對ICO爭議不斷,國內(nèi)外專家學者就如何甄別ICO項目疑似傳銷,如何通過相關(guān)法律對ICO進行有效監(jiān)管等問題展開了研究。2008年,周虹等人從數(shù)字貨幣的生命周期的角度出發(fā)對金融監(jiān)管體系的構(gòu)建進行了研究。[8]2014年,樊云慧等人以比特幣為例探討數(shù)字貨幣的法律監(jiān)管,并提出了一系列對數(shù)字貨幣進行監(jiān)管的有效建議。[9]2016年,熊俊等人描述了非法定數(shù)字貨幣的界定,同時提出要針對不同類別的非法定數(shù)字貨幣采取差別監(jiān)管。[4]2017年,鄧建鵬就ICO的風險進行了探討,同時提出了一些如何進行ICO監(jiān)管的有效方法。[10]但上述研究僅僅是對數(shù)字貨幣的特點進行歸納總結(jié),提出了一些預防監(jiān)管政策。而并沒有對ICO是否為傳銷行為的判定給出有效辦法,針對此問題,本文提出了一種基于支持向量機的ICO傳銷類罪模型,利用該模型對難以定性的ICO進行分類,從而實現(xiàn)對未定性的ICO進行判定。
1995年,Vapnik等人在基于統(tǒng)計學習理論思想上提出了一種名為支持向量機的全新分類識別方法(Support Vector Machine SVM)。[11][12]此后在此基礎(chǔ)上進行改進的模型相繼出現(xiàn),[13][14]但其基本思想都是基于在給定樣本的屬性空間上構(gòu)造最優(yōu)分類的超平面,使得分類器得到全局最優(yōu)。支持向量機以其較好地實現(xiàn)了結(jié)構(gòu)風險最小化原則成為機器學習的重要手段。而目前根據(jù)樣本的可分性可將支持向量機歸納為以下兩種情況:
1.線性可分或非線性可分
當樣本線性可分時,可直接在原樣本空間尋找最優(yōu)分類超平面;而線性不可分的情況下,通過加入了松弛變量構(gòu)造軟間隔超平面。
2.線性不可分
針對樣本不可分,通過使用非線性映射將低維輸入空間的樣本映射到高維屬性空間使其變?yōu)榫€性情況,從而使得在高維屬性空間采用線性算法對樣本的非線性進行分析成為可能,并在該特征空間中尋找最優(yōu)分類超平面。
支持向量機模型主要是對ICO疑似傳銷的一種判斷,其本質(zhì)是一種分類問題,其分類原理如圖1所示,是通過在給定輸入空間中尋找能夠盡可能地將給定的數(shù)據(jù)訓練集正確地分開,且在分開的同時使得兩類數(shù)據(jù)點距離分類面最遠的超平面。通過此平面,得到分類函數(shù),由此函數(shù)將ICO分為高風險疑似傳銷項目和低風險疑似傳銷項目,即當值為1時表示高風險疑似傳銷,值為-1時為低風險疑似傳銷。因此,支持向量機模型可對ICO行為進行分類以判定其項目的特性。
圖1 支持向量機分類示意圖
1.樣本線性或非線性可分
假定函數(shù)時間間隔r1為1,樣本是線性可分的,可得式(2):
當訓練集T的兩類樣本近似線性可分時,即允許存在不滿足約束條件的樣本點后,仍然能繼續(xù)使用超平面進行劃分??赏ㄟ^引入松弛變量構(gòu)造軟間隔超平面,得約束條件,當ξi充分大時,樣本點總數(shù)滿足約束條件,同時為了約束ξi過大,在目標函數(shù)中引人懲罰參數(shù)C,由此得到如式(3):
當C=∞時,就等價于線性可分的情況。
求解式(4)的最優(yōu)解α*=(α1*,α1*,...,αn*)T,計算,選擇α*的一個正分量 0<αj*<C,并以此計算。
于是構(gòu)造分類超平面(ω*·x)+b*=0,并由此求得決策函數(shù),得到分類函數(shù),從而對未知樣本進行分類。
2.樣本不可分
當訓練集T的兩類樣本點集重合的區(qū)域很大時,此時用上述模型來處理線性不可分問題顯然不合理。因此,通過引進從輸入空間X到另一個高維的Hilber空間H的變換進行樣本的空間H線性可分,即將原輸入空間X的訓練集轉(zhuǎn)化為Hilber空間H重的新的訓練集。由在Hilber空間H中線性可分,可在空間H中求得超平面,于是將式(2)轉(zhuǎn)化為如式(5)的二次規(guī)劃問題:
采用核函數(shù)K滿足:
將避免在高維特征空間進行復雜的運算,不同的核函數(shù)形成不同的算法,主要的核函數(shù)有以下幾類別:
通過式(5)可得其拉格朗日函對偶問題:
若核函數(shù)是正定核,則式(10)對偶問題是一個凸二次規(guī)劃問題,必定有最優(yōu)解。求解式(10)的最優(yōu)化問題,得到最優(yōu)解,選擇的一個正分量,并以此計算,構(gòu)造分類函數(shù)。
值得注意的是,上述的求二次規(guī)劃的最優(yōu)解問題,可通過內(nèi)點算法(Interior Point Method)、[15]SMO(Sequentil Minimal Optimization)方法、[16]SVM 分解方法等方法進行求解。
基于支持向量機模型的ICO傳銷類罪指標的選取十分重要,需要從ICO的本質(zhì)以及公安部已證實為涉及傳銷、詐騙等金融騙局的案例出發(fā),分析與提取ICO經(jīng)濟類罪相關(guān)評價指標。2017年,東方科技報道了一篇名為“關(guān)于ICO市場亂象:有人在圈錢,但不是所有人”的文章,該文章指出判斷ICO項目疑似傳銷的主要特征有:項目是否去中心化、是否開源、是否有白皮書、是否許諾高收益高分成、是否成立公司等因素。[17]同年4月,江蘇省互金協(xié)會發(fā)布了2017年版《互聯(lián)網(wǎng)傳銷識別指南》,并指出判斷ICO項目是否存在的傳銷的主要特征有:是否過度炒作、官網(wǎng)是否基于https協(xié)議、是否繳納入會費、是否有嚴格會員體系、是否拉人頭送金幣獎勵。[18]
本文在上述文獻提出的特征基礎(chǔ)上,對已證實為傳銷的案件進行了總結(jié)分析,提取了如表1所示的15條判斷ICO疑似傳銷的評價指標,并根據(jù)這15條特征指標進行建模,旨在通過ICO類罪傳銷因素的權(quán)值指標,對ICO進行分類,進而對ICO進行傳銷判定。
表1 ICO傳銷類罪模型評價指標
在式(11)中:Rl表示判斷ICO是否疑似銷的15個指標。
根據(jù)設(shè)計的ICO傳銷類罪評價指標,收集180組樣本數(shù)據(jù)。樣本數(shù)據(jù)主要由央視曝光的2017年最新金融騙局黑名單[19]和加密貨幣分析網(wǎng)站CoinMarketCap加密貨幣數(shù)據(jù)組成,對收集數(shù)據(jù)進行數(shù)據(jù)清洗、屬性裝換等預處理工作,實現(xiàn)各ICO指標值的規(guī)范化。經(jīng)過數(shù)據(jù)探測和理解,采用0-1標準化方式對數(shù)據(jù)進行處理,形成180組數(shù)據(jù)樣本,將其中的150組作為學習樣本,剩下的30組作為測試樣本,其中部分測試樣本集如表2所示。
表2 部分測試樣本集
根據(jù)提出的基于支持向量機的ICO傳銷類罪模型,記訓練集數(shù)量n=150,特征屬性,則對于給定的訓練集樣本,利用Matlab的優(yōu)化工具箱,求得最優(yōu)解ω*,b*得到最優(yōu)分類函數(shù)。把30個測試樣本,j=1,2,..,30。代入分類函數(shù),按表示第j個樣本點為低風險疑似傳銷項目,表示第j個樣本點為高風險疑似傳銷項目,進行分類,得ICO類罪模型分類表3和圖3的實驗結(jié)果對比數(shù)據(jù)。
表3 實驗結(jié)果對比
圖3 ICO類罪模型分類圖
由實驗表3和圖3中可看出,30個測試ICO項目樣本中有20個是低風險疑似傳銷項目,10個是高風險疑似傳銷項目。表 2中的 FintruX、Snovio、DigiPulse、Graft、華強幣和Auctus是低風險疑似傳銷項目,Vechain、珍寶幣、幣盛和善心幣是高風險疑似傳銷項目。
值得注意的是,表3中的期望值是根據(jù)2017年央視公布350個資金傳銷組織名單得出的,[19]由處理后的值與期望值進行對比,知該模型的分類正確率為90%。
本文針對目前ICO難以定性的問題,通過分析ICO傳銷特征,提取其信息建立數(shù)據(jù)集,利用支持向量機模型對ICO進行分類,實現(xiàn)對未定性ICO的判定,并對模型進行了實驗研究,研究結(jié)果表明利用支持向量機模型進行ICO分類,其結(jié)果的準確率較高,能夠初步的對ICO疑似傳銷進行判定。今后,可以利用深度學習的方法對ICO的定性問題進一步分析。