国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

區(qū)塊鏈交易網(wǎng)絡(luò)研究綜述*

2021-10-21 08:09:12吳嘉婧劉潔利林丹鄭子彬
關(guān)鍵詞:比特賬戶加密

吳嘉婧,劉潔利,2,林丹,2,鄭子彬,2

1. 中山大學(xué)計算機學(xué)院,廣東廣州 510006

2. 中山大學(xué)軟件工程學(xué)院,廣東珠海 519082

隨著區(qū)塊鏈技術(shù)的發(fā)展,區(qū)塊鏈加密貨幣在近年來也受到了廣泛的歡迎和關(guān)注。截至2021年1月,區(qū)塊鏈加密貨幣的總市值已超1萬億美元,其中市場占比第一的是比特幣,其市值高達(dá)7 000 億美元。在區(qū)塊鏈加密貨幣平臺上,所有交易記錄具備不可篡改的特性,并按照時間順序鏈接記錄在區(qū)塊鏈中。同時,區(qū)塊鏈加密貨幣的交易無需依賴可信第三方,具有去中心化的特點。目前,電子支付和區(qū)塊鏈加密貨幣支付是主要的兩種支付方式,現(xiàn)金流通的減少已成為不可扭轉(zhuǎn)的趨勢,各國亦在積極探索法定數(shù)字貨幣的發(fā)行方案。在此背景下,中國人民銀行提出了發(fā)布央行數(shù)字貨幣DCEP(digital currency electronic payment)的 計劃。央行數(shù)字貨幣的發(fā)布將一方面降低紙幣發(fā)行和流通的成本,提升交易的便利性,另一方面增強國家對交易的監(jiān)管和對貨幣的控制力,從而維護國家金融體系的穩(wěn)定和安全。

由于區(qū)塊鏈的開放性和透明性,包含豐富信息和完整金融活動痕跡的加密貨幣交易數(shù)據(jù)可以被公開獲取,這為金融交易數(shù)據(jù)挖掘領(lǐng)域提供了前所未有的機會。對區(qū)塊鏈交易數(shù)據(jù)進行分析和挖掘的主要價值有兩個:1) 通過對區(qū)塊鏈交易數(shù)據(jù)的分析和挖掘,可以廣泛探究交易系統(tǒng)中的用戶行為、財富分配和交易網(wǎng)絡(luò)的演化過程,推測加密貨幣金融市場波動的原因,作為其他金融活動的參考;2) 近年來區(qū)塊鏈系統(tǒng)中各種類型的網(wǎng)絡(luò)犯罪現(xiàn)象層出不窮,區(qū)塊鏈交易數(shù)據(jù)分析有助于識別其中的非法交易,為構(gòu)建更健康的區(qū)塊鏈生態(tài)提供有效的監(jiān)管方案,相關(guān)技術(shù)亦可作為法定數(shù)字貨幣交易監(jiān)管的參考??偠灾?,對區(qū)塊鏈加密貨幣交易數(shù)據(jù)進行分析不僅可以提升復(fù)雜網(wǎng)絡(luò)、數(shù)據(jù)挖掘等技術(shù)在金融系統(tǒng)中的理論價值和應(yīng)用價值,而且有利于增強加密貨幣平臺的金融安全和監(jiān)管。

網(wǎng)絡(luò)是描述現(xiàn)實世界中交互系統(tǒng)的通用語言,而復(fù)雜網(wǎng)絡(luò)科學(xué)被廣泛認(rèn)為是分析網(wǎng)絡(luò)系統(tǒng)的有效工具。在現(xiàn)有的區(qū)塊鏈加密貨幣交易數(shù)據(jù)分析文獻中,有相當(dāng)一部分是從網(wǎng)絡(luò)的角度進行研究,即在分析時先將加密貨幣系統(tǒng)中的對象(如賬戶、智能合約等) 抽象為節(jié)點,將對象之間的關(guān)系抽象為連邊。不同的加密貨幣平臺可能存在一些不同的交易活動,例如轉(zhuǎn)賬、智能合約的創(chuàng)建及調(diào)用等,因而我們可以從不同的角度對加密貨幣的交易活動進行網(wǎng)絡(luò)構(gòu)建,然后基于網(wǎng)絡(luò)性質(zhì)分析、節(jié)點分類、鏈路預(yù)測等網(wǎng)絡(luò)科學(xué)方法完成下游的數(shù)據(jù)挖掘任務(wù)。

作為一個新興的跨學(xué)科的研究領(lǐng)域,區(qū)塊鏈加密貨幣的交易網(wǎng)絡(luò)分析引起了大量學(xué)者的關(guān)注。本文旨在全面回顧和總結(jié)這一領(lǐng)域的現(xiàn)有文獻和最新技術(shù),重點討論加密貨幣交易網(wǎng)絡(luò)的建模、交易網(wǎng)絡(luò)的分析和交易網(wǎng)絡(luò)上的識別問題。其中,在進行區(qū)塊鏈加密貨幣的交易網(wǎng)絡(luò)研究時,我們首先要將交易數(shù)據(jù)建模為交易網(wǎng)絡(luò),通過交易網(wǎng)絡(luò)分析我們可以了解交易網(wǎng)絡(luò)上一些特有的性質(zhì),最后,我們可以結(jié)合交易網(wǎng)絡(luò)的性質(zhì)為交易網(wǎng)絡(luò)上的識別任務(wù)設(shè)計檢測工具。本文內(nèi)容的順序安排如下:第1節(jié)介紹區(qū)塊鏈交易及交易數(shù)據(jù)來源的預(yù)備知識,第2節(jié)從交易網(wǎng)絡(luò)建模、交易網(wǎng)絡(luò)分析和交易網(wǎng)絡(luò)上的識別技術(shù)對區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)的研究現(xiàn)狀展開綜述,第3節(jié)為本文的總結(jié)與展望。

1 區(qū)塊鏈及其交易

區(qū)塊鏈加密貨幣類型多樣,且不同加密貨幣的數(shù)據(jù)結(jié)構(gòu)互不相同。具體而言,區(qū)塊鏈加密貨幣的交易主要基于以交易為中心的模型和以賬戶為中心的模型。本節(jié)將對這兩種常見的交易模型進行介紹,并且介紹區(qū)塊鏈交易數(shù)據(jù)的收集方式,從而為第2節(jié)的交易網(wǎng)絡(luò)分析打下基礎(chǔ)。

1.1 區(qū)塊鏈交易模型

區(qū)塊鏈交易可被視為加密貨幣平臺上的用戶操作。當(dāng)一個新交易被用戶發(fā)起時,它將被廣播到點對點(P2P,peer-to-peer) 網(wǎng)絡(luò)中的所有節(jié)點,經(jīng)由驗證后可被添加到區(qū)塊鏈的新區(qū)塊中。區(qū)塊鏈技術(shù)最早可追溯于中本聰在2008 年發(fā)布的比特幣白皮書[1],隨后在2009 年,第一條區(qū)塊鏈伴隨著比特幣系統(tǒng)的發(fā)布和挖礦操作而誕生。自比特幣誕生以來,區(qū)塊鏈技術(shù)得到了廣泛的關(guān)注,并被應(yīng)用于智能金融、物聯(lián)網(wǎng)等多個領(lǐng)域[2-4]。同時,許多被稱為altcoins 的替代幣迅速出現(xiàn),例如第一個去中心化的域名系統(tǒng)Namecoin[5];在交易確認(rèn)速度上得到提升的Litecoin[6];提出采用股權(quán)證明(PoS, proof of stake) 作為工作量證明(PoW,proof of work) 的替代方案的Peercoin[7]。根據(jù)CoinMarketCap. com 的統(tǒng)計,到2021 年初,市場上已有超過8 000 種區(qū)塊鏈加密貨幣,總市值一度超過1 萬億美元。其他著名的加密貨幣包括Monero[8]、Zerocash[9]、EOS[10]和Libra[11]等,其中,以太坊[11]是最大的具備圖靈完備的智能合約的區(qū)塊鏈系統(tǒng),其主要的貨幣被稱為Ether (簡稱ETH),是僅次于比特幣的全球第二大加密貨幣。在眾多區(qū)塊鏈加密貨幣中,它們的交易模型主要可以分為以交易為中心的模型和以賬戶為中心的模型,其中,比特幣和以太坊分別是這兩類交易模型的典型代表。

在比特幣系統(tǒng)中,作為一種用戶標(biāo)識,比特幣地址是由用戶公鑰經(jīng)過一系列單向的哈希算法得到的,單個用戶可以擁有多個交易地址。比特幣系統(tǒng)采用的交易模型是以交易為中心的模型,其中單個交易可以具有多輸入和多輸出,并且可以與多地址關(guān)聯(lián)。交易的輸入由一組未花費的交易輸出(UTXO,unspent transaction output) 組成,其總金額需不小于交易支付金額。交易輸入方的用戶可以指定一個新地址來接收找零,用于接收找零的地址又被稱為找零地址(change address)。此外,比特幣中沒有賬戶余額的概念,可以通過用戶錢包中UTXO 的金額總和來計算該用戶的余額。

以太坊中的交易模型是以賬戶為中心的模型,它包含兩種賬戶,即外部賬戶(EOA,externally owned account) 和合約賬戶。其中,EOA類似于銀行賬戶,它具有存款、取款和記錄一些動態(tài)狀態(tài)信息(如賬戶余額) 的功能。合約賬戶關(guān)聯(lián)著一個可執(zhí)行的字節(jié)碼,其交易行為由用戶編寫的智能合約代碼所控制,并會對一些狀態(tài)信息進行維護,如字節(jié)碼哈希值及合約賬戶的余額等。與比特幣不同,以太坊中的交易是從一個賬戶到另一個賬戶的簽名數(shù)據(jù)包,它僅包含一個輸入和一個輸出。此外,以太坊交易可以完成包括轉(zhuǎn)賬、合約創(chuàng)建和合約調(diào)用在內(nèi)的3種主要功能。根據(jù)交易發(fā)送方,以太坊交易可以分為由EOA 發(fā)起的外部交易和由合約調(diào)用觸發(fā)的內(nèi)部交易。圖1給出了一個以太坊外部交易和內(nèi)部交易的典型示例,其中交易1 和交易2 都是由EOA 發(fā)起的交易,因此它們是外部交易,而交易3、交易4 及交易5 是由智能合約觸發(fā)的交易,因此它們是內(nèi)部交易。外部交易可能會導(dǎo)致許多內(nèi)部交易的產(chǎn)生,比如在交易2中,一個EOA 調(diào)用了一個合約賬戶,繼而觸發(fā)了后續(xù)的3個內(nèi)部交易。

圖1 以太坊的外部交易和內(nèi)部交易Fig. 1 Examples of the external transactions and internal transactions in Ethereum

1.2 區(qū)塊鏈交易的數(shù)據(jù)源

區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)分析的數(shù)據(jù)源主要包括區(qū)塊鏈交易數(shù)據(jù)和標(biāo)簽數(shù)據(jù)。最原始的獲取區(qū)塊鏈交易數(shù)據(jù)的方法是通過區(qū)塊鏈客戶端(例如BitcoinCore和Geth) 去訪問區(qū)塊鏈網(wǎng)絡(luò)并同步區(qū)塊數(shù)據(jù),從而獲得區(qū)塊鏈的原始數(shù)據(jù)。但是,對于許多加密貨幣而言,它們的原始區(qū)塊鏈數(shù)據(jù)以二進制格式存儲,需要解析為可讀的格式以進一步分析。因此,我們可以根據(jù)區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)構(gòu)建解析器,從獲取的原始數(shù)據(jù)中提取交易記錄。另外,一些區(qū)塊鏈客戶端為用戶提供了JSON-RPC接口以便獲取交易數(shù)據(jù)。然而,對于一些啟用智能合約功能的區(qū)塊鏈系統(tǒng),其內(nèi)部交易記錄并未存儲在區(qū)塊鏈系統(tǒng)中。這些內(nèi)部交易記錄可以通過區(qū)塊鏈瀏覽器檢索獲取,也可以通過使用自定義客戶端重演所有外部交易來獲取有關(guān)內(nèi)部交易的詳細(xì)信息。部分客戶端亦提供獲取內(nèi)部交易信息的接口,例如以太坊OpenEthereum 客戶端的“trace” 模塊能提供在以太坊虛擬機中生成的詳細(xì)運行時數(shù)據(jù),是訪問內(nèi)部交易記錄的便捷工具。

在一些交易網(wǎng)絡(luò)挖掘任務(wù)中,利用標(biāo)簽信息能進一步輔助方法的設(shè)計和驗證。但是,區(qū)塊鏈用戶在交易過程中無需暴露真實的身份信息,因此很難找到其對應(yīng)的標(biāo)簽信息。隨著區(qū)塊鏈生態(tài)的日益成熟,我們可以從一些區(qū)塊鏈論壇、區(qū)塊鏈瀏覽器上找到部分人工標(biāo)記的標(biāo)簽數(shù)據(jù)。例如,Walletexplorer. com 是一個具有地址自動聚類能力,能提供豐富地址標(biāo)簽的智能區(qū)塊鏈瀏覽器;比特幣論壇Bitcoin Forum 記錄了一些跟比特幣搶劫、盜竊、詐騙有關(guān)的地址①https://bitcointalk.org/index.php?topic=83794.0;區(qū)塊鏈瀏覽器Etherscan 的標(biāo)簽詞云模塊②https://etherscan.io/labelcloud提供了由用戶標(biāo)記的以太坊賬戶標(biāo)簽;此外,CryptoScamDB. org提供了一個開源數(shù)據(jù)集,用于跟蹤與區(qū)塊鏈系統(tǒng)有關(guān)的惡意網(wǎng)址及相關(guān)加密貨幣地址。

此外,一些研究者還發(fā)布了經(jīng)過清洗和整理的區(qū)塊鏈數(shù)據(jù)集以供研究。例如XBlock. pro 是一個旨在助力區(qū)塊鏈良性發(fā)展和數(shù)據(jù)研究的數(shù)據(jù)集共享平臺,它收集了當(dāng)前主流的區(qū)塊鏈加密貨幣的相關(guān)數(shù)據(jù),并對數(shù)據(jù)進行了清洗和歸類,是目前學(xué)術(shù)界數(shù)據(jù)量最大、覆蓋面最廣的區(qū)塊鏈數(shù)據(jù)平臺之一,可支持科研人員進行區(qū)塊鏈鏈上數(shù)據(jù)分析、區(qū)塊鏈反欺詐、智能合約分析、區(qū)塊鏈性能分析等方面的研究。

比特幣是最典型的采用以交易為中心的模型的區(qū)塊鏈交易系統(tǒng),目前已有一系列的對比特幣交易數(shù)據(jù)進行網(wǎng)絡(luò)建模的工作。文獻[12] 首先介紹了比特幣交易網(wǎng)絡(luò)建模的概念,并提出將比特幣的交易過程建模為將交易作為節(jié)點的交易網(wǎng)絡(luò)和將用戶作為節(jié)點的用戶網(wǎng)絡(luò),分別代表交易之間和用戶之間的比特幣資金流。在比特幣交易過程中, 由于交易的輸入是來自先前交易的UTXO,因此交易網(wǎng)絡(luò)的構(gòu)建非常直觀及簡單,即用節(jié)點代表交易,用包含金額和時間戳信息的有向邊表示比特幣資金流??紤]到用戶擁有多個比特幣地址的可能,文獻[12] 首先將屬于相同用戶的地址以聚類的方式進行聚合,然后構(gòu)建以用戶為節(jié)點、用戶之間的資金流關(guān)系為邊的用戶網(wǎng)絡(luò)。這兩種比特幣交易網(wǎng)絡(luò)建模方法被廣泛應(yīng)用于后續(xù)區(qū)塊鏈交易網(wǎng)絡(luò)分析的研究中[13-14]。此外,文獻[15] 將比特幣交易數(shù)據(jù)建模為以交易和地址為節(jié)點的帶權(quán)有向超圖,可以表示地址和交易之間的輸入和輸出關(guān)系。

以太坊是基于以賬戶為中心的交易模型的區(qū)塊鏈系統(tǒng)的典型代表。在以太坊的相關(guān)研究中,文獻[16] 介紹了3種以太坊交易數(shù)據(jù)網(wǎng)絡(luò)建模方式,即資金流網(wǎng)絡(luò)、智能合約創(chuàng)建網(wǎng)絡(luò)和智能合約調(diào)用網(wǎng)絡(luò)。在這3個網(wǎng)絡(luò)中,EOA 和合約賬戶均被抽象為網(wǎng)絡(luò)的節(jié)點,但是3個網(wǎng)絡(luò)中邊的語義有所不同。在資金流網(wǎng)絡(luò)中,邊表示資金流向,而在智能合約創(chuàng)建網(wǎng)絡(luò)和智能合約調(diào)用網(wǎng)絡(luò)中,邊分別表示合約的創(chuàng)建和合約調(diào)用。同時,只有合約賬戶才能作為智能合約創(chuàng)建網(wǎng)絡(luò)和智能合約調(diào)用網(wǎng)絡(luò)中邊的終點。考慮到兩個賬戶之間會發(fā)生多個交易,文獻[17] 提出將以太坊交易記錄建模為時序多重網(wǎng)絡(luò)。其中,賬戶被表示為節(jié)點,每個交易被表示為一條由交易發(fā)送方指向交易接收方的有向邊,每條邊包含了時間和金額信息,具體如圖2所示。

圖2 基于以太坊交易的時序加權(quán)多重有向網(wǎng)絡(luò)[17]Fig. 2 Temporal weighted multidigraph in Ethereum[17]

作為網(wǎng)絡(luò)分析的基本步驟,網(wǎng)絡(luò)建模直接影響上層算法的設(shè)計和效果,因此它非常關(guān)鍵。目前的交易網(wǎng)絡(luò)建模方式有許多種,但是在進行網(wǎng)絡(luò)構(gòu)建時,我們會面臨區(qū)塊鏈交易操作種類繁多、信息多源異構(gòu)的問題及不同的下游任務(wù)。因而如何找到適用于各種區(qū)塊鏈數(shù)據(jù)和不同區(qū)塊鏈任務(wù)的通用建模方式和建模標(biāo)準(zhǔn)是一個重要的研究方向。

2 研究現(xiàn)狀

現(xiàn)有的區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)分析工作具體可以總結(jié)為3個緊密相關(guān)且逐層遞進的部分:交易網(wǎng)絡(luò)建模、交易網(wǎng)絡(luò)分析和交易網(wǎng)絡(luò)上的識別技術(shù)。其中,交易網(wǎng)絡(luò)建模主要涵蓋將交易數(shù)據(jù)以網(wǎng)絡(luò)形式存儲的方法和討論;交易網(wǎng)絡(luò)分析從網(wǎng)絡(luò)科學(xué)的角度對交易網(wǎng)絡(luò)的特有屬性進行了討論;交易網(wǎng)絡(luò)上的識別技術(shù)主要包括賬戶地址背后的歸屬識別、交易模式識別和區(qū)塊鏈上非法活動的識別。本節(jié)將分別對這3個部分的研究現(xiàn)狀進行介紹和總結(jié)。

2.1 交易網(wǎng)絡(luò)建模

區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)研究的第一步是根據(jù)區(qū)塊鏈的交易特性將區(qū)塊鏈交易數(shù)據(jù)建模為網(wǎng)絡(luò)。目前區(qū)塊鏈系統(tǒng)的交易模型可大致分為兩類,即以交易為中心的模型和以賬戶為中心的模型?;谶@兩種不同的交易模型的區(qū)塊鏈系統(tǒng),其交易數(shù)據(jù)的網(wǎng)絡(luò)建模亦有很大差別。

2.2 交易網(wǎng)絡(luò)分析

復(fù)雜網(wǎng)絡(luò)理論已經(jīng)被廣泛地證明是一種建模和描述各類復(fù)雜系統(tǒng)的有效工具。近20 年來,復(fù)雜網(wǎng)絡(luò)相關(guān)的研究者提出了各種各樣的研究指標(biāo)以對網(wǎng)絡(luò)特征進行描述和度量。本小節(jié)將簡要介紹一些重要的網(wǎng)絡(luò)指標(biāo)以及區(qū)塊鏈在這些指標(biāo)上的表現(xiàn),以助了解區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)的特有性質(zhì)。

1) 節(jié)點和邊的數(shù)量。網(wǎng)絡(luò)中節(jié)點和邊的數(shù)量是衡量網(wǎng)絡(luò)規(guī)模和密度的常用指標(biāo)。在對區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)進行分析的過程中,Maesa等[18]觀察到比特幣交易網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模增長速度比線性增長更快。Alqassem 等[19]也注意到了這一現(xiàn)象,并發(fā)現(xiàn)比特幣交易網(wǎng)絡(luò)正在變得越來越密集,且其度分布遵循冪律分布。Chen 等[16]統(tǒng)計了以太坊的資金流網(wǎng)絡(luò)、智能合約創(chuàng)建網(wǎng)絡(luò)和智能合約調(diào)用網(wǎng)絡(luò)中節(jié)點和邊的數(shù)量,發(fā)現(xiàn)在以太坊中用戶的轉(zhuǎn)賬行為比創(chuàng)建智能合約及調(diào)用智能合約的行為更頻繁。

2) 度分布。在無向網(wǎng)絡(luò)中,節(jié)點的度是指節(jié)點的邊數(shù)。而在有向網(wǎng)絡(luò)中,節(jié)點的度分為入度和出度,起始于節(jié)點的邊的數(shù)量稱為該節(jié)點的出度,終止于節(jié)點的邊的數(shù)量稱為該節(jié)點的入度。度分布可以表示網(wǎng)絡(luò)中節(jié)點度的概率分布,計算公式如下

在復(fù)雜網(wǎng)絡(luò)中,一個有趣的現(xiàn)象是許多從真實系統(tǒng)建模而來的網(wǎng)絡(luò)的度分布符合冪律分布,即滿足

其中C和α是常數(shù),k是度的值。Kondor等[20]發(fā)現(xiàn)比特幣地址網(wǎng)絡(luò)入度和出度分布都具有高度異構(gòu)性。Motamed 等[21]對5 種加密貨幣的交易網(wǎng)絡(luò)進行了度分布分析,發(fā)現(xiàn)這些交易網(wǎng)絡(luò)的度分布都符合冪律分布,且冪律參數(shù)α經(jīng)過一定的波動后會收斂到穩(wěn)定狀態(tài)。

3) 路徑長度。網(wǎng)絡(luò)中兩個節(jié)點之間的路徑長度定義為連接這兩個節(jié)點時必須經(jīng)過的最少的邊數(shù),通??梢圆捎脧V度優(yōu)先搜索的方法找到兩個節(jié)點間的最短路徑。網(wǎng)絡(luò)直徑是網(wǎng)絡(luò)中所有節(jié)點對最短路徑中值最大的路徑長度。Lischke 等[22]指出,不同國家比特幣用戶子網(wǎng)絡(luò)的平均最短路徑在同一范圍內(nèi)。根據(jù)交易網(wǎng)絡(luò)直徑隨時間的變化,Gaihre 等[23]推斷出比特幣用戶對系統(tǒng)匿名性的擔(dān)憂。Alqassem 等[19]分析了比特幣交易網(wǎng)絡(luò)直徑增加的4個可能原因,即匿名性、竊賊、找零地址和比特幣混幣服務(wù)。此外,許多研究通過計算平均最短路徑來評估比特幣和以太坊中的 “小世界”現(xiàn)象[4]。

4) 聚類系數(shù)。聚類系數(shù)描述了網(wǎng)絡(luò)中節(jié)點的聚集程度。聚類系數(shù)的兩種度量方法包括局部聚類系數(shù)和整體聚類系數(shù)。局部聚類系數(shù)量化了共享同一鄰居的兩個節(jié)點本身也是鄰居的概率。全局聚類系數(shù)是網(wǎng)絡(luò)中所有長度為2的路徑中閉合路徑所占的比例[24],可通過以下公式計算

其中n是節(jié)點數(shù),kv是無向網(wǎng)絡(luò)中節(jié)點v的度數(shù),tv是包含節(jié)點v的三角形數(shù)。Baumann 等[13]觀察到比特幣用戶網(wǎng)絡(luò)具有較高的平均聚類系數(shù)和典型的 “小世界” 特性。在以太坊的資金流網(wǎng)絡(luò)中也發(fā)現(xiàn)了類似的結(jié)果[16]。然而,最近的研究表明,Ripple 和Namecoin 的交易網(wǎng)絡(luò)的聚類系數(shù)相對較?。?]。

5) 中心性。網(wǎng)絡(luò)中計算節(jié)點中心性的方法有很多種。其中,最簡單的中心性度量是節(jié)點度,其他被廣泛應(yīng)用的中心性度量包括特征向量中心性、katz中心性、PageRank算法、介數(shù)中心性和接近度中心性。Lischke 等[22]使用度中心性識別比特幣交易網(wǎng)絡(luò)中的主要樞紐。 Chen 等[16]通過PageRank 算法獲得了資金流網(wǎng)絡(luò)、智能合約創(chuàng)建網(wǎng)絡(luò)和智能合約調(diào)用網(wǎng)絡(luò)中最重要的10 個節(jié)點。他們發(fā)現(xiàn),交易所等金融應(yīng)用在資金轉(zhuǎn)移、合約創(chuàng)建和合約調(diào)用方面發(fā)揮著重要作用。

6) 同配性系數(shù)。同配性系數(shù)是用來衡量節(jié)點是否趨向于和與之相似的其他節(jié)點進行連接的指標(biāo)。度同配性系數(shù)表示網(wǎng)絡(luò)中的節(jié)點是否愿意與具有相似度的其他節(jié)點進行連接,其最大值是1,最小值是-1。值為正表示網(wǎng)絡(luò)是同配性的,值為負(fù)說明網(wǎng)絡(luò)中節(jié)點對的度是負(fù)相關(guān)的,也稱為異配,取0代表網(wǎng)絡(luò)結(jié)構(gòu)不存在相關(guān)性。一系列的研究表明,許多區(qū)塊鏈系統(tǒng),如比特幣、以太坊、萊特幣和達(dá)世幣,其加密貨幣交易網(wǎng)絡(luò)是異配的。

7) 連通分量。在無向網(wǎng)絡(luò)中,定義一個連通分量為一個子圖,該子圖中每對節(jié)點間均有一條路徑。而在有向網(wǎng)絡(luò)中,連通分量的概念包括弱連通分量和強連通分量。弱連通分量的定義類似于無向網(wǎng)絡(luò)中連通分量的定義。強連通分量是指對于所有節(jié)點集,每對節(jié)點之間至少存在一條有向路徑。在計算弱連通分量時,有向網(wǎng)絡(luò)的邊的方向信息將被忽略。對連通分量進行統(tǒng)計和分析有助于我們了解網(wǎng)絡(luò)結(jié)構(gòu),其中在區(qū)塊鏈交易網(wǎng)絡(luò)的分析上,Gaihre 等[23]觀察到,比特幣交易網(wǎng)絡(luò)中連通分量的數(shù)目在2011 年之前激增,但后來有所減少。他們分析得到這是因為許多交易所在2010年和2011年前后興起,促進了比特幣的流通。文獻[19] 提到,大多數(shù)比特幣地址包含在比特幣交易網(wǎng)絡(luò)的最大連通分量中,這個性質(zhì)與其他網(wǎng)絡(luò)類似。Guo 等[25]發(fā)現(xiàn),在以太坊中連通分量的大小分布可用冪律分布來近似,并且存在重尾特性。

8) 社區(qū)。社區(qū)是內(nèi)部節(jié)點連接緊密而與外部節(jié)點少有連接的網(wǎng)絡(luò)模塊。一個網(wǎng)絡(luò)可以經(jīng)過社區(qū)檢測算法劃分為多個社區(qū),不同的社區(qū)可以近似反映網(wǎng)絡(luò)中功能或者結(jié)構(gòu)的劃分。 Alqassem等[19]研究了比特幣中社區(qū)結(jié)構(gòu)的性質(zhì),發(fā)現(xiàn)社區(qū)規(guī)模的分布可以用指數(shù)截斷的冪律分布來擬合,且大多數(shù)比特幣社區(qū)都具有樹狀結(jié)構(gòu)。Moreno-Sanchez 等[26]研究了Ripple 中社區(qū)是如何形成的,他們發(fā)現(xiàn)用戶社區(qū)是動態(tài)的,是通過連接到同一地理區(qū)域的網(wǎng)關(guān)而形成的。

9) 網(wǎng)絡(luò)模體。網(wǎng)絡(luò)模體是指在復(fù)雜網(wǎng)絡(luò)中出現(xiàn)次數(shù)顯著高于在隨機網(wǎng)絡(luò)中出現(xiàn)次數(shù)的子圖模式,它是揭示網(wǎng)絡(luò)中高階組織的有效工具,被稱為復(fù)雜系統(tǒng)中的基礎(chǔ)構(gòu)件。Moreno-Sanchez 等[26]從最常見的模體出發(fā),將錢包分為網(wǎng)關(guān)、交易所和用戶,并分析得出網(wǎng)關(guān)是Ripple 中的關(guān)鍵角色,這與低聚類系數(shù)和異配性的網(wǎng)絡(luò)特性是一致的。Bai 等[27]研究了以太坊資金流網(wǎng)絡(luò)中13 種包含3個節(jié)點的模體,并將這些模體分為閉合的和開放的三角形。他們發(fā)現(xiàn)雖然閉合的三角形數(shù)量有所增加,但其比例呈下降趨勢。Paranjape 等[28]觀察到,比特幣中循環(huán)三角形模體的比例比Stack-Overflow等任何其他數(shù)據(jù)集都要高得多。

除了上述眾所周知的網(wǎng)絡(luò)特性外,一些研究者還從幾個新的角度對區(qū)塊鏈交易網(wǎng)絡(luò)進行了研究。例如,不同于以往只關(guān)注全局網(wǎng)絡(luò)性質(zhì)的研究,Ron 等[29]主要研究比特幣交易網(wǎng)絡(luò)上的用戶行為,包括用戶如何使用比特幣,如何在不同賬戶之間轉(zhuǎn)移比特幣,并分析了比特幣系統(tǒng)中發(fā)生的最大交易。他們發(fā)現(xiàn)大部分比特幣處于休眠狀態(tài),且網(wǎng)絡(luò)中有許多看起來奇怪的結(jié)構(gòu),如二叉樹結(jié)構(gòu)、長鏈。Lischke 等[22]結(jié)合鏈下數(shù)據(jù)(包括商業(yè)標(biāo)簽、IP 地址和地理位置) 對比特幣系統(tǒng)的用戶網(wǎng)絡(luò)和經(jīng)濟狀況進行了分析。他們深入了解了不同國家的業(yè)務(wù)分布和交易分布,以及不同的業(yè)務(wù)和不同的國家分別涉及的交易子網(wǎng)絡(luò)的網(wǎng)絡(luò)性質(zhì)。Maesa 等[30]分析了比特幣用戶網(wǎng)絡(luò)中度分布的異常值,發(fā)現(xiàn)了一些異常的交易模式。通過網(wǎng)絡(luò)分析,Gaihre 等[23]回答了比特幣用戶是否關(guān)心匿名性的問題,他們發(fā)現(xiàn)大多數(shù)用戶對匿名性的關(guān)注度很弱,但一個重要的影響因素是用戶擁有的比特幣的價值。Chen 等[31]通過交易網(wǎng)絡(luò)分析研究以太坊ERC20 代幣的創(chuàng)建者、持有者和代幣交易活動。Liang 等[32]研究了3 種區(qū)塊鏈加密貨幣的交易網(wǎng)絡(luò)性質(zhì),并從這些性質(zhì)分析了這3種加密貨幣的競爭力。

盡管目前的研究已經(jīng)充分涵蓋不同時間段主流區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)的網(wǎng)絡(luò)性質(zhì)分析,但是在網(wǎng)絡(luò)性質(zhì)的時序分析及交易網(wǎng)絡(luò)的生成和演化方面,現(xiàn)有研究討論非常初步。同時,鮮有研究揭示區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)與傳統(tǒng)引文網(wǎng)絡(luò)、社交網(wǎng)絡(luò)的異同。未來可對區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)的網(wǎng)絡(luò)性質(zhì)進行更深入的討論,并結(jié)合交易網(wǎng)絡(luò)的特性輔助下游任務(wù)的進行。

2.3 交易網(wǎng)絡(luò)上的識別技術(shù)

由于區(qū)塊鏈交易無需真實的用戶身份信息,許多區(qū)塊鏈加密貨幣平臺已成為各種網(wǎng)絡(luò)犯罪和非法金融活動的溫床?;趨^(qū)塊鏈交易網(wǎng)絡(luò)的發(fā)展的檢測和識別技術(shù),可以幫助我們識別區(qū)塊鏈上的異常交易行為。接下來將從實體識別、交易模式識別和非法活動檢測展開介紹。其中,實體識別可以幫助找到屬于同一用戶或組織的賬戶地址,它通常是后續(xù)分析任務(wù)的基礎(chǔ),交易模式識別對不同類型用戶的交易行為進行區(qū)分與識別,為后續(xù)的非法活動檢測提供依據(jù)。

2.3.1 實體識別大多數(shù)區(qū)塊鏈加密貨幣平臺創(chuàng)建新的賬戶或地址的成本很低,且無需驗證用戶真實的身份信息。因而用戶可以很方便地使用多個賬戶地址來增強區(qū)塊鏈交易活動的隱蔽性,這種操作在涉及區(qū)塊鏈交易的犯罪案例中很常見。Ron 等[29]第一次提出用 “實體” 來描述這種多個賬戶地址的擁有者,其中實體可以是一個用戶,也可以是一個組織。為了挖掘區(qū)塊鏈賬戶地址背后真實的身份信息,首先要對屬于同一個實體的多個賬戶地址進行關(guān)聯(lián),又被稱為實體識別?,F(xiàn)有的實體識別方法大致分為3種類型:基于交易屬性的實體識別、基于行為的實體識別和基于鏈下信息的實體識別。

基于交易屬性的實體識別主要利用區(qū)塊鏈交易的特有屬性來判斷賬戶地址是否屬于同一實體。在比特幣系統(tǒng)中,交易具有多個輸入和多個輸出,由于花費一個地址的比特幣需要提供該地址的私鑰,正常情況下用戶不會共享他們擁有的比特幣地址的私鑰。因此,Reid 等[12]認(rèn)為比特幣交易的多個輸入地址處于同一實體控制之下,并通過這種方法對比特幣系統(tǒng)的地址進行實體識別,這種方法被稱為多輸入啟發(fā)式方法。Harrigan 等[33]進一步調(diào)查了這種啟發(fā)式方法的有效性,并發(fā)現(xiàn)多輸入啟發(fā)式方法可能會導(dǎo)致漏檢和誤判誤差。而兩種誤差可能是由于地址重用、超級集群和持續(xù)增長的地址簇等多方面因素造成的。Remy等[34]結(jié)合多輸入的啟發(fā)式方法和社區(qū)檢測技術(shù)提出了一種新的實體識別方法,該方法能以精確度為代價增加召回率,因而在實際應(yīng)用中可以自行進行調(diào)整。比特幣系統(tǒng)中利用交易屬性進行實體識別的另一種典型方法是找零地址啟發(fā)式方法,該方法由Reid 等[12]提出。在比特幣交易中,會使用額外的找零地址接收找零,因此我們可以識別交易輸出方的找零地址并將其與對應(yīng)的輸入地址進行關(guān)聯(lián)。Klusman 等[35]指出,多輸入啟發(fā)式和找零地址啟發(fā)式方法并不適用于以太坊等基于以賬戶為中心的交易模型的區(qū)塊鏈系統(tǒng)。為解決這個問題,Victor[36]提出了3 個在以太坊上的啟發(fā)式規(guī)則:存款賬戶重復(fù)使用,空投多參與以及自我授權(quán)。存款賬戶重復(fù)使用規(guī)則是以交易所為背景設(shè)計的。事實上,交易所通常會為用戶生成存款賬戶,一旦用戶將資金轉(zhuǎn)入其存款賬戶,這筆錢稍后會自動轉(zhuǎn)入屬于交易所的熱錢包。當(dāng)存款賬戶被重復(fù)使用,就可以將使用相同存款賬戶的一系列其他賬戶識別為同一個實體。空投多參與規(guī)則為空投情況而設(shè)計,其中,空投是一種通過分發(fā)代幣來為ICO籌集資金的常用營銷方式。由于一些用戶將注冊多個賬戶參加空投并將代幣匯總到一個賬戶,因此可以將這些賬戶識別為同一實體。自我授權(quán)規(guī)則基于以下假設(shè):代幣消費者和代幣所有者在調(diào)用授權(quán)函數(shù)時可以被識別為同一實體。經(jīng)過實驗分析和驗證,Victor[36]認(rèn)為存款賬戶規(guī)則是實驗中最有效的方法。

基于行為的實體識別是利用用戶在交易過程中特有的行為偏好來判斷多個賬戶地址是否屬于同一實體,因而一些研究者將實體識別問題視為基于交易行為特征的分類或聚類問題。Androulaki等[37]考慮了一些交易行為特征,包括交易時間、交易方的索引、交易金額等,并通過基于特征的聚類揭示了近40%的用戶身份。Jourdan等[38]探索了5種類型的特征,包括地址特征、實體特征、時間特征、中心性特征和模體特征,并研究了這些特征在比特幣地址分類任務(wù)的效果。Harlev 等[39]將交易行為特征作為監(jiān)督學(xué)習(xí)的輸入,以實現(xiàn)比特幣地址的去匿名。此外,Shao 等[40]通過網(wǎng)絡(luò)嵌入的方法將比特幣地址在交易網(wǎng)絡(luò)中的交互活動轉(zhuǎn)換為低維特征向量,并結(jié)合深度學(xué)習(xí)方法進行實體識別。

區(qū)塊鏈鏈下數(shù)據(jù)指未存儲在區(qū)塊鏈中的相關(guān)數(shù)據(jù),它可以用來協(xié)助去匿名化過程。典型的鏈下數(shù)據(jù)包括節(jié)點的IP 地址、公開的標(biāo)簽等。一些用戶會在論壇整理發(fā)布帶欺詐性的交易地址、混幣服務(wù)地址等,這為我們創(chuàng)造了一個通過爬蟲采集這些信息的機會。同時,如果一位用戶暴露了自己的地址信息,可以通過分析用戶的交易行為找到其所擁有的其他地址。Reid 等[12]首先在實體識別中應(yīng)用了這種方法,并利用鏈下信息識別了一些參與盜竊的實體。根據(jù)比特幣論壇上提供的鏈下信息,F(xiàn)leder 等[41]將比特幣地址鏈接到其對應(yīng)的真實身份,并發(fā)現(xiàn)一些論壇用戶參與過暗網(wǎng)交易和賭博活動。M?ser 等[42]通過使用混幣服務(wù)來獲取相關(guān)的地址信息,并通過分析這些地址信息的交易構(gòu)建了混幣服務(wù)識別模型。

2.3.2 交易模式識別在區(qū)塊鏈加密貨幣生態(tài)中,不同用戶的交易行為大相徑庭,例如交易所的交易活動遠(yuǎn)比普通用戶的交易活動活躍。交易模式識別旨在揭示交易網(wǎng)絡(luò)的特殊結(jié)構(gòu)并進一步分析用戶的交易行為,相關(guān)方法可總結(jié)為:可視化方法、跟蹤分析和模體分析。

網(wǎng)絡(luò)可視化是一種強大的分析方法,可直觀了解交易網(wǎng)絡(luò)及其內(nèi)部的交易模式。McGinn 等[43]通過可視化某些特定區(qū)塊中的比特幣交易網(wǎng)絡(luò),發(fā)現(xiàn)了包括洗錢和拒絕服務(wù)攻擊在內(nèi)的異常交易模式。Chen 等[44]對異常地址的每日交易網(wǎng)絡(luò)子圖進行可視化,發(fā)現(xiàn)了一些與比特幣市場價格操縱相關(guān)的異常交易模式,如自環(huán)、雙向、三角形等。McGinn等[45]將比特幣交易的源區(qū)塊和目標(biāo)區(qū)塊視為鄰接矩陣進行可視化,并發(fā)現(xiàn)這種可視化方法很容易揭示出一些重復(fù)交易行為,方便將具有相似行為的交易關(guān)聯(lián)在一起。

在已知特定賬戶地址身份的情況下,對賬戶地址的交易進行跟蹤分析有利于總結(jié)出該類型賬戶的交易模式。Maesa 等[30]分析了比特幣交易網(wǎng)絡(luò)中度分布的離群點,通過對這些離群點進行分析,他們注意到一種類型刷屏行為的交易。經(jīng)過進一步分析后,他們總結(jié)出這些異常的刷屏交易可能是區(qū)塊鏈上的假名攻擊、垃圾郵件攻擊或者廣告行為。Ron 等[29]跟蹤了比特幣系統(tǒng)中超過50 000 BTC的大額交易,并分析了這些交易在長鏈和分叉合并模式下背后隱藏的交易意圖。

分析加密貨幣的交易模式的一系列研究是通過對交易網(wǎng)絡(luò)模體的分析展開的。Ranshous 等[46]使用有向超圖對比特幣交易網(wǎng)絡(luò)進行建模,并在有向超圖中引入網(wǎng)絡(luò)模體來揭示交易所的交易模式。Wu 等[47]在時序有向的比特幣交易網(wǎng)絡(luò)中提出了時序異構(gòu)模體的概念,并將其用于比特幣混幣服務(wù)的地址檢測。Zola 等[48]使用網(wǎng)絡(luò)模體特征設(shè)計了一種實體識別方法,同時,他們也研究了不同實體交易模式隨著時間推移的相似性,并探索是否有一些交易模式在不同批次的比特幣交易中重復(fù)進行的問題。Jourdan 等[38]利用網(wǎng)絡(luò)模體來揭示實體的交易模式信息,并通過實體識別任務(wù)說明交易模式可以被看作實體的指紋。

2.3.3 非法活動檢測區(qū)塊鏈系統(tǒng)的去中心化和交易無需真實身份的特性不僅吸引了大量的投機者,也吸引了許多犯罪分子的注意,因而區(qū)塊鏈也成為了詐騙、黑市貿(mào)易、洗錢等違法犯罪活動的溫床。與傳統(tǒng)金融場景不同,區(qū)塊鏈系統(tǒng)在進行交易之前不能通過執(zhí)行 “了解你的用戶”(KYC,know your customer) 流程來驗證用戶的身份。但是,區(qū)塊鏈系統(tǒng)中公開和不可篡改的交易記錄為我們提供了非法活動的檢測機會。接下來,我們將重點回顧基于交易網(wǎng)絡(luò)上的識別技術(shù)進行的區(qū)塊鏈金融詐騙和洗錢的檢測工作。

區(qū)塊鏈系統(tǒng)上的金融詐騙給加密貨幣生態(tài)的健康發(fā)展帶來了巨大威脅。在Vasek 等[49]的研究中,報告了包含龐氏騙局、采礦詐騙、詐騙錢包和欺詐性交易在內(nèi)的多種比特幣詐騙方式,并發(fā)現(xiàn)在192 起與比特幣交易有關(guān)的詐騙案中,1. 3 萬名潛在受害者損失了約1 100 萬美元。此外,其他區(qū)塊鏈系統(tǒng)中也發(fā)現(xiàn)了豐富的欺詐類型,如ICO詐騙[50]、蜜罐釣魚合約詐騙[51]等。由于區(qū)塊鏈詐騙不僅損害了交易人和投資人的利益,同時也影響了區(qū)塊鏈交易的可靠性和人們對區(qū)塊鏈的信任,一些研究者展開對區(qū)塊鏈詐騙檢測的研究。目前的檢測方法不僅包含一些基于特征提取的方法[52],亦包括了一些基于智能特征提取的檢測方法。文獻[53] 提出了一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的Edge-Prop 方法來學(xué)習(xí)大規(guī)模交易網(wǎng)絡(luò)中節(jié)點和邊的嵌入。與傳統(tǒng)的基于圖卷積神經(jīng)網(wǎng)絡(luò)的方法不同,EdgeProp 能學(xué)習(xí)到多重邊的邊信息,進而有效地識別以太坊上的非法賬戶。Wu等[54-55]提出了兩種基于隨機游走的嵌入方法,它們在學(xué)習(xí)節(jié)點嵌入時考慮了交易網(wǎng)絡(luò)的交易量、時間戳和多重邊等特性,并在下游釣魚檢測任務(wù)中驗證了方法的有效性。

在區(qū)塊鏈系統(tǒng)中,洗錢也是一個需要得到監(jiān)管和重視的問題。洗錢通常分為3 個步驟:首先,將黑錢注入金融體系;其次,將黑錢混入合法的貨幣中,與非法來源脫鉤;最后,這些黑錢被犯罪分子整合和收回,并處于一種看似合法的狀態(tài)[56]。由于區(qū)塊鏈具有去中心化、交易匿名的特性且存在許多可用的隱私保護技術(shù),加密貨幣已成為洗錢過程中隱藏非法資金流向的選擇之一。著名的加密貨幣情報公司Elliptic 在關(guān)于比特幣的洗錢報告中指出,交易所、混幣服務(wù)和賭博網(wǎng)站是比特幣洗錢的主要流向[57]。因此,近年來對加密貨幣交易網(wǎng)絡(luò)上的洗錢檢測的研究,主要集中在混幣業(yè)務(wù)和交易所的可疑交易模式上。比特幣混幣服務(wù)最初是為了通過混淆交易輸入方和接收方的關(guān)系來增強交易的匿名性,使資金來源更加不可追蹤,但它同時也成為了協(xié)助非法洗錢的一大利器。Prado-Romero 等[58]首先強調(diào)了混幣服務(wù)檢測的重要性,并將混幣服務(wù)檢測視為一個社區(qū)離群點檢測問題來解決。因為一旦檢測到混幣服務(wù),我們就可以進一步分析與這些服務(wù)交互的賬戶地址是否參與了非法活動。然而,這項工作的解決方案缺乏對不同類型混幣服務(wù)的自動適用能力。Wu 等[47]進一步提出了一種基于網(wǎng)絡(luò)模體檢測方法,從而自動刻畫不同混幣服務(wù)的交易模式。除了混幣服務(wù)識別以外,Hu等[59]通過特征分析對比特幣洗錢交易模式進行特征刻畫,并利用deepwalk[60]和node2vec[61]等網(wǎng)絡(luò)嵌入方法,構(gòu)建了識別洗錢交易的分類器。Battista 等[62]提出了純度的概念以理解比特幣是何時以及如何混幣的,并建立了一個名為BitConeView 的比特幣資金流可視化系統(tǒng)。Ranshous 等[46]指出,交易所提供了匿名身份與真實身份之間的聯(lián)系,因此研究交易所的交易模式是反洗錢的重要步驟。他們將交易所涉及的可疑洗錢模式用網(wǎng)絡(luò)模體進行刻畫,并利用網(wǎng)絡(luò)模體作為交易所的識別特征。

除了金融詐騙和洗錢問題,研究者還基于交易網(wǎng)絡(luò)識別技術(shù)提出了其他檢測區(qū)塊鏈非法活動的方法。Weber 等[57]提供了一個比特幣系統(tǒng)上的Elliptic 數(shù)據(jù)集,其中包含超過20 萬個交易節(jié)點、23. 4萬條交易信息以及166個節(jié)點特征。此數(shù)據(jù)集中的交易根據(jù)真實實體信息被標(biāo)記為合法類別(如交易所、錢包提供商、礦工和合法服務(wù))、非法類別(如詐騙、惡意軟件、恐怖組織和勒索軟件) 和未標(biāo)記類別?;谠摂?shù)據(jù)集,研究者使用EvolveGCN[63]方法對交易進行識別和分類。由于加密貨幣在勒索軟件支付中的廣泛應(yīng)用,Akcora等[64]提出了一種基于拓?fù)湫畔⒌睦账鬈浖z測框架,用于檢測已知勒索軟件和新出現(xiàn)的勒索軟件的地址。Conti等[65]從比特幣支付的角度研究了最近的勒索軟件及其經(jīng)濟影響,并結(jié)合共同輸入交易和找零地址信息提出了兩種聚類啟發(fā)式算法,以識別與勒索軟件相關(guān)的地址。在對黑市調(diào)查過程中,F(xiàn)oley等[66]對比特幣中的非法交易活動進行了量化,并基于社區(qū)檢測和分類模型提出兩種識別方法。此外,作者通過分析結(jié)果指出約有一半的比特幣交易與非法活動有關(guān)。

總而言之,現(xiàn)有的這些交易網(wǎng)絡(luò)識別技術(shù)不可避免地會受到區(qū)塊鏈上隱私保護技術(shù)的干擾,這兩類技術(shù)就像矛與盾的較量和比拼,互相促使各自的技術(shù)創(chuàng)新與發(fā)展。目前令人棘手的區(qū)塊鏈非法活動檢測任務(wù)也僅僅做到了事后檢測,可實際應(yīng)用的非法活動預(yù)警和非法資金追蹤與攔截方案較少。因此就未來而言,區(qū)塊鏈交易網(wǎng)絡(luò)上的識別技術(shù)仍有非常大的發(fā)展空間和應(yīng)用潛力。

3 總結(jié)與展望

由于區(qū)塊鏈系統(tǒng)的透明性和開放性,區(qū)塊鏈加密貨幣的大多數(shù)交易數(shù)據(jù)可被公開獲取。通過將加密貨幣系統(tǒng)中不同的對象抽象為節(jié)點,并將對象之間的交易關(guān)系抽象為連邊,區(qū)塊鏈加密貨幣的交易數(shù)據(jù)可被建模為大規(guī)模的復(fù)雜網(wǎng)絡(luò)。在過去的10 年里,研究者們已從網(wǎng)絡(luò)的角度進行了大量有關(guān)區(qū)塊鏈交易分析的研究。本文對區(qū)塊鏈交易網(wǎng)絡(luò)研究的相關(guān)工作進行了全面的回顧,并將現(xiàn)有技術(shù)和結(jié)果歸納為3個緊密相關(guān)且逐層遞進的部分,即區(qū)塊鏈加密貨幣的交易網(wǎng)絡(luò)建模、交易網(wǎng)絡(luò)分析和交易網(wǎng)絡(luò)上的識別技術(shù)。從總體來看,目前的區(qū)塊鏈加密貨幣分析領(lǐng)域已有了初步的發(fā)現(xiàn)和理論成果,同時也推動了復(fù)雜網(wǎng)絡(luò)理論和圖挖掘技術(shù)的發(fā)展。通過對現(xiàn)有工作的總結(jié)與思考,我們提出一些在區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)分析領(lǐng)域未來的研究方向:

1) 動態(tài)信息建模與處理?,F(xiàn)有的區(qū)塊鏈交易網(wǎng)絡(luò)分析和挖掘工作通常會忽略時間信息,但是,區(qū)塊鏈網(wǎng)絡(luò)是一個不斷增長的網(wǎng)絡(luò),新交易的發(fā)生伴隨著新節(jié)點或新連邊的出現(xiàn)。這些新節(jié)點和新連邊可能會改變原有網(wǎng)絡(luò)的性質(zhì),同時也讓基于原有交易網(wǎng)絡(luò)設(shè)計的數(shù)據(jù)挖掘模型的效果受到影響。因而,未來的工作可以進一步探索如何對動態(tài)的區(qū)塊鏈交易數(shù)據(jù)進行建模,分析網(wǎng)絡(luò)的動態(tài)特性和演化規(guī)律,設(shè)計能自適應(yīng)網(wǎng)絡(luò)變化的識別技術(shù)。

2) 交易網(wǎng)絡(luò)數(shù)據(jù)擴充。區(qū)塊鏈加密貨幣交易網(wǎng)絡(luò)的數(shù)據(jù)擴充將是區(qū)塊鏈交易數(shù)據(jù)分析中值得期待的一大研究方向。一方面,近年來許多用于提升區(qū)塊鏈可擴展性的鏈下交易方案已被提出并得到了初步的應(yīng)用,比如閃電網(wǎng)絡(luò)、雷電網(wǎng)絡(luò)等,而這些方案會使我們無法獲取全部的區(qū)塊鏈交易數(shù)據(jù)。另一方面,區(qū)塊鏈加密貨幣的交易數(shù)據(jù)存在著標(biāo)簽數(shù)量少、各類別標(biāo)簽數(shù)量不均衡的問題。通過網(wǎng)絡(luò)數(shù)據(jù)擴充,可以還原部分缺失的網(wǎng)絡(luò)結(jié)構(gòu)信息,對交易網(wǎng)絡(luò)進行有效的信息補全,并且在一定程度上緩解標(biāo)簽獲取困難的問題,從而輔助區(qū)塊鏈交易數(shù)據(jù)分析。

3) 交易審計與追蹤。在區(qū)塊鏈交易中,用戶無需使用真實的身份信息,且可利用一些服務(wù)和工具來增強交易的匿名性。雖然這能為用戶更好地實現(xiàn)隱私保護,但也吸引了很多犯罪分子利用區(qū)塊鏈交易來逃避監(jiān)管?,F(xiàn)有的交易去匿名和追蹤技術(shù)非常有限,因此,如何利用交易網(wǎng)絡(luò)分析在強匿名性、去中心化的區(qū)塊鏈上實現(xiàn)交易的可審計、非法交易的可追蹤與可攔截是一個重要的研究方向,不僅可以加強區(qū)塊鏈交易的合規(guī)性,還可以減少用戶和潛在投資者的財務(wù)風(fēng)險。

猜你喜歡
比特賬戶加密
探索自由貿(mào)易賬戶體系創(chuàng)新應(yīng)用
中國外匯(2019年17期)2019-11-16 09:31:14
外匯賬戶相關(guān)業(yè)務(wù)
中國外匯(2019年10期)2019-08-27 01:58:28
一種基于熵的混沌加密小波變換水印算法
父親的股票賬戶
特別健康(2018年4期)2018-07-03 00:38:20
比特幣還能投資嗎
海峽姐妹(2017年10期)2017-12-19 12:26:20
比特幣分裂
比特幣一年漲135%重回5530元
銀行家(2017年1期)2017-02-15 20:27:20
認(rèn)證加密的研究進展
基于ECC加密的電子商務(wù)系統(tǒng)
蘋果封殺比特幣應(yīng)用另有隱情?
永嘉县| 湖南省| 南丰县| 苍山县| 平阳县| 通道| 望江县| 习水县| 景德镇市| 楚雄市| 海兴县| 泰安市| 策勒县| 射阳县| 贵定县| 拉孜县| 微博| 黄山市| 福州市| 清镇市| 电白县| 辰溪县| 长泰县| 英吉沙县| 乐都县| 炎陵县| 句容市| 柞水县| 乐平市| 成都市| 广宗县| 四会市| 宁河县| 莲花县| 胶州市| 大渡口区| 新晃| 台中市| 太原市| 阳高县| 临泽县|