張靜波
(遼寧石化職業(yè)技術(shù)學(xué)院,遼寧錦州,121000)
近年來,隨著大數(shù)據(jù)的蓬勃發(fā)展,數(shù)據(jù)交易成為新興的熱門領(lǐng)域。以貴陽、北京、上海等地為代表的多個地區(qū),一批大數(shù)據(jù)交易所(或中心)快速興起,引發(fā)了社會各界的廣泛關(guān)注。數(shù)據(jù)交易是大數(shù)據(jù)發(fā)展到一定階段的必然需求,對推動我國數(shù)據(jù)公開化、共享化,建立健全以數(shù)據(jù)為基礎(chǔ)的科學(xué)化社會體系具有重要意義。數(shù)據(jù)交易依賴于完善的數(shù)據(jù)治理體系,進(jìn)而確保良好的數(shù)據(jù)質(zhì)量和安全的交易環(huán)境。而我國現(xiàn)有的大數(shù)據(jù)交易體系面臨兩個方面的主要問題:
(1)源數(shù)據(jù)和目標(biāo)數(shù)據(jù)難以匹配的問題。數(shù)據(jù)產(chǎn)生和應(yīng)用的環(huán)境不同直接導(dǎo)致數(shù)據(jù)的提供方與需求方對數(shù)據(jù)的要求不一致,較大程度的影響了數(shù)據(jù)交易的效率。因此,現(xiàn)有數(shù)據(jù)交易過程是提供方(或第三方交易場所)列出能夠提供的數(shù)據(jù)清單,需求方根據(jù)自身需要進(jìn)行有限的選擇。
(2)數(shù)據(jù)交易過程中的安全保障問題。不同于其他的實(shí)體物品交易,數(shù)據(jù)的只能在網(wǎng)絡(luò)上進(jìn)行,這就為數(shù)據(jù)交易過程中進(jìn)行數(shù)據(jù)篡改提供了可能。
解決上述兩個問題的關(guān)鍵是建立一種協(xié)同共治、安全可信的數(shù)據(jù)治理體系,區(qū)塊鏈技術(shù)為建立這樣的體系提供了技術(shù)可能。
區(qū)塊鏈?zhǔn)且环N新型的數(shù)據(jù)庫技術(shù),具有去中心化、防信息篡改等典型特征,使其在金融、征信等領(lǐng)域得到廣泛應(yīng)用[1]。區(qū)塊鏈技術(shù)適用于相關(guān)方互相不互信,而又對信息安全要求比較高的環(huán)境。因此,是解決數(shù)據(jù)交易現(xiàn)存問題的一種理想技術(shù)手段。
區(qū)塊鏈技術(shù)采用鏈?zhǔn)浇Y(jié)構(gòu)組織數(shù)據(jù)存儲節(jié)點(diǎn),也即區(qū)塊的概念,采用時間的先后順序,利用密碼學(xué)的技術(shù)建立起鏈?zhǔn)浇Y(jié)構(gòu)[1]。相比原傳統(tǒng)數(shù)據(jù)庫的“增刪改查”操作,區(qū)塊鏈形式組織的“數(shù)據(jù)庫”僅具有“增”和“查”的操作,且增加的數(shù)據(jù)需要各參與方的共同認(rèn)可,有效的保障了數(shù)據(jù)的安全性和可靠性。
按照系統(tǒng)是否具有準(zhǔn)入管理機(jī)制,區(qū)塊鏈的可以分許可鏈和非許可鏈。在許可鏈中,加入和查詢需要經(jīng)過系統(tǒng)的許可。根據(jù)擁有許可權(quán)限的范圍,許可鏈又可進(jìn)一步分為聯(lián)盟鏈和私有鏈,加入和讀取的權(quán)限分別控制在“聯(lián)盟”和少數(shù)私有人手中。非許可鏈?zhǔn)酵耆_放的,又稱為共有鏈,加入和查詢等相關(guān)操作在符合系統(tǒng)規(guī)則的前提下完全自由。
區(qū)塊鏈技術(shù)已經(jīng)應(yīng)用在金融、征信、醫(yī)療等諸多領(lǐng)域。部分學(xué)者已經(jīng)開始將區(qū)塊鏈技術(shù)應(yīng)用在政府?dāng)?shù)據(jù)管理、數(shù)據(jù)一致性等相關(guān)領(lǐng)域[2,3,4]。部分學(xué)者開始關(guān)注區(qū)塊鏈技術(shù)在隱私保護(hù)領(lǐng)域的應(yīng)用[5,6]。這些研究都為在數(shù)據(jù)交易領(lǐng)域引入?yún)^(qū)塊鏈技術(shù)奠定了良好的基礎(chǔ)。
參與交易的數(shù)據(jù)需采用區(qū)塊鏈的技術(shù)進(jìn)行存儲,僅有鏈內(nèi)可以參與交易。圖1為用于交易的數(shù)據(jù)區(qū)塊鏈結(jié)構(gòu),每個區(qū)塊鏈具有以下幾項(xiàng)關(guān)鍵要素:
a.基礎(chǔ)功能組件。實(shí)現(xiàn)數(shù)據(jù)庫的基本功能,如與其他區(qū)塊節(jié)點(diǎn)建立聯(lián)系,數(shù)據(jù)的讀取、加密、接口等,實(shí)現(xiàn)數(shù)據(jù)管理的基礎(chǔ)功能,確保數(shù)據(jù)數(shù)據(jù)可以按照安全的、按照指定的形式由賣方轉(zhuǎn)移至買方,確保數(shù)據(jù)交易過程順利完成。
b.數(shù)據(jù)校驗(yàn)(賬本)。所有參與交易的數(shù)據(jù)必須滿足交易雙方以及數(shù)據(jù)管理方共同約定的數(shù)據(jù)格式與存儲要求,可以采用現(xiàn)有的元數(shù)據(jù)管理方式,建立相應(yīng)的數(shù)據(jù)字典。也可以更廣泛的對數(shù)據(jù)清洗、隱私保護(hù)等提出約定。賬本功能是對本節(jié)點(diǎn)是否滿足事先的約定進(jìn)行校驗(yàn),通過校驗(yàn)方可建立相應(yīng)的區(qū)塊,并存儲相應(yīng)的數(shù)據(jù)。
c.共識,管理存儲數(shù)據(jù)和獲取數(shù)據(jù)的操作過程。參與數(shù)據(jù)交易的各方,是區(qū)塊鏈的管理與使用方。共識要素用來確保滿足條件的數(shù)據(jù)是經(jīng)各方認(rèn)可后存儲,也是經(jīng)各方認(rèn)可后進(jìn)行查詢和讀取。
圖1 區(qū)塊鏈模型
d.操作指令集合。用于實(shí)現(xiàn)區(qū)塊鏈操作過程中的各項(xiàng)指令。如文獻(xiàn)[1]所述,指令集合既可遵循圖靈完備性,也可不遵循圖靈完備性,需要根據(jù)雙方交易的數(shù)據(jù)類型和交易之前的約定確定。指令集合是具體交易的編碼實(shí)現(xiàn)。
e.數(shù)據(jù)存儲區(qū)。用于存儲交易所需的數(shù)據(jù)??紤]到現(xiàn)有交易的數(shù)據(jù)種類多樣,不僅局限于原有的關(guān)系數(shù)據(jù)類型,采用NoSQL技術(shù)對數(shù)據(jù)進(jìn)行存儲,將數(shù)據(jù)存儲為對象的范式,建立適用于多種數(shù)據(jù)類型的數(shù)據(jù)庫體系。
基于上述區(qū)塊鏈模型的數(shù)據(jù)交易,改變了傳統(tǒng)數(shù)據(jù)交易的基本流程,主要涉及三個方面:
a.數(shù)據(jù)交易不再是基于現(xiàn)有數(shù)據(jù),而是采用預(yù)約交易的方式。數(shù)據(jù)買賣雙方與數(shù)據(jù)交易平臺實(shí)現(xiàn)對相關(guān)數(shù)據(jù)達(dá)成共識,形成約定。相關(guān)數(shù)據(jù)的產(chǎn)生、清洗、存儲、交易等多個環(huán)節(jié)均由數(shù)據(jù)交易參與方共同參與管理。區(qū)塊鏈模型可確保參與交易的數(shù)據(jù)產(chǎn)生、交易全流程能夠符合事先的約定。
b.數(shù)據(jù)交易平臺職能弱化,交易平臺僅是區(qū)塊鏈數(shù)據(jù)庫系統(tǒng)的建設(shè)者和維護(hù)者,其雖參與交易過程,但并不實(shí)質(zhì)性的參與交易,更多的承擔(dān)交易監(jiān)督者的職能。
c.交易重心不再是交易本身,而是交易之前的約定,約定一旦達(dá)成,不能更改,參與交易的各方均是遵從合約的行為,各方的地位更加平等,交易更加公平。
圖2 系統(tǒng)模型結(jié)構(gòu)
系統(tǒng)模型,也即數(shù)據(jù)交易場所的管理系統(tǒng)模型?;谇笆龅膮^(qū)塊鏈模型和數(shù)據(jù)交易流程模型,系統(tǒng)模型重點(diǎn)是實(shí)現(xiàn)對多個區(qū)塊鏈存儲系統(tǒng)的綜合管理,其基本架構(gòu)如圖2所示。
系統(tǒng)模型邏輯上可分為三層,即應(yīng)用層、區(qū)塊鏈層以及基礎(chǔ)設(shè)施層。
應(yīng)用層。通過調(diào)用區(qū)塊鏈層和基礎(chǔ)設(shè)施層相應(yīng)的功能,為系統(tǒng)的使用各方提供基礎(chǔ)的展示功能和簡單的數(shù)據(jù)應(yīng)用。例如,提供數(shù)據(jù)樣例的展示、較為簡單的數(shù)據(jù)分析功能等。
區(qū)塊鏈層?;谏鲜鰠^(qū)塊鏈模型,為每個交易行為建立對應(yīng)的區(qū)塊鏈數(shù)據(jù)庫。交易行為與區(qū)塊鏈數(shù)據(jù)唯一對應(yīng)。區(qū)塊鏈采用聯(lián)盟鏈的形式,只有交易相關(guān)方和平臺的管理方是聯(lián)盟的成員,可以對鏈數(shù)據(jù)庫進(jìn)行相應(yīng)的操作。交易完成后,其對應(yīng)的區(qū)塊鏈隨即刪除。
基礎(chǔ)設(shè)施層。包括CPU、GPU、網(wǎng)絡(luò)、I/O、存儲等基礎(chǔ)硬件,以及使用云平臺所需的中間件等基礎(chǔ)軟件。
區(qū)塊鏈技術(shù)突破性的解決了安全環(huán)境和可靠交易的問題,具有良好的發(fā)展前景和廣泛的應(yīng)用領(lǐng)域。目前,對區(qū)塊鏈技術(shù)的研究還處于起步階段。本文是基于區(qū)塊鏈技術(shù)的通用技術(shù)特征,對應(yīng)用區(qū)塊鏈技術(shù)建立數(shù)據(jù)交易模型,解決數(shù)據(jù)交易面臨的問題,進(jìn)行了有益的探索。長遠(yuǎn)來看,隨著區(qū)塊鏈技術(shù)的不斷發(fā)展和應(yīng)用的逐步成熟,其與云計(jì)算、大數(shù)據(jù)等關(guān)鍵技術(shù)將有機(jī)結(jié)合,成為促進(jìn)我國數(shù)據(jù)交易環(huán)境不斷完善,數(shù)據(jù)共享能力不斷提升的有效途徑。