鄒鵬
摘??要:數(shù)據(jù)孤島形成形勢的愈發(fā)嚴峻,為此,需要展開對基于區(qū)塊鏈的大數(shù)據(jù)共享模型與關鍵機制的研究分析。分析了基于區(qū)塊鏈的大數(shù)據(jù)共享模型,并分別從網(wǎng)絡的數(shù)據(jù)可靠連接機制、數(shù)據(jù)權能訪問控制機制、數(shù)據(jù)服務定制機制3個層面出發(fā),展開了對基于區(qū)塊鏈大數(shù)據(jù)共享模型的關鍵機制研究,以實現(xiàn)預期的大數(shù)據(jù)在不同領域內(nèi)的共享交互目標。
關鍵詞:區(qū)塊鏈??大數(shù)據(jù)共享模型??關鍵機制??數(shù)據(jù)交互
中圖分類號:TP311
Research?and?Implementation?of?the?Sharing?Big?Data?Model?and?Its?Key?Mechanisms?Based?on?Blockchain
ZOU?Peng
(Guangzhou?Nanyang?Polytechnic?College,?Guangzhou,?Guangdong?Province,510900?China)
Abstract:?The?formation?situation?of?data?silos?is?becoming?increasingly?severe,?so?it?is?necessary?to?conduct?the?research?and?analysis?of?the?sharing?big?data?model?and?its?key?mechanisms?based?on?blockchain.?The?article?analyzes?the?sharing?big?data?model?based?on?blockchain,?and?conducts?research?on?the?key?mechanisms?of?the?sharing?big?data?model?based?on?blockchain?from?three?levels:?the?data?reliability?connection?mechanism,?data?permission?access?control?mechanism?and?data?service?customization?mechanism?of?the?network,?in?order?to?achieve?the?expected?shared?and?interactive?goals?of?big?data?in?different?fields.
Key?Words:?Blockchain;?Sharing?big?data?model;?Key?mechanism;Data?interaction
現(xiàn)代科學技術的發(fā)展速度極快,這就使得無論是智能化硬件與軟件,還是配套的互聯(lián)網(wǎng)設備設施,均獲得了持續(xù)完善的基礎條件。但在看到大數(shù)據(jù)時代背景下帶給人們工作與生活更多便利條件的同時,也應該同時提高對所形成數(shù)據(jù)孤島的重視。為此,打造出基于區(qū)塊鏈的大數(shù)據(jù)共享模型,并對其關鍵機制展開研究具有極為重要的現(xiàn)實意義。
1??基于區(qū)塊鏈的大數(shù)據(jù)共享模型
1.1?特點
多類技術的融合是區(qū)塊鏈技術發(fā)展過程中所表現(xiàn)出的主要特征,相較具有集中式與分布式特點的傳統(tǒng)數(shù)據(jù)庫來說,其優(yōu)勢凸顯得尤為明顯,例如可確保數(shù)據(jù)存儲與使用的安全性、建立數(shù)據(jù)信任、滿足對擴展性的信賴需求等。從這一角度來看,可將基于區(qū)塊鏈的大數(shù)據(jù)共享模型的使用特點總結如下。
1.1.1??全程透明且不具有可隨意篡改的特點
從數(shù)據(jù)共享的核心特征分析,由于主體類型的不同,使得其對于數(shù)據(jù)進行共享化處理的要求同樣存在著諸多差異,如存在開放性較強的數(shù)據(jù),但也有必須簽署相應協(xié)議的企業(yè)數(shù)據(jù),這一部分的數(shù)據(jù)在權限交互過程中,表現(xiàn)出了對多類硬性條件的實際需求[1]。而在區(qū)塊鏈的幫助下,可確保全部的交互流程均在區(qū)塊鏈中被公開,全程透明的特點使得其在滿足驗證與使用安全需求的同時,也能夠避免出現(xiàn)不同主體間在信任缺失情況下,使得大量成本涌入其中,典型的包括機會成本與交易成本。
1.1.2??去中心化
具有分布式特點的主體,在物聯(lián)網(wǎng)與互聯(lián)網(wǎng)的協(xié)助下,無論是信息的實時記錄還是網(wǎng)絡的更新,均可在不同主體的交互過程中完成相應任務,并非某個機構作為中間點執(zhí)行任務操作[2]。再加上多數(shù)的大數(shù)據(jù)對應的主體具有廣泛分布的特點,過程中有關系對等的特征表現(xiàn),進而可滿足對信息在不同主體中進行交換與基于實際環(huán)境要求進行存儲的需求,且可保證這一環(huán)節(jié)享有的信息權益,促使其主動履行相應的義務。
1.1.3??智能合約
區(qū)塊鏈技術經(jīng)由持續(xù)發(fā)展,存儲數(shù)據(jù)的前提下實際上包含了相對較為完備的圖靈狀態(tài)機,使得發(fā)展出的諸多智能合約均可被接受,并實現(xiàn)基于不同需求下的狀態(tài)維持與對繁雜事務的科學處理[3]。合約在接納設定參數(shù)背景下的事務信息后,即可對原有的數(shù)據(jù)狀態(tài)進行及時更新,對應的也將會產(chǎn)生相應的狀態(tài)機變化。且在大數(shù)據(jù)技術的應用協(xié)助下,即使有多類數(shù)據(jù)產(chǎn)生,也能夠在核心需求下進行不同類型權限的交互,相應的體系邏輯將會在智能合約的全面應用背景下,執(zhí)行針對信息流的自動化操作,從而避免不確定因素出現(xiàn)帶給信息流的干擾。圖1為基于區(qū)塊鏈的大數(shù)據(jù)共享模型。
1.2??存儲模型
系統(tǒng)業(yè)務數(shù)據(jù)與大數(shù)據(jù)集是當下實現(xiàn)大數(shù)據(jù)共享的信息存儲類型,且以具有集中式特點的存儲方案為主要的存儲形式。在打造出的模型中,可借由模型實現(xiàn)基于進行預定義處理的數(shù)據(jù)表包含的數(shù)據(jù)訪問權限、用戶等信息的存儲,并可確保無論是企業(yè)還是個人,均可保證信息傳遞至數(shù)據(jù)中心后的存儲安全性[4]。從實際應用情況來看,該模型的應用背景下不僅易于操作,且無須在數(shù)據(jù)的存儲與管理方面投入過多時間。原因在于用戶可借助平臺實現(xiàn)數(shù)據(jù)的自動化統(tǒng)一上傳與基于算法的集中管理,數(shù)據(jù)庫的維護管理不在存儲環(huán)節(jié)的考慮范圍內(nèi)。但應注意的是,此種方法的共享交互無法達到全程透明的目的,為保證其擴展性與安全性,需進一步完善存儲模型[5]。例如:可將數(shù)據(jù)管理與數(shù)據(jù)源頭區(qū)分,省略第三方的中間管理機構,在企業(yè)或個人的層面進行數(shù)據(jù)的全程存儲與管控。伴隨物聯(lián)網(wǎng)設備設施的逐漸完善與企業(yè)數(shù)據(jù)庫的快速建立,可在提供的云存儲技術下提供具有可視化特征的支持條件,為后續(xù)的數(shù)據(jù)共享提供安全保障。
1.3??連接模型
為解決由于冗余數(shù)據(jù)相對較多,使得整體的數(shù)據(jù)共識效率被眼紅降低的問題,同時降低數(shù)據(jù)在不同節(jié)點位置的存儲成本,打造出融入分布式文件系統(tǒng)的數(shù)據(jù)訪問與連接模型極為關鍵[3]。相應的存儲方式與對應的存儲內(nèi)容主要有以下幾種:
一是政府、企業(yè)以及個人的大數(shù)據(jù)源,對應的存儲內(nèi)容主要為根據(jù)實際需求所確定的不同場景、領域層面的大數(shù)據(jù)集合;二是區(qū)塊鏈網(wǎng)絡,對應存儲內(nèi)容主要為已經(jīng)經(jīng)過確定的不同數(shù)據(jù)之間的歸屬關系、對數(shù)據(jù)質量進行統(tǒng)一評估的關鍵數(shù)據(jù)等;三是分布式文件系統(tǒng),對應的存儲數(shù)據(jù)主要為已經(jīng)明確非關鍵屬性的一系列文件,如具有共享特點的協(xié)議、經(jīng)過加密處理的對應數(shù)據(jù)源的合適訪問形式等。
2??基于區(qū)塊鏈的大數(shù)據(jù)共享模型關鍵機制
2.1??數(shù)據(jù)可靠連接機制
2.1.1??體系架構
該種連接機制相較統(tǒng)一采取分散集群形式的組網(wǎng)存在著諸多不同,其核心架構類型為對等網(wǎng)絡(Peer-to-Peer,簡稱P2P),可實現(xiàn)網(wǎng)絡層面的開放性與扁平化功能使用目標,與區(qū)塊鏈的功能體系一一對應,進而在實際使用期間展現(xiàn)出了可為提供大數(shù)據(jù)的用戶獲取分布式功能特性的優(yōu)勢。
2.1.2??有著較強的兼容性
此類連接機制由于傳輸方式為HTTP,且有著對應不同平臺的兼容節(jié)點,并可在針對性的節(jié)點文件傳輸工具協(xié)助應用下,在連接不同平臺后迅速被部署。再加上生成的每一份文件均有對應hash碼支持地址的單獨訪問,因此,這一過程中,在確??商峁┓奖阍L問條件的同時,也能夠對應記錄至相應的區(qū)塊鏈網(wǎng)絡,其也是保證所產(chǎn)生與文件記錄真實性的重要基礎。
2.1.3??文件層面的諸多功能
以往大文件的存儲需要耗費的資源較多,而在此類連接形式之下,卻可提供分塊存儲的支持,并能夠準確記錄文件的變化狀態(tài),充分發(fā)揮管理優(yōu)勢,自身不具備對大小與類型予以限制的平臺屬性,因此無論何種對數(shù)據(jù)進行描述的形式,均可進行快速適應以實現(xiàn)全面的數(shù)據(jù)應用。
2.2??基于區(qū)塊鏈的數(shù)據(jù)權能訪問控制機制
2.2.1??數(shù)據(jù)權能訪問控制模式
在區(qū)塊鏈的應用協(xié)助下創(chuàng)設了去中心化的基礎環(huán)境,針對用戶一直以來存在的展開對數(shù)據(jù)進行全面管控的難度較高、使用機制的擴展性相對較差等問題,可啟動基于數(shù)據(jù)權能的科學訪問機制。作為一類相對較為簡單的資源管理機制類型,權能在其中被賦予了特殊通行的屬性,可將資源作為基礎單位進行隨時隨地的細粒度層面的訪問控制,使得其權限可在不同時間段被實時更新或解除。與傳統(tǒng)的訪問機制相比較,即使是在動態(tài)較強與數(shù)量龐大的數(shù)據(jù)背景下,也可針對相對復雜的權限控制特征,實現(xiàn)對資源的分布式管理(權限層面)。此外,該模式本身的管理難度相對較低,再加上有著相對較強的可擴展性,因此可對存在的數(shù)據(jù)信任問題予以有效解決,提供給有著相應需求的雙方靈活的交互條件。
2.2.2??數(shù)據(jù)權能交互信息流
第一步,由數(shù)據(jù)源作為發(fā)起者,提供給具備數(shù)據(jù)集的用戶相應的DST信息。該信息包含了全部的包含共享特性的文件地址、數(shù)據(jù)集、訪問路徑等;第二步,由擁有數(shù)據(jù)集的用戶或終端對信息進行發(fā)布;第三步,請求數(shù)據(jù)發(fā)出者將數(shù)據(jù)的獲取請求予以發(fā)出(RT),包含了數(shù)據(jù)請求用戶的ID、需求文件地址等;第四步,擁有數(shù)據(jù)的用戶,可在驗證通過后,及時將相應的權能以打包的形式集中發(fā)送給需求者,打包的權能包含了關聯(lián)數(shù)據(jù)集的ID以及配套的查詢方式;第五步,作為數(shù)據(jù)請求人員,在獲取到相應的DAT后可獲取來自數(shù)據(jù)源的一系列需求數(shù)據(jù);第六步,從數(shù)據(jù)源頭的角度分析,在獲取驗證并提供與之配套的相應下載方式后,即可實現(xiàn)請求者對擁有者的全面信息反饋,同時對所統(tǒng)計的一系列記錄進行更新處理。
2.3??基于區(qū)塊鏈的數(shù)據(jù)服務定制機制
2.3.1??數(shù)據(jù)服務定制模式
當下平臺在使用期間依舊存在著多數(shù)領域進行針對數(shù)據(jù)服務的定制能力相對較差的情況,若能夠及時將發(fā)布訂閱模型引入其中,即可在配合落實對數(shù)據(jù)服務進行高度定制的相應機制后,提供給數(shù)據(jù)進行共享過程中相應的定制能力,不僅全過程高效,且可根據(jù)需要獲取異步數(shù)據(jù)。從傳統(tǒng)的通信模式使用情況來看,無論是點對點,還是用戶借助服務器進行通信的形式,均需要作為請求消息的終端預先發(fā)送消息,且需要在獲取相應命令后才可獲取相應信息,耗費了大量的時間且存在空間限制。
2.3.2??數(shù)據(jù)服務定制信息流
第一步是對數(shù)據(jù)服務執(zhí)行訂閱操作。作為用戶可根據(jù)實際需要對數(shù)據(jù)服務的交易形式與內(nèi)容進行訂閱,創(chuàng)建完成后給出對應合約的關鍵字段與相應的積分價值。在合約機檢索形式的支持下,已經(jīng)獲取的數(shù)據(jù)可快速對應給出的標準,并制定可滿足要求的條件數(shù)據(jù)集合。同時,可分析出相應的訂閱需求,將其納入對應監(jiān)聽事件的關聯(lián)列表內(nèi)。
第二步是將數(shù)據(jù)進行發(fā)布處理。一旦新數(shù)據(jù)產(chǎn)生,即可借助合約用于對關鍵信息進行過濾處理,明確數(shù)