賈文溪,張軍堂,馬曉潔
(1.石家莊學(xué)院 a.黨政辦公室;b.信息中心,河北 石家莊 050035;2.石家莊市中醫(yī)院 人事處,河北 石家莊 050000)
區(qū)塊鏈的概念方興未艾,目前已步入?yún)^(qū)塊鏈3.0時代,即可編程社會,所有可記錄的檔案信息都可以上網(wǎng)、上云、上鏈,隨著技術(shù)的創(chuàng)新和發(fā)展,在社會生活各方面都產(chǎn)生了較為廣泛而深遠的影響。
狹義上講,它可稱為一種分布式賬本,一種鏈?zhǔn)降臄?shù)據(jù)結(jié)構(gòu):即鏈上的每個數(shù)據(jù)區(qū)塊(單元)按照時間順序依次相連,它的不可偽造和不可篡改性以密碼學(xué)的方式保護,并且區(qū)塊鏈可以同時存儲在多個節(jié)點上。從廣義上講,它是一種先進技術(shù)的代表,是利用塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來驗證與存儲數(shù)據(jù)、利用分布式節(jié)點共識算法來生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約來編程和操作數(shù)據(jù)的一種全新的分布式基礎(chǔ)架構(gòu)與計算范式。[1]“區(qū)塊鏈”可以從技術(shù)角度(數(shù)字時間戳、共識機制、非對稱加密)、載體方式(存儲方式)、數(shù)據(jù)庫、運行過程等不同角度理解,具有開放性、去中心化、可追溯、不可篡改及匿名性的特征。本文采用的是區(qū)塊鏈的廣義概念,著眼于區(qū)塊鏈多種技術(shù)組合在檔案信息資源中的實際應(yīng)用。
檔案是社會組織或個人在以往的社會實踐活動中直接形成的具有清晰、確定的原始記錄作用的固化信息。檔案的本質(zhì)屬性是原始記錄性,因而檔案可以還原歷史的真實狀況,具有較高的參考價值與法律效力。檔案信息來源廣泛、形式多樣、結(jié)構(gòu)復(fù)雜、數(shù)量膨脹、價值多元、深度共享,是國家重要的戰(zhàn)略性信息資源,蘊藏著巨大的潛能價值,在塑造政府形象、治理國家現(xiàn)代化、整合社會資源、提升公共服務(wù)、優(yōu)化發(fā)展政策等各個領(lǐng)域中發(fā)揮著基礎(chǔ)信息支撐作用。
基于區(qū)塊鏈的檔案信息資源整合不僅是一種觀念上的變革,更是一種全新的數(shù)據(jù)整合模式,能夠促進檔案管理部門結(jié)構(gòu)的扁平化,有力推動檔案部門的職能轉(zhuǎn)變和角色轉(zhuǎn)換,提高檔案信息的透明度和開放度,同時有效保護檔案信息的數(shù)據(jù)安全和用戶的隱私安全,提升信息共享效率,推動信息價值的深挖互聯(lián),關(guān)乎社會的進步和人類文明的傳承。
目前檔案信息資源面臨著數(shù)據(jù)收集困難、中心化存儲及整合率低、安全性差、信任度低、隱私保護難等問題,而區(qū)塊鏈技術(shù)的開放性、去中心化、可追溯、不可篡改及匿名性與實現(xiàn)檔案信息整合有渾然天成的契合點,可以有效彌合這些不足,推進檔案信息資源的整合利用。(見表1)
表1 區(qū)塊鏈技術(shù)適用于檔案信息整合的對比
多點收集、去中心化是區(qū)塊鏈最重要的特征之一。首先,在多點收集、去中心化的過程中意味著點對點平等、多主體治理、多中心參與、信息對稱、檔案數(shù)據(jù)自治等功能的逐漸實現(xiàn),改變了檔案部門在檔案信息整合中的主體中心地位。而且很好地重視了檔案的第一價值,即通過元數(shù)據(jù)多點捕獲對形成者的價值有了較為全面的記錄和保存。其次,可以根據(jù)用戶的具體需求實現(xiàn)在鏈上的訪問、檢索、查詢等功能,逐步實現(xiàn)多主體多中心參與,有利于促進檔案信息資源的共建共享。最后,通過點對點的方式對檔案信息整合中各主體和節(jié)點的權(quán)責(zé)劃分,并非所有主體權(quán)責(zé)均等,而是一方面要發(fā)揮檔案部門的“元治”角色,另一方面要不斷吸納社會力量,保證檔案信息整合的有序進行。
值得注意的是,這個階段的信息與服務(wù)對象、保存場所、管理形式之間交錯穿插,因此,檔案的集中化管理、保密特性及業(yè)務(wù)的職業(yè)本能與區(qū)塊鏈技術(shù)的“去中心化”“相對信任”之間的“矛盾”更為突出。再者,環(huán)境及技術(shù)的復(fù)雜不僅會使傳統(tǒng)的檔案業(yè)務(wù)發(fā)生顛覆性的改變,如傳統(tǒng)檔案中的“鑒定”“銷毀”環(huán)節(jié)在不斷弱化,綜合性、系統(tǒng)性更強的檔案利用、個性化智能服務(wù)在不斷增強,并且由于文件的價值形態(tài)、存儲結(jié)構(gòu)方式、管理主體等方面的變化,使得區(qū)塊鏈環(huán)境下檔案信息資源整合的范圍和內(nèi)容都在不斷擴大,工作環(huán)境愈加復(fù)雜,因此對檔案管理部門和相關(guān)人員也提出了更高的要求。
安全是檔案信息整合的前提和生命線。目前,檔案信息面臨著信息泄露、濫用數(shù)據(jù)、病毒侵染、隱私侵犯、黑客攻擊、缺乏安全共享渠道等風(fēng)險。區(qū)塊鏈的時間戳可以用于標(biāo)識某一時刻的時間,具有相對唯一性。時間戳不僅在檔案信息整合中增加了一個時間維度,同時也增強了檔案數(shù)據(jù)的可讀性,保證了檔案信息的真實性、可靠性,從而成為一種存在性的證明。共識機制則是為了防止數(shù)據(jù)偽造和篡改,利用共識算法保證上鏈數(shù)據(jù)的不可篡改。通過保障各分布式節(jié)點數(shù)據(jù)在充分信任的狀態(tài)下進行,實現(xiàn)檔案信息的自信任和集體信任,從而進一步加快檔案信息整合的進程。
借助加戳加密、共識機制、非對稱加密等技術(shù),有助于實現(xiàn)檔案部門、民眾和社會機構(gòu)之間良好的合作秩序和基于區(qū)塊鏈形成的信任體系,并通過深度對話、有效溝通,降低隱私安全擔(dān)憂,提升安全防護能力,從根本上夯實檔案信息整合的信任基石。
區(qū)塊鏈的類型可以按照開放程度的不同分為私有鏈、公有鏈和聯(lián)盟鏈,根據(jù)對接類型則可分為為單鏈、側(cè)鏈以及互聯(lián)鏈。多種類型的選擇和多鏈的配合有助于提高系統(tǒng)的可靠性、改善系統(tǒng)擴展性,有效緩解檔案信息整合中存在的數(shù)據(jù)分散、信息孤島、數(shù)據(jù)流通難等問題,從而提高檔案信息整合的的共享程度。
多鏈配合、大數(shù)據(jù)挖掘給檔案信息的整合及開發(fā)利用帶來了諸多便利,但是目前我國相關(guān)制度與法規(guī)、相關(guān)標(biāo)準(zhǔn)規(guī)范尚未健全,對區(qū)塊鏈驅(qū)動檔案信息資源整合的探索較為分散,各地相關(guān)機構(gòu)對區(qū)塊鏈的研究常常“各自為政”,容易造成資源的浪費和重復(fù)建設(shè);另外,由于我國檔案管理的模式長期以來都是中心化的方式,第三方中介機構(gòu)介入較少,缺乏監(jiān)管經(jīng)驗,在區(qū)塊鏈分布式賬本突破地理界限、強調(diào)用戶個人信息、利用信息保護的同時,對于密級較高和特殊種類的檔案來說,一旦利用者和檔案管理部門產(chǎn)生法律糾紛,監(jiān)管和責(zé)任認(rèn)定存在一定的困難。
文件生命周期理論是在20 世紀(jì)文件數(shù)量急劇增長的專業(yè)背景下提出的。文件生命周期理論的基本內(nèi)容主要可概括為三點:第一,文件從其形成到銷毀或永久保存,是一個完整的運動過程;第二,文件的整體運動過程由于價值形態(tài)的變化可劃分為若干階段;第三,不同階段的文件與服務(wù)對象、保存場所、管理形式之間存在內(nèi)在的對應(yīng)關(guān)系。[2]這個理論在電子文件時代,對于區(qū)塊鏈視域下的檔案信息資源整合仍具有參考性和適用性。通過結(jié)合文件生命周期理論,區(qū)塊鏈視域下的檔案信息資源整合路徑如下:
在信息形成階段,主要是捕獲真實完整的元數(shù)據(jù),并以私有鏈的方式記錄。首先根據(jù)相關(guān)的標(biāo)準(zhǔn)規(guī)范和智能合約,將不同種類的元數(shù)據(jù)信息收集到智能合約中,并進行初步鑒定;其次,對于有一定保存價值的信息由產(chǎn)生部門獲得的公鑰對其加密,同時提出存儲請求;最后通過共識機制把信息封裝成新的區(qū)塊,存儲在區(qū)塊鏈中,并以各個部門為節(jié)點組成一條私有鏈。各部門之間的檔案信息往來均發(fā)生在區(qū)塊鏈上,且每次處理的行為軌跡均被區(qū)塊鏈所記錄。存儲信息的區(qū)塊可分為區(qū)塊頭和區(qū)塊體,封裝的區(qū)塊頭包括:前一區(qū)塊地址、當(dāng)前版本號、時間戳、當(dāng)前區(qū)塊的目標(biāo)哈希值等;區(qū)塊體則包括元數(shù)據(jù)信息及相關(guān)描述信息。(見圖1)由此捕獲并存儲的信息可追溯、不可更改、可驗證,因而很好保障了檔案信息收集過程及捕獲內(nèi)容的真實完整。
圖1 信息捕獲存儲流程圖
在信息形成階段,尤其是信息形成前,強化頂層設(shè)計、達成共識理念尤為重要。目前區(qū)塊鏈的核心技術(shù)逐漸成熟,但在安全性能、大數(shù)據(jù)冗余、隱私保護、技術(shù)升級等方面也面臨著諸多挑戰(zhàn)。如何運用技術(shù)對檔案信息資源整合并進行頂層設(shè)計是首先要面臨的問題,它的實現(xiàn)必須依靠強有力的執(zhí)行、規(guī)范的操作、充沛的資金等方面的保障。雖然共享系統(tǒng)鏈上的主體權(quán)限不同、功能需求不同,但應(yīng)達成共識理念,捋順職責(zé)功能。學(xué)界不僅要積極探索新技術(shù)應(yīng)用的可能性、可行性及必要性,還要摸清區(qū)塊鏈技術(shù)發(fā)展的規(guī)律,并指導(dǎo)理論應(yīng)用;檔案部門要不斷探索區(qū)塊鏈技術(shù)與檔案信息整合的契合點和結(jié)合方法,在實踐中完善,順勢而為,順勢有為。
區(qū)塊鏈涉及到的安全技術(shù)主要包括數(shù)字摘要算法、數(shù)字簽名以及加密算法。在信息流轉(zhuǎn)階段,通過物理歸檔或邏輯歸檔的檔案信息,需要通過區(qū)塊鏈技術(shù)加戳加密,確保私有鏈中元數(shù)據(jù)信息的真實、完整、有效。隨后,通過跨鏈技術(shù)將私有鏈中需要移交的元數(shù)據(jù)信息向聯(lián)盟鏈移交,它的具體過程是:首先在聯(lián)盟鏈的智能合約中約定好所需要存儲的元數(shù)據(jù)類型,其次當(dāng)通過跨鏈技術(shù)、共識機制觸發(fā)智能合約啟動時,隨機的密鑰會對檔案對象進行加密,然后將整合的檔案存儲對象(包括哈希值、指紋等其他屬性)加密后存入集群,同時對檔案館身份、檔號、檔案對象的哈希值、檔案指紋等信息進行簽名,通過調(diào)用合約從簽名中恢復(fù)公鑰信息并進行對比,根據(jù)智能合約判定信息是否在保存范圍內(nèi),不屬于保存范圍的元數(shù)據(jù),會被駁回存儲請求;屬于保存范圍內(nèi)的元數(shù)據(jù),會通過存儲請求,自動公鑰加密并將這些信息存儲在聯(lián)盟鏈中,添加檔號與摘要等信息的映射,從而實現(xiàn)信息的流轉(zhuǎn)。
在這個階段,信息流轉(zhuǎn)頻繁。企事業(yè)單位及其他部門通過私有鏈結(jié)合到一起,聯(lián)盟鏈和私有鏈的結(jié)合點為檔案部門,各個檔案部門又通過聯(lián)盟鏈與檔案館結(jié)合在一起。(見圖2)為了確保流轉(zhuǎn)過程中的數(shù)據(jù)安全,共識機制、數(shù)字時間戳及加密技術(shù)尤為重要。共識機制是在信任的狀態(tài)下進行各分布式節(jié)點間的數(shù)據(jù)共享,實現(xiàn)對存儲數(shù)據(jù)所有節(jié)點的共同維護。而時間戳形成的時間鏈不僅僅是一種存在性證明,增強了信息的可讀性,更重要的是時間維度的存在可以保證存儲在區(qū)塊鏈中的檔案信息具有很高的可追溯與可驗證性,任何異動的發(fā)生都會產(chǎn)生相應(yīng)的時間記錄,有效避免了某些人為因素導(dǎo)致的信息泄露與盜取風(fēng)險;加密技術(shù)主要指的是基于哈希算法的非對稱加密算法,以對應(yīng)的公開密鑰和私有密鑰組成加密方法分析檔案信息的數(shù)據(jù)特征,對相關(guān)涉密信息和隱私信息進行加密,從而確保檔案信息的數(shù)據(jù)安全,降低流轉(zhuǎn)過程中存在的隱私安全。
圖2 聯(lián)盟鏈和私有鏈結(jié)合圖
在信息流轉(zhuǎn)階段,無論是私有鏈還是聯(lián)盟鏈,角色管理與權(quán)限控制都是非常重要的環(huán)節(jié),關(guān)系著檔案信息在各個服務(wù)對象之間的流轉(zhuǎn)順利。它的內(nèi)容主要是基于角色的權(quán)限控制,根據(jù)信息價值形態(tài)的變化、服務(wù)對象的需求、保管場所的差異一般可分為系統(tǒng)管理員、檔案管理員、一般用戶、黑名單用戶。系統(tǒng)管理員可以對系統(tǒng)進行相關(guān)設(shè)置,同時對用戶開展管理;檔案管理員具有相對完整的管理權(quán)限,能夠?qū)崿F(xiàn)對檔案信息的錄入、檢索、調(diào)用等,同時還可以審核普通用戶的注冊申請和借閱傳遞申請。一般用戶可以通過注冊查詢和查看檔案,同時可以通過提出借閱和驗證申請來獲取檔案信息。
信息流轉(zhuǎn)階段,各個節(jié)點相互交錯,技術(shù)應(yīng)用繁雜,各種關(guān)系復(fù)雜,因此必須依靠法治建設(shè),形成長效機制。檔案部門要緊跟相關(guān)國際、國家標(biāo)準(zhǔn),不斷加強區(qū)塊鏈技術(shù)應(yīng)用于檔案信息整合的標(biāo)準(zhǔn)體系建設(shè),包括基礎(chǔ)標(biāo)準(zhǔn)、方法過程標(biāo)準(zhǔn)、應(yīng)用標(biāo)準(zhǔn)、安全標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、操作標(biāo)準(zhǔn)等,驗證標(biāo)準(zhǔn)適用性,規(guī)范標(biāo)準(zhǔn)流程性,完善檔案信息數(shù)據(jù)的治理。同時,還要形成長效機制,在私有鏈中建立收集、存儲、管理的多主體整合融通、協(xié)同互動機制,在聯(lián)盟鏈中建立平等協(xié)商、信息共享、準(zhǔn)入退出、利益平衡等長效機制,在公有鏈中建立共同協(xié)商、監(jiān)督維護的共識機制等。
檔案信息共享利用一般是在聯(lián)盟鏈內(nèi)部或聯(lián)盟與外部用戶之間通過智能合約、IPFS 及混合加密機制實現(xiàn)的。聯(lián)盟鏈中的節(jié)點包含節(jié)點上的信息及節(jié)點外的信息。對于節(jié)點上的操作過程、利用痕跡都會被直接存儲在聯(lián)盟鏈上,留痕且可追溯、匿名且不可篡改。節(jié)點之外一般為普通用戶,普通用戶的操作流程為:首先用戶根據(jù)需求提出申請,隨后通過身份驗證,鏈下為用戶提供檔案信息(版本號、檔號、時間、操作管理員、附件等)并記錄相關(guān)利用的利用者、利用時間、利用內(nèi)容等信息,隨后在智能合約中將這些需要存儲到聯(lián)盟鏈中的信息類型記錄,通過執(zhí)行鏈上的智能合約,對利用的相關(guān)信息經(jīng)過檔案館公鑰加密,并通過共識機制記錄到區(qū)塊鏈中。通過私有鏈和聯(lián)盟鏈的連接,鏈上與鏈下的配合,聯(lián)盟鏈與聯(lián)盟鏈的對接,實現(xiàn)對檔案信息的處置、保管、利用,對有價值的信息進行有效整合。(見圖3)
圖3 區(qū)塊鏈信息流轉(zhuǎn)流程圖
區(qū)塊鏈的去中心化功能可以讓用戶根據(jù)自身需求在區(qū)塊鏈上訪問、查詢、獲取檔案信息,從而改變檔案部門在檔案信息開發(fā)利用中的絕對中心地位,實現(xiàn)在開發(fā)利用檔案信息過程中信息對稱、點對點平等、多主體治理、多中心協(xié)同參與,提高檔案數(shù)據(jù)利用效率和共享效能,重建多元共治、多元共享的良性格局,重塑檔案管理部門、社會、民眾之間的良性互動關(guān)系。值得注意的是,信息領(lǐng)域的變革在文檔工作的發(fā)展過程中具有原發(fā)作用,科技的進步與社會的發(fā)展離不開人才的培養(yǎng),要想在未來的信息時代掌握主動權(quán),技術(shù)人才是關(guān)鍵,管理人才是核心,復(fù)合人才顯光芒。無論是管理上的統(tǒng)籌謀劃、頂層設(shè)計、戰(zhàn)略規(guī)劃,學(xué)術(shù)上的宏觀指導(dǎo)與理論突破,還是技術(shù)上的攻堅克難、持續(xù)創(chuàng)新,都必須加大人才的培養(yǎng)力度。
這是一個人類傳播媒介手段日趨豐富的時代,也是人體的信息功能日益外擴、體外化信息系統(tǒng)逐漸獲得相對獨立性的過程。在檔案用戶需求多元、多樣、迫切的大數(shù)據(jù)時代,要立足社會信息資源共建共治共享理念,打破數(shù)據(jù)壁壘,推動檔案信息的開放共享、深挖互聯(lián)、跨界流動和價值發(fā)揮。推動區(qū)塊鏈技術(shù)應(yīng)用于檔案信息資源整合的落地生根,優(yōu)化檔案信息共享環(huán)境,實現(xiàn)檔案信息的個性化、社會化、智能化發(fā)展。