連曉曉 唐松 姚利彬 左北辰
引言
檔案作為重要信息資源和獨特歷史文化遺產(chǎn),價值日益凸顯,傳統(tǒng)紙質(zhì)檔案雖然具有直觀反映歷史面貌的優(yōu)點,但也存在收集整理難、儲存空間大、易損壞、利用難等弊端。隨著數(shù)字技術(shù)的飛速發(fā)展,信息資源越發(fā)成為一種重要的戰(zhàn)略性資源,檔案事業(yè)在迎來新的發(fā)展機遇的同時也面臨著前所未有的挑戰(zhàn)。適應(yīng)并立足新發(fā)展階段,推進檔案數(shù)字轉(zhuǎn)型和智能升級,推進檔案工作適應(yīng)黨政機構(gòu)日常工作成為一項必不可少的研究課題。2021年國家檔案局進一步明確了檔案信息化發(fā)展工作要點及加快推進檔案數(shù)字化轉(zhuǎn)型工作[1]。
一、區(qū)塊鏈技術(shù)研究現(xiàn)狀
(一)區(qū)塊鏈技術(shù)概述
比特幣的底層技術(shù)就是區(qū)塊鏈,自此區(qū)塊鏈技術(shù)走入國內(nèi)外學(xué)者研究領(lǐng)域,隨后區(qū)塊鏈技術(shù)被應(yīng)用于以太坊,直到出現(xiàn)了企業(yè)級開發(fā)平臺超級賬本,區(qū)塊鏈才真正脫離了電子貨幣的束縛,為其他各行各業(yè)應(yīng)用服務(wù)提供了可能[2]。區(qū)塊鏈本質(zhì)上是塊鏈?zhǔn)綌?shù)據(jù)存儲結(jié)構(gòu)、共識算法、智能合約來驗證、存儲、保護數(shù)據(jù)安全的,目前成果應(yīng)用于物聯(lián)網(wǎng)、醫(yī)療健康、供應(yīng)鏈等領(lǐng)域。
(二)區(qū)塊鏈在檔案領(lǐng)域應(yīng)用分析
作為一種安全的分布式賬本,區(qū)塊鏈意味著任何輸出都要經(jīng)過網(wǎng)格內(nèi)所有人的驗證。張奇文提出一種基于Gossip協(xié)議的信任收集共識算法,即通過評估鄰近節(jié)點的信息度選擇通信節(jié)點,消息在通信過程中不斷收集信任值,以超過全網(wǎng)臨界受信閾值時確認(rèn)為達成共識,提高傳統(tǒng)算法的穩(wěn)定性和效率[3]。區(qū)塊鏈技術(shù)在解決傳統(tǒng)檔案管理方面具有巨大潛力,越來越多的基于區(qū)塊鏈的應(yīng)用研究旨在提高檔案管理的安全性。王洋以中國電力建設(shè)集團有限公司電子文件單套歸檔和電子檔案單套管理試點為例,結(jié)合區(qū)塊鏈技術(shù)進一步保障當(dāng)前電子文件真實性[4]。聶勇浩以廣州互聯(lián)網(wǎng)法院為例,基于區(qū)塊鏈技術(shù)針對電子證據(jù)的可采、可信、可控和可用問題構(gòu)建生態(tài)系統(tǒng),保證電子證據(jù)安全可靠[5]。宋世昕為解決電子數(shù)據(jù)易攻擊性,很容易被篡改或破壞的問題,基于區(qū)塊鏈及IPFS技術(shù),提出了一套基于區(qū)塊鏈和IPFS的去中心化電子存證方案[6]。梅勝以健康檔案為研究對象,以區(qū)塊鏈技術(shù)為基礎(chǔ),構(gòu)建了健康數(shù)據(jù)跨域共享業(yè)務(wù)模型,分析了健康檔案的跨域共享業(yè)務(wù)和可信安全需求,旨在通過對數(shù)據(jù)源節(jié)點的 CA 認(rèn)證,提高數(shù)據(jù)源的真實性和安全性[7]?;趨^(qū)塊鏈的業(yè)務(wù)檔案存證溯源由電子檔案生命周期牽涉到的各單位構(gòu)建聯(lián)盟鏈,共同打造檔案存證溯源和防偽技術(shù)認(rèn)證平臺,可提供業(yè)務(wù)檔案數(shù)據(jù)存證、防偽驗證、檔案溯源、數(shù)據(jù)查驗等功能,目前多應(yīng)用于司法領(lǐng)域。除此之外區(qū)塊鏈技術(shù)還可應(yīng)用于互聯(lián)網(wǎng)數(shù)據(jù)存證、溯源[8]、身份認(rèn)證等領(lǐng)域。
二、基于區(qū)塊鏈的電子檔案管理系統(tǒng)構(gòu)建
(一)電子檔案管理系統(tǒng)技術(shù)要點
1.基于國密 SM3 和雪花算法,構(gòu)建高效鏈上電子檔案標(biāo)識碼。
2.基于 leveldb、merkle tree、HBase 構(gòu)建電子檔案分級存證,實現(xiàn)高效電子檔案多中心存儲、多方背書,實現(xiàn)檔案實時業(yè)務(wù)數(shù)據(jù)快速讀取、查詢和驗證。
3.基于智能化合約分權(quán)機制,實現(xiàn)電子檔案隱私數(shù)據(jù)管理,結(jié)合用戶業(yè)務(wù)和檔案管理角色,聯(lián)動封裝內(nèi)部調(diào)用智能合約和外部調(diào)用合約,給檔案數(shù)據(jù)提供不同級別的保護,內(nèi)部調(diào)用合約不對合約外暴露接口,用于檔案隱私數(shù)據(jù)管理。
(二)電子檔案管理系統(tǒng)簡介
本系統(tǒng)建設(shè)擬采用B/S體系結(jié)構(gòu),基于J2EE規(guī)范開發(fā),采用SOA、WEB2.0技術(shù)、工作流、知識管理、互聯(lián)網(wǎng)等核心技術(shù),同時采取多層安全技術(shù)認(rèn)證和安全管理機制,全面保障信息數(shù)據(jù)安全可靠。在應(yīng)用平臺方面既可支持Windows和Linux操作系統(tǒng),也可支持Unix操作系統(tǒng),來最大可能符合所有檔案管理設(shè)備,且兼容性較好,支持目前市場上IE8以上及各大主流的瀏覽器,支持HTTP、HTTPS、JMS、WebServices、TCP/IPSocket、SOAP、FTP、本地文件等傳輸協(xié)議。在適配性滿足的情況下,對檔案文件等數(shù)據(jù)信息以及訪問權(quán)限控制度高,確保檔案信息資源的安全可靠。
本系統(tǒng)檔案信息資源數(shù)據(jù)庫具備數(shù)據(jù)采集、數(shù)據(jù)組織與管理、數(shù)據(jù)處理、查詢統(tǒng)計、數(shù)據(jù)更新、輸出等集中管理功能,便于各職能部門、業(yè)務(wù)系統(tǒng)跨平臺交流,提高檔案利用效率。支持TCP、HTTP、SSL及HTTPS多種傳輸協(xié)議。多措并舉保證檔案信息資源安全,一是對登錄系統(tǒng)用戶進行身份鑒別。二是嚴(yán)格控制訪問權(quán)限。三是通過壓力測試確保系統(tǒng)具有一定抗攻擊性和訪問壓力。四是通過配置和應(yīng)用SSL證書來啟用HTTPS協(xié)議,保證互聯(lián)網(wǎng)數(shù)據(jù)傳輸?shù)陌踩?,實現(xiàn)系統(tǒng)管理數(shù)據(jù)、鑒別信息和重要業(yè)務(wù)數(shù)據(jù)在通信過程中的完整性,防止數(shù)據(jù)在傳輸過程中被篡改、竊取或破壞。五是分區(qū)存儲數(shù)據(jù),嚴(yán)格管理數(shù)據(jù)庫密碼及權(quán)限,定期備份數(shù)據(jù)。
(三)電子檔案標(biāo)識碼生成算法
電子檔案標(biāo)識碼生成算法是實現(xiàn)檔案管理的基礎(chǔ),需實現(xiàn)對電子檔案進行唯一標(biāo)識碼編碼,初步定義標(biāo)識碼包括電子檔案的完整性校驗值、校驗算法和用戶信息、電子簽名和可信時間標(biāo)識等。包括將檔案信息上傳并存儲至區(qū)塊鏈網(wǎng)絡(luò);基于區(qū)塊鏈網(wǎng)絡(luò),使用預(yù)設(shè)私鑰對所述檔案進行加密得到數(shù)字簽名,根據(jù)預(yù)設(shè)規(guī)則基于國密SM3和雪花算法,構(gòu)建高效鏈上電子檔案標(biāo)識碼。結(jié)合檔案管理應(yīng)用場景制定電子檔案標(biāo)識碼算法規(guī)則,標(biāo)識碼共有211bit組成,首先使用國密SM3算法對電子檔案進行計算輸出128bit摘要值,基于雪花算法對初次上傳的電子檔案進行分配相應(yīng)的56bit唯一標(biāo)識碼編碼,然后取當(dāng)前機器物理地址8bit,取可信授時服務(wù)器時間19bit(精確到納秒)。將此標(biāo)識碼寫入?yún)^(qū)塊鏈?zhǔn)澜鐮顟B(tài)數(shù)據(jù)庫,實現(xiàn)在整個生命周期對檔案進行反向追溯綁定。
將所述關(guān)鍵信息作為鍵,數(shù)字簽名作為與鍵對應(yīng)的值生成鍵值對,并將所述鍵值對上傳并存儲至所述區(qū)塊鏈網(wǎng)絡(luò),同時將所述關(guān)鍵信息與所述校驗位順序連接生成所述唯一標(biāo)識碼。利用區(qū)塊鏈的去中心化、可信任特性,從根本上避免了唯一標(biāo)識碼在生成和校驗過程中被篡改的可能性,從而確保檔案電子數(shù)據(jù)的可信度和真實性,提升檔案管理技術(shù)層面和業(yè)務(wù)層面的協(xié)調(diào)效率。
(四)智能化合約機制規(guī)范文檔管理模型
智能合約是區(qū)塊鏈網(wǎng)絡(luò)中去中心化應(yīng)用程序,基于智能化合約分權(quán)機制,實現(xiàn)電子檔案隱私數(shù)據(jù)管理。結(jié)合用戶業(yè)務(wù)和檔案管理角色聯(lián)動封裝內(nèi)部調(diào)用智能合約和外部調(diào)用合約,給檔案數(shù)據(jù)提供不同級別的保護。利用區(qū)塊鏈技術(shù)打通各檔案館,構(gòu)建安全有效的檔案共享渠道,實現(xiàn)多方參與,支持電子文檔的自動處置。系統(tǒng)的智能合約(又叫做鏈代碼)跟Peer節(jié)點主要通過gRPC通道來通信,運行在虛擬機內(nèi),鏈碼與Peer節(jié)點之間的交互過程(圖1)[9]。
智能合約可以根據(jù)檔案共享業(yè)務(wù)事先制定的規(guī)則保證交易的執(zhí)行,是在檔案管理業(yè)務(wù)鏈上產(chǎn)生并且編譯的軟件代碼,并由所有節(jié)點持有。根據(jù)合約自動執(zhí)行的特點,用戶部署在區(qū)塊鏈上的合約,是在虛擬機中執(zhí)行的,因此,無需第三方干預(yù),具備安全性和可靠性的優(yōu)勢,電子檔案流轉(zhuǎn)的各個環(huán)節(jié)不再需要依賴中央網(wǎng)絡(luò)節(jié)點進行數(shù)據(jù)信息傳輸,完成共識操作,且具有可擴展性。虛擬機,是智能合約代碼的執(zhí)行器,智能合約被編譯成二進制文件后,被部署到區(qū)塊鏈上[10]。
電子檔案的獲取、歸檔、跨機構(gòu)調(diào)取均通過調(diào)用智能合約的Inrstance接口(節(jié)點調(diào)用EVM的接口)和Callback接口(EVM回調(diào)節(jié)點的接口),來觸發(fā)智能合約的執(zhí)行操作,區(qū)塊鏈網(wǎng)絡(luò)中節(jié)點共識后,會將記錄追加存入?yún)^(qū)塊鏈中,后續(xù)不可再更改(圖2)。
有檔案查詢需求不同業(yè)務(wù)端口通過和區(qū)塊鏈支撐平臺之間建立智能合約接口來實現(xiàn)檔案信息共享。依托智能合約接口可將相關(guān)業(yè)務(wù)系統(tǒng)內(nèi)電子檔案的形成、修改、審核和提交等環(huán)節(jié)所形成的檔案上鏈。此外,還可用于將接收、檢測、利用和銷毀等電子檔案上鏈。區(qū)塊鏈支撐平臺包括平臺支撐服務(wù)、聯(lián)盟鏈、數(shù)據(jù)庫等部分,其中平臺支撐服務(wù)使用基于聯(lián)盟鏈的智能合約和數(shù)據(jù)庫所提供的服務(wù),構(gòu)建身份管理、檔案保護、檔案驗證等服務(wù),為業(yè)務(wù)系統(tǒng)和電子檔案管理系統(tǒng)提供檔案真實性保障支持[11],圖3為我們基于此技術(shù)獨立研發(fā)設(shè)計的電子檔案管理原型中部分改能展示。
參考文獻:
[1] 國家檔案局.“十四五”全國檔案事業(yè)發(fā)展規(guī)劃[EB/OL].[2022-08-15]. https://www.saac.gov.cn/daj/toutiao/ 202106/ecca2de5bce44a0eb55c890762868683.shtml.
[2] 白伊瑞,田寧,雷虹等.基于DID的跨鏈身份認(rèn)證研究綜述[J/OL].計算機科學(xué)與探索:1-17[2023-07-29].http:// kns.cnki.net/kcms/detail/11.5602.TP.20230712.2207.004.html.
[3] 張奇文,王志強,張逸謙.基于Gossip協(xié)議的信任收集共識算法研究[J].計算機科學(xué),2020,47(S1):391-394.
[4] 王洋.基于優(yōu)化共識的區(qū)塊鏈在電子文件全生命周期真實性保障中的應(yīng)用—以中國電力建設(shè)集團有限公司電子文件單套歸檔和電子檔案單套管理試點為例[J].檔案學(xué)研究,2022,No.185(02):89-96.
[5] 聶勇浩,張炘.基于區(qū)塊鏈的電子證據(jù)保全模式研究—以廣州互聯(lián)網(wǎng)法院為例[J].檔案學(xué)研究,2021,No.182(05):28-36.
[6] 宋世昕.基于區(qū)塊鏈和IPFS的去中心化電子存證系統(tǒng)的研究與實現(xiàn)[D].北京工業(yè)大學(xué),2019.DOI:10.26935/d.cnki. gbjgu.2019.000382.
[7] 梅勝,王曉麗,孔斌等.基于區(qū)塊鏈的健康檔案跨域共享可信安全機制研究[J].中國數(shù)字醫(yī)學(xué),2023,18(05):94-99.
[8] 朱季希凝,王杰華,丁衛(wèi)平等.基于雙鏈結(jié)構(gòu)和國密算法的疫苗溯源方案[J].計算機工程與設(shè)計,2023,44(07):1961- 1968.
[9] 于澤偉. 基于區(qū)塊鏈的農(nóng)產(chǎn)品追溯系統(tǒng)設(shè)計與實現(xiàn)[D].大連理工大學(xué),56,2019.DOI:10.26991/d.cnki.gdllu.2019.001907.
[10] 姚超,唐松.區(qū)塊鏈技術(shù)在冷鏈?zhǔn)称匪菰粗袘?yīng)用的研究[J].河北省科學(xué)院學(xué)報,2021,38(01):78-83.DOI:10.16191/j.cnki.hbkx.2021.01.011.
[11] 袁嘉新,楊安榮.基于區(qū)塊鏈技術(shù)的電子檔案管理應(yīng)用實踐——上海信聯(lián)信息發(fā)展股份有限公司成功實踐[J].中國檔案,2020(10):28-30.
基金項目:河北省檔案科技項目“基于區(qū)塊鏈技術(shù)的檔案管理體系構(gòu)建”(2022-X-27)
作者單位:河北省科學(xué)院? 河北省科學(xué)院應(yīng)用數(shù)學(xué)研究所? 河北省信息安全認(rèn)證技術(shù)創(chuàng)新中心