劉麗華
摘 要:現(xiàn)階段高校教育檔案管理系統(tǒng)面臨數(shù)據(jù)易被篡改、存儲分散、難以追溯等挑戰(zhàn),區(qū)塊鏈技術(shù)的出現(xiàn)為解決上述安全問題提供了新思路。本文基于區(qū)塊鏈技術(shù)提出一個高校教育檔案存證溯源系統(tǒng)。首先根據(jù)高校教育檔案需求提出相應(yīng)的教育檔案存證溯源總體框架和角色構(gòu)成;其次,從層次定位角度出發(fā)設(shè)計了系統(tǒng)兩大模塊;最后從數(shù)據(jù)存儲層面將教育檔案存證溯源信息和教育檔案文件分離存儲,并給出智能合約技術(shù)開發(fā)流程。該系統(tǒng)的提出為教育檔案區(qū)塊鏈的進一步發(fā)展提供了一定借鑒作用。
關(guān)鍵詞:教育檔案;區(qū)塊鏈;存證溯源;星際文件系統(tǒng)
中圖分類號:G270.7文獻標(biāo)識碼:A文章編號:1673-260X(2024)06-0039-04
教育檔案是指教育機關(guān)、單位和個人按照一定原則和方法保管的具有保存價值的教育文獻資料。高校中記錄學(xué)生在校期間產(chǎn)生的各類教育信息的重要文件是教育檔案重要的組成部分,主要包含考核成績、學(xué)位學(xué)歷、思想道德表現(xiàn)、獎懲紀(jì)律、掌握技能、特長和家庭狀況等。學(xué)生通過教育檔案可以了解自己各階段教育歷程,總結(jié)在學(xué)習(xí)過程中存在的優(yōu)點與不足,從而更好地規(guī)劃未來。大量單位在招新時都會查看學(xué)生的教育檔案,從中了解學(xué)生在學(xué)校的表現(xiàn),關(guān)注學(xué)生的學(xué)歷學(xué)位、成績、已掌握技能、實踐經(jīng)驗等,作為后續(xù)招聘錄用的重要參考依據(jù)。因此,教育檔案對于學(xué)生每一階段的綜合評定、學(xué)業(yè)規(guī)劃、升學(xué)和就業(yè)等都起著重要作用。
高校教育檔案管理是教育領(lǐng)域的一項重要任務(wù)。在我國,有專門機構(gòu)負(fù)責(zé)管理教育檔案,但中心化的教育檔案管理方式存在檔案數(shù)據(jù)易被篡改、存儲分散、難以追溯等問題。隨著科學(xué)技術(shù)的不斷進步,大部分教育檔案已由紙質(zhì)轉(zhuǎn)變?yōu)殡娮有问?。教育檔案的電子化管理不僅節(jié)約了大量紙張,還方便了檔案信息的管理和檔案內(nèi)容的共享傳播,但伴隨而來的是教育檔案信息的真實性、安全性和完整性受到了極大的威脅。如何提高教育檔案的真實性、安全性和完整性成為現(xiàn)階段教育檔案領(lǐng)域必須面對的難題。
區(qū)塊鏈(Blockchain)技術(shù)的出現(xiàn)為解決上述教育檔案問題提供了新思路。區(qū)塊鏈結(jié)合了分布式存儲、點對點傳輸、共識機制、密碼學(xué)等技術(shù),具有去中心化、防篡改、可追溯、匿名性和可編程等眾多優(yōu)勢。由于其安全可信的分布式架構(gòu),涉及的行業(yè)領(lǐng)域非常廣泛,其中包括教育檔案領(lǐng)域。截至2024年1月14日,在中國知網(wǎng)(CNKI)以“區(qū)塊鏈+高校檔案”為檢索詞進行篇名檢索,共得到60篇文章,以“區(qū)塊鏈+學(xué)生檔案”為檢索詞進行篇名檢索,共得到30篇文章。這足以說明區(qū)塊鏈技術(shù)已被引入檔案管理領(lǐng)域,并有了一定的研究進展,同時也說明“區(qū)塊鏈+檔案”是未來檔案發(fā)展的必然趨勢。
本文針對傳統(tǒng)中心化高校教育檔案管理方式存在的檔案數(shù)據(jù)易被篡改、難以追溯等問題,提出并設(shè)計了一個基于區(qū)塊鏈的高校教育檔案存證溯源系統(tǒng)。具體來說,首先根據(jù)高校教育檔案需求提出相應(yīng)的教育檔案存證溯源總體框架和角色構(gòu)成;接著設(shè)計滿足教育檔案管理的分布式教育檔案存證溯源系統(tǒng);最后基于星際文件系統(tǒng)(InterPlanetary File System,IPFS)將教育檔案存證溯源信息和教育檔案文件分離存儲。借助區(qū)塊鏈的不可篡改性和IPFS的分布式存儲分別保證教育檔案存證溯源的可信性和檔案文件的安全性,既方便學(xué)生查詢和下載教育檔案文件,又保障用人單位對檔案的驗證和溯源需求。
1 區(qū)塊鏈技術(shù)
2008年中本聰(Satoshi Nakamoto)發(fā)表了一篇奠基性論文“Bitcoin: a peer-to-peer electronic cashsystem”并提出比特幣(Bitcoin)概念[1]。從中可知,區(qū)塊鏈技術(shù)是伴隨著以比特幣為首的數(shù)字貨幣而出現(xiàn)的一項新興技術(shù)。從區(qū)塊鏈的組織結(jié)構(gòu)和運行原理來看,它是一種以密碼學(xué)算法為基礎(chǔ)的點對點分布式賬本技術(shù)[2],因此區(qū)塊鏈作為比特幣的底層技術(shù)為大眾熟知。工業(yè)和信息化部2016年發(fā)布的《中國區(qū)塊鏈技術(shù)和應(yīng)用發(fā)展白皮書》也明確指出區(qū)塊鏈技術(shù)的定義,即是一種按照時間順序?qū)?shù)據(jù)區(qū)塊以順序相連的方式組合成鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu),并以密碼學(xué)方式保證不可篡改和不可偽造的分布式賬本技術(shù)。比特幣區(qū)塊鏈結(jié)構(gòu)如圖1所示。
隨著區(qū)塊鏈技術(shù)不斷成熟,其早已從金融領(lǐng)域延伸向多個其他領(lǐng)域,其中包括檔案領(lǐng)域。一方面,區(qū)塊鏈系統(tǒng)中各全節(jié)點地位平等,具有相同權(quán)限,通過競爭參與共識,保持所有節(jié)點同步更新。另一方面,區(qū)塊鏈系統(tǒng)中任意一個全節(jié)點出現(xiàn)故障,其余節(jié)點仍能提供完整的數(shù)據(jù)備份,保障了其存證能力。由于新技術(shù)如物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等的出現(xiàn)使傳統(tǒng)高校教育檔案管理系統(tǒng)面臨前所未有的安全威脅,而傳統(tǒng)的教育檔案管理主要側(cè)重信息的收集、管理、查詢、增刪改等業(yè)務(wù)功能的實現(xiàn),對檔案數(shù)據(jù)的真實性、完整性、安全性等顯得無能為力。因此,區(qū)塊鏈技術(shù)的引入可以使教育檔案在一個不完全可信的環(huán)境中實現(xiàn)一種安全可靠的去中心化的分布式數(shù)據(jù)存儲。目前,區(qū)塊鏈技術(shù)在電子檔案管理領(lǐng)域的捕獲歸檔、移交接收、自動處置和檔案檢測等場景已經(jīng)開始應(yīng)用[3]。
2 基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)架構(gòu)
傳統(tǒng)的高校教育檔案中心化儲存方式極易受到惡意攻擊,并且缺乏數(shù)據(jù)追溯功能。一旦服務(wù)器被攻擊,數(shù)據(jù)被偽造、篡改或刪除的可能性極大,追蹤變更來源或歷史極其困難。但由于區(qū)塊鏈?zhǔn)欠植际酱鎯η移滏準(zhǔn)浇Y(jié)構(gòu)具有時間戳特性,將每個區(qū)塊通過特定哈希方法連接起來,可以實現(xiàn)教育檔案在區(qū)塊鏈中的去中心化和可溯源性。
基于區(qū)塊鏈的高校教育檔案存證溯源系統(tǒng)主要采用鏈上與鏈下相結(jié)合的模式。用戶可以使用瀏覽器進行系統(tǒng)前端訪問,各高校則可以進入管理界面,對本校學(xué)生的教育檔案進行管理。管理員則對該系統(tǒng)進行維護和更新。
高校教育檔案存證溯源系統(tǒng)自頂向下分別是用戶層、系統(tǒng)業(yè)務(wù)層、智能合約層和數(shù)據(jù)存儲層。用戶主要由高校檔案部門、學(xué)生和用人單位構(gòu)成。系統(tǒng)業(yè)務(wù)層包括用戶管理模塊、業(yè)務(wù)系統(tǒng)模塊、電子檔案管理模塊,其中業(yè)務(wù)系統(tǒng)模塊包含檔案文件生成、修改、審核和歸檔,電子檔案管理模塊包含檔案接收、檔案保管、檔案利用、檔案銷毀等功能。數(shù)據(jù)存儲層主要包含區(qū)塊鏈(聯(lián)盟鏈)和星際文件系統(tǒng)IPFS,系統(tǒng)架構(gòu)如圖2所示。
高校教育檔案存證溯源系統(tǒng)主要涉及三類角色,分別為高校、學(xué)生和用人單位,如圖3所示。高校是大學(xué)生教育檔案的直接管理單位。在學(xué)生入學(xué)直至畢業(yè)期間,高校需要收集學(xué)生在校產(chǎn)生的所有教育數(shù)據(jù),并及時錄入檔案存證溯源系統(tǒng),確保學(xué)生能夠在該系統(tǒng)中及時查看教育檔案內(nèi)容,明確自身優(yōu)勢與不足,以便進一步規(guī)劃學(xué)業(yè)和未來發(fā)展方向。在學(xué)生就業(yè)時,用人單位需要通過系統(tǒng)對學(xué)生提交的教育檔案進行溯源驗證,確保學(xué)生擁有入職資格。
3 基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)分析設(shè)計
本節(jié)對基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)進行層次定位,從線下和線上兩方面分析。線下需要人工對教育檔案電子化加工和檔案圖像處理。線上則需要進行檔案數(shù)據(jù)化和審核。最終結(jié)果經(jīng)過處理存入?yún)^(qū)塊鏈,實現(xiàn)對教育檔案的隱私保護、防篡改、可追溯,如圖4所示。
基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)主要由兩大模塊構(gòu)成:
(1)數(shù)字教育檔案上鏈存證。在高校教育檔案管理系統(tǒng)中,需要為每位學(xué)生建立一個電子檔案,采集學(xué)生基本信息,形成準(zhǔn)確的學(xué)生教育檔案。
①信息包含“基本信息、學(xué)習(xí)經(jīng)歷、教育過程信息、獎懲信息、家庭成員信息、聯(lián)系方式”等。這些信息存入檔案存證溯源系統(tǒng)。
②數(shù)字教育檔案管理系統(tǒng)中的數(shù)據(jù),在初步審核后,計算一致性哈希并基于共識機制上鏈。
③上鏈后的數(shù)據(jù)要基于檔案號建立索引,方便后續(xù)的“信息鏈”查詢操作。
④教育檔案上鏈過程可配置,管理員可配置特定節(jié)點擁有查看權(quán)限,其他節(jié)點沒有數(shù)據(jù)查看權(quán)限。
⑤管理員擁有所有電子化檔案數(shù)據(jù)的查詢權(quán)限,但不可修改。
⑥學(xué)生僅擁有查詢自己檔案的權(quán)限,但不可修改。
⑦僅區(qū)塊鏈配置的管理員擁有教育檔案數(shù)據(jù)的上傳、修改、查詢權(quán)限。對于已上鏈的數(shù)據(jù),管理員可發(fā)起“修改”交易進行數(shù)據(jù)修改,不可改變已共識上鏈的數(shù)據(jù),僅追加修改記錄,修改記錄應(yīng)保存上鏈,形成數(shù)據(jù)操作信息鏈。
⑧實現(xiàn)數(shù)據(jù)不可篡改及不可抵賴的全流程回溯確責(zé)。
(2)教育檔案溯源。
①實現(xiàn)數(shù)據(jù)核驗溯源接口,學(xué)生可根據(jù)自己的信息和鏈上摘要信息,驗證其檔案數(shù)據(jù)的真實性。
②管理員擁有所有學(xué)生數(shù)字教育檔案信息核驗權(quán)限。
③第三方檔案管理機構(gòu)獲得學(xué)生主體允許的情況下,可核驗該學(xué)生檔案的真實性。
4 基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)存儲與智能合約開發(fā)
這部分主要從檔案的數(shù)據(jù)存儲和智能合約兩個角度進行闡述。教育檔案存證溯源系統(tǒng)中的數(shù)據(jù)存儲通過區(qū)塊鏈技術(shù)和IPFS實現(xiàn),既保證了重要存證溯源數(shù)據(jù)及時上鏈,又保證了基本檔案數(shù)據(jù)的安全可靠。智能合約可以保證系統(tǒng)存證溯源順利實施。
4.1 教育檔案中的數(shù)據(jù)存儲
4.1.1 區(qū)塊鏈(聯(lián)盟鏈)
區(qū)塊鏈相當(dāng)于一個去中介化的數(shù)據(jù)庫,分為公有鏈、聯(lián)盟鏈和私有鏈。本文中基于區(qū)塊鏈的教育檔案存證溯源系統(tǒng)采用聯(lián)盟鏈。聯(lián)盟鏈?zhǔn)怯梢唤M相互信任的機構(gòu)或組織共同管理和維護的一種特定區(qū)塊鏈模式。與私有鏈的運作空間和效率相比,其價值更大。與公有鏈完全去中心化的不可控和隱私安全相比,其更具有可操作性。在電子檔案管理中,尤其是高校教育檔案管理中采用聯(lián)盟鏈?zhǔn)潜厝贿x擇。多個高校間構(gòu)成聯(lián)盟,共同建立和維護一個用于高校檔案管理的區(qū)塊鏈網(wǎng)絡(luò)來共享檔案數(shù)據(jù),并確保數(shù)據(jù)安全可靠。
4.1.2 IPFS
IPFS是一種新型的互聯(lián)網(wǎng)傳輸協(xié)議,通過使用基于內(nèi)容尋址的文件系統(tǒng)來取代傳統(tǒng)的基于位置尋址的文件系統(tǒng)。這意味著文件不再通過文件路徑來定位,而是通過哈希值來標(biāo)識和檢索。同時,IPFS還支持文件的分塊存儲和去重技術(shù),大大提高了文件的存儲和傳輸效率。IPFS是一種去中心化的分布式文件系統(tǒng),而區(qū)塊鏈則是一種去中心化的分布式賬本技術(shù)。將這兩種技術(shù)結(jié)合在一起,可以實現(xiàn)更高效、更安全的數(shù)據(jù)存儲和傳輸,將教育檔案存證溯源信息和教育檔案文件分離存儲,即IPFS作為教育檔案數(shù)據(jù)存儲的基礎(chǔ),使用聯(lián)盟鏈來保證數(shù)據(jù)的可信和安全。
4.1.3 智能合約開發(fā)
傳統(tǒng)合約是由雙方共同制定合同規(guī)則,需要可信的第三方機構(gòu)對合約執(zhí)行進行監(jiān)督、授信或仲裁,以保證合同規(guī)則被多方同時合法執(zhí)行[4,5]。與傳統(tǒng)合約概念相比,智能合約可以理解為是滿足預(yù)定條件而自動執(zhí)行的程序(或協(xié)議或合同中的操作),其主要存儲在區(qū)塊鏈上。智能合約開發(fā)技術(shù)流程如圖5所示。
本文中智能合約的重要三個業(yè)務(wù)操作是指檔案數(shù)據(jù)上鏈,鏈上檔案數(shù)據(jù)查詢和溯源審計,其中重點闡述檔案的追溯流程合約,如圖6所示。
在高校教育檔案存證追溯系統(tǒng)中,追溯節(jié)點一般發(fā)起追溯檔案交易(Transaction),但需要進行授權(quán)來觸發(fā)教育檔案追溯合約。當(dāng)教育檔案數(shù)據(jù)上鏈時,追溯方法將返回當(dāng)前檔案交易數(shù)據(jù)的區(qū)塊哈希、區(qū)塊高度、區(qū)塊時間戳等。這種嚴(yán)格的授權(quán)驗證流程保證了追溯數(shù)據(jù)的真實性與安全性,同時也增強了整個追溯體系的透明度和可追溯性。追溯合約旨在實現(xiàn)教育檔案數(shù)據(jù)的上鏈存儲和查詢,用戶使用Trace( )合約輸入來觸發(fā)教育檔案追溯數(shù)據(jù)存儲上鏈合約。合約執(zhí)行后,將交易數(shù)據(jù)上鏈存儲并更改節(jié)點狀態(tài)數(shù)據(jù)庫,發(fā)送到共識節(jié)點進行排序和打包出塊,最終備份到整個聯(lián)盟鏈節(jié)點的區(qū)塊上。執(zhí)行Trace( )合約后,用戶可以通過輸入GetData( )方法從用戶節(jié)點備份區(qū)塊查詢數(shù)據(jù),輸入應(yīng)包括教育檔案追溯碼以索引查詢。執(zhí)行GetData( )方法后,用戶獲取存儲在鏈上的檔案追溯數(shù)據(jù)。在此期間,合約會遍歷查找相匹配的業(yè)務(wù)方法,并驗證用戶授權(quán)有效性,觸發(fā)教育檔案追溯數(shù)據(jù)存儲上鏈合約。通過上述步驟有序執(zhí)行,才能完成教育檔案追溯數(shù)據(jù)的上鏈存儲和查詢功能,保證教育檔案追溯數(shù)據(jù)的安全性和可靠性。
5 結(jié)束語
區(qū)塊鏈應(yīng)用于高校教育檔案管理是檔案領(lǐng)域未來發(fā)展的必然趨勢。通過對“區(qū)塊鏈+教育檔案”的范式進行深入研究,本文提出一種基于區(qū)塊鏈技術(shù)的高校教育檔案存證溯源系統(tǒng)解決方法。具體分析了教育檔案存證溯源總體框架和角色構(gòu)成,從層次定位角度出發(fā)設(shè)計出系統(tǒng)兩大模塊。接著從數(shù)據(jù)存儲層面將教育檔案存證溯源信息和教育檔案文件分離存儲,并給出智能合約技術(shù)開發(fā)流程。只有將區(qū)塊鏈技術(shù)融入檔案管理業(yè)務(wù)中才能真正實現(xiàn)檔案信息服務(wù)的個性化、精準(zhǔn)化和及時化,滿足“數(shù)智”時代對電子檔案的發(fā)展需求。
參考文獻:
〔1〕Nakamoto S. A peer-to-peer electronic cash system[J]. Bitcoin. Available: https://bitcoin. org/bitcoin. pdf, 2008:1-24.
〔2〕林知微,張嵩川,王成吉,等.區(qū)塊鏈技術(shù)綜述:在下一代智能制造中的應(yīng)用[J].智能科學(xué)與技術(shù)學(xué)報,2023,5(02):200-211.
〔3〕王艷松,王棟,王為久,等.區(qū)塊鏈在電子檔案管理中的應(yīng)用分析與實施路徑探究[J].北京檔案,2022, 39(01):10-14.
〔4〕黎強.基于區(qū)塊鏈的云南咖啡溯源系統(tǒng)研究與實現(xiàn)[D].昆明:云南農(nóng)業(yè)大學(xué),2023.
〔5〕青樂,朱慧君.基于區(qū)塊鏈智能合約的大數(shù)據(jù)安全[J].計算機應(yīng)用與軟件,2023,40(12):332-337.