張雪莉
(鄭州澍青醫(yī)學(xué)高等??茖W(xué)校,河南 鄭州450000)
隨著信息的增長(zhǎng),海量數(shù)據(jù)正以迅猛態(tài)勢(shì),全方位進(jìn)入社會(huì)生活的各個(gè)領(lǐng)域,引起了諸多行業(yè)的巨大變革。實(shí)現(xiàn)大數(shù)據(jù)驅(qū)動(dòng)的智慧信息服務(wù)成為圖書(shū)館轉(zhuǎn)型變革的必經(jīng)之路,圖書(shū)館需要快速、高效、準(zhǔn)確地從海量基礎(chǔ)數(shù)據(jù)中提取到有用的信息資源,將用戶所需的信息以直觀和豐富的表現(xiàn)形式智慧化地傳遞給用戶,這給圖書(shū)館帶來(lái)了巨大的挑戰(zhàn)。雖然圖書(shū)館也給予大數(shù)據(jù)較多的關(guān)注,但仍然存在著諸多現(xiàn)實(shí)問(wèn)題,許多圖書(shū)館的大數(shù)據(jù)服務(wù)處于理論研究階段,在圖書(shū)館大數(shù)據(jù)服務(wù)實(shí)際運(yùn)用中所面臨的資源、技術(shù)、安全、成本、人才等方面還存在著瓶頸。區(qū)塊鏈?zhǔn)且环N網(wǎng)絡(luò)技術(shù),可以讓用戶有機(jī)會(huì)安全地共享內(nèi)容或進(jìn)行交易,而無(wú)需中間人或中央管理系統(tǒng),它是通過(guò)去中心化和去信任的方式集體維護(hù)一個(gè)可靠數(shù)據(jù)庫(kù)的技術(shù)方案,這不僅使區(qū)塊鏈和大數(shù)據(jù)有著緊密的聯(lián)系,甚至可以說(shuō),區(qū)塊鏈將重構(gòu)大數(shù)據(jù)。借助區(qū)塊鏈技術(shù),圖書(shū)館可低成本地實(shí)施大數(shù)據(jù)戰(zhàn)略,解決大數(shù)據(jù)環(huán)境下服務(wù)所面臨的問(wèn)題,以進(jìn)一步提升圖書(shū)館服務(wù)管理質(zhì)量的效率和效能,實(shí)現(xiàn)大數(shù)據(jù)在圖書(shū)館領(lǐng)域更廣泛的應(yīng)用。筆者擬探討圖書(shū)館在大數(shù)據(jù)環(huán)境下的瓶頸問(wèn)題,闡述區(qū)塊鏈技術(shù)如何與大數(shù)據(jù)技術(shù)互補(bǔ),并解決這些問(wèn)題。
大數(shù)據(jù)(big data)是指規(guī)模巨大,在合理時(shí)間范圍內(nèi)無(wú)法用常規(guī)軟硬件設(shè)備進(jìn)行獲取、處理和管理的海量數(shù)據(jù)集合,這些大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)通過(guò)深層分析和價(jià)值挖掘可以獲得洞察和決策的能力。它具有Volume(海量性)、Value(高價(jià)值)、Variety(多樣性)三大特征。隨著圖書(shū)館信息化、智慧化、數(shù)字圖書(shū)館建設(shè)進(jìn)程的加速,圖書(shū)館數(shù)據(jù)也初步具備了大數(shù)據(jù)特征。圖書(shū)館大數(shù)據(jù)主要包括資源數(shù)據(jù)、用戶數(shù)據(jù)、感知數(shù)據(jù)[1],這些數(shù)據(jù)量大且增長(zhǎng)迅速,僅以資源數(shù)據(jù)為例,平均每所高校圖書(shū)館的館藏資源記錄已接近1500萬(wàn)條,并且每日都在增加。同時(shí)圖書(shū)館數(shù)據(jù)類型繁多,既包括了結(jié)構(gòu)化的數(shù)字圖書(shū)館資源,也包括了非結(jié)構(gòu)化圖書(shū)館感知數(shù)據(jù)以及讀者個(gè)人數(shù)據(jù)等,數(shù)據(jù)類型包括了音頻、視頻、圖片、位置信息、設(shè)備使用數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)等等,這些多類型的數(shù)據(jù)對(duì)圖書(shū)館數(shù)據(jù)處理能力提出了更高要求。圖書(shū)館大數(shù)據(jù)同樣具有較高的價(jià)值,大數(shù)據(jù)在圖書(shū)館領(lǐng)域可以被運(yùn)用到讀者行為識(shí)別與串聯(lián)、讀者信息與服務(wù)需求預(yù)判、圖書(shū)館運(yùn)行狀態(tài)描述、資源建設(shè)成效評(píng)估和文獻(xiàn)資源配置優(yōu)化、圖書(shū)館管理助力等[2]。
對(duì)信息數(shù)據(jù)的收集、處理、存儲(chǔ)、分析、利用,這是大部分現(xiàn)有的信息數(shù)據(jù)管理均遵循的流程,而大數(shù)據(jù)環(huán)境下圖書(shū)館在這一流程中也面臨著諸多的困境,例如數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)利用等技術(shù)方面的制約,也會(huì)受到如知識(shí)產(chǎn)權(quán)等法律方面的制約,具體如下所述。
圖書(shū)館作為信息機(jī)構(gòu),收集、整合和共享資源是其根本任務(wù),然而在實(shí)際工作中圖書(shū)館數(shù)據(jù)源的收集上卻存在著瓶頸問(wèn)題,首先是數(shù)據(jù)源的完整性問(wèn)題,它要求圖書(shū)館不能有漏收和間斷情況出現(xiàn),但由于受到經(jīng)費(fèi)、渠道等因素的制約,圖書(shū)館并不能保證完整而系統(tǒng)地收集數(shù)據(jù)。一方面圖書(shū)館希望獲得更多更好的數(shù)據(jù)源進(jìn)行深度挖掘,而另一方面雖然數(shù)據(jù)開(kāi)放和共享是大數(shù)據(jù)時(shí)代的核心精神,但當(dāng)前各個(gè)數(shù)據(jù)庫(kù)開(kāi)放程度低,而數(shù)據(jù)庫(kù)商對(duì)于數(shù)據(jù)的共享猶豫不決,相關(guān)數(shù)據(jù)庫(kù)存在著壟斷現(xiàn)象,圖書(shū)館大數(shù)據(jù)中心在建設(shè)和使用過(guò)程中面臨著信息孤島、數(shù)據(jù)封閉、數(shù)據(jù)分享動(dòng)力不足等實(shí)際問(wèn)題,圖書(shū)館在與數(shù)據(jù)庫(kù)商的談判中往往處于劣勢(shì),付出高昂成本。其次是數(shù)據(jù)可信度問(wèn)題,圖書(shū)館數(shù)據(jù)本身往往被視為“可靠數(shù)據(jù)”,但實(shí)際上圖書(shū)館數(shù)據(jù)來(lái)源的不可追溯以及以中心存儲(chǔ)的方式也使得數(shù)據(jù)可以被修改,而無(wú)法證明其有效性,不利于科學(xué)研究。如圖書(shū)館書(shū)目數(shù)據(jù)的來(lái)源包括聯(lián)合編目、編目外包等等,書(shū)目數(shù)據(jù)的質(zhì)量不能得到有效控制,影響了文獻(xiàn)的利用水平和讀者的時(shí)間成本。以上可以看出,在圖書(shū)館數(shù)據(jù)資源開(kāi)發(fā)中,數(shù)據(jù)完整獲取存在困難,底層數(shù)據(jù)的缺失和混亂,使其數(shù)據(jù)的利用和分析也就缺乏基礎(chǔ)。
大數(shù)據(jù)環(huán)境下,知識(shí)的存儲(chǔ)是圖書(shū)館的基本責(zé)任,國(guó)內(nèi)數(shù)字圖書(shū)館建設(shè)的熱潮下,數(shù)字資源建設(shè)速度逐年遞增、規(guī)模急劇擴(kuò)大、種類日益豐富,構(gòu)建了海量的分布式數(shù)字資源庫(kù)群、大規(guī)模元數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)群。而圖書(shū)館在數(shù)據(jù)存儲(chǔ)上的痛點(diǎn)主要包括數(shù)據(jù)量巨大,且不同類型的異構(gòu)數(shù)據(jù)的存儲(chǔ)方式和數(shù)據(jù)格式也大相徑庭,圖書(shū)館傳統(tǒng)的單一形式的集中式的計(jì)算機(jī)系統(tǒng)面對(duì)如此龐大的數(shù)據(jù)量和異構(gòu)數(shù)據(jù),無(wú)論是儲(chǔ)存能力還是計(jì)算能力都難以勝任,而受到技術(shù)瓶頸和經(jīng)費(fèi)短缺的限制,大多數(shù)圖書(shū)館要想全面升級(jí)換代現(xiàn)有數(shù)據(jù)庫(kù)和提高現(xiàn)有存儲(chǔ)容量是不可能的。其次圖書(shū)館不同類型的數(shù)據(jù)的使用有著不同性能要求、不同容量要求,這些需求隨時(shí)會(huì)發(fā)生改變,需要有效地管理和按需分配存儲(chǔ)資源以提高利用率。這給圖書(shū)館基礎(chǔ)設(shè)施帶來(lái)了極大的壓力,由于成本的制約,越來(lái)越多的圖書(shū)館將應(yīng)用由高端服務(wù)器向中低端硬件構(gòu)成的大規(guī)模計(jì)算機(jī)集群轉(zhuǎn)換[3]。
圖書(shū)館需要存儲(chǔ)的大量數(shù)據(jù)還面臨著包括數(shù)據(jù)丟失、隱私泄露以及黑客攻擊等安全問(wèn)題。一般來(lái)說(shuō),圖書(shū)館存儲(chǔ)著大量的讀者個(gè)人數(shù)據(jù),其中不乏身份證號(hào)、學(xué)號(hào)、手機(jī)號(hào)、電子郵箱、讀者借閱信息、讀者閱讀行為數(shù)據(jù)等敏感數(shù)據(jù),而對(duì)這些敏感數(shù)據(jù)的使用因易侵犯讀者個(gè)人隱私而存在很大的法律風(fēng)險(xiǎn)。圖書(shū)館對(duì)用戶個(gè)人信息的數(shù)據(jù)監(jiān)控不能實(shí)時(shí)進(jìn)行查看,日常安全防護(hù)管理不能有效進(jìn)行。同時(shí),圖書(shū)館存儲(chǔ)的數(shù)據(jù)需要保證數(shù)據(jù)不被丟失或者遭受攻擊造成的數(shù)據(jù)泄露,而沒(méi)有訪問(wèn)權(quán)限的訪問(wèn)者、第三方甚至黑客可能非法入侵、訪問(wèn)、修改、下載和刪除相關(guān)信息,存儲(chǔ)的數(shù)據(jù)出現(xiàn)安全風(fēng)險(xiǎn)的幾率加大。
大數(shù)據(jù)環(huán)境下,圖書(shū)館也會(huì)面臨數(shù)據(jù)的知識(shí)產(chǎn)權(quán)問(wèn)題,例如高校圖書(shū)館對(duì)本校特色和優(yōu)勢(shì)學(xué)科,利用網(wǎng)絡(luò)數(shù)據(jù)自動(dòng)抓取工具獲取感興趣的數(shù)據(jù)資源,自己構(gòu)建該學(xué)科的文獻(xiàn)數(shù)據(jù)庫(kù),完成數(shù)據(jù)的收集,可能會(huì)造成對(duì)下載作品的復(fù)制權(quán)、匯編權(quán)侵權(quán),對(duì)館藏文獻(xiàn)數(shù)字化造成的著作權(quán)糾紛[4],網(wǎng)絡(luò)來(lái)源的數(shù)據(jù)也難以確權(quán),造成著作者知識(shí)產(chǎn)權(quán)保護(hù)的困難。此外,圖書(shū)館自建數(shù)據(jù)庫(kù)將他人作品數(shù)字化也會(huì)可能會(huì)構(gòu)成知識(shí)產(chǎn)權(quán)的問(wèn)題,出于知識(shí)產(chǎn)權(quán)保護(hù)的原因,有些圖書(shū)館自建數(shù)據(jù)庫(kù)沒(méi)有完全對(duì)外來(lái)機(jī)構(gòu)或個(gè)人開(kāi)放,只在限定范圍內(nèi)提供給讀者使用,或是根據(jù)資源的安全級(jí)別和其他使用限制,不同圖書(shū)館相互訪問(wèn)數(shù)字資源也存在信任壁壘。以上種種原因都說(shuō)明了圖書(shū)館在知識(shí)產(chǎn)權(quán)上存在的問(wèn)題。
大數(shù)據(jù)功能實(shí)現(xiàn)的基本方法是通過(guò)對(duì)數(shù)據(jù)分析獲取所需要的信息,大數(shù)據(jù)技術(shù)發(fā)展很快,很多先進(jìn)的大數(shù)據(jù)技術(shù),如針對(duì)非結(jié)構(gòu)化大數(shù)據(jù)處理的Hadapt數(shù)據(jù)庫(kù)等被開(kāi)發(fā)出來(lái),技術(shù)上的障礙主要表現(xiàn)在先進(jìn)的大數(shù)據(jù)技術(shù)無(wú)法全部或部分在圖書(shū)館大數(shù)據(jù)中運(yùn)用上。大數(shù)據(jù)分析是一項(xiàng)技術(shù)含量很高的工作,要求數(shù)據(jù)分析人員不僅要懂技術(shù),還要精通圖書(shū)館業(yè)務(wù),并具有靈活的思維能力和很高的信息意識(shí),但很多圖書(shū)館都缺乏這樣的復(fù)合人才。圖書(shū)館受人才、經(jīng)費(fèi)和軟硬件條件的制約,很難將大數(shù)據(jù)技術(shù)全部引進(jìn)并應(yīng)用到大數(shù)據(jù)管理和數(shù)據(jù)挖掘中,而這對(duì)圖書(shū)館大數(shù)據(jù)功能發(fā)揮的影響是非常直接的,技術(shù)跟不上很難保證大數(shù)據(jù)功能得到充分實(shí)現(xiàn)。數(shù)據(jù)種類的多樣化給圖書(shū)館傳統(tǒng)常規(guī)分析帶來(lái)了極大的挑戰(zhàn),大量的異構(gòu)數(shù)據(jù)處理與分析需要有新的突破。其次,現(xiàn)有的圖書(shū)館之間的數(shù)據(jù)往往是各自創(chuàng)建和維護(hù),彼此之間并沒(méi)有共享數(shù)據(jù),即便是圖書(shū)館聯(lián)盟之間也是如此,這給數(shù)據(jù)利用也帶來(lái)了諸多不便。
區(qū)塊鏈(BlockChain)是現(xiàn)代信息社會(huì)最前沿的技術(shù)之一,也是繼大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)之后的又一項(xiàng)顛覆性技術(shù)。區(qū)塊鏈概念是2008年由Satoshi Nakamoto提出的,用于創(chuàng)建“純粹的點(diǎn)對(duì)點(diǎn)的電子貨幣”,區(qū)塊鏈技術(shù)的首次成功應(yīng)用是比特幣加密貨幣,比特幣系統(tǒng)記錄了誰(shuí)擁有比特幣,流通重每個(gè)比特幣的支付歷史,支持比特幣的系統(tǒng)因?yàn)橥瑯舆m用于其他領(lǐng)域而受到關(guān)注。從根本上來(lái)說(shuō),區(qū)塊鏈本質(zhì)上是一個(gè)分布式數(shù)據(jù)庫(kù),區(qū)塊鏈中每個(gè)用戶可以在這里讀取和寫(xiě)入數(shù)據(jù)庫(kù)交易,沒(méi)有第三方來(lái)檢查這些交易,區(qū)塊鏈有一個(gè)內(nèi)置的共識(shí)機(jī)制,可以檢查交易以確保它們的安全,由于區(qū)塊鏈采用一種單向哈希算法,傳遞的事務(wù)得到哈希,基本上,分配了一個(gè)標(biāo)識(shí)事務(wù)的數(shù)字指紋。那些經(jīng)過(guò)驗(yàn)證的事務(wù)然后被組合成一個(gè)塊,該塊被分配了自己的哈希值。該哈希成為下一個(gè)事務(wù)塊的第一個(gè)哈希,將它們鏈接在一起。在正常情況下,區(qū)塊鏈理論上可以為我們提供一個(gè)值得信賴的良好交易數(shù)據(jù)庫(kù),而無(wú)需人或機(jī)構(gòu)進(jìn)行干預(yù)以驗(yàn)證這些交易。區(qū)塊鏈的主要特征可歸納如下:
①具有分布式結(jié)構(gòu)。經(jīng)驗(yàn)證的交易信息作為塊生成并存儲(chǔ)在區(qū)塊鏈中,它是分散的數(shù)據(jù)分發(fā)存儲(chǔ)系統(tǒng)。此時(shí),數(shù)據(jù)被復(fù)制并存儲(chǔ)在分布式節(jié)點(diǎn)中,而不是存儲(chǔ)在中央服務(wù)器中。由于所有節(jié)點(diǎn)都具有相同的數(shù)據(jù),因此可以在不通過(guò)中央服務(wù)器的情況下直接在個(gè)人之間進(jìn)行交易。任何人都可以參與系統(tǒng),參與系統(tǒng)的所有節(jié)點(diǎn)共享相同的數(shù)據(jù)。
②數(shù)據(jù)難以被篡改。塊與前一個(gè)塊的哈希值鏈接在一起。如果數(shù)據(jù)被任意改變,則連接塊的哈希值將改變,并且在系統(tǒng)中不被識(shí)別。因此,幾乎不可能更改數(shù)據(jù),因?yàn)樗泄?jié)點(diǎn)都必須立即更改數(shù)據(jù)。區(qū)塊鏈作為可靠的分布式數(shù)據(jù)存儲(chǔ)技術(shù)受到了密切關(guān)注。區(qū)塊鏈?zhǔn)且环N用于在不使用中央服務(wù)器的情況下將復(fù)制數(shù)據(jù)存儲(chǔ)和分發(fā)給參與系統(tǒng)的所有節(jié)點(diǎn)的技術(shù)。幾乎不可能對(duì)記錄進(jìn)行任何更改,因?yàn)閰^(qū)塊鏈會(huì)不時(shí)地比較每個(gè)節(jié)點(diǎn)的數(shù)據(jù)以查找更改的部分。因此,區(qū)塊鏈保證了數(shù)據(jù)的完整性,并且可以保持永久記錄。
③智能合約實(shí)現(xiàn)了自動(dòng)化和高效的工作流程。用戶可以通過(guò)簡(jiǎn)單創(chuàng)建嵌入在區(qū)塊鏈中的腳本來(lái)創(chuàng)建應(yīng)用程序。由于可以在線完成合同,因此它是有效的,因?yàn)樗梢钥朔恢孟拗撇⒂么a替換合同所需的文檔和簽名。最重要的是,如果滿足預(yù)先編寫(xiě)的代碼的條件,則自動(dòng)執(zhí)行合同以便可以快速處理業(yè)務(wù)。
區(qū)塊鏈與大數(shù)據(jù)有著天然的關(guān)聯(lián)性,區(qū)塊鏈和大數(shù)據(jù)相互協(xié)作、相互推進(jìn),可以讓大數(shù)據(jù)更加活躍起來(lái),從數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)安全、數(shù)據(jù)知識(shí)產(chǎn)權(quán)以及數(shù)據(jù)利用上改善圖書(shū)館大數(shù)據(jù)服務(wù),如表1所示。
表1 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)服務(wù)的重塑
3.2.1 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)源的改善
區(qū)塊鏈技術(shù)的分布式結(jié)構(gòu)、數(shù)據(jù)難以被篡改以及智能合約實(shí)現(xiàn)自動(dòng)化和高效化等特性,使得圖書(shū)館可以突破數(shù)據(jù)收集的瓶頸,在數(shù)據(jù)來(lái)源方面,可信任、安全的區(qū)塊鏈?zhǔn)沟酶嗟臄?shù)據(jù)被解放出來(lái),圖書(shū)館得以獲取更多的數(shù)據(jù)。其次,區(qū)塊鏈技術(shù)在時(shí)間維度生成、傳播的完整鏈條,使得數(shù)據(jù)交易可以在不同主體之間直接進(jìn)行,基于智能合約技術(shù)的區(qū)塊鏈?zhǔn)沟脠D書(shū)館可以直接從出版機(jī)構(gòu),甚至從作者處采購(gòu)相關(guān)數(shù)據(jù),從而打破原有的必須從數(shù)據(jù)庫(kù)商處購(gòu)買(mǎi)數(shù)據(jù)的傳統(tǒng)方式,并且,也突破了數(shù)據(jù)庫(kù)商各自開(kāi)發(fā)所造成的數(shù)據(jù)孤島現(xiàn)象。最后,由于區(qū)塊鏈的數(shù)據(jù)是可追溯的,任何一條數(shù)據(jù)的記錄都可以留存在區(qū)塊鏈上,一旦數(shù)據(jù)被寫(xiě)入,區(qū)塊鏈對(duì)數(shù)據(jù)的準(zhǔn)確性和質(zhì)量負(fù)責(zé),這就使得進(jìn)入鏈中的數(shù)據(jù)質(zhì)量得到保證,從而改善數(shù)據(jù)的來(lái)源和質(zhì)量問(wèn)題,保障數(shù)據(jù)收集的完整性和可信度。
3.2.2 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)存儲(chǔ)的改善
區(qū)塊鏈本身可以看成是一套由多方參與的、可靠的分布式數(shù)據(jù)存儲(chǔ)系統(tǒng),其獨(dú)特之處在于:一是記錄行為的多方參與,即各方可參與記錄;二是數(shù)據(jù)存儲(chǔ)的多方參與、共同維護(hù),即文件的分散存儲(chǔ)。區(qū)塊鏈可以通過(guò)向人們提供具有貨幣價(jià)值的代幣來(lái)激勵(lì)人們托管數(shù)據(jù),使得數(shù)據(jù)的存儲(chǔ)比集中式存儲(chǔ)或維護(hù)自己的服務(wù)器的方案更加便宜而得以改善。數(shù)據(jù)在P2P網(wǎng)絡(luò)上進(jìn)行分片、加密、復(fù)制和分發(fā)。存儲(chǔ)數(shù)據(jù)的節(jié)點(diǎn)通常會(huì)因在網(wǎng)絡(luò)上托管數(shù)據(jù)而獲得加密貨幣補(bǔ)償。為了確保數(shù)據(jù)在需要訪問(wèn)時(shí)是可用的,并確定節(jié)點(diǎn)的正常運(yùn)行時(shí)間,可以要求存儲(chǔ)節(jié)點(diǎn)提供抵押品,由智能合約來(lái)保證和觸發(fā),數(shù)據(jù)不可用時(shí)可以要求抵押品。這些節(jié)點(diǎn)的分布式特性還具有使分散存儲(chǔ)具有高度可擴(kuò)展性的優(yōu)勢(shì)。目前,國(guó)外的Storj.io和Sia.tech是兩種可用的區(qū)塊鏈存儲(chǔ)產(chǎn)品。據(jù)報(bào)道,Sia的分散式云存儲(chǔ)成本平均比現(xiàn)有云存儲(chǔ)提供商低90%;在Sia上存儲(chǔ)1TB文件的成本約為每月兩美元,而亞馬遜網(wǎng)絡(luò)服務(wù)的S3服務(wù)則為23美元。相信今后還會(huì)有更多的同類的區(qū)塊鏈存儲(chǔ)產(chǎn)品。這使得圖書(shū)館的部分存儲(chǔ)需求可以放到更加具有性價(jià)比的區(qū)塊鏈存儲(chǔ)產(chǎn)品上,從而改善圖書(shū)館數(shù)據(jù)存儲(chǔ)的技術(shù)和經(jīng)費(fèi)瓶頸的限制。
3.2.3 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)安全的改善
各類型的數(shù)據(jù)是圖書(shū)館的重要資產(chǎn)之一,區(qū)塊鏈在數(shù)據(jù)安全上有著特有的優(yōu)勢(shì),區(qū)塊鏈對(duì)數(shù)據(jù)的安全性表現(xiàn)在以下幾個(gè)方面:①加密和驗(yàn)證。區(qū)塊鏈平臺(tái)對(duì)數(shù)據(jù)進(jìn)行加密,這意味著修改數(shù)據(jù)是一項(xiàng)艱巨的任務(wù),這將為用戶提供一種確保文件不受篡改的方式,而無(wú)需將整個(gè)文件保存在區(qū)塊鏈上。由于其分散的性質(zhì),始終可以在網(wǎng)絡(luò)中所有節(jié)點(diǎn)上的所有分類賬中交叉檢查文件簽名,并確認(rèn)它們沒(méi)有被更改,如果有人確實(shí)更改了記錄,那么簽名將變?yōu)闊o(wú)效。②分散式數(shù)據(jù)保護(hù)方式。由于區(qū)塊鏈技術(shù)本質(zhì)上是分散的,因此它不依賴于一個(gè)中央控制點(diǎn),使系統(tǒng)更公平、更安全。它是每臺(tái)擁有完整數(shù)據(jù)副本的計(jì)算機(jī)的交易數(shù)字分類賬。區(qū)塊鏈不依賴中央機(jī)構(gòu)與其他用戶安全地進(jìn)行交易,而是利用跨節(jié)點(diǎn)網(wǎng)絡(luò)的創(chuàng)新共識(shí)協(xié)議,以可靠的方式驗(yàn)證交易和記錄數(shù)據(jù)。由于區(qū)塊鏈?zhǔn)切畔⒌姆诸愘~,因此存儲(chǔ)的信息真實(shí)、準(zhǔn)確非常重要。由于數(shù)據(jù)保存在多臺(tái)計(jì)算機(jī)上,因此即使一臺(tái)或兩臺(tái)計(jì)算機(jī)出現(xiàn)故障,也可以確保數(shù)據(jù)的高度安全。③黑客難點(diǎn)。區(qū)塊鏈?zhǔn)前灰子涗浀臄?shù)字“塊”鏈,每個(gè)塊都連接到它之前和之后的所有塊,盡管黑客可以闖入傳統(tǒng)網(wǎng)絡(luò)并在單個(gè)存儲(chǔ)庫(kù)中找到所有數(shù)據(jù)并對(duì)其進(jìn)行泄漏或破壞,但區(qū)塊鏈?zhǔn)惯@變得難以實(shí)施。這使得圖書(shū)館所存儲(chǔ)的數(shù)據(jù)不可篡改、丟失以及被攻擊,從而保證了圖書(shū)館的數(shù)據(jù)的安全。
3.2.4 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)知識(shí)產(chǎn)權(quán)的改善
區(qū)塊鏈還可以被應(yīng)用到數(shù)據(jù)知識(shí)產(chǎn)權(quán)的保護(hù)上,這對(duì)圖書(shū)館來(lái)說(shuō)也可以解決原有模式的瓶頸。區(qū)塊鏈?zhǔn)枪_(kāi)顯示的可信分類賬,使用區(qū)塊鏈建設(shè)的數(shù)據(jù)庫(kù)可以通過(guò)將哈希值安全地放在區(qū)塊鏈上來(lái)保護(hù)所有類型的知識(shí)產(chǎn)權(quán),例如數(shù)據(jù)、文本、圖像、音樂(lè)、視頻、代碼、3D資產(chǎn)、網(wǎng)站或商業(yè)秘密,使得任何數(shù)據(jù)所有者可以安全共享和出售其作品和敏感信息,通過(guò)構(gòu)建允許用戶存儲(chǔ)和交易數(shù)據(jù)的區(qū)塊鏈,知識(shí)產(chǎn)權(quán)所有者和最終消費(fèi)者都將從中受益,知識(shí)產(chǎn)權(quán)所有者可以通過(guò)防御性出版來(lái)保護(hù)發(fā)明和科學(xué)發(fā)現(xiàn),并確保其他使用和消費(fèi)者在研究過(guò)程中能夠快速訪問(wèn)此信息。在所有權(quán)發(fā)生爭(zhēng)議時(shí),交易的時(shí)間戳可以作為證據(jù)在法庭上使用。圖書(shū)館完全可以通過(guò)區(qū)塊鏈拓展資源渠道,建設(shè)用戶生成知識(shí)資源的區(qū)塊鏈,從而徹底解決版權(quán)問(wèn)題。
3.2.5 區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)利用的改善
區(qū)塊鏈對(duì)圖書(shū)館數(shù)據(jù)利用上也能提供一定的改善,首先是數(shù)據(jù)的透明和共享使得利用更加方便。以往的數(shù)據(jù)是封閉的,區(qū)塊鏈智能合約的使用允許不同的組織通過(guò)由智能合約編寫(xiě)的一組已批準(zhǔn)和共享的業(yè)務(wù)規(guī)則來(lái)共享數(shù)據(jù)的控制。允許其控制誰(shuí)可以通過(guò)區(qū)塊鏈訪問(wèn)其數(shù)據(jù)。使得圖書(shū)館之間所收集的數(shù)據(jù)以一種安全可行的方式共享,需要使用數(shù)據(jù)的一方可以發(fā)起數(shù)據(jù)事務(wù)請(qǐng)求,請(qǐng)求數(shù)據(jù)生成器提供數(shù)據(jù)使用權(quán),從區(qū)塊鏈獲得授權(quán)的數(shù)據(jù)集,這就打破了以往的“數(shù)據(jù)孤島”的壁壘。其次,區(qū)塊鏈有助于創(chuàng)建一個(gè)系統(tǒng)來(lái)管理被稱為分類賬的內(nèi)容塊,信息分析是安全且自動(dòng)化的,通過(guò)將數(shù)據(jù)分析的算法集成到區(qū)塊鏈中,使得數(shù)據(jù)的分析和利用自動(dòng)執(zhí)行,Omnilytics就是將區(qū)塊鏈與大數(shù)據(jù)分析相結(jié)合的平臺(tái),使用人工智能和機(jī)器學(xué)習(xí)來(lái)大大提高數(shù)據(jù)處理速度和質(zhì)量。最后,區(qū)塊鏈還可以用于徽章來(lái)促進(jìn)館員所需的證書(shū)或培訓(xùn),以大大地增強(qiáng)館員的素質(zhì),從而提高數(shù)據(jù)的利用。