◆劉 杰
(山西大學商務學院 山西 030031)
基于大數(shù)據(jù)的圖書館信息安全問題分析
◆劉 杰
(山西大學商務學院 山西 030031)
在對大數(shù)據(jù)及其相關概念進行論述的基礎上,探討了大數(shù)據(jù)環(huán)境下圖書館運行過程中所面臨的主要問題。為了保證圖書館的信息安全,本文分別從知識產(chǎn)權(quán)保護、隱私安全、網(wǎng)絡安全以及數(shù)據(jù)存儲四個方面提出了對應的策略,形成了相對完善的圖書館信息安全管理對策,為圖書館信息安全問題應對提供相關參考。
大數(shù)據(jù);信息安全;圖書館
大數(shù)據(jù)是在“Web2.0”和云計算之后出現(xiàn)的一種新型信息技術(shù),是當前信息技術(shù)研究的熱點問題之一。隨著現(xiàn)代圖書館信息系統(tǒng)建設規(guī)模的不斷擴大,大數(shù)據(jù)在圖書館信息服務中開始得到了相對廣泛的應用,這給圖書館信息系統(tǒng)帶來發(fā)展的同時,也給圖書館的信息安全防范工作帶來了一定的挑戰(zhàn)。因此,探討大數(shù)據(jù)環(huán)境下圖書館信息安全面臨的主要問題,并提出針對性的解決策略,對優(yōu)化圖書館整體信息安全系統(tǒng),保證圖書館信息安全具有十分重要的作用。
大數(shù)據(jù)(Big Data)是一個相對抽象的概念,在當前信息研究領域并沒有一個統(tǒng)一的定義。通常認為大數(shù)據(jù)是指使用常用軟件工具獲得、管理并處理數(shù)據(jù)所消耗時間超過可容忍時間的數(shù)據(jù)集。根據(jù)Gartner的定義,“大數(shù)據(jù)”需要對處理模式進行更新才能夠提高系統(tǒng)的決策能力、洞察能力以及流程優(yōu)化能力,從而能夠獲得多樣化的信息資源[1]。也有部分研究人員將“大數(shù)據(jù)”描述成為是未來的新石油,不同的定義多是根據(jù)大數(shù)據(jù)的具體特征歸納整理出的,其大多是從大數(shù)據(jù)的規(guī)模性、多樣性、高速性與價值性四個方面著手進行分析。
2.1 圖書館藏知識產(chǎn)權(quán)及衍生知識產(chǎn)權(quán)問題
在當前大數(shù)據(jù)環(huán)境下,圖書館網(wǎng)絡系統(tǒng)通常會通過構(gòu)建海量的信息資源共享知識數(shù)據(jù)庫,實現(xiàn)不同圖書館之間的館際共享和交流。大量的數(shù)字資源在圖書館網(wǎng)絡系統(tǒng)中傳播,不但容易被復制、截取,而且容易產(chǎn)生知識產(chǎn)權(quán)等方面的糾紛。尤其是在當前云共享以及分布式存儲網(wǎng)絡體系之下,知識產(chǎn)權(quán)糾紛和矛盾已經(jīng)成為了圖書館館藏管理的重要對象。例如,不同的圖書館機構(gòu)通過購買云服務,并將自己產(chǎn)生的數(shù)字資源提交給云服務上進行管理。按照知識產(chǎn)權(quán)的理念,數(shù)據(jù)的持有者應該完全擁有其被托管數(shù)據(jù)的知識產(chǎn)權(quán),但是實際上當數(shù)據(jù)提交給云服務商之后,他們通過數(shù)據(jù)挖掘等方式獲得數(shù)據(jù)的內(nèi)在核心價值,并對這些數(shù)據(jù)加以利用。通過這種對數(shù)據(jù)二次開發(fā)的方式從中獲得相關信息,并獲得相關利益,這在很大程度上侵犯了信息所有者的知識產(chǎn)權(quán)。
2.2 用戶的隱私保護問題
在當前的大數(shù)據(jù)背景下,圖書館館際服務能夠為用戶提供豐富的知識資源與服務,例如數(shù)字圖書、知識挖掘、知識分析和數(shù)據(jù)處理等。當通過使用大數(shù)據(jù)方式進行整合、挖掘、分析而獲得海量的數(shù)據(jù)信息時,會涉及到很多個體用戶及機構(gòu)的私人信息。若不能夠?qū)@些數(shù)據(jù)信息進行妥善處理,則可能會嚴重威脅社會穩(wěn)定,造成安全威脅。例如,圖書館通常會對用戶的資料、讀書行為、個人偏好以及位置信息等進行分析,甚至可以深入至微博、微信等社交網(wǎng)絡中,達到某種商業(yè)價值,從而給用戶的生活帶來困擾。
2.3 網(wǎng)絡安全問題
現(xiàn)代數(shù)字圖書館是以互聯(lián)網(wǎng)為基礎構(gòu)建起來的信息傳遞以及知識共享的系統(tǒng),能夠為讀者提供全面的服務。在網(wǎng)絡系統(tǒng)中,大數(shù)據(jù)因為其豐富的資源及其更具價值的特點更加容易成為網(wǎng)絡上被攻擊的目標。這主要是因為圖書館的“大數(shù)據(jù)”不但包含大量的數(shù)據(jù),同時還包含了用戶行為、敏感數(shù)據(jù)等,這些數(shù)據(jù)更容易吸引攻擊者,使得大數(shù)據(jù)成為更加有吸引力的目標。同時,黑客通過大數(shù)據(jù)發(fā)起網(wǎng)絡攻擊,能夠同時控制數(shù)百萬臺計算機,實現(xiàn)多點海量攻擊。另外,利用大數(shù)據(jù),黑客還可以發(fā)動APT攻擊,并將其攻擊代碼隱藏在大數(shù)據(jù)中,難以被檢測得到[2]。
2.4 數(shù)據(jù)存儲安全問題
當前,現(xiàn)代圖書館所關注的數(shù)據(jù)不再局限于普通的數(shù)目(書目)信息、讀者信息和數(shù)字刊物等業(yè)務數(shù)據(jù),其還涉及到微博、微信和移動互聯(lián)網(wǎng)絡等讀者活動中產(chǎn)生的信息。這些數(shù)據(jù)具有極強的社會化功能,其龐大的數(shù)據(jù)集是對圖書館存儲、軟硬件設備的一個重大考驗。因此,如何避免這些重要數(shù)據(jù)的丟失、損毀以及被非法入侵、利用,是現(xiàn)代圖書館數(shù)據(jù)存儲所面臨的一個重要安全問題。一般,在大數(shù)據(jù)環(huán)境下,圖書館為了壓縮成本,通常會將這些數(shù)據(jù)存儲至云端,而云端的開放性、海量性都給其帶來了潛在的風險與威脅。
3.1 知識產(chǎn)權(quán)的保護
針對大數(shù)據(jù)環(huán)境下知識產(chǎn)權(quán)的保護問題,圖書館的信息資源存儲中心要結(jié)合云計算的具體協(xié)議與標準,制定在圖書館內(nèi)部使用云計算時必須遵循的準則與規(guī)范。同時,對通過對提供云計算服務的相關供應商進行對應的評估和考核,詳細地了解企業(yè)所提供的云計算產(chǎn)品的技術(shù)性能和能夠持續(xù)應用的情況,并對其采取對應的訪問控制及管理措施,保證圖書館間的合作與數(shù)據(jù)共享能夠逐漸實現(xiàn)標準化和規(guī)范化。另外,國家相關部門還應該盡快地完善相關的法律制度,以適應新的技術(shù),使得云服務提供商與圖書館、著作權(quán)人機用戶之間的利益得到權(quán)衡,避免出現(xiàn)網(wǎng)絡資源隨意傳播,侵害著作權(quán)人權(quán)益現(xiàn)象的出現(xiàn)。最后,數(shù)字簽名、數(shù)據(jù)加密、數(shù)字證書、安全容器等技術(shù)手段也能夠在對應程度上打擊侵權(quán)現(xiàn)象的出現(xiàn)。
3.2 數(shù)據(jù)安全監(jiān)管機制的構(gòu)建
大數(shù)據(jù)及其關鍵技術(shù)的快速發(fā)展給圖書館大數(shù)據(jù)的存儲及分析奠定了堅實的基礎,其逐步成為了圖書館的重要資產(chǎn)。但是,這些海量數(shù)據(jù)及數(shù)據(jù)分析結(jié)果一旦出現(xiàn)問題,例如泄露等情況,則對個人及整個圖書館都是一個重大的損失,甚至可能造成聲譽受損的情況,嚴重時還需要承擔相關的法律責任。除了技術(shù)問題之外,圖書館的大數(shù)據(jù)還是一個管理問題。因此,圖書館除了需要從技術(shù)方面保證數(shù)據(jù)存儲安全、云安全以及網(wǎng)絡安全等方面保證系統(tǒng)的信息安全威脅之外,還需要從數(shù)據(jù)安全監(jiān)管、數(shù)據(jù)資源共享機制以及數(shù)據(jù)隱私保護等方面進行管理,加強對敏感數(shù)據(jù)的審計與保護工作,從管理方面避免圖書館核心數(shù)據(jù)、隱私數(shù)據(jù)以及敏感數(shù)據(jù)的流失。最終形成一個能夠貫穿到圖書館運行各個流程的數(shù)據(jù)監(jiān)控與管理機制,保證隱私數(shù)據(jù)、數(shù)據(jù)預處理等功能。
3.3 強化網(wǎng)絡監(jiān)管
為了保護大數(shù)據(jù)環(huán)境下圖書館信息資源的安全,并避免圖書館網(wǎng)絡導致的數(shù)據(jù)泄露問題。這就要求圖書館必須做好網(wǎng)絡監(jiān)管工作,通過集中優(yōu)勢資源,學習并借鑒國內(nèi)外其他圖書館運行管理獲得的先進經(jīng)驗,建設具有自身獨特功能及效果的網(wǎng)絡監(jiān)管系統(tǒng),做好網(wǎng)絡安全監(jiān)管與檢查工作。同時,在日常的數(shù)據(jù)管理工作中,也需要通過加強數(shù)據(jù)的實時監(jiān)控及定期抽查等工作,將信息安全問題作為網(wǎng)絡管理的重要手段。
3.4 確保數(shù)據(jù)存儲安全
圖書館是云存儲服務的重要用戶,其關注的重點在于保證云端數(shù)據(jù)的完整性和安全性,即要避免非法入侵,并保證合法訪問時數(shù)據(jù)的精確性。從當前大數(shù)據(jù)的實際應用及相關成果來看,為了保證存儲數(shù)據(jù)的安全,可以從身份認證、加密存儲以及數(shù)據(jù)災備三個方面來保證云數(shù)據(jù)安全。
(1)身份認證技術(shù)
應該強化圖書館云端數(shù)據(jù)的管理,通過身份認證的方式,保證管理員、用戶、云存儲服務商等通過認證的用戶能夠獲得訪問權(quán)限,并可能夠?qū)崿F(xiàn)對“云端”數(shù)據(jù)資源的管理、分析、訪問。云端數(shù)據(jù)因為具有跨平臺、異構(gòu)、分布等特點,為了提高管理人員及用戶的訪問效率,應該建立一個高效的統(tǒng)一身份登錄與認證系統(tǒng),支持各個圖書館之間進行身份認證信息共享,減少重復驗證造成的資源浪費問題。
(2)加密存儲技術(shù)
通過對數(shù)據(jù)及文件進行加密存儲,能夠保證圖書館的數(shù)據(jù)在云存儲及數(shù)據(jù)資源傳輸過程中不會出現(xiàn)意外的丟失、損壞和非法利用。加密處理過程中,主要包括這樣兩個方面:① 密鑰的管理與生成;② 使用密鑰對數(shù)據(jù)進行加密存儲與解密讀取[3]。利用云存儲系統(tǒng)給用戶生成的解密秘鑰,系統(tǒng)將數(shù)據(jù)存儲在云端,用戶在下載加密數(shù)據(jù)之后,通過使用自己的秘鑰恢復數(shù)據(jù),獲得原始的真實數(shù)據(jù)。在這個過程中,存儲性能及網(wǎng)絡傳輸效率將會影響到存儲性能,所以要加快加密存儲技術(shù)的研究。另外,也需要有針對性地對重要數(shù)據(jù)、敏感數(shù)據(jù)及個人信息數(shù)據(jù)等進行加密存儲。
(3)數(shù)據(jù)災備技術(shù)
云計算的一個重要特點及其優(yōu)勢就是具有數(shù)據(jù)災備的優(yōu)勢。通過使用虛擬化技術(shù)、分布式技術(shù)以及云計算等技術(shù),能夠?qū)崿F(xiàn)多點備份、數(shù)據(jù)的自動冗余存儲、云節(jié)點數(shù)據(jù)級災備等功能,可以保證數(shù)據(jù)在出現(xiàn)災變之后及時地恢復系統(tǒng)功能。因此,圖書館通過利用云存儲技術(shù)在不同的物理存儲設備上建立兩個及以上的圖書館云存儲數(shù)據(jù)中心,形成一個跨地域的統(tǒng)一存儲平臺體系,各個業(yè)務部門以及用戶都能夠?qū)崿F(xiàn)數(shù)據(jù)共享,保證數(shù)據(jù)中心的整體完整性,能夠為數(shù)據(jù)中心提供持續(xù)的服務。
[1]王彤.大數(shù)據(jù)時代下的圖書館跨界服務信息安全技術(shù)問題及對策[J].數(shù)字圖書館,2014.
[2]鮑劼,李蘇豐.大數(shù)據(jù)環(huán)境下圖書館信息安全問題與對策分析[J].科技情報開發(fā)與經(jīng)濟,2014.
[3]胡瑋瑋.大數(shù)據(jù)時代下圖書館面臨的信息安全問題與對策[J].創(chuàng)新科技,2015.