朱稅顯
摘 要 大數(shù)據(jù)技術(shù)在信息搜集、整理、分析和提煉中發(fā)揮著重要作用。高校圖書館應(yīng)用大數(shù)據(jù)技術(shù)有著重要的作用,大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書館資源的“大”,大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書管管理的“快”,大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書館服務(wù)的“精”。高校圖書館提升服務(wù)水平所需要的大數(shù)據(jù)技術(shù)主要有文獻(xiàn)管理系統(tǒng)、傳感器技術(shù)、RFID 技術(shù)和移動終端技術(shù)。高校應(yīng)用大數(shù)據(jù)技術(shù)存在諸多困境,如大數(shù)據(jù)管理人才缺乏,圖書館數(shù)據(jù)采集對象模糊,高校圖書館用戶隱私保護(hù)存在問題。
關(guān)鍵詞 高校圖書館 大數(shù)據(jù)技術(shù) 必要性 困境
中圖分類號:G255.2 文獻(xiàn)標(biāo)識碼:A DOI:10.16400/j.cnki.kjdks.2017.03.012
1 高校圖書館應(yīng)用大數(shù)據(jù)技術(shù)的必要性
大數(shù)據(jù)技術(shù)的應(yīng)用使得高校圖書館在圖書資源的搜集、整理、分類、貯藏、使用等方面等到了優(yōu)化和改進(jìn),使得圖書管服務(wù)從傳統(tǒng)的館藏、借閱等服務(wù)拓展到了個性化服務(wù)、學(xué)科知識服務(wù)等領(lǐng)域,提升了圖書館的服務(wù)水平和服務(wù)層次。
(1)大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書館資源的“大”。大數(shù)據(jù)技術(shù)結(jié)合了云計算分布式處理、分布式數(shù)據(jù)庫、虛擬化技術(shù)、云存儲技術(shù)等,實現(xiàn)了圖書存儲的海量化發(fā)展。大數(shù)據(jù)技術(shù)引入圖書館使得結(jié)構(gòu)化數(shù)據(jù)(能夠用統(tǒng)一結(jié)構(gòu)加以表示的數(shù)據(jù),如符號、數(shù)字、文字等)、非結(jié)構(gòu)化數(shù)據(jù)(不能用統(tǒng)一結(jié)構(gòu)表示的數(shù)據(jù),如所有格式的辦公文檔、各類報表、圖片、錄像、音頻、網(wǎng)頁等)、半結(jié)構(gòu)化數(shù)據(jù)(完全無結(jié)構(gòu)數(shù)據(jù)與完全結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),如HTML文檔)等各類數(shù)據(jù)都能夠存儲于云服務(wù)器中,創(chuàng)新了傳統(tǒng)的數(shù)據(jù)采集和處理模式。高校圖書館對大數(shù)據(jù)技術(shù)的應(yīng)用有效地實現(xiàn)了空間上和時間上的突破,使過去的圖書管理模式發(fā)生了質(zhì)的提升,促進(jìn)了圖書管理的便捷化、科學(xué)化和高效化,有利于實現(xiàn)圖書館服務(wù)向以用戶為中心的轉(zhuǎn)變。
(2)大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書管管理的“快”。傳統(tǒng)圖書館信息傳遞的介質(zhì)主要是紙質(zhì)書籍,圖書館管理也主要表現(xiàn)為對紙質(zhì)圖書及相關(guān)服務(wù)的管理。在過去,圖書館員基本是通過手工的形式對圖書進(jìn)行搜集、分類、整理、館藏、檢索、匯編、借閱、使用等,即便計算機(jī)技術(shù)引用圖書館管理后,對傳統(tǒng)圖書的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等也沒有從根本上超越手工處理階段,因為對圖書資源的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等各個環(huán)節(jié)是彼此脫節(jié)的,無法實現(xiàn)圖書館服務(wù)管理的“快”。大數(shù)據(jù)技術(shù)引用圖書館使得個性化服務(wù)成為可能,極大地提高了圖書館管理效率。高校圖書館可以利大數(shù)據(jù)技術(shù)對圖書的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等環(huán)節(jié)進(jìn)行資源整合,大大提升了高校圖書館管理效率。
(3)大數(shù)據(jù)技術(shù)有利于實現(xiàn)圖書館服務(wù)的“精”。傳統(tǒng)圖書館服務(wù)時代,服務(wù)的內(nèi)容聚焦于圖書借閱服務(wù)、圖書館藏服務(wù)以及與之相關(guān)的其他服務(wù)上,缺乏以用戶為核心的個性化服務(wù),尤其缺乏對用戶在與圖書館發(fā)生關(guān)系過程中產(chǎn)生的各種數(shù)據(jù)的搜集、整理和分析,因此無法掌握廣大師生的使用偏好,進(jìn)而為他們提供個性化服務(wù),使得服務(wù)粗糙而不精。這與當(dāng)時的計算機(jī)技術(shù)密切相關(guān),在傳統(tǒng)的圖書館服務(wù)時代,計算機(jī)還只能充當(dāng)協(xié)助存儲、協(xié)助管理角色,還不能對廣大師生在與圖書館發(fā)生關(guān)系過程中產(chǎn)生的巨量數(shù)據(jù)進(jìn)行搜集、整理、分析和提煉,并把這些有價值的數(shù)據(jù)運用于對用戶的使用偏好、研究偏好等的預(yù)測上,因而無法及時有效地為他們提供個性化、針對性服務(wù)。而大數(shù)據(jù)技術(shù)的發(fā)展和在圖書館領(lǐng)域的應(yīng)用,實現(xiàn)了圖書管理的智能化,圖書館管理由此而進(jìn)入了“第四范式”。大數(shù)據(jù)技術(shù)發(fā)揮它的信息搜集、加工處理、預(yù)測分析優(yōu)勢,能夠形成用戶個性分析庫,為他們提供定制式服務(wù)。
2 提升高校圖書館服務(wù)水平所需的主要大數(shù)據(jù)技術(shù)
2.1 文獻(xiàn)管理系統(tǒng)
作為大數(shù)據(jù)技術(shù)重要支撐的圖書館文獻(xiàn)管理系統(tǒng),記錄了高校師生在搜索資源、借還書籍等過程中產(chǎn)生的一切數(shù)據(jù),這些數(shù)據(jù)可以表現(xiàn)出他們的閱讀興趣和閱讀習(xí)慣,也可以反映出他們的研究領(lǐng)域和研究方向。這方面的數(shù)據(jù)能夠為大數(shù)據(jù)技術(shù)提供重要的數(shù)據(jù)來源。通過大數(shù)據(jù)技術(shù)可以提升圖書館已有數(shù)據(jù)的價值。隨著互“聯(lián)網(wǎng)+”時代的到來,用戶能夠接觸到的信息量越來越大、渠道越來越多、方式越來越廣,對圖書館館藏圖書的需求有所減少。歸根到底是高校圖書館沒有充分關(guān)照師生用戶的實際需求要。因此,利用大數(shù)據(jù)技術(shù)深入地挖掘、分析、整理和提煉圖書館文獻(xiàn)管理系統(tǒng)中用戶留下的各種數(shù)據(jù),采用可視化技術(shù),洞察和分析讀者的閱讀行為和習(xí)慣,了解他們的研究領(lǐng)域、閱讀偏好,進(jìn)而有針對性地、主動地為他們提供教學(xué)、科研和學(xué)習(xí)所需要的知識服務(wù)是非常必要的。在“互聯(lián)網(wǎng)+”時代,尤其是在大數(shù)據(jù)時代,用戶所需要的不是資源線索,而是與自己的教學(xué)、科研及學(xué)習(xí)相關(guān)的知識,高校圖書館要建設(shè)在復(fù)雜學(xué)科背景下的知識集成、知識整理、知識匯編、知識創(chuàng)造、知識發(fā)現(xiàn)等知識服務(wù),運用大數(shù)據(jù)技術(shù),充分利用文獻(xiàn)館藏系統(tǒng)跟蹤用戶教學(xué)、科研和學(xué)習(xí)需要,挖掘知識主體、知識客體等之間的相互關(guān)系,為知識服務(wù)的實現(xiàn)提供前提條件。
2.2 傳感器技術(shù)
傳感器是能夠感應(yīng)規(guī)定的被測對象,且能夠有規(guī)律地把所測數(shù)據(jù)轉(zhuǎn)換成可用信號的裝置。傳感器技術(shù)作為數(shù)據(jù)獲取的重要方式,與計算機(jī)技術(shù)、通信技術(shù)一道構(gòu)成了信息技術(shù)的三大支柱。隨著傳感器技術(shù)的不斷發(fā)展,其應(yīng)用領(lǐng)域越來越廣泛,覆蓋了環(huán)境保護(hù)領(lǐng)域、交通運輸領(lǐng)域、文化教育領(lǐng)域、醫(yī)療衛(wèi)生領(lǐng)域等。傳感器能夠?qū)⑷祟惿睢W(xué)習(xí)、工作等各個方面的信息,按照一定的規(guī)律,轉(zhuǎn)化成為可用的信號。部分智能傳感器還能夠識別被測對象產(chǎn)生的價值數(shù)據(jù),并進(jìn)行信號轉(zhuǎn)化,為大數(shù)據(jù)的獲取提供了重要支持,避免了大量數(shù)據(jù)同時被轉(zhuǎn)化,造成數(shù)據(jù)堵塞和數(shù)據(jù)處理困難的問題。傳感器技術(shù)的發(fā)展和應(yīng)用為大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用提供了數(shù)據(jù)支撐。目前,高校圖書館應(yīng)用傳感器的方式多種多樣,如使用紅外傳感器,以解決高校圖書館普遍存在的“占位”問題。因此,利用傳感器技術(shù),搜集圖書館內(nèi)的各種數(shù)據(jù),并利用大數(shù)據(jù)技術(shù)處理這些數(shù)據(jù),對于研究用戶的閱讀行為習(xí)慣、閱讀偏好,進(jìn)而有針對性地調(diào)整服務(wù)策略,具有重要的實踐價值。
2.3 RFID 技術(shù)
RFID(Radio Frequency Identification)技術(shù),即射頻識別技術(shù),是對傳統(tǒng)條形碼技術(shù)的發(fā)展和創(chuàng)新。RFID技術(shù)與傳統(tǒng)條形碼技術(shù)相比,操作距離得到擴(kuò)展,標(biāo)簽的使用更便捷,只需要一個可移動閱讀器,就可以對標(biāo)簽信息進(jìn)行識別和閱讀。除此之外,RFID技術(shù)還有許多優(yōu)勢,比如,操作范圍廣、性能穩(wěn)定、存儲能力強(qiáng),這些優(yōu)勢使它越來越成為物聯(lián)網(wǎng)時代的重要信息獲取技術(shù)。這種技術(shù)在未來的圖書館發(fā)展中,必然會得到廣泛運用。高校圖書館應(yīng)用RFID技術(shù)能夠?qū)崿F(xiàn)對圖書等資源及相關(guān)服務(wù)的實時跟蹤、即時分析,獲取和把握知識資源及相關(guān)服務(wù)的情況。如此,就可以及時分析和了解高校圖書館為師生提供的知識服務(wù)效果,并根據(jù)效果情況不斷調(diào)整服務(wù)策略,最大程度滿足用戶的秩序需要。由此可見,RFID技術(shù)將成為大數(shù)據(jù)時代圖書館數(shù)據(jù)處理和分析的重要工具。
2.4 移動終端技術(shù)
我們正處于互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)時代使移動終端得以普及,手機(jī)、平板電腦等等已經(jīng)成了人們生活、工作和學(xué)習(xí)不可缺少的工具,也成為人們各種數(shù)據(jù)產(chǎn)生的重要來源。手機(jī)、平板電腦等移動終端本身具有較強(qiáng)的信息處理能力,比如二維碼掃描、GPS定位等。高校圖書館已經(jīng)基本普及了移動圖書館、微信圖書館、二維碼技術(shù)等服務(wù),這與移動終端的普及是分不開的,離開了移動終端,這些服務(wù)就無法實現(xiàn)。圖書館用戶在通過移動終端享受圖書館服務(wù)過程中,會產(chǎn)生各種各樣的數(shù)據(jù),這些數(shù)據(jù)直接為大數(shù)據(jù)技術(shù)提供了支撐。大數(shù)據(jù)技術(shù)能夠?qū)崿F(xiàn)對移動終端上產(chǎn)生的數(shù)據(jù)的處理和分析。一般來說,高校圖書館通過用戶的移動終端采集信息的來源主要有三種:第一,用戶在移動終端上查閱、瀏覽書籍產(chǎn)生的數(shù)據(jù);第二,用戶使用的移動終端內(nèi)置的傳感器采集到的數(shù)據(jù);第三,用戶在互聯(lián)網(wǎng)上發(fā)生的網(wǎng)絡(luò)行為產(chǎn)生的數(shù)據(jù),如網(wǎng)絡(luò)評論、轉(zhuǎn)發(fā)的微博等數(shù)據(jù)。移動終端技術(shù)能夠促進(jìn)大數(shù)據(jù)技術(shù)在圖書館中的運用和普及。通過大數(shù)據(jù)技術(shù),搜集用戶在使用移動終端過程中產(chǎn)生的各種數(shù)據(jù),了解他們的閱讀偏好和閱讀習(xí)慣,掌握他們的知識需求,對于提升圖書館的知識服務(wù)水平有著重要意義。
3 高校圖書館應(yīng)用大數(shù)據(jù)技術(shù)面臨的問題
3.1 大數(shù)據(jù)管理人才缺乏
大數(shù)據(jù)文件系統(tǒng)主要有Hadoop的分布式文件系統(tǒng)(HDFS)、谷歌的可擴(kuò)展分布式文件系統(tǒng)(GFS)、集群文件系統(tǒng)公司開發(fā)的平行分布式文件系統(tǒng)(Lustre),F(xiàn)acebook開發(fā)的Haystack文件系統(tǒng)等等。大數(shù)據(jù)時代,高校圖書館需要對用戶與圖書館發(fā)生關(guān)系過程中產(chǎn)生的海量數(shù)據(jù)進(jìn)行管理,但是,圖書館數(shù)據(jù)管理人員缺乏,對大數(shù)據(jù)文件系統(tǒng)有所了解的人更少,由此而制約了高校圖書館從傳統(tǒng)服務(wù)向知識服務(wù)的轉(zhuǎn)型。高校圖書館數(shù)據(jù)管理人才必須對圖書館學(xué)、統(tǒng)計學(xué)、數(shù)學(xué)、大數(shù)據(jù)技術(shù)等都有所了解,并能夠融會貫通,是非常難得的復(fù)合型人才。目前,對這類人才的培養(yǎng)還存在諸多問題,因此,這類人才較為缺乏。為了解決這個問題,高校圖書館一般都是通過委培等方式,與有關(guān)的培訓(xùn)機(jī)構(gòu)簽訂培訓(xùn)協(xié)議,把有志于從事大數(shù)據(jù)管理的圖書館員選拔出來,派出進(jìn)修,較為系統(tǒng)地學(xué)習(xí)大數(shù)據(jù)技術(shù)等大數(shù)據(jù)管理所需要的知識,在學(xué)有所成后回到原單位從事大數(shù)據(jù)管理方面的工作??梢姡咝D書館應(yīng)用大數(shù)據(jù)技術(shù)面臨的一大困境就是人才問題。
3.2 圖書館數(shù)據(jù)采集對象模糊
大數(shù)據(jù)技術(shù)對高校圖書館來說是一項全新的技術(shù),高校圖書館員很少有人真正了解這門技術(shù)。高校圖書館通過對大數(shù)據(jù)管理人才培養(yǎng)、引進(jìn)中,雖然逐漸擁有了一批大數(shù)據(jù)管理人才,但是仍然存在一些問題,比如數(shù)據(jù)采集對象的問題。在應(yīng)用大數(shù)據(jù)技術(shù)采集數(shù)據(jù)資源時圖書館員首先面臨的問題是采集什么數(shù)據(jù),通過什么方式采集這些數(shù)據(jù),通過這些數(shù)據(jù)是否可以了解用戶的閱讀習(xí)慣和閱讀偏好,這些數(shù)據(jù)是否對圖書館知識服務(wù)有用,等等。這些問題都是圖書館員在應(yīng)用大數(shù)據(jù)技術(shù)時必須要深入考慮的。此外,對于大數(shù)據(jù)的采集與分析,圖書館員還要考慮數(shù)據(jù)采集和分析的經(jīng)濟(jì)性,即采集數(shù)據(jù)的成本和效益。對于時效性強(qiáng)、存在周期短、數(shù)據(jù)量大(下轉(zhuǎn)第66頁)(上接第25頁)的數(shù)據(jù),必須有要相應(yīng)的采集標(biāo)準(zhǔn)。同時,高校圖書館引入大數(shù)據(jù)技術(shù)必須以提升用戶的滿意度為目的,對于高校而言主要是以為用戶提供高效率、有價值的知識服務(wù)為目的。比如,美國的Hiptype公司就通過大數(shù)據(jù)技術(shù)分析電子書閱讀用戶的喜好,并提供了更加貼近讀者的人性化服務(wù)。
3.3 高校圖書館用戶隱私保護(hù)存在問題
大數(shù)據(jù)時代是彰顯數(shù)據(jù)價值的時代,但是價值主體不同,會使數(shù)據(jù)的使用方式不同。價值主體如果是合法主體,那么大數(shù)據(jù)就能造福于人。價值主體如果是不法分子,那么數(shù)據(jù)及其反映的個人、法人等的隱私就面臨泄露的危險,甚至?xí)虼硕o個人、法人等帶來嚴(yán)重的損失。此外,大數(shù)據(jù)技術(shù)的數(shù)據(jù)采集對象是兼具海量化和復(fù)雜性,通過大數(shù)據(jù)技術(shù),要從這些數(shù)據(jù)之中獲取有用的信息,是比較容易的。不法分子可以跟蹤用戶信息,分析用戶產(chǎn)生的各種數(shù)據(jù),破譯他們的各種密碼,使其隱私泄露,人身和財產(chǎn)安全受到威脅。而且,大數(shù)據(jù)的搜集、分析等工作,很多高校都外包給第三方機(jī)構(gòu),第三方機(jī)構(gòu)可能因為各方面的原因泄露高校圖書館用戶數(shù)據(jù),如:自身系統(tǒng)的安全系數(shù)不高,數(shù)據(jù)庫被攻破,信息外泄;內(nèi)部人員受利益驅(qū)使,而盜取數(shù)據(jù),造成數(shù)據(jù)外泄,等等。另外,高校圖書館本身也存在泄露用戶隱私的問題。我們知道,高校圖書館引入大數(shù)據(jù)技術(shù)是為了更好地為用戶服務(wù),提升用戶的滿意度,并促進(jìn)高??蒲小⒔虒W(xué)等的不斷發(fā)展,但是部分高校圖書館為了最大化地提升服務(wù)效益、提高自身的競爭力,可能會泄露部分用戶的個人隱私??梢姡髷?shù)據(jù)時代,高校圖書館應(yīng)該從技術(shù)、制度等層面加強(qiáng)對用戶隱私的保護(hù)。
參考文獻(xiàn)
[1] 曾瑛.Web挖掘工具與數(shù)字圖書館信息服務(wù)[J].中國科技信息,2005(7):38-39.
[2] 梁澤本.數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館個性化服務(wù)中的應(yīng)用[J].科技情報開發(fā)與經(jīng)濟(jì),2005(18):96-97.
[3] 李志明,胡樹森.數(shù)據(jù)挖掘及其在現(xiàn)代化圖書館中的應(yīng)用[J].圖書館學(xué)研究,2006(6):39-41.
[4] 楊小云.數(shù)據(jù)挖掘在圖書館中的應(yīng)用[J].渭南師范學(xué)院學(xué)報,2005(2):129.
[5] 來紅梅.數(shù)據(jù)時代圖書館信息服務(wù)面臨的挑戰(zhàn)與對策[J].圖書館學(xué)刊,2014(3):30-31.
[6] 楊海燕.數(shù)據(jù)時代的圖書館服務(wù)淺析[J].圖書與情報,2012(8):15-17.
[7] 陳臣.于大數(shù)據(jù)的圖書館個性化服務(wù)安全體系構(gòu)建研究[J].新世紀(jì)圖書館,2014(11):20-21.
[8] 韓煒.數(shù)據(jù)時代公共圖書館消除數(shù)據(jù)不平等的路徑選擇[J].圖書館論壇,2014(3):10-11.