馬 婧
(伊春市圖書館,黑龍江 伊春 153000)
大數(shù)據(jù)技術(shù)系統(tǒng)包含了非常深刻的技術(shù)原理和操作邏輯。運(yùn)用大數(shù)據(jù)技術(shù),可以對(duì)數(shù)據(jù)進(jìn)行高效的數(shù)據(jù)集成、數(shù)據(jù)分析、基于大數(shù)據(jù)的現(xiàn)代運(yùn)行機(jī)制。在高校信息化建設(shè)過(guò)程中,引入大數(shù)據(jù)系統(tǒng)將會(huì)帶來(lái)一系列的變革,不僅能解決某些技術(shù)問(wèn)題,而且還能解決整個(gè)系統(tǒng)的架構(gòu)問(wèn)題。要使大數(shù)據(jù)系統(tǒng)更加多元化,須切實(shí)落實(shí)大數(shù)據(jù)技術(shù)在高校中的應(yīng)用,從長(zhǎng)遠(yuǎn)角度考慮其建設(shè)。
大數(shù)據(jù)技術(shù)。在大數(shù)據(jù)技術(shù)的支持下,數(shù)字信息技術(shù)發(fā)展到今天,因?yàn)槠涞讓舆壿嫃?fù)雜、實(shí)施方式多樣、應(yīng)用領(lǐng)域多種多樣,到目前為止,學(xué)術(shù)界還沒(méi)有一個(gè)統(tǒng)一的定義。本文通過(guò)對(duì)大數(shù)據(jù)技術(shù)和科研文獻(xiàn)的研究進(jìn)行了回顧,提出了以海量信息資源為基礎(chǔ)的數(shù)據(jù)庫(kù),并利用數(shù)字技術(shù)對(duì)各行業(yè)進(jìn)行分析、清洗和挖掘,為各行業(yè)的發(fā)展提供定量依據(jù)。目前大數(shù)據(jù)技術(shù)的應(yīng)用,主要是利用大數(shù)據(jù)自身的非結(jié)構(gòu)數(shù)據(jù)的泛化特性,成為商業(yè)智能和數(shù)字化技術(shù)發(fā)展的開(kāi)發(fā)和應(yīng)用價(jià)值基礎(chǔ),從而為工業(yè)數(shù)字化高質(zhì)量發(fā)展提供新的動(dòng)能。知識(shí)寶庫(kù)。“智能圖書館”這個(gè)概念最初是艾托拉(芬蘭)提出的。本文以重慶大學(xué)楊新涯院長(zhǎng)為代表的“智慧圖書館”概念界定為:“智慧圖書館是指利用數(shù)字化、網(wǎng)絡(luò)化、大數(shù)據(jù)、人工智能等新技術(shù),對(duì)文獻(xiàn)元數(shù)據(jù)和運(yùn)行數(shù)據(jù)進(jìn)行有效的整合,從而提高圖書館的功能,構(gòu)建以互聯(lián)網(wǎng)為基礎(chǔ)的共享服務(wù)體系,實(shí)現(xiàn)精準(zhǔn)化、個(gè)性化和智能化文獻(xiàn)管理和服務(wù)的新型圖書館。在此基礎(chǔ)上,結(jié)合現(xiàn)有的相關(guān)理論,對(duì)如何在大數(shù)據(jù)平臺(tái)框架下構(gòu)建智能圖書館的概念進(jìn)行界定具有一定的指導(dǎo)意義和借鑒意義。在此基礎(chǔ)上,在智能圖書館的發(fā)展與建設(shè)中,必須具備感知能力、合作共享、決策智能、知識(shí)整合、人性化交互、精確化、個(gè)性化[1]。
智能圖書館的終極目的是為讀者提供信息,在實(shí)現(xiàn)智能圖書館的過(guò)程中,如何更好地滿足用戶的需求,是實(shí)現(xiàn)信息資源共享的重要途徑。首先,利用大數(shù)據(jù)技術(shù),可以將大學(xué)生的個(gè)人信息進(jìn)行綜合,包括大學(xué)生喜歡的書籍、喜歡的作家、習(xí)慣的習(xí)慣等等,并根據(jù)學(xué)生的特點(diǎn),制定出適合自己的個(gè)性化推薦方案;其次,大數(shù)據(jù)技術(shù)可以作為“第一道防線”,幫助大學(xué)生篩選出自己不喜歡的部分,從而迅速地將自己感興趣的部分與之相匹配。在此過(guò)程中,利用大數(shù)據(jù)技術(shù),既能滿足學(xué)生的閱讀需要,又能節(jié)省學(xué)生的選擇時(shí)間,為大學(xué)生科學(xué)地安排學(xué)校生活和養(yǎng)成良好的興趣。
大學(xué)引入了大數(shù)據(jù)技術(shù),使圖書館的建設(shè)工作效率得到很大的提升。首先,在智能圖書館的整體構(gòu)建中,運(yùn)用大數(shù)據(jù)技術(shù)來(lái)改變傳統(tǒng)的工作模式,實(shí)現(xiàn)工作流程的審批、流程對(duì)接、內(nèi)容校對(duì)、方案修改等,提高了圖書館信息化建設(shè)的效率;其次,大數(shù)據(jù)技術(shù)往往與計(jì)算機(jī)、人工智能、物聯(lián)網(wǎng)等相關(guān)。必須積極地適應(yīng)各類技術(shù)的發(fā)展。在此過(guò)程中,有關(guān)部門將逐步提升信息化辦公水平,加速智慧圖書館的建設(shè),早日實(shí)現(xiàn)其目標(biāo)。
通過(guò)對(duì)信息系統(tǒng)的整合,可以為整個(gè)智能圖書館的構(gòu)建提供支撐。一方面,應(yīng)用大數(shù)據(jù)技術(shù)體系構(gòu)建智慧圖書館,不只是簡(jiǎn)單地進(jìn)行技術(shù)的堆疊,更是各種技術(shù)的協(xié)同作用。基于大數(shù)據(jù)技術(shù)的支持,高校智能圖書館的建設(shè)能夠逐步實(shí)現(xiàn)一個(gè)系統(tǒng)的建設(shè),并逐步實(shí)現(xiàn)規(guī)模平臺(tái)化。另一方面,通過(guò)對(duì)大數(shù)據(jù)技術(shù)體系的內(nèi)在邏輯的探討,能夠給員工提供多種激勵(lì),不斷地優(yōu)化,最終形成符合學(xué)生、教師和學(xué)校需求的運(yùn)行模型。這種運(yùn)行方式不僅是一種“智慧化”的智能圖書館,更是一種合理的平臺(tái)體系,與高校圖書館的長(zhǎng)遠(yuǎn)發(fā)展有著密切的聯(lián)系。
目前,一些大學(xué)往往忽視了學(xué)生的現(xiàn)實(shí)需要,以追求“智慧化”的智能圖書館。首先,一些高校在建設(shè)智能圖書館時(shí),把所有的注意力都放在了對(duì)技術(shù)問(wèn)題的探索上,而沒(méi)有針對(duì)學(xué)生的實(shí)際需要,對(duì)服務(wù)對(duì)象進(jìn)行開(kāi)發(fā)。目前,我國(guó)高校普遍存在著知識(shí)產(chǎn)權(quán)不足、知識(shí)產(chǎn)權(quán)不足、缺乏實(shí)用價(jià)值等問(wèn)題。其次,一些智能圖書館采用的是一種先進(jìn)的技術(shù),但是學(xué)生在進(jìn)入圖書館后卻不能很快掌握,要花大量的時(shí)間來(lái)熟悉操作過(guò)程,不能方便地查閱和使用,這就是高校智能圖書館與現(xiàn)實(shí)的差距。
目前,一些高校對(duì)智能圖書館的重視程度較高,但至今未見(jiàn)成效。造成智能圖書館建設(shè)進(jìn)展緩慢的原因主要有以下幾個(gè)方面:一是部分高校還停留在傳統(tǒng)的觀念上,忽視了技術(shù)的發(fā)展和技術(shù)的運(yùn)用。智能圖書館與傳統(tǒng)的圖書館有著本質(zhì)的區(qū)別,它是通過(guò)各種現(xiàn)代科技的綜合運(yùn)用來(lái)實(shí)現(xiàn)的。由于缺少技術(shù)支持,高校圖書館的建設(shè)將面臨一系列的阻力,使其無(wú)法取得有效的發(fā)展。
二是一些大學(xué)在引進(jìn)先進(jìn)的教學(xué)設(shè)備、教學(xué)技術(shù)后,缺乏專業(yè)人員的實(shí)際操作與運(yùn)用。針對(duì)這些問(wèn)題,有的大學(xué)會(huì)進(jìn)行技術(shù)培訓(xùn),但是技術(shù)培訓(xùn)要經(jīng)過(guò)一段時(shí)期的實(shí)踐,才能取得良好的效果。從整體上看,要提高圖書館的建設(shè)效益,必須從技術(shù)和人才兩個(gè)方面著手。
高校智能圖書館既要與多種技術(shù)系統(tǒng)相適應(yīng),又要構(gòu)建一個(gè)科學(xué)的平臺(tái),而有的大學(xué)則把重點(diǎn)放在技術(shù)層面上,而忽視了系統(tǒng)的構(gòu)建。一方面,部分高校在技術(shù)上的簡(jiǎn)單開(kāi)發(fā)和技術(shù)的疊加,而忽視了各技術(shù)系統(tǒng)的相容性,從而造成了一些不實(shí)用、不合理的技術(shù)服務(wù),從而給讀者帶來(lái)了極大的不便;另一方面,一些大學(xué)在構(gòu)建智能圖書館的平臺(tái)體系結(jié)構(gòu)時(shí),并沒(méi)有充分認(rèn)識(shí)到安全防護(hù)的重要性。由于智能圖書館中各種網(wǎng)絡(luò)技術(shù)的存在,存在著網(wǎng)絡(luò)安全隱患,如果發(fā)生突發(fā)事件,將影響到整個(gè)系統(tǒng)的安全,嚴(yán)重的影響到智能圖書館的數(shù)據(jù),從而對(duì)高校的安全造成難以估量的影響。
綜觀國(guó)內(nèi)外有關(guān)實(shí)現(xiàn)高校智能圖書館技術(shù)發(fā)展和應(yīng)用的相關(guān)研究,不難看出,由于數(shù)據(jù)技術(shù)的集成和資源突破了時(shí)間和空間的局限,資源的整合還處在起步階段,如何突破時(shí)間和空間的局限,實(shí)現(xiàn)資源的有效整合,是當(dāng)前亟待解決的技術(shù)難題。另外,由于資金、人力等多方面的制約,以及圖書館資源快速更新的特點(diǎn),使其在技術(shù)上的高并發(fā)性、高兼容性等方面存在較大困難,而以大數(shù)據(jù)技術(shù)為基礎(chǔ)的高校智慧圖書館資源泛在性和延續(xù)性建設(shè)有待提高。因此,當(dāng)前大學(xué)智能圖書館的建設(shè)無(wú)論是理念標(biāo)準(zhǔn)、功能實(shí)現(xiàn)、技術(shù)升級(jí)、資源整合、新老系統(tǒng)安全升級(jí)等方面都存在著巨大的困難,難以滿足用戶日益增長(zhǎng)的現(xiàn)實(shí)需求,同時(shí)也難以實(shí)現(xiàn)技術(shù)與人文價(jià)值的有機(jī)融合。
高校智能圖書館要更好地適應(yīng)大學(xué)生的現(xiàn)實(shí)需要,必須抓住以下兩個(gè)方面:第一,高校在發(fā)展智能圖書館的技術(shù)時(shí),既要追求高、精、尖,又要從學(xué)生的實(shí)際需要出發(fā)。其次,從大數(shù)據(jù)角度對(duì)高校智能圖書館進(jìn)行了研究。并對(duì)所提供的技術(shù)服務(wù)的實(shí)用性做出了評(píng)價(jià)。通過(guò)對(duì)高校圖書館技術(shù)服務(wù)的分析,可以有效地反映高校圖書館的實(shí)際需要[2]。
高校要進(jìn)一步推進(jìn)智能圖書館的建設(shè),必須從以下幾個(gè)方面著手:第一,與傳統(tǒng)的圖書館不同,要積極轉(zhuǎn)變觀念,注重技術(shù)的發(fā)展與技術(shù)的運(yùn)用。隨著計(jì)算機(jī)、人工智能、物聯(lián)網(wǎng)等技術(shù)的不斷發(fā)展,高校能夠充分利用大數(shù)據(jù)集成的作用,有效地整合各類技術(shù)參數(shù),探索不同技術(shù)系統(tǒng)的相容性,使不同技術(shù)系統(tǒng)的優(yōu)點(diǎn)最大化,從而促進(jìn)圖書館的有序建設(shè)。二是要加快建設(shè)智能圖書館,既要嚴(yán)格控制技術(shù)引進(jìn),又要加強(qiáng)人才的管理。定期舉辦智慧圖書館建設(shè)技術(shù)培訓(xùn),建設(shè)智慧圖書館建設(shè)大數(shù)據(jù)專題培訓(xùn),加強(qiáng)員工使用信息化技術(shù),便于員工整合資源、整合方法、整合平臺(tái)。同時(shí),高校還可以通過(guò)邀請(qǐng)科技領(lǐng)域的資深專家到學(xué)校來(lái)和教師們一起探討、交流,圍繞著數(shù)據(jù)集成的作用,不斷創(chuàng)新智慧圖書館的建設(shè)途徑,從而提升圖書館的工作效率。
根據(jù)大數(shù)據(jù)系統(tǒng)自身的內(nèi)在邏輯,大學(xué)可以對(duì)其進(jìn)行進(jìn)一步的優(yōu)化。一方面,大數(shù)據(jù)系統(tǒng)具有信息跟蹤的能力,能夠?qū)D書的查找、借閱、歸還等各個(gè)環(huán)節(jié)進(jìn)行跟蹤。在此基礎(chǔ)上,高校能夠根據(jù)大學(xué)生的閱讀需要,設(shè)計(jì)出與之相適應(yīng)的運(yùn)營(yíng)邏輯。而在“安全防范”問(wèn)題上,大學(xué)應(yīng)重視。利用大數(shù)據(jù)技術(shù)系統(tǒng),可以從源頭上追溯信息,并將其與大數(shù)據(jù)的技術(shù)邏輯相結(jié)合,設(shè)計(jì)出安全保護(hù)的操作邏輯,從而提高其防范風(fēng)險(xiǎn)的能力。在智能圖書館中,大數(shù)據(jù)系統(tǒng)就是一道安全屏障,它能有效地保障整個(gè)智能圖書館的平臺(tái)結(jié)構(gòu),使其正常運(yùn)作。
通過(guò)Hadoop的層次結(jié)構(gòu),將該技術(shù)應(yīng)用到智能圖書館的大數(shù)據(jù)平臺(tái)上,既包括了圖書館的數(shù)據(jù),又包括了教學(xué)數(shù)據(jù)和讀者消費(fèi)數(shù)據(jù)。大數(shù)據(jù)平臺(tái)具有海量的數(shù)據(jù)資源,可以根據(jù)大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)的存儲(chǔ)、分析和應(yīng)用演示。在平臺(tái)搭建中,要按照層次分明的邏輯層次進(jìn)行設(shè)計(jì),以適應(yīng)各種業(yè)務(wù)的多元化需求。主要包括數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)服務(wù)層和數(shù)據(jù)應(yīng)用層四個(gè)層次。
數(shù)據(jù)采集層:數(shù)據(jù)收集層包括了數(shù)據(jù)系統(tǒng)和提取元數(shù)據(jù)。這些資料既包含了圖書館現(xiàn)有的各種資料,也包含了圖書館的資料。智慧圖書館是智慧校園的一個(gè)重要組成部分,因此,它不僅僅是一個(gè)獨(dú)立的系統(tǒng),它還必須與學(xué)生的教學(xué)數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、學(xué)生的消費(fèi)數(shù)據(jù)等保持聯(lián)系。數(shù)據(jù)收集是指將學(xué)生的信息進(jìn)行抽取、清洗、轉(zhuǎn)化、裝入,形成統(tǒng)一的格式,以便為數(shù)據(jù)存儲(chǔ)提供支持。
數(shù)據(jù)存儲(chǔ)層:在大數(shù)據(jù)平臺(tái)上,各種數(shù)據(jù)的存儲(chǔ)是一個(gè)非常重要的工作,所以在智能圖書館的大數(shù)據(jù)平臺(tái)中,數(shù)據(jù)存儲(chǔ)是一個(gè)非常關(guān)鍵的環(huán)節(jié)。平臺(tái)上的一切商業(yè)與展示都要求與資料儲(chǔ)存層合作。在智能圖書館大數(shù)據(jù)平臺(tái)上,通常都會(huì)使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)和分布式的文檔系統(tǒng)來(lái)進(jìn)行數(shù)據(jù)存儲(chǔ)。在學(xué)校的內(nèi)部,關(guān)聯(lián)數(shù)據(jù)主要用于整合現(xiàn)有商業(yè)系統(tǒng)的數(shù)據(jù),為各種類型的數(shù)據(jù)進(jìn)行清理和轉(zhuǎn)換,同時(shí)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),挖掘隱藏在數(shù)據(jù)后面的信息。在海量數(shù)據(jù)中,分布式文件系統(tǒng)是以數(shù)據(jù)為基礎(chǔ)的,它包括了結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)。
數(shù)據(jù)服務(wù)層:在整個(gè)系統(tǒng)平臺(tái)中,服務(wù)層擔(dān)負(fù)著數(shù)據(jù)存儲(chǔ)器與應(yīng)用程序的連接,它可以通過(guò)定義相應(yīng)的界面來(lái)實(shí)現(xiàn)平臺(tái)上的各種業(yè)務(wù)的關(guān)聯(lián),從而為上層的應(yīng)用程序提供一個(gè)很好的訪問(wèn)界面。數(shù)據(jù)分析是基于Hadoop的數(shù)據(jù)分析平臺(tái),利用其強(qiáng)大的運(yùn)算能力,根據(jù)企業(yè)的實(shí)際需求,實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換、抽取、分析和挖掘。
數(shù)據(jù)應(yīng)用層面:數(shù)據(jù)分析,挖掘,業(yè)務(wù)集成。本層的特定應(yīng)用有:決策支持系統(tǒng),圖書館報(bào)告,個(gè)人閱讀報(bào)告,移動(dòng)客戶端等。
要確保智能圖書館大數(shù)據(jù)平臺(tái)的順利建設(shè),推動(dòng)數(shù)據(jù)分析與挖掘工作的有效開(kāi)展,必須對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的數(shù)據(jù)抽取、清洗和轉(zhuǎn)化。由于元數(shù)據(jù)來(lái)源于不同的自動(dòng)化系統(tǒng),所以每個(gè)自動(dòng)化系統(tǒng)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)都是按照各自的業(yè)務(wù)要求來(lái)設(shè)計(jì)的,而且它們之間的邏輯關(guān)系比較復(fù)雜。因此,為了保證相關(guān)工作的順利進(jìn)行,必須建立一個(gè)統(tǒng)一的數(shù)據(jù)規(guī)范,以便為以后的數(shù)據(jù)分析、挖掘工作奠定基礎(chǔ),保證工作的有效性。
針對(duì)海量的結(jié)構(gòu)化和非結(jié)構(gòu)性的數(shù)據(jù)存儲(chǔ)需要,在數(shù)據(jù)存儲(chǔ)體系中進(jìn)行配置。同時(shí),還必須確保相關(guān)的數(shù)據(jù)存儲(chǔ)和有效地訪問(wèn)和利用。HDFS是一種很好的存儲(chǔ)方式,它的存儲(chǔ)能力很強(qiáng),可以通過(guò)備份來(lái)保證數(shù)據(jù)的高可用性和系統(tǒng)的容錯(cuò)性。HDFS是 Hadoop生態(tài)系統(tǒng)的一個(gè)關(guān)鍵部件,它可以有效地對(duì) HDFS中存儲(chǔ)的數(shù)據(jù)進(jìn)行有效的讀取。由于云存儲(chǔ)中包含了多個(gè)商業(yè)系統(tǒng)的數(shù)據(jù),所以要按照存儲(chǔ)目錄來(lái)劃分不同的服務(wù)類別和信息維度,以保證數(shù)據(jù)的規(guī)范化。
該技術(shù)的合理運(yùn)用,將有助于實(shí)現(xiàn)校園網(wǎng)絡(luò)的內(nèi)部數(shù)據(jù)整合,并能針對(duì)不同的業(yè)務(wù)需要,選擇合適的抽取方式。從商業(yè)系統(tǒng)中提取出大數(shù)據(jù)平臺(tái)所需要的各種數(shù)據(jù),然后在中間層進(jìn)行清洗、轉(zhuǎn)化和集成。然后將這些信息匯總到目標(biāo)數(shù)據(jù)庫(kù)中,這個(gè)技術(shù)在收集數(shù)據(jù)的時(shí)候起到了至關(guān)重要的作用。
數(shù)據(jù)提取是建立智能圖書館大數(shù)據(jù)平臺(tái)數(shù)據(jù)采集的一個(gè)關(guān)鍵環(huán)節(jié),在此過(guò)程中,必須對(duì)數(shù)據(jù)類型、類型等進(jìn)行全面的調(diào)研和研究。因?yàn)樵诘谝淮尾杉瘯r(shí),會(huì)涉及到大量的業(yè)務(wù)數(shù)據(jù),因此,在進(jìn)行首次數(shù)據(jù)采集時(shí),就是全量抽取。在以后的數(shù)據(jù)收集過(guò)程中,必須以此為依據(jù)進(jìn)行增量提取。在工作中,要正確地選擇合適的提取頻率,但由于業(yè)務(wù)數(shù)據(jù)的特性各不相同,因此必須針對(duì)具體的情況設(shè)置適當(dāng)?shù)奶崛☆l率。
以大數(shù)據(jù)為核心的智能圖書館的建設(shè),以人為中心。信息資源的多樣性、復(fù)雜性是圖書館建設(shè)的核心問(wèn)題,利用大數(shù)據(jù)技術(shù)、通信技術(shù)、物聯(lián)網(wǎng)、云計(jì)算等先進(jìn)的數(shù)字化技術(shù),是實(shí)現(xiàn)圖書館服務(wù)范圍覆蓋廣、質(zhì)量高的必然模式,也是滿足人們?nèi)找嬖鲩L(zhǎng)的資源需求、人文關(guān)懷以及科研創(chuàng)新要求的重要方式。利用大數(shù)據(jù)智能圖書館的建設(shè),既能在技術(shù)上,又能在人文層面上達(dá)到“以人為本”的服務(wù)宗旨,充分體現(xiàn)出圖書館的社會(huì)價(jià)值。