朱玉來
(沈陽(yáng)醫(yī)學(xué)院圖書館 遼寧 沈陽(yáng) 110000)
隨著信息技術(shù)快速發(fā)展和互聯(lián)網(wǎng)的普及,信息的數(shù)據(jù)量爆炸式增長(zhǎng),傳統(tǒng)的信息處理方法已經(jīng)無法滿足數(shù)據(jù)的處理和管理需求,“大數(shù)據(jù)”作為一個(gè)新興的概念,受到了廣泛關(guān)注和研究。在大數(shù)據(jù)時(shí)代,數(shù)字圖書館也遇到了更大的機(jī)遇和挑戰(zhàn)。數(shù)字圖書館不僅影響圖書館自身的發(fā)展與改革,還涉及資源共享、知識(shí)傳播、文化傳承等問題。如何利用大數(shù)據(jù),滿足用戶需求,提高數(shù)字資源的利用率和價(jià)值,是一個(gè)重要而有價(jià)值的研究課題。本文將探討數(shù)字圖書館在大數(shù)據(jù)時(shí)代的建設(shè)策略,以推動(dòng)數(shù)字圖書館建設(shè)的創(chuàng)新發(fā)展。
大數(shù)據(jù)(big data)是指規(guī)模巨大、類型繁多,難以用標(biāo)準(zhǔn)的數(shù)據(jù)處理應(yīng)用軟件處理的數(shù)據(jù)集。2001年,META集團(tuán)(現(xiàn)為Gartner)分析員Doug Laney用“3V”模型概括了數(shù)據(jù)增加帶來的挑戰(zhàn)和機(jī)遇,即uolume(數(shù)據(jù)大小)、uelocity(數(shù)據(jù)速度)和uariety(數(shù)據(jù)類型),這一描述被視為大數(shù)據(jù)的基本特征。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)規(guī)模達(dá)到百萬、億級(jí)別以上,數(shù)據(jù)的增長(zhǎng)和處理速度變得越來越快,數(shù)據(jù)的交換和傳播速度驚人,因此,一條數(shù)據(jù)采集、分析等工作必須快速、及時(shí)地進(jìn)行,才能最大限度地利用大數(shù)據(jù)的價(jià)值。同時(shí),數(shù)據(jù)類型顯得更加多樣化,既包括傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),也包括半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),如視音頻、網(wǎng)頁(yè)、圖片、文本等。此外,大數(shù)據(jù)還具有價(jià)值密度低的特征,即數(shù)據(jù)本身并不具備直接的商業(yè)價(jià)值,需要使用大數(shù)據(jù)技術(shù)和工具對(duì)數(shù)據(jù)進(jìn)行分析、處理和挖掘,提取有用的信息和知識(shí)??傊?大數(shù)據(jù)是一種重要的資源,它是數(shù)字化時(shí)代的產(chǎn)物,對(duì)經(jīng)濟(jì)、社會(huì)、文化和科學(xué)技術(shù)等領(lǐng)域都產(chǎn)生了深刻的影響[1]。
數(shù)字圖書館是基于互聯(lián)網(wǎng)而產(chǎn)生的一種分布式信息系統(tǒng),它將圖書館中不同的信息資源以編碼的形式進(jìn)行加工和存儲(chǔ),以方便用戶進(jìn)行檢索和利用[2]。具體來說就是采用計(jì)算機(jī)可識(shí)別的“0”“1”二進(jìn)制編碼技術(shù)對(duì)各種類型的文獻(xiàn)進(jìn)行數(shù)字化處理,將其轉(zhuǎn)化為數(shù)字形式的文獻(xiàn)資源,并通過計(jì)算機(jī)網(wǎng)絡(luò)、信息存儲(chǔ)等技術(shù)進(jìn)行管理和服務(wù),實(shí)現(xiàn)數(shù)字資源的在線共享、互動(dòng)、應(yīng)用和保護(hù)等功能,從而擴(kuò)展了傳統(tǒng)圖書館的服務(wù)領(lǐng)域。數(shù)字圖書館具有數(shù)字化信息、網(wǎng)絡(luò)化存儲(chǔ)、虛擬化空間、多樣化服務(wù)等特征[3]。并以豐富的資源為核心,以信息技術(shù)為支撐,采用網(wǎng)絡(luò)化服務(wù)方式,為用戶提供便捷、高效、個(gè)性化的數(shù)字化信息資源服務(wù)。
大數(shù)據(jù)時(shí)代的到來,對(duì)數(shù)字圖書館的發(fā)展帶來了前所未有的影響。
一方面,大數(shù)據(jù)為數(shù)字圖書館帶來了新的機(jī)遇。大數(shù)據(jù)拓寬了數(shù)字圖書館的資源范疇,增加了資源整合的廣度。它不僅是將文獻(xiàn)型資源數(shù)字化,還增加了對(duì)再生資源的生產(chǎn)、匯集和存儲(chǔ),以及經(jīng)過關(guān)聯(lián)、挖掘分析后形成的各類綜合數(shù)據(jù)的收集。同時(shí),大數(shù)據(jù)使數(shù)字圖書館的服務(wù)更加個(gè)性化和精準(zhǔn)。通過分析用戶數(shù)據(jù)和行為數(shù)據(jù),可以根據(jù)用戶的興趣和偏好提供更加精準(zhǔn)的個(gè)性化服務(wù),提升服務(wù)質(zhì)量和用戶滿意度。此外,大數(shù)據(jù)技術(shù)也提高了數(shù)字圖書館資源組織加工深度。數(shù)字圖書館可以利用大數(shù)據(jù)技術(shù),對(duì)海量的文獻(xiàn)資源進(jìn)行自動(dòng)分類、索引和標(biāo)注,提高文獻(xiàn)資源的利用率和管理效率[4]。
另一方面,大數(shù)據(jù)也給數(shù)字圖書館帶來了極大的挑戰(zhàn)。隨著數(shù)字圖書館中數(shù)據(jù)量的增大,數(shù)據(jù)的管理和維護(hù)將變得越發(fā)困難,圖書館如何在大數(shù)據(jù)下更好地掌握信息、存儲(chǔ)數(shù)據(jù),面臨著巨大的挑戰(zhàn)。其次,在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館建設(shè)面對(duì)海量數(shù)據(jù)的選擇、數(shù)據(jù)的處理和分析,需要投入更多的人力、物力資源,承受巨大的資金壓力。此外,數(shù)字圖書館要利用大數(shù)據(jù)技術(shù)處理和分析大量的數(shù)據(jù),從中發(fā)掘出有價(jià)值的信息和知識(shí),如何利用大數(shù)據(jù)技術(shù)來對(duì)已有的數(shù)據(jù)進(jìn)行分析與處理,也必將成為大數(shù)據(jù)圖書館面臨的挑戰(zhàn)[5-6]。
在大數(shù)據(jù)時(shí)代,數(shù)字圖書館可以提供個(gè)性化服務(wù)。這種服務(wù)模式通過分析用戶需求和興趣,向用戶推薦與其相關(guān)的資源和信息,幫助用戶快速、精準(zhǔn)地獲取信息和資源。圖書館運(yùn)用大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘算法,分析用戶的基本屬性、行為數(shù)據(jù)和社交數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)化,建立用戶標(biāo)簽體系,繪制用戶關(guān)系圖譜,完成用戶畫像?;谟脩舢嬒?提供個(gè)性化檢索、精準(zhǔn)推薦、精準(zhǔn)宣傳、圖書館參考決策等服務(wù)[7]。
開放式服務(wù)模式是數(shù)字圖書館在大數(shù)據(jù)時(shí)代提供的一種服務(wù)模式。它通過開放數(shù)據(jù)、接口等方式,讓用戶參與數(shù)字圖書館的建設(shè)和發(fā)展,更好地滿足用戶的需求。圖書館通過組建聯(lián)盟、多主體參與等模式,建立互相開放的數(shù)據(jù)平臺(tái)和資源共享機(jī)制,實(shí)現(xiàn)資源共享和知識(shí)傳播,為用戶提供全面的服務(wù)。圖書館也可以通過應(yīng)用程序編程接口等方式將自身的服務(wù)和數(shù)據(jù)資源開放給其他系統(tǒng)或應(yīng)用,這樣既方便了用戶獲取資源和服務(wù),又吸引了更多開發(fā)者和用戶參與數(shù)字圖書館的建設(shè)和發(fā)展,提升了數(shù)字圖書館服務(wù)的質(zhì)量[8]。
數(shù)字圖書館的多元化服務(wù)模式是一種滿足用戶多種需求的服務(wù)方式。它通過整合資源和服務(wù),提供多樣化的服務(wù)內(nèi)容。在這種服務(wù)模式下,數(shù)字圖書館提供多類型和多學(xué)科領(lǐng)域的資源服務(wù),為用戶提供跨學(xué)科、全方位的資源獲取。同時(shí),數(shù)字圖書館也提供多樣化知識(shí)服務(wù),如參考咨詢、信息素養(yǎng)教育、科研支持、移動(dòng)知識(shí)服務(wù)、自動(dòng)化知識(shí)服務(wù)等。該服務(wù)模式給數(shù)字圖書館和用戶提供了廣闊的發(fā)展空間和良性互動(dòng),為用戶提供更全面、更綜合、更高效的服務(wù),實(shí)現(xiàn)了數(shù)字圖書館與用戶共同發(fā)展[9]。
近年來,數(shù)字圖書館建設(shè)取得了一定的成就,但總體來說數(shù)字圖書館仍然有很多不足,尤其是在大數(shù)據(jù)時(shí)代,數(shù)字圖書館建設(shè)遇到了更加嚴(yán)峻的問題與挑戰(zhàn)。
數(shù)字圖書館作為信息資源集成、管理、服務(wù)與利用平臺(tái),服務(wù)質(zhì)量的高低直接影響到數(shù)字圖書館的發(fā)展和用戶認(rèn)可度。由于數(shù)字圖書館涉及的領(lǐng)域較廣,資源種類繁多,資源來源不一,因此在資源的分類和標(biāo)注上,常有主題詞、標(biāo)引詞等不夠準(zhǔn)確、不夠細(xì)致的問題。導(dǎo)致用戶檢索到的資源結(jié)果不夠準(zhǔn)確,影響用戶的使用體驗(yàn)和服務(wù)深度。另外,數(shù)字圖書館的個(gè)性化服務(wù)能力還不夠強(qiáng)。許多數(shù)字圖書館并未建立完善的用戶畫像體系,未對(duì)用戶進(jìn)行深度挖掘,而是通過簡(jiǎn)單的借閱歷史、檢索歷史等基礎(chǔ)信息進(jìn)行分類。這使得不能充分了解用戶對(duì)信息資源的使用需求和偏好,無法提供更個(gè)性化的資源服務(wù)。
數(shù)字圖書館建設(shè)需要投入大量的資金和技術(shù)支持。數(shù)字圖書館要完成大量的數(shù)據(jù)處理與存儲(chǔ)工作,必須購(gòu)置大量的存儲(chǔ)設(shè)備,如服務(wù)器、存儲(chǔ)設(shè)備等。還要引進(jìn)、開發(fā)、維護(hù)一系列軟硬件設(shè)備,使其面臨著很大的資金壓力。另外,由于數(shù)字圖書館的使用量越來越大,對(duì)系統(tǒng)的性能要求也越來越高。因此,必須定期更新系統(tǒng),以確保其正常運(yùn)作,提升讀者的使用體驗(yàn),這也進(jìn)一步增加了運(yùn)作費(fèi)用。再者,大量的數(shù)字資源還涉及知識(shí)產(chǎn)權(quán)問題,而著作權(quán)法對(duì)數(shù)字圖書館建設(shè)有一定的限制,再加上圖書館建設(shè)的公益服務(wù)性,這些都增加了數(shù)字圖書館的資金負(fù)擔(dān)。
數(shù)字圖書館建設(shè)存在數(shù)據(jù)泄露和盜用的風(fēng)險(xiǎn)。數(shù)字圖書館中的信息資源極為豐富,包含大量用戶個(gè)人身份信息、借閱信息、學(xué)術(shù)研究成果等。隨著數(shù)字圖書館所承載的數(shù)據(jù)量逐年增加,數(shù)據(jù)泄露和盜用風(fēng)險(xiǎn)也越來越大。黑客攻擊、工作人員操作失誤、惡意軟件挾持等均能導(dǎo)致數(shù)據(jù)泄露或盜用,這些信息一旦泄露或盜用,不僅會(huì)對(duì)用戶個(gè)人造成不良影響,還可能對(duì)數(shù)字圖書館的聲譽(yù)和信譽(yù)造成重大損失,甚至引起法律訴訟和賠償。另外,數(shù)字圖書館建設(shè)中還存在數(shù)據(jù)丟失風(fēng)險(xiǎn)。由于數(shù)字圖書館中存儲(chǔ)的信息量巨大,數(shù)據(jù)備份和恢復(fù)工作需要花費(fèi)大量的時(shí)間和精力,如果數(shù)字圖書館在備份和恢復(fù)工作中出現(xiàn)問題,就可能導(dǎo)致部分或全部信息丟失,從而影響用戶使用體驗(yàn)和知識(shí)獲取。
在大數(shù)據(jù)時(shí)代,數(shù)字圖書館要不斷創(chuàng)新服務(wù)模式,滿足用戶需求,提升服務(wù)水平。數(shù)字圖書館應(yīng)該加強(qiáng)用戶畫像建設(shè),利用人工智能技術(shù)對(duì)用戶的借閱歷史、檢索歷史等數(shù)據(jù)進(jìn)行分析和挖掘,根據(jù)用戶的搜索歷史和興趣點(diǎn)為其推薦相關(guān)的資源。同時(shí),需要加強(qiáng)數(shù)字資源的分類與標(biāo)注工作,利用自然語言處理(natural language processing,NLP)技術(shù)對(duì)文本資源進(jìn)行語義分析,確保數(shù)字資源的內(nèi)容、格式、類型等信息得到清晰準(zhǔn)確的標(biāo)注,從而為用戶提供更精準(zhǔn)的檢索服務(wù),提高資源的檢索效率和準(zhǔn)確性[10]。此外,還可以加強(qiáng)與用戶的互動(dòng)和交流,建立數(shù)字圖書館與用戶的互動(dòng)平臺(tái)。通過與用戶的互動(dòng)和交流,可以更好地了解用戶需求和反饋,進(jìn)一步提升服務(wù)質(zhì)量。
數(shù)字圖書館需要完善資源建設(shè)以適應(yīng)用戶對(duì)數(shù)據(jù)和信息的需求。在數(shù)字化資源建設(shè)中,數(shù)字圖書館應(yīng)該通過多種方式,如數(shù)字掃描、光學(xué)字符識(shí)別技術(shù)、NLP技術(shù)等手段,將圖書、期刊、報(bào)紙等各種文獻(xiàn)資料數(shù)字化,并建立完善的數(shù)字化資源庫(kù)。還要加強(qiáng)數(shù)據(jù)存儲(chǔ)和管理,采用云計(jì)算和分布式存儲(chǔ)技術(shù),實(shí)現(xiàn)數(shù)據(jù)的備份和容災(zāi),確保數(shù)據(jù)的安全性和可靠性。采用標(biāo)準(zhǔn)化的元數(shù)據(jù)和分類標(biāo)準(zhǔn),建立完善的數(shù)據(jù)管理體系,以便用戶可以快速準(zhǔn)確地找到所需的信息。在完善數(shù)字資源的數(shù)量和質(zhì)量的同時(shí)為避免資源浪費(fèi)和重復(fù)建設(shè),還需加強(qiáng)數(shù)字資源的共享和互聯(lián)。通過建立符合國(guó)際標(biāo)準(zhǔn)和規(guī)范的數(shù)字資源共享平臺(tái),對(duì)數(shù)字資源進(jìn)行標(biāo)準(zhǔn)化處理,并與相關(guān)機(jī)構(gòu)合作,共建共享數(shù)字資源,提高數(shù)字資源利用率和共享效益[11]。
隨著數(shù)據(jù)量的不斷增加和技術(shù)手段的不斷進(jìn)步,數(shù)字圖書館的數(shù)據(jù)安全遇到越來越多的挑戰(zhàn)。在大數(shù)據(jù)時(shí)代,數(shù)字圖書館必須建立完善的數(shù)據(jù)安全管理制度。這包括制定數(shù)據(jù)安全策略、完善數(shù)據(jù)備份與恢復(fù)機(jī)制、建立數(shù)據(jù)訪問控制和審計(jì)機(jī)制等。采用加密技術(shù)、安全認(rèn)證技術(shù)、網(wǎng)絡(luò)防護(hù)技術(shù)等,確保數(shù)據(jù)在傳輸和存儲(chǔ)中的安全性。需要加強(qiáng)對(duì)用戶數(shù)據(jù)的保護(hù),包括用戶隱私信息和個(gè)人數(shù)據(jù)的保護(hù)。需要加強(qiáng)數(shù)據(jù)安全意識(shí)教育,數(shù)據(jù)安全是一個(gè)持續(xù)不斷的過程,相關(guān)的工作人員應(yīng)該不斷提高數(shù)據(jù)安全意識(shí),加強(qiáng)安全意識(shí)教育,避免因?yàn)槭韬鰧?dǎo)致數(shù)據(jù)泄露和其他安全問題的發(fā)生[12]。
數(shù)字圖書館的建設(shè)需要投入大量的人力、物力、財(cái)力,給數(shù)字圖書館的發(fā)展帶來了極大的經(jīng)濟(jì)負(fù)擔(dān)。因此,在建設(shè)數(shù)字圖書館過程中,要注重降低運(yùn)營(yíng)成本,完善資金投入機(jī)制。對(duì)于降低運(yùn)營(yíng)成本,在建設(shè)數(shù)字圖書館之前,需要進(jìn)行詳細(xì)的規(guī)劃和分析,通過合理的規(guī)劃,減少冗余建設(shè)和不必要的開銷。在選擇數(shù)字資源時(shí),需要合理評(píng)估和把握多種形式資源的重要性和使用價(jià)值,避免浪費(fèi)和多余的開銷。政府應(yīng)加大對(duì)數(shù)字圖書館建設(shè)的政策支持力度,制定相關(guān)政策法規(guī),設(shè)立專門的數(shù)字圖書館建設(shè)基金并撥款補(bǔ)助數(shù)字圖書館,確保數(shù)字圖書館有穩(wěn)定的資金來源。同時(shí),還可以探索多元化的融資途徑,與企業(yè)、社會(huì)組織、文化機(jī)構(gòu)及個(gè)人等合作伙伴關(guān)系,共同完成數(shù)字圖書館建設(shè)。通過合作,引入社會(huì)資源,包括資金、技術(shù)、人力等,降低財(cái)務(wù)壓力,拓寬收入來源[13]。另外,數(shù)字圖書館在無償服務(wù)為主的前提下適當(dāng)提供一些知識(shí)付費(fèi)服務(wù),為用戶提供更加深入系統(tǒng)的知識(shí)服務(wù)。
綜上所述,本文針對(duì)大數(shù)據(jù)時(shí)代數(shù)字圖書館建設(shè)的策略進(jìn)行了分析,重點(diǎn)探討了大數(shù)據(jù)對(duì)數(shù)字圖書館的影響、面臨的問題及建設(shè)策略。隨著信息技術(shù)的不斷發(fā)展,數(shù)字圖書館已經(jīng)成為社會(huì)各界關(guān)注的焦點(diǎn)。大數(shù)據(jù)技術(shù)為數(shù)字圖書館提供了更廣闊的發(fā)展空間和更深層次的服務(wù)模式,但同時(shí)也帶來了數(shù)據(jù)安全和管理方面的問題。為了適應(yīng)大數(shù)據(jù)時(shí)代的需求,數(shù)字圖書館需要建設(shè)完善的資源體系和服務(wù)模式,實(shí)現(xiàn)數(shù)據(jù)的可視化、分析和挖掘,提供個(gè)性化的服務(wù)和智能化的推薦。同時(shí),數(shù)字圖書館也需要加強(qiáng)數(shù)據(jù)的安全保護(hù),建立健全的數(shù)據(jù)管理制度和技術(shù)支持體系。未來數(shù)字圖書館的發(fā)展趨勢(shì)將更加智能化、個(gè)性化和多元化,數(shù)字圖書館將不斷深入到各個(gè)領(lǐng)域,與社會(huì)各界進(jìn)行更廣泛的合作,實(shí)現(xiàn)數(shù)字資源共享和互聯(lián)互通。數(shù)字圖書館將成為知識(shí)傳播和智慧創(chuàng)新的重要載體,為學(xué)術(shù)研究、科學(xué)發(fā)展和社會(huì)進(jìn)步提供重要支撐。