李大信
[摘 要] 本文研究了云計算、大數(shù)據(jù)在圖書館的應用以及對圖書館發(fā)展模式的影響,提出云計算、大數(shù)據(jù)與圖書館最終結合的形態(tài),是云數(shù)據(jù)圖書館的模式。并從平臺、服務、內容、相互關系等方面論述了云數(shù)據(jù)圖書館的特征。
[關鍵詞] 云計算;大數(shù)據(jù);圖書館
[中圖分類號] G250.7 [文獻標識碼] A [文章編號] 1671-0037(2017)8-89-4
Research on Innovative Development Model of Library Based on Cloud Computing Big Data
Li Daxin
(Literature and Information center of Henan Academy of Social Sciences, Zhengzhou Henan 450000)
Abstract: This paper researches the application of cloud computing and big data in the library and its influence on the development model of the library, and proposes that the ultimate combination form of cloud computing, big data and library is cloud data library mode. The characteristics of cloud data library are discussed from the aspects of platform, service, content and relationship.
Keywords: cloud computing; big data; library
圖書館的發(fā)展,經歷了傳統(tǒng)圖書館模式,電子圖書館模式,網(wǎng)絡圖書館模式,數(shù)字圖書館模式等不同形態(tài)。在這些發(fā)展過程中,技術進步對圖書館發(fā)展模式的變化有著重大影響,主導了圖書館發(fā)展模式的變革。那么,云計算技術和大數(shù)據(jù)技術的出現(xiàn),將對圖書館的發(fā)展帶來那些影響?新的技術條件下,圖書館的發(fā)展,將會出現(xiàn)什么樣的模式呢?
1 云計算與圖書館的發(fā)展
1.1 云計算與圖書館
云計算是“以公開的標準和服務為基礎,以互聯(lián)網(wǎng)為中心,提供安全、快速、便捷的數(shù)據(jù)存儲和網(wǎng)絡計算服務,讓互聯(lián)網(wǎng)這片`云'成為每一個網(wǎng)民的數(shù)據(jù)中心和計算中心”[1]。
圖書館發(fā)展的最終目標,是對圖書館以及一切知識信息資源進行充分整合,利用先進的信息技術,構建共知、共建、共享的智能的知識信息存取中心,共同致力于在整個國家乃至全世界范圍內建立大文化集群。云計算為圖書館的目標提供了新的思路,它可以整合龐大的異構資源,形成云計算數(shù)字圖書館,并以云計算為服務平臺,為用戶提供全天候全地域的信息資源和服務,消除信息孤島,實現(xiàn)信息資源共享。2009年5月,R.Wallis和F.Haugen等人提出了“云計算圖書館”(Cloud Computing Libraries)的新概念[2]。
云計算環(huán)境下,硬件對一個圖書館的影響將被弱化,豐富而大規(guī)模的應用集成是云計算與圖書館深度融合的基礎。圖書館可以按照自身特色打造自己的服務平臺,同時借助云計算的無限擴展性進行跨平臺的數(shù)據(jù)收集、管理、提供,為用戶提供廣域的知識存取,實現(xiàn)信息自然交流。云計算對于資源的動態(tài)管理能力能夠很好滿足用戶信息服務需求的多元特征和變化特征。
1.2 云計算在圖書館的應用形式
1.2.1 軟件即服務(SaaS)。即運營商把軟件安裝在自己的服務器上,用戶購買軟件的使用權并通過網(wǎng)絡使用該軟件。大量屬于Web2.0的圖書館應用,基本都屬于這種類型。
1.2.2 計算機集成系統(tǒng)(ILS)。建立在云計算上的ILS,形式上也表現(xiàn)為軟件供應商通過網(wǎng)絡對用戶提供服務,但是,圖書館的ILS的運行,更加依賴于圖書館自身的書目數(shù)據(jù),一般情況下都是在本地服務器安裝系統(tǒng)、保存數(shù)據(jù),供應商掌握某些權限,通過計算機網(wǎng)絡進行系統(tǒng)維護。
1.2.3 云存貯。云計算應用于圖書館最早的功能是存貯,越來越龐大的信息資源對圖書館的硬件建設帶來了很大的壓力,信息存儲容量和安全的要求越來越高,因此,作為一種更加快捷廉價的解決方案,云計算的網(wǎng)絡存貯應用將給圖書館帶來巨大的影響。
1.2.4 平臺即服務。用來自于云計算的服務,完全替代本地的it硬件和人員,將圖書館的服務移植到云計算中,擺脫硬件困境,可以使圖書館的業(yè)務和人力資源更多的分配到核心業(yè)務上來。
1.3 云計算圖書館的體系結構
傳統(tǒng)的圖書館體系一般由硬件、系統(tǒng)、應用及服務等4個層次構成,而云計算的應用必將使圖書館發(fā)生巨大變化。在云計算上構建圖書館模型,必然將圖書館的資源包括軟硬件資源以及最重要的信息資源進行整合,并將其架構與統(tǒng)一的云服務平臺上,在更高的層次進行調度與分配。云計算環(huán)境下的圖書館體系結構將分為以下層次。
第一層,基礎設施層。硬件云是基于Iaas的基礎設施層,通過虛擬化技術連接處于不同空間的處理器、存儲設備,并用網(wǎng)絡將這些設施連接成相互聯(lián)系的資源池,然后再集合成一個整體即云計算,實現(xiàn)云內的透明使用和統(tǒng)一訪問。
第二層,管理層。主要通過云計算技術,管理基礎設施層的設備,將其劃分為相互關聯(lián)的資源池,并對其進行統(tǒng)一調度和管理,為用戶的應用或更高層次的平臺提供開發(fā)、運行和管控的環(huán)境。
第三層,應用服務層。該層是云計算圖書館架構核心層,是圖書館應用的集合,該層主要功能是為運行在云計算中的圖書館應用提供統(tǒng)一的接口,并通過網(wǎng)絡將交付給用戶使用。endprint
第四層:云客戶端。是指用戶獲得云計算圖書館服務的軟件工具,用戶可以通過接入網(wǎng)絡的各種設備來使用這種工具,訪問圖書館的資源。
與傳統(tǒng)的體系結構相比,云計算圖書館的體系結構有著以下特點:資源海量、虛擬化、協(xié)議化。
1.4 云計算給圖書館帶來了機遇和挑戰(zhàn)
云計算給圖書館帶來的最大便利,就是改變了圖書館現(xiàn)有的IT架構理念,使得很多圖書館得以擺脫硬件困境和技術困境,獲得更好的發(fā)展機會,也使得圖書館共享理念進一步成為可能,給圖書館的發(fā)展帶來了前所未有的機遇。但另一方面,云計算也給圖書館帶來了挑戰(zhàn),從云計算的基本理念及圖書館應用云計算的框架分析,云計算將帶來圖書館管理與服務相關的問題,圖書館界需要認真應對云計算帶來的挑戰(zhàn),深入、系統(tǒng)的研究應用云計算所帶來的相關問題。
2 大數(shù)據(jù)與圖書館的發(fā)展
2.1 大數(shù)據(jù)與圖書館
“大數(shù)據(jù)”是一個用來描述海量的結構化和非結構化數(shù)據(jù)的短語,特性用“4V+1C”[2]描述,即數(shù)量龐大(volume)、種類多樣(variety)、更新快速(velocity)、真實準確(veracity)和處理復雜(complexity)。大數(shù)據(jù)有著非常廣泛的分布,包括業(yè)務流程數(shù)據(jù)、企業(yè)大數(shù)據(jù)、社會大數(shù)據(jù)、個人大數(shù)據(jù)、科學大數(shù)據(jù)等[3]。
圖書館歷來是新信息技術的研究和應用“先鋒”之一,必將能夠抓住大數(shù)據(jù)時代來臨的良好契機,實現(xiàn)服務體系創(chuàng)新。具備大數(shù)據(jù)的處理能力的圖書館,可以創(chuàng)造更具挑戰(zhàn)性的服務,增加服務手段,提供更多服務方式,服務水平得到提升,服務領域將會得到擴展。圖書館可以依托大數(shù)據(jù),發(fā)展更加高級的數(shù)據(jù)處理與數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)分析、數(shù)據(jù)挖掘服務,為社會、為政府、企業(yè)提供大數(shù)據(jù)服務將成為圖書館的主要工作。
2.2 圖書館應用大數(shù)據(jù)的必要性
大數(shù)據(jù)的應用體現(xiàn)出越來越重要的戰(zhàn)略價值和經濟價值,國際數(shù)據(jù)環(huán)境發(fā)生了很大變化,聯(lián)合國在2010年7月就發(fā)布了《大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機遇》白皮書,指出了大數(shù)據(jù)存在的巨大價值,于是,各國政府紛紛將大數(shù)據(jù)上升為國家戰(zhàn)略。大數(shù)據(jù)同時也是一種信息獲取和處理的體系,為科研信息化(E-Science)提供了一種解決途徑,能夠為科學研究提供數(shù)據(jù)驅動的研究環(huán)境。大數(shù)據(jù)可以為圖書館用戶提供更大數(shù)量、更高質量的信息,滿足用戶社會搜尋的需求。
2.3 大數(shù)據(jù)在圖書館服務中的應用
大數(shù)據(jù)技術一個很重要的內容就是基于大數(shù)據(jù)的行為分析,引入大數(shù)據(jù)技術的圖書館系統(tǒng),可以對讀者的訪問行為進行挖掘分析,并在分析結果的基礎上向讀者進行有針對性的、個性化的服務推送,引導讀者使用圖書館的服務,提高讀者的時間效益。同樣,大數(shù)據(jù)還能夠預知讀者需求,為圖書館的資源采集、資源更新提供依據(jù),幫助圖書館確定資源建設的方向,提高圖書館的社會效益。
大數(shù)據(jù)本身也是一種信息資源,可以作為圖書館館藏的一部分,既可以提供公眾使用,也可以作為圖書館參考咨詢的平臺,館員可以在具備大數(shù)據(jù)特征的咨詢課題上引入大數(shù)據(jù)技術,跳出傳統(tǒng)的參考咨詢業(yè)務的限制,提供預測咨詢、變化趨勢咨詢、在大數(shù)據(jù)的基礎上,獲取更加準確的結果,使圖書館深度參考咨詢服務成為可能。
3 基于云計算大數(shù)據(jù)的圖書館發(fā)展模式構想
3.1 數(shù)據(jù)云圖書館——云計算大數(shù)據(jù)環(huán)境下圖書館發(fā)展模式
云計算和大數(shù)據(jù)是雖然都來自于計算機技術發(fā)展的概念,但兩者一個屬于系統(tǒng)管理的概念,一個屬于數(shù)據(jù)管理的概念,存在本質的區(qū)別,但在實際應用上又產生了密切聯(lián)系。云計算是跨越空間的計算機資源的聯(lián)合,是計算機硬件系統(tǒng)發(fā)展的主要方向;大數(shù)據(jù)相當于海量數(shù)據(jù)的“數(shù)據(jù)庫”,是未來數(shù)據(jù)環(huán)境的主要發(fā)展方向,既是數(shù)據(jù),又是數(shù)據(jù)管理系統(tǒng),既是信息資源,又是數(shù)據(jù)挖掘技術。二者具有相輔相成、密不可分的關系,云計算可以為大數(shù)據(jù)的存儲和處理提供按需擴展的計算和存儲資源,是實現(xiàn)大數(shù)據(jù)的最佳平臺。
云計算是大數(shù)據(jù)實現(xiàn)價值的軟硬件基礎,大數(shù)據(jù)是推動云計算變革的重要動力。云計算和大數(shù)據(jù)有機融合在一起,將會成為圖書館的重要基礎平臺,依托這個平臺,圖書館的設備、技術、資源從理論上可以無限擴展,從而使得圖書館更加接近理想:保存人類所有知識,并支持所有人隨時隨地取用。
云計算技術、大數(shù)據(jù)技術與圖書館結合,將會產生一種新的圖書館的發(fā)展模式,我們可以稱之為數(shù)據(jù)云圖書館,簡單說就是以數(shù)據(jù)化的信息為主要服務內容,運行于云計算之上的圖書館。
3.2 數(shù)據(jù)云圖書館產生的條件
3.2.1 對現(xiàn)有文獻信息的數(shù)據(jù)化加工達到一定的規(guī)模?,F(xiàn)有的文獻信息數(shù)字化的加工,使得數(shù)量龐大的紙質文獻變成計算機可利用的數(shù)字化信息,這些信息以名稱、主題、著者、關鍵詞、年代等為索引組成數(shù)據(jù)庫,是數(shù)字圖書館得以建立的基礎。如果再進一步,對數(shù)字化的文獻信息資源進行數(shù)據(jù)化的加工,使得其中每一個字詞都成為可以檢索、排序、組織的資源,那么這些更加龐大的數(shù)據(jù)就成為了一種大數(shù)據(jù),那么以這些數(shù)據(jù)為資源的圖書館即可跨入大數(shù)據(jù)時代。但是,圖書館大數(shù)據(jù)業(yè)務,無法單獨建立在對單獨圖書館自身所使用的文獻數(shù)據(jù)庫及自建數(shù)據(jù)庫的數(shù)字化加工上,即使是區(qū)域性甚至全國性的圖書館聯(lián)盟也沒有這個可能,因為這些期刊、圖書、報紙等數(shù)據(jù)庫的所有權是版權所有者,而且數(shù)據(jù)化的加工,必須達到一定的規(guī)模,才能稱為大數(shù)據(jù)。
3.2.2 云計算的商業(yè)化應用普及一定規(guī)模,其價格可以為日常應用所接受。
目前云計算技術已經進入實用領域,但是,圖書館界對如何使用云還有一些分歧,有人呼吁利用云計算技術,把一部分圖書館的軟硬件統(tǒng)合起來,建立圖書館的專門云,也有人希望利用成熟的商業(yè)云來建設圖書館的云。從云計算技術的理念本身來說,這種狹義上的專門的圖書館的云是與云計算的理念背道而馳的;價格適中、運行穩(wěn)定、安全有保障且面向公眾開放的計算機的云,才符合圖書館對于云計算的需求。endprint
3.2.3 社會對大數(shù)據(jù)的需求達到一定水平。數(shù)據(jù)云圖書館的建立,需要建立在用戶對大數(shù)據(jù)一定需求的基礎上,用戶的數(shù)據(jù)素養(yǎng)達到一定程度,有需要且能夠利用大數(shù)據(jù)資源。這就需要大數(shù)據(jù)應用越來越廣泛,從商業(yè)應用逐步拓展到政府、企業(yè)、社會團體的決策,甚至于個人也可以利用大數(shù)據(jù)來進行分析預測。
3.3 數(shù)據(jù)云圖書館的特點
數(shù)據(jù)云圖書館,將是一種全新的圖書館發(fā)展模式,它應該具備以下特點。
3.3.1 依托云計算平臺而存在,以數(shù)據(jù)化的信息為主要服務內容。數(shù)據(jù)云圖書館的基礎設施都是由云計算平臺租賃而來,所有的資源也都存儲在云上,依托網(wǎng)絡平臺向用戶提供服務,支持用戶在任意環(huán)境下獲取所需的數(shù)據(jù)或服務。數(shù)據(jù)云圖書館以大數(shù)據(jù)為主要的資源的性質,使得它所擁有的資源必將有更高的存儲、傳輸、處理及安全的需求,只有依靠云計算平臺的巨大資源,才能滿足數(shù)據(jù)云圖書館的IT需求。
3.3.2 數(shù)據(jù)云圖書館以大數(shù)據(jù)為主要的服務內容,其自身又是應用大數(shù)據(jù)技術的平臺。隨著大數(shù)據(jù)技術的逐漸普及,大數(shù)據(jù)本身的數(shù)量將會出現(xiàn)巨大的增長,而各種有針對性搜集整理的專門性大數(shù)據(jù)也將會隨之出現(xiàn),這些大數(shù)據(jù)在使用之后就會失去專門應用價值和保存價值,但這些大數(shù)據(jù)在其他方面仍然存在研究價值。另外,社會公共機構搜集的可以面向公眾開放的大數(shù)據(jù)也將進入人們的視野。所有這些大數(shù)據(jù),數(shù)據(jù)云圖書館都可以進行搜集、管理、提供公眾使用。數(shù)據(jù)云圖書館系統(tǒng)自身,也將會使用大數(shù)據(jù)技術,對訪問者的信息進行處理,當這些數(shù)據(jù)達到一定數(shù)量的時候,就成為新產生的大數(shù)據(jù),變成數(shù)據(jù)云圖書館提供信息的一部分。
3.3.3 大數(shù)據(jù)分析師將是數(shù)據(jù)云圖書館的重要組成部分,而分析預測和參考咨詢將是它的重要服務方式。傳統(tǒng)圖書館向服務對象提供的都是可讀的文本信息,而數(shù)據(jù)云圖書館提供的則是大數(shù)據(jù)信息,數(shù)量龐大、內容繁雜,需要根據(jù)服務對象的需求進行專門的處理,提供各項分析,幫助服務對象解讀每一項數(shù)據(jù)背后的真正含義,滿足服務對象的需要。所以,大數(shù)據(jù)分析師將是數(shù)據(jù)云圖書館不可或缺的重要崗位。
數(shù)據(jù)云圖書館的大數(shù)據(jù)信息不同于傳統(tǒng)圖書館的文本信息,提供已有的知識或信息供服務對象使用。借閱和閱覽將不是它的主要業(yè)務,以大數(shù)據(jù)為依托,根據(jù)服務對象的需求,進行分析預測參考咨詢或者知識的創(chuàng)造,將會是數(shù)據(jù)云圖書館的主要服務形式。大數(shù)據(jù)分析師已經不是傳統(tǒng)意義上的圖書館工作人員,而是可以參與服務對象決策的核心人物。
3.3.4 數(shù)據(jù)云圖書館具備自我增長、自我適應的特性。從概念上來看,大數(shù)據(jù)本身就是不斷增長變化的,數(shù)據(jù)云圖書館的大數(shù)據(jù)系統(tǒng),時刻處于自動搜集數(shù)據(jù)信息、加工數(shù)據(jù)信息、存儲數(shù)據(jù)信息的工作中,數(shù)據(jù)云圖書館這樣就實現(xiàn)了自我增長。數(shù)據(jù)云圖書館可以借助大數(shù)據(jù)技術來了解訪問者類型與信息需求特征,預測讀者信息需求的變化,制定個性化信息服務策略,動態(tài)、交互地融入用戶信息查找、信息發(fā)現(xiàn)和信息獲取的全過程。因此,數(shù)據(jù)云圖書館可以依托云計算的資源分配能力,主動進行數(shù)據(jù)資源的建設,并根據(jù)訪問者的需求調配各種數(shù)據(jù)資源,構建一個自我增長、自動適應的新型服務體系。
3.3.5 數(shù)據(jù)云圖書館將是整個社會大數(shù)據(jù)的有機組成部分。數(shù)據(jù)云圖書館可以成為各種大數(shù)據(jù)的存儲系統(tǒng)。數(shù)據(jù)云圖書館作為公共的大數(shù)據(jù)平臺,可以為政府、社會團體等進行的大數(shù)據(jù)業(yè)務提供搜集和存儲的服務,進行公共大數(shù)據(jù)的搜集和保存的工作。很多大數(shù)據(jù),特別是商業(yè)類型的大數(shù)據(jù),是根據(jù)需求進行搜集處理的,在達到使用者的目的后,對使用者來說即變?yōu)闊o用的數(shù)據(jù)。數(shù)據(jù)云圖書館可以對這些非長期持續(xù)性大數(shù)據(jù)進行搜集、存儲,并向公眾開放,成為社會大數(shù)據(jù)的存儲器。作為一個提供社會服務的系統(tǒng),數(shù)據(jù)云圖書館本身也在產生大數(shù)據(jù),是大數(shù)據(jù)資源生產的源頭,這些數(shù)據(jù)同樣可以被獲取、分析,而分析的結果又變成數(shù)據(jù)云圖書館資源的一部分,實現(xiàn)數(shù)據(jù)資源的有序增長。
4 結語
數(shù)據(jù)云圖書館在形式上已經完全不同于傳統(tǒng)的圖書館,云計算中的不特定的計算資源池將替代傳統(tǒng)的圖書館建筑設備,大數(shù)據(jù)管理員、大數(shù)據(jù)分析師將代替?zhèn)鹘y(tǒng)的圖書館員,大數(shù)據(jù)將替代傳統(tǒng)館藏的文獻信息。但是,它依然具備了圖書館搜集信息、整理信息、提供信息的本質特征,萬變不離其宗,所以,我們稱其為數(shù)據(jù)云圖書館。
參考文獻:
[1] 李開復.云中漫步——迎接云計算時代的到來[EB/OL].http://www.googlechinablog.com/2008/05/blog-post_09.html,2010-10-23.
[2] 趙玉冬,李桂貞,謝明亮.云計算環(huán)境下數(shù)字圖書館的變革.[J]圖書館研究,2016(5):14-17.
[3] 陳傳夫,錢鷗,代鈺珠.大數(shù)據(jù)時代數(shù)字圖書館建設研究.[J]圖書館情報工作,2014(7):40-45.endprint