劉春金
〔摘 要〕分析高校圖書館各類數(shù)字資源建設現(xiàn)狀,并對數(shù)字資源在其信息生命周期如何降低管理成本獲得最大信息價值進行探討。
〔關鍵詞〕數(shù)字資源;信息生命周期管理;分級存儲;數(shù)據(jù)遷移
〔中圖分類號〕G201 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)07-0067-03
Research on University Library Digital Resource
Based on Information Lifecycle ManagementLiu Chunjin
(Library,Zhejiang Chinese Medical University,Hangzhou 310053,China)
〔Abstract〕In this paper,the different types of digital resources in university library and how to get the maximum benefit with the minimum costs from digital resources by applying the information lifecycle was discussed.
〔Key words〕digital resource;information life cycle management;hierarchical storage;data migration
人類社會進入21世紀以來,信息、物質和能源構成了現(xiàn)代人類生存和社會發(fā)展的三大基本資源。信息社會中,信息的積累呈幾何級數(shù)增長,各數(shù)據(jù)中心的信息存儲量幾乎每18~24個月就會翻番。在信息爆炸的時代,信息過量幾乎成為人人都需要面對的問題。如何管理海量信息,使之發(fā)揮最大價值,已經(jīng)成為大多數(shù)高校圖書館亟待解決的問題。
1 信息生命周期管理的提出
美國著名信息資源管理專家霍頓曾提出,信息是有生命的,信息資源是一種具有生命周期的資源。他認為,信息生命周期(Information Lifecycle)是指信息運動的自然規(guī)律,一般由信息需求的確定以及信息資源的生產(chǎn)、采集、傳播、處理、存儲和利用等階段所組成。信息就如同人類以及其他生物一樣,是具有生命特征的,會隨著生命周期的不同階段而起落。
為了讓信息更好地在其生命周期中有序地流動,并在流動過程中實現(xiàn)其最大價值,就要對信息進行必要的管理,于是產(chǎn)生了信息生命周期管理(Information Lifecycle Management,ILM)這一概念。信息生命周期管理不是一個新的存儲解決方案,也不是某個硬件或軟件產(chǎn)品,而是評估和管理信息的存儲方式,是一種信息管理模型,貫穿信息整個生命過程并對其進行管理,從創(chuàng)建、使用到歸檔和處理[1]。信息生命周期管理就是要在信息生命周期的不同階段,根據(jù)信息價值的不同而采取不同程度的管理,達到以最低的成本在信息生命周期的每一個階段都能獲得信息最大效益的目的。
ILM是一種針對信息主動管理的策略,通過實施真正意義上的ILM,可讓信息在正確的時間處于正確的位置,從而幫助客戶在信息生命的各個階段以最低的整體擁有成本獲得最大的價值。ILM作為新興的信息管理策略,其最早并不是用于圖書館領域,而是用于金融、通信和醫(yī)院等行業(yè)中。近年來,作為社會知識、信息、文化的記憶裝置和擴散裝置的高校圖書館,各類資源特別是數(shù)字館藏資源增長非常迅猛,大部分高校圖書館面臨將內部龐大信息的利用價值充分發(fā)揮的難題。本文試圖將ILM策略引入高校圖書館數(shù)字資源建設中,希望借此降低數(shù)字資源管理成本,提高數(shù)字資源利用率,并對此進行一定探討。
2 高校圖書館數(shù)字資源建設現(xiàn)狀
現(xiàn)代高校圖書館數(shù)字資源不僅包含本館擁有物理實體的數(shù)字資源,還包括可通過互聯(lián)網(wǎng)獲取利用的館外信息資源所構成的虛擬數(shù)字資源[2]。實體數(shù)字資源主要由保存在本地服務器或單機上的數(shù)字資源組成。虛擬數(shù)字資源則主要由提供異地存取服務的網(wǎng)絡數(shù)據(jù)庫和網(wǎng)絡資源導航系統(tǒng)組成。虛擬數(shù)字資源極大地延伸了數(shù)字資源的范圍,成為高校圖書館資源中重要的組成部分。
紙質文獻載體形式單一,分類方式較簡單。而數(shù)字資源特別是高校圖書館數(shù)字資源,無論是構成方式還是表現(xiàn)形式,都比較復雜,因此對數(shù)字資源進行分類是一個相當棘手的問題。為了簡化研究,筆者暫且將高校圖書館數(shù)字資源,按照資源來源不同,劃分為6種類型:圖書館管理系統(tǒng)數(shù)據(jù)庫、特色數(shù)據(jù)庫、自建學位論文數(shù)據(jù)庫、學術型網(wǎng)絡數(shù)據(jù)庫、光盤數(shù)據(jù)庫、試用數(shù)據(jù)庫。
2.1 圖書館管理系統(tǒng)數(shù)據(jù)庫不可或缺
除了上述的數(shù)字資源之外,高校圖書館普遍采用各種圖書館管理系統(tǒng),如金盤、ILASⅡ與Interlib圖書館管理系統(tǒng)等對人員、讀者以及傳統(tǒng)館藏資源等進行管理。這些管理系統(tǒng)經(jīng)過多年運行積累起來的大量珍貴數(shù)據(jù)資源,在確保圖書館正常運轉中發(fā)揮舉足輕重的作用。這些數(shù)字資源如果丟失的話,圖書館無疑將迎來一場可怕的災難。另外,由于計算機技術的迅猛發(fā)展,圖書館管理系統(tǒng)升級更新很快,淘汰后的老版本圖書館管理系統(tǒng)數(shù)據(jù)庫因為保存了圖書館重要的歷史信息,其存儲也應納入數(shù)字資源的管理范疇,以應不時之需。
2.2 特色數(shù)據(jù)庫發(fā)展迅速
在高校圖書館中的數(shù)字資源中,特色數(shù)據(jù)庫的建設是高校圖書館數(shù)字資源建設的重中之重。隨著信息技術的發(fā)展,高校圖書館特色數(shù)據(jù)庫的建設,實現(xiàn)了從書目數(shù)據(jù)庫向內容數(shù)據(jù)庫、從館藏文獻資源向網(wǎng)絡資源鏈接、從各館孤立建設轉向多館共享建設、從自給自足的資源服務方式拓展到網(wǎng)上專題資源共享服務的轉變[3]。目前,國內比較典型的特色數(shù)據(jù)庫有浙江中醫(yī)藥大學圖書館的浙江中醫(yī)藥古籍數(shù)據(jù)庫、蘭州大學圖書館的敦煌學數(shù)據(jù)庫、廈門大學圖書館的東南亞研究與華僑華人研究題錄數(shù)據(jù)庫等。國內眾多高校圖書館都意識到要提高圖書館的服務水平,必須建立具有本館館藏特色、本校學科特色和本地區(qū)特色相結合的數(shù)據(jù)庫,目前這些特色數(shù)據(jù)庫正在蓬勃發(fā)展中。
2.3 自建學位論文數(shù)據(jù)庫建設踴躍
除了特色數(shù)據(jù)庫外,國內高校圖書館還對本校資源進行整理挖掘,如高校中的碩博士學位論文因為探討的問題專深,學術價值高,引起高校圖書館的高度重視,不少圖書館將本校的碩博士學位論文進行統(tǒng)一管理,建立高校學位論文數(shù)據(jù)庫并加以利用,如北京大學、復旦大學、上海交通大學等都建立了各自的學位論文數(shù)據(jù)庫。
2.4 學術型網(wǎng)絡數(shù)據(jù)庫比重大
科研工作作為高校的重要組成部分,各種類型的學術型網(wǎng)絡數(shù)據(jù)庫在高校圖書館中占有很大比重。如外文方面,部分高校購置了EBSCO、Springer、Elsevier等網(wǎng)絡數(shù)據(jù)庫;中文方面,大部分高校圖書館相繼購置了中國學術期刊全文數(shù)據(jù)庫、維普資訊數(shù)據(jù)庫及萬方數(shù)據(jù)資源系統(tǒng)等。這些學術型網(wǎng)絡數(shù)據(jù)庫在高校的教學和科研工作中受到廣大師生的歡迎,得到較廣泛的利用。
2.5 光盤數(shù)據(jù)庫建設日益重視
隨著光盤數(shù)據(jù)量的激增,傳統(tǒng)的單光盤的檢索方式已經(jīng)不能適應人們對光盤數(shù)據(jù)庫的使用需求。光盤庫、磁盤陣列、光盤鏡像硬盤塔和硬盤組合技術的出現(xiàn)基本上解決了這個難題。一些高校圖書館對這部分資源越來越重視,購買或自建了多種光盤數(shù)據(jù)庫系統(tǒng),如Medline光盤數(shù)據(jù)庫、中國生物醫(yī)學文獻光盤數(shù)據(jù)庫(CBMDisc)以及將一些隨書光盤通過技術手段建立起來的隨書光盤系統(tǒng)。
2.6 試用數(shù)據(jù)庫種類多
知識經(jīng)濟社會中,各大小知識產(chǎn)品供應商都積極開發(fā)了不同類型、不同層次、不同面向對象的數(shù)據(jù)庫產(chǎn)品。由于市場競爭激烈,這些數(shù)據(jù)庫中正式列入高校圖書館的采購計劃前,往往會為高校用戶提供數(shù)據(jù)庫產(chǎn)品的試用,試用周期長短不一。試用結束后提供使用統(tǒng)計報告,使資源的最終使用者能真正參與資源的評估和建設環(huán)節(jié)。這些數(shù)據(jù)庫產(chǎn)品的試用在增加了高校圖書館的選擇空間時,無疑也增加了數(shù)字資源管理的難度。
3 高校圖書館數(shù)字資源ILM策略實施
研究發(fā)現(xiàn),各類傳統(tǒng)文獻都具有一定的使用壽命,如圖書一般在10~20年,期刊3~5年,科技報告10年左右,產(chǎn)品樣本3~5年,文獻使用壽命一定程度上反映了信息生命周期規(guī)律。
數(shù)字資源和傳統(tǒng)文獻相比,盡管信息的載體發(fā)生了變化,但兩者的生命周期整體大致相當。數(shù)字資源依靠先進的信息技術,信息更新的周期短,不受時間、地點限制,傳遞速度快,具有高度共享性。為便于對信息生命周期進行研究,不同專家和學者采用不同的標準如信息價值標準、信息作用標準,并且從多個角度如信息利用次數(shù)、使用頻率等對信息生命周期的階段進行了劃分。全球知名的數(shù)據(jù)存儲商EMC公司將數(shù)字資源的信息生命周期,分為創(chuàng)建、保護、訪問、遷移、歸檔和銷毀6個階段[4]。
3.1 數(shù)字資源創(chuàng)建階段
信息技術的飛速發(fā)展,使得作為高校教學科研信息資源主要提供者的高校圖書館的服務突破了時間和空間的限制,服務內容多樣化,服務手段先進化,服務項目個性化。高校圖書館在保持傳統(tǒng)服務的同時,更要實現(xiàn)由傳統(tǒng)服務向網(wǎng)絡服務的轉變,不僅要積極地把館藏傳統(tǒng)資源轉化為網(wǎng)絡數(shù)字資源,在網(wǎng)上拓展圖書館的信息服務項目,而且要把網(wǎng)絡中豐富的信息資源轉化為圖書館信息資源的一部分,提供給廣大讀者,從而提高文獻信息的生命周期。
3.2 數(shù)字資源保護階段
高校圖書館集中了各種特色資源和豐富的學術資源,這些資源對高校教學科研工作非常重要。因此,高校圖書館應該不僅要重視數(shù)字資源的建設,更要重視資源的硬件基礎建設,加強對數(shù)字資源的保護。不過,國內大部分高校圖書館存在經(jīng)費短缺的問題,根據(jù)信息生命周期相關理論,我們可以根據(jù)數(shù)字資源的不同價值,對數(shù)字資源采取不同的措施和技術來進行保護,從而降低管理成本。
3.3 數(shù)字資源訪問階段
針對傳統(tǒng)文獻進行管理時,為了降低文獻保存成本,解決圖書館空間與文獻數(shù)量劇增矛盾,一些專家提出了一系列解決方案,比較著名的方案是“三線典藏制”,該方案是以美國圖書館專家R?W?Truesovel提出的“二八率”(2/8 rule)為理論依據(jù)制定的,即將傳統(tǒng)文獻按照利用率的高、中、低,分別將傳統(tǒng)文獻分配到一線館藏區(qū)、二線館藏區(qū)和三線館藏區(qū),從而方便讀者找到利用率較高的文獻,降低保存成本。這個方案和ILM的思想基本類似。
將ILM策略應用到高校圖書館數(shù)字資源管理中,就要依據(jù)數(shù)字資源在其信息生命周期中價值的變化規(guī)律,對不同類型的數(shù)字資源,在不同的時間、不同的階段,進行分級存儲、保護和服務,達到以最低的管理成本實現(xiàn)信息價值的最大化。和傳統(tǒng)文獻的“三線典藏制”類似,高校圖書館的數(shù)字資源按訪問頻率可分為在線數(shù)據(jù)、近線數(shù)據(jù)和離線數(shù)據(jù)三類(見表1)。
在線數(shù)據(jù)是高校圖書館數(shù)據(jù)庫中最為活躍的部分,提供日常業(yè)務處理所需的數(shù)據(jù)和信息,如圖書館管理系統(tǒng)數(shù)據(jù)庫,另外特色數(shù)據(jù)庫和學位論文數(shù)據(jù)庫專有性強,訪問頻率高,因此也列入在線數(shù)據(jù)范疇。在線數(shù)據(jù)存儲時應達到高性能、大容量要求,保證系統(tǒng)的正常運轉。
近線數(shù)據(jù)指訪問頻率一般的數(shù)字資源,這類數(shù)字資源可以保存在本地或網(wǎng)絡服務器上,如學術型網(wǎng)絡數(shù)據(jù)庫、光盤數(shù)據(jù)庫等。如果用戶對某些數(shù)字資源訪問量特別大,最好是將其保存在本地服務器上,加快訪問速度。
離線數(shù)據(jù)指平時訪問率非常低的數(shù)據(jù),如過期數(shù)據(jù)庫、老版本圖書館管理系統(tǒng)數(shù)據(jù)庫等。對于這些數(shù)據(jù),我們應將其存放在價格更低的存儲介質或單機上,供單機查詢。
3.4 數(shù)字資源遷移階段
數(shù)字資源具有一定的生命周期,經(jīng)過其利用高峰后,我們應將訪問率降低的數(shù)字資源由主存儲設備遷移到次級存儲設備,遷移操作可以為訪問頻率高的數(shù)字資源騰出寶貴的主存儲空間,提高資源訪問和備份的速度[5]。目前,一些數(shù)據(jù)庫系統(tǒng)公司開發(fā)出相應軟件,可以方便地進行數(shù)據(jù)遷移操作,如CommVault系統(tǒng)公司開發(fā)的Simpana軟件可以采用自動的、基于策略的方法,快捷高效地遷移數(shù)據(jù),而且遷移過程對于最終用戶而言是隱匿的,即可以在不影響系統(tǒng)正常運行情況下將數(shù)據(jù)從一個存儲設備轉移到另一個存儲設備。
3.5 數(shù)字資源歸檔階段
高校圖書館對一些非常重要的數(shù)字資源,應及時進行歸檔處理,萬一在進行誤操作的情況下,可以使原始數(shù)字資源完整恢復過來而不至于影響圖書館的正常運作。
3.6 數(shù)字資源銷毀階段
數(shù)字資源在經(jīng)歷創(chuàng)建、保護、訪問、遷移、歸檔階段后,資源被訪問的頻率逐漸降低,甚至喪失了保存的價值。這時,我們可以考慮將其進行銷毀處理。在銷毀前,可以根據(jù)高校圖書館的目標和數(shù)字資源的特點,構建一個合理的評價指標體系,依據(jù)一定方法對數(shù)字資源的價值進行評價[6]。由于數(shù)字資源一旦被銷毀,恢復的難度很大,筆者認為這對數(shù)字資源進行銷毀時要慎而又慎,以免造成難以預測的災難性后果。
4 結 語
數(shù)字資源的信息生命周期管理是一個復雜的系統(tǒng)工程,其核心是針對不同數(shù)據(jù)的不同生命階段,采取不同的存儲策略和存儲介質。高校圖書館采用ILM策略管理數(shù)字資源,可以從新的角度深入了解信息,以最低成本實現(xiàn)信息價值最大化,提高圖書館的管理和服務水平。在實施ILM策略過程中,還存在相當多需要研究的問題,期待更多專家對數(shù)字資源的信息生命周期管理這一課題進行關注和探討。
參考文獻
[1]翁佳.信息生命周期管理[J].情報科學,2005,23(6):880-884.
[2]馬越.普通高校圖書館的數(shù)字館藏建設[J].河南圖書館學刊,2002,22(3):47-50.
[3]魏靜,宋秋水.中國高校圖書館特色數(shù)據(jù)庫的發(fā)展[J].河南職工醫(yī)學院學報,2007,19(5):510-512.
[4]吳錫剛,趙莉娜.圖書館數(shù)字信息生命周期管理[J].圖書館學研究,2005,(12):59-61.
[5]周杭霞,鐘梅,劉硯秋.運用信息生命周期管理思想建設存儲系統(tǒng)[J].計算機時代,2006,(4):40-41.
[6]索傳軍.基于信息生命周期的數(shù)字館藏管理研究[J].大學圖書館學報,2005,(1):26-29.