周和玉
(武漢理工大學(xué) 圖書館,湖北 武漢430070)
關(guān)于數(shù)字圖書館建設(shè)策略的思考*
周和玉
(武漢理工大學(xué) 圖書館,湖北 武漢430070)
數(shù)字圖書館建設(shè)是現(xiàn)代圖書館發(fā)展的必然趨勢,從建設(shè)什么樣的數(shù)字圖書館,數(shù)字資源整合,數(shù)據(jù)質(zhì)量和網(wǎng)站建設(shè)等幾個方面,討論了數(shù)字圖書館建設(shè)的策略。
數(shù)字圖書館;資源整合;數(shù)據(jù)質(zhì)量;數(shù)字圖書館網(wǎng)站
目前數(shù)字圖書館建設(shè)正在各級各類圖書館中興起,但建設(shè)一個什么樣的數(shù)字圖書館,在建設(shè)數(shù)字圖書館之前和建設(shè)之中應(yīng)充分考慮和注意那些問題,這些涉及到數(shù)字圖書館建設(shè)的科學(xué)性及使用效率,值得我們深入探討。本文擬結(jié)合數(shù)字圖書館建設(shè)的具體實(shí)踐,就以上問題作一思考。
數(shù)字圖書館概念的提出是在20世紀(jì)90年代前后,由于其尚處于發(fā)展時期,因此,到目前為止關(guān)于數(shù)字圖書館的定義還沒有形成統(tǒng)一的認(rèn)識。但從近些年的理論研究和建設(shè)實(shí)踐來看,筆者以為美國科學(xué)基金會對數(shù)字圖書館的描述似乎更具代表性。“數(shù)字圖書館并不僅僅是一個有著信息管理工具的數(shù)字收藏的等價詞,數(shù)字圖書館更是一個環(huán)境,它將收藏、服務(wù)和人集合到一起以支持?jǐn)?shù)據(jù)、信息,乃至知識的全部流程,包括從創(chuàng)造、傳播、使用,到保存的全過程”[1]。在這里,數(shù)字圖書館是一個環(huán)境,是一個平臺。它包含了三個最主要的要素,即人、資源和技術(shù)。人是指與數(shù)字圖書館密切相關(guān)的人,包括為數(shù)字圖書館提供資源的數(shù)據(jù)庫生產(chǎn)者,建設(shè)和管理數(shù)字圖書館的圖書館工作人員,以及使用數(shù)字圖書館的讀者;資源是指數(shù)字圖書館上運(yùn)行的各種信息源,包括各種數(shù)據(jù)庫(全文型數(shù)據(jù)庫、文摘型數(shù)據(jù)庫、數(shù)據(jù)型數(shù)據(jù)庫、館藏書目數(shù)據(jù)庫等等),網(wǎng)絡(luò)資源,自建特色資源等等;技術(shù)是指維持?jǐn)?shù)字圖書館運(yùn)行的各項(xiàng)技術(shù),包括數(shù)據(jù)庫技術(shù),數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)推送技術(shù)等等。在這三個要素當(dāng)中,起主導(dǎo)作用的是人,因?yàn)槭侨藶閿?shù)字圖書館提供資源,是人在建設(shè)和管理數(shù)字圖書館,也是人在利用數(shù)字圖書館。如果對數(shù)字圖書館沒有比較明晰的認(rèn)識,數(shù)據(jù)庫生產(chǎn)者就不可能很好地為數(shù)字圖書館提供合格的數(shù)字資源,圖書館工作人員就不可能建設(shè)和管理好數(shù)字圖書館,讀者就不可能充分利用數(shù)字圖書館這個平臺獲取信息、數(shù)據(jù)和知識。數(shù)字圖書館就是把這三個要素集合在一個平臺上,進(jìn)行信息、數(shù)據(jù)和知識的交換、傳遞及創(chuàng)造。
建設(shè)什么樣的數(shù)字圖書館,這是每一個數(shù)字圖書館建設(shè)者首先要考慮的問題。目前,由于數(shù)字圖書館尚處于發(fā)展階段,在理論上還沒有一個統(tǒng)一的標(biāo)準(zhǔn),在實(shí)踐上也沒有統(tǒng)一的數(shù)字圖書館模型。再加上各館在辦館理念、經(jīng)費(fèi)、人力資源、文獻(xiàn)資源(包括印本和數(shù)字資源)、服務(wù)對象等方面也大不相同,因此在建設(shè)上也就顯得不一樣。但不管理論、實(shí)踐、環(huán)境等方面有多大差別,建設(shè)一個對讀者實(shí)用的數(shù)字圖書館是大家的共識。
那么,什么樣的數(shù)字圖書館才是對讀者實(shí)用的呢?從我們的調(diào)查和讀者反映來看,適合讀者需要的數(shù)字圖書館應(yīng)該能全面反映圖書館的各種資源(包括印本的和數(shù)字的),各種資源應(yīng)該充分整合在一起,應(yīng)能提供全方位的信息服務(wù)以及各種個性化服務(wù),使用方便,便于各種信息交流等等。因此,我們可以將數(shù)字圖書館理解為一個平臺,一個環(huán)境,在這個平臺上,資源提供者(生產(chǎn)者)、資源管理者(圖書館工作人員)和資源使用者(讀者)進(jìn)行著信息、數(shù)據(jù)和知識的生產(chǎn)、傳遞及創(chuàng)造。這個平臺是開放式的,可以對外進(jìn)行數(shù)據(jù)交換。因此,它是全球數(shù)字圖書館聯(lián)盟(全球各數(shù)字圖書館聯(lián)在一起形成一個大的數(shù)字圖書館)的一分子,是全球數(shù)字圖書館的一個入口或一個節(jié)點(diǎn),讀者在這樣一個數(shù)字圖書館上,既可獲得本地資源,又可以查到其他數(shù)字圖書館的資源,進(jìn)而通過文獻(xiàn)傳遞系統(tǒng)獲得異地資源。這就要求我們的數(shù)字圖書館不能是封閉的,而應(yīng)該是開放式的。這就是整體定位應(yīng)考慮的問題。我們不要求也不可能要求單個數(shù)字圖書館包羅萬象,但至少要能與其他數(shù)字圖書館相互鏈接。讀者在這樣一個相互鏈接的數(shù)字圖書館群體——“全球數(shù)字圖書館”上,能獲得所需的各種各樣的信息和服務(wù)。筆者以為,這些問題在建館之初都應(yīng)該考慮清楚,整體設(shè)計(jì)時考慮全面一些,才便于之后分步實(shí)施。
所謂信息資源整合,是指依據(jù)一定的需要,對各個相對獨(dú)立的信息資源系統(tǒng)中的數(shù)據(jù)對象與功能結(jié)構(gòu)及其互動關(guān)系進(jìn)行融合、類聚和重組,形成一個效能更好,效率更高的新的信息資源體系[2]。圖書館的信息資源多種多樣,大致可分為印本資源(包括各種圖書、期刊、報紙等等),數(shù)字資源(主要包括電子圖書、電子期刊、各種文摘數(shù)據(jù)庫和事實(shí)數(shù)據(jù)庫等)和網(wǎng)絡(luò)資源等,這些資源分別由不同的系統(tǒng)管理著,如印本資源由傳統(tǒng)的圖書館集成系統(tǒng)管理,各數(shù)據(jù)庫也有自己的管理平臺,由于各系統(tǒng)之間沒有相互聯(lián)系,讀者要檢索印本資源需進(jìn)入圖書館集成系統(tǒng),需查找電子圖書、電子期刊和其他電子資源又必須進(jìn)入相應(yīng)的數(shù)據(jù)庫系統(tǒng),這樣給讀者使用帶來了很大的不便。信息資源整合的目的是要把這些毫不相干的信息,通過一定的技術(shù)和手段整合到一起,使其成為一個相互連接的整體,為讀者提供一個知識相互鏈接和利用方便的平臺,這是目前數(shù)字圖書館建設(shè)的一個主要內(nèi)容。
目前,國內(nèi)外數(shù)字圖書館采取的整合方式主要有:基于OPAC系統(tǒng)的整合,基于數(shù)字資源管理的整合,基于知識服務(wù)的整合[3]。基于OPAC系統(tǒng)的整合就是通過圖書館集成管理系統(tǒng)軟件進(jìn)行MARC編目,將電子圖書和電子期刊整合到OPAC系統(tǒng)中,并在OPAC系統(tǒng)中提供超級鏈接功能,這樣讀者在OPAC系統(tǒng)中檢索到印本圖書、印本期刊的同時,還可以檢索到相應(yīng)的電子圖書、電子期刊,進(jìn)而通過超級鏈接打開全文?;跀?shù)字資源管理的整合就是在數(shù)字資源當(dāng)中嵌入印本圖書和印本期刊的OPAC信息,從而實(shí)現(xiàn)印本資源和數(shù)字資源的無縫鏈接?;谥R服務(wù)的整合則是從知識服務(wù)的需要出發(fā),直接通過分布式資源間的相互操作,相互鏈接,將所有的信息資源組成立體、網(wǎng)狀的知識資源服務(wù)系統(tǒng)。以上各種整合方式有著各自的優(yōu)缺點(diǎn),前兩種實(shí)現(xiàn)起來比較容易,但不能實(shí)現(xiàn)所有資源間的知識鏈接。最后一種整合方式可以實(shí)現(xiàn)所有資源間知識的立體、網(wǎng)狀鏈接,但實(shí)現(xiàn)起來難度較大。基于以上分析,我們可以看出,就真正的資源整合而言,基于知識服務(wù)的整合才是真正意義上的資源整合。因?yàn)樗梢詫?shí)現(xiàn)針對分布環(huán)境下的電子資源的整合檢索和獲取目標(biāo)信息的無縫連接,以及實(shí)現(xiàn)各種知識和信息服務(wù)的整合。要實(shí)現(xiàn)知識服務(wù)的整合,通行的做法是在建立本地元數(shù)據(jù)庫的基礎(chǔ)上,通過資源調(diào)度系統(tǒng)實(shí)現(xiàn)資源檢索和提供的無縫鏈接。本地元數(shù)據(jù)庫應(yīng)包括OPAC數(shù)據(jù)、商用數(shù)據(jù)庫和網(wǎng)絡(luò)資源數(shù)據(jù),其中OPAC數(shù)據(jù)為本館所有,網(wǎng)絡(luò)數(shù)據(jù)可以通過加工獲得,但商用數(shù)據(jù)庫的元數(shù)據(jù)則需要數(shù)據(jù)商提供。目前,這部分?jǐn)?shù)據(jù)獲得比較困難,也不穩(wěn)定。這就是我們前面所提到的數(shù)字圖書館建設(shè)不僅僅是圖書館的事,而是涉及到數(shù)字圖書館系統(tǒng)各方面人員的共同努力,才能把數(shù)字圖書館建設(shè)好。但不管困難有多大,在數(shù)字圖書館設(shè)計(jì)之初,也就是方案設(shè)計(jì)中,應(yīng)該考慮未來數(shù)字圖書館的可持續(xù)發(fā)展,為未來的可持續(xù)發(fā)展預(yù)留下足夠的空間。
信息資源整合總的原則應(yīng)該是科學(xué)設(shè)計(jì),統(tǒng)籌規(guī)劃,分步實(shí)施。我們說資源整合中要將各種信息資源整合在一起,這是整體上的要求,是整體設(shè)計(jì)上應(yīng)考慮到的,但在實(shí)施上會遇到很多困難。例如,數(shù)據(jù)商配合的問題,知識產(chǎn)權(quán)的問題,數(shù)據(jù)量大的問題等等。因此,在具體實(shí)施上,可考慮分步實(shí)施,先易后難。我們武漢理工大學(xué)圖書館采取的是先整合本地資源,包括本館OPAC,裝在本地的電子圖書以及自建的一些數(shù)字資源,然后待運(yùn)行穩(wěn)定和條件成熟后,再逐個解決相關(guān)數(shù)據(jù)庫的整合問題。
注重?cái)?shù)據(jù)和整合方式的標(biāo)準(zhǔn)化、規(guī)范化,以使得數(shù)據(jù)和服務(wù)能在數(shù)字圖書館之間順利流動,從而避免形成新的信息孤島。
數(shù)據(jù)質(zhì)量是數(shù)字圖書館建設(shè)中不可忽視的一個非常重要的方面,數(shù)據(jù)質(zhì)量的好壞,直接關(guān)系到數(shù)字圖書館建設(shè)的成敗。在數(shù)字圖書館建設(shè)中涉及到的數(shù)據(jù)主要有OPAC數(shù)據(jù)、商用數(shù)據(jù)庫元數(shù)據(jù)和網(wǎng)絡(luò)資源元數(shù)據(jù)等等。
一是標(biāo)準(zhǔn)化要求。標(biāo)準(zhǔn)化規(guī)范化是實(shí)現(xiàn)不同系統(tǒng)間網(wǎng)絡(luò)信息資源交流的基礎(chǔ),實(shí)現(xiàn)數(shù)字信息資源整合的關(guān)鍵在于要遵循標(biāo)準(zhǔn)化的規(guī)范體系。如果沒有統(tǒng)一的數(shù)字信息資源建設(shè)標(biāo)準(zhǔn)和相應(yīng)的規(guī)范,就不可能實(shí)現(xiàn)各分布式資源之間的互操作和信息的共享。在數(shù)據(jù)庫建設(shè)中 ,由于缺乏標(biāo)準(zhǔn)規(guī)范,往往導(dǎo)致大量異構(gòu)資源的出現(xiàn)。因此,面對分散異構(gòu)、不斷變化和開放的數(shù)字信息資源與服務(wù)環(huán)境,應(yīng)采用新的標(biāo)準(zhǔn)規(guī)范體系,使各類、各種信息在網(wǎng)絡(luò)平臺之間能自由流動。
二是完整性要求。完整性是實(shí)現(xiàn)資源檢索和調(diào)度的基礎(chǔ),數(shù)據(jù)項(xiàng)目不完整,檢索時容易造成漏檢,資源調(diào)度時容易產(chǎn)生調(diào)度誤差,從而影響資源整合的效果。
1.OPAC數(shù)據(jù)問題。目前國內(nèi)大多數(shù)高校圖書館的OPAC數(shù)據(jù)是從上世紀(jì)80年代末到90年代初圖書館集成系統(tǒng)(或稱圖書館自動化系統(tǒng))應(yīng)用時開始建立的,在開始階段,不少館采取的是“大兵團(tuán)作戰(zhàn)”的方式建立數(shù)據(jù),即全館動員大多數(shù)人員參與,在較短的時間內(nèi)將圖書館借閱流通的圖書建立數(shù)據(jù)庫。由于參與人員并非全部是圖書編目人員,加上對機(jī)讀格式并不很熟悉,所以加工的數(shù)據(jù)質(zhì)量參差不齊,存在的主要問題是著錄項(xiàng)目不全,項(xiàng)目錄入錯誤等等。這些問題往往會導(dǎo)致資源整合和調(diào)度中出現(xiàn)差錯。
2.商用數(shù)據(jù)庫元數(shù)據(jù)問題。商用數(shù)據(jù)庫元數(shù)據(jù)主要存在兩個方面的問題,一是難于獲取,目前國內(nèi)一些主要數(shù)據(jù)庫的元數(shù)據(jù)經(jīng)過協(xié)商,大多數(shù)都能獲得,而外文數(shù)據(jù)庫的元數(shù)據(jù)則較難獲得,且大多數(shù)數(shù)據(jù)商不開放接口;二是數(shù)據(jù)更新難,難在數(shù)據(jù)商不提供接口,增量數(shù)據(jù)無法自動獲取。
對于OPAC數(shù)據(jù)問題,需要花較大氣力清庫來解決。目前,比較好的解決方案是將以前的數(shù)據(jù)逐條對照CALIS或中國國家圖書館的數(shù)據(jù)套錄,因?yàn)檫@兩個系統(tǒng)的數(shù)據(jù)比較規(guī)范標(biāo)準(zhǔn),從而形成自己比較規(guī)范標(biāo)準(zhǔn)的OPAC數(shù)據(jù)。
對于商用元數(shù)據(jù)問題,鑒于其整合的難度較大,筆者以為,可以采取先易后難的辦法解決,即裝在本地的資源,其元數(shù)據(jù)也放在本地元數(shù)據(jù)庫中,進(jìn)行完全整合。而對于沒有裝在本地的網(wǎng)絡(luò)訪問的數(shù)字資源,可以有兩種方式來處理。一是與數(shù)據(jù)商協(xié)商解決元數(shù)據(jù)本地存放和開放接口,或者由有開發(fā)能力和經(jīng)驗(yàn)的數(shù)據(jù)商將本地資源整合進(jìn)相關(guān)數(shù)據(jù)庫平臺;二是暫時不整合進(jìn)本地平臺,待條件成熟后再整合。
數(shù)字圖書館建設(shè)的設(shè)計(jì)理念以及資源和服務(wù)都是通過數(shù)字圖書館網(wǎng)站來展現(xiàn)的,讀者面對的也是數(shù)字圖書館的網(wǎng)站。一個好的數(shù)字圖書館網(wǎng)站應(yīng)該成為圖書館與圖書館,圖書館與讀者,讀者與讀者,讀者與館員,甚至讀者與資源創(chuàng)造者(包括作者、數(shù)據(jù)商、書商等)之間的紐帶和橋梁。因此,數(shù)字圖書館網(wǎng)站的設(shè)計(jì)就顯得非常重要。在數(shù)字圖書館網(wǎng)站設(shè)計(jì)上應(yīng)該注意以下幾點(diǎn):
首先,網(wǎng)站設(shè)計(jì)上應(yīng)該體現(xiàn)出數(shù)字圖書館能為讀者提供信息、數(shù)據(jù)、知識的獲取、交換、傳遞和創(chuàng)造的平臺,這些功能應(yīng)在主頁面上反映出來。
其次,在內(nèi)容展示上,應(yīng)實(shí)行功能分塊,要站在讀者利用數(shù)字圖書館的角度進(jìn)行設(shè)計(jì),使讀者一目了然。一個數(shù)字圖書館大致可分為以下幾個區(qū)域,資源揭示區(qū)、資源檢索區(qū)、讀者登錄區(qū)、圖書館概況、讀者指南、個性化服務(wù)區(qū)、消息發(fā)布區(qū)等等,其中資源檢索和資源揭示是讀者最感興趣的項(xiàng)目,因此,這兩個區(qū)應(yīng)擺在網(wǎng)頁版面醒目的位置。例如,武漢理工大學(xué)數(shù)字圖書館網(wǎng)站設(shè)計(jì)就是采取功能分塊的,整體上分左、中、右三大塊,左上為檢索區(qū)(資源統(tǒng)一檢索、館藏印本資源檢索),左中為消息報道,左下為資源推介;中間為主要區(qū)域,分別安排了讀者指南(圖書館相關(guān)情況介紹、資源使用指南、新生須知等),資料查詢(各種印本和電子資源查詢、新書通報等),信息服務(wù)(參考咨詢、科技查新、文獻(xiàn)傳遞等等),資源導(dǎo)航(數(shù)據(jù)庫和電子期刊導(dǎo)航以及網(wǎng)絡(luò)資源導(dǎo)航等)和特色資源(自建的特色資源和門戶等)等;右邊安排了用戶登錄,特色服務(wù),資源利用排行等等。運(yùn)行兩年多來,讀者普遍反映良好。
再次,盡量避免使用太專業(yè)化的術(shù)語(例如:“OPAC檢索”等等),網(wǎng)頁設(shè)計(jì)上要盡量簡潔。
綜上所述,數(shù)字圖書館建設(shè)對于一個圖書館來說是一件大事,應(yīng)該從設(shè)計(jì)理念(建設(shè)什么樣的數(shù)字圖書館),資源整合,數(shù)據(jù)規(guī)范化,網(wǎng)站設(shè)計(jì)等多方面給予足夠的重視,組織館內(nèi)相關(guān)人員反復(fù)認(rèn)真論證,再聯(lián)合相關(guān)專家和軟件開發(fā)公司技術(shù)人員討論并實(shí)施,為讀者建造一個功能齊全、實(shí)用的數(shù)字圖書館。
[1] 曾 蕾,張 甲,楊宗英.?dāng)?shù)字圖書館,路在何方?[DB/OL].(2009-11-20)[2010-02-10]http:∥oldweb.lib.sjtu.edu.cn/chinese/teaching&research/1.html.
[2] 崔瑞琴.?dāng)?shù)字信息資源整合問題研究[J].圖書情報工作,2007,51(7):35-37.
[3] 龔亦農(nóng).?dāng)?shù)字圖書館的資源整合[J].圖書情報工作,2005,49(7):121-124.
(責(zé)任編輯 文 格)
Thoughts on the Strategies of Digital Library Construction
ZHOU He-yu
(Library,WHUT,Wuhan430070,Hubei,China)
To construct digital library is the inevitable trend of modern library development.The strategies of digital library construction has been discussed from the following aspects of what type digital library to construct,integrating digital information resources,data quality and network construction.
digital library;integrating information resources;data quality;network of digital library
G250
:ADOI:10.3963/j.issn.1671-6477.2010.05.033
2010-03-10
周和玉(1957-),男,安徽省樅陽縣人,武漢理工大學(xué)圖書館研究館員,主要從事數(shù)字圖書館、情報存貯與檢索研究。
教育部科技發(fā)展中心項(xiàng)目資助(2009113)