肖陽
摘 要:隨著信息網(wǎng)絡技術的普及和科技的飛速發(fā)展,使得信息爆炸性增長,浩如煙海的信息成多樣性、無序性增長,因而用戶不能迅速、有效地獲取自己所需的信息,在這種情況下數(shù)字圖書館應運而生。然而在數(shù)字圖書館建設的過程中存在諸多問題,如何建設好數(shù)字圖書館已成為當代圖書館學研究的一個熱門話題。
關鍵詞:數(shù)字圖書館;圖書館建設;數(shù)字信息
中圖分類號:C93 文獻標志碼:A 文章編號:1673-291X(2012)36-0215-02
一、數(shù)字圖書館的概念
所謂數(shù)字圖書館是指建立在內(nèi)部業(yè)務高度自動化基礎上,不僅能使本地和遠程用戶聯(lián)機存取其聯(lián)機公共檢索目錄以查詢傳統(tǒng)圖書館藏(非數(shù)字化和數(shù)字化的),而且也能使用戶通過網(wǎng)絡聯(lián)機存取圖書館內(nèi)外的其他電子信息資源,信息實時更新并且高度共享的現(xiàn)代化圖書館。數(shù)字圖書館是由數(shù)字化的有序化信息和信息部門等構(gòu)成,它強調(diào)數(shù)字化支持技術、數(shù)字化資源和數(shù)字服務,本質(zhì)上是一種實體性的信息機構(gòu)。數(shù)字圖書館的研究和建設已經(jīng)在全球范圍內(nèi)引起了廣泛的關注。近代數(shù)字圖書館可以稱作資料中心、信息中心和研究中心,這跟過去以藏書為目的的圖書館相比,有了一個很大的提高。
二、數(shù)字圖書館的功能
數(shù)字圖書館的功能應該說在近現(xiàn)代以來發(fā)揮的越來越好,尤其是21世紀以來,信息化、數(shù)字化時代的到來越來越快,這個過程中互聯(lián)網(wǎng)的發(fā)展給圖書館提供了一個新的發(fā)展契機,也是一個新的挑戰(zhàn)[1]。因此筆者認為現(xiàn)代數(shù)字圖書館在功能上、定位上都發(fā)生了變化,而功能上的變化,從讀者的需求上來說,主要有以下三種。
1.提供數(shù)字化的圖書資料,過去紙本的圖書通過掃描、攝像等手段形成數(shù)字化即一個抽象的東西。過去圖書館主要是借用紙本圖書,現(xiàn)在數(shù)字圖書館主要是提供圖書的圖像文件,甚至是電子文稿,這樣可以方便用戶研究。
2.整理并提供數(shù)字化的歷史文獻。浩如煙海的歷史文獻經(jīng)過掃描方式的數(shù)字化處理形成電子版圖書,這樣圖書占用空間不大,但信息量很大。很多寶貴的珍本或孤本,進過數(shù)字化以后,可以提供給眾多的研究者,這樣可以使我們更好地利用過去的這些文獻。
3.數(shù)字圖書館能夠提供快捷的數(shù)字化信息。圖書館通過互聯(lián)網(wǎng)發(fā)布信息,使研究者在資料信息及研究方法上得到有價值的東西,加快學術成果及信息的交流,我認為這也是現(xiàn)代圖書館和數(shù)字圖書館為學術研究者提供的最大的方便。
三、建設數(shù)字圖書館中存在的問題
1.所建數(shù)據(jù)庫服務質(zhì)量不高。雖然高校圖書館已經(jīng)基本上實現(xiàn)了采訪、編目、流通、檢索等業(yè)務自動化管理,但仍有一些館處于自動化集成系統(tǒng)的初步實用階段。從整體上看,尚未形成以網(wǎng)絡化為龍頭帶動整個圖書館數(shù)字化建設的局面,對現(xiàn)有的館藏數(shù)字化比例不高,可提供服務的虛擬資源仍十分不足,多數(shù)圖書館能夠上網(wǎng)的數(shù)字化資源仍局限于館藏書目的層面上,并有一半以上的圖書館尚未實施專題特色數(shù)據(jù)庫的開發(fā)建設。從已經(jīng)上網(wǎng)并提供服務自建的專題數(shù)據(jù)庫使用情況來看,除記錄太少外,多數(shù)也只能提供二次文獻及簡單檢索服務,很難滿足用戶深層次的需求。這就表明數(shù)據(jù)庫的內(nèi)容有待擴大,開發(fā)深度及檢索質(zhì)量等方面有待于進一步提高。
2.自動化專業(yè)人員結(jié)構(gòu)不合理。數(shù)字圖書館建設人員應是圖書情報、學科專業(yè)人員、計算機專業(yè)人員相結(jié)合。數(shù)字圖書館建設牽涉到的方面較多,內(nèi)容的收集與篩選需圖書情報人員與學科專業(yè)人員共同確定,以保證收錄內(nèi)容的完整、合理、先進、使用 [2]。然而現(xiàn)在從事圖書館相關工作中計算機、自動化專業(yè)的大學本科以上畢業(yè)生所占的比例極少,而非專業(yè)技術人員卻占的比例較大。圖書館數(shù)字化建設缺乏大批具備計算機技術、網(wǎng)絡技術的高素質(zhì)專業(yè)人才,目前這種人員狀況影響了高校數(shù)字圖書館建設的發(fā)展。
3.數(shù)字圖書館中館藏資源的合法性問題?,F(xiàn)實圖書館合法取得復本,加上國家并未規(guī)定“公共借閱權”,因此一般不存在入藏資料的合法性問題。數(shù)字圖書館情況則不同,將圖書數(shù)字化,行使的是版權人的復制權,這種復制權由作者控制 [3]。所以,數(shù)字圖書館所收藏文獻必須取得法律或著作權人的授權。信息資源的社會共享和知識產(chǎn)權的保護,是網(wǎng)絡信息時代不可避免的兩個問題,兩者是對立和統(tǒng)一的關系,過分嚴厲的保護著作權,只會抑制信息的傳播,并不能給權利人帶來更多的利益,使每個人都可以自由的獲取信息,才是人類社會的根本要求。但是給予作者和著作權有關的權利人信息網(wǎng)絡著作權是必要的,否則,就打破了著作權人的創(chuàng)作動力。當然,還應對這一權利進行適當?shù)南拗?,已達到社會利益和權利人個人利益的平衡。就數(shù)字圖書館而言,它的活動不是以營利為目的的,在要求信息資源共享的社會公眾利益和要求著作權保護的創(chuàng)作者個人利益之間,起著維護社會公眾利益的目的。因此,給予數(shù)字圖書館特殊的法律,通過圖書館獨特的傳播者地位,以保護公眾獲取信息的權利。
4.數(shù)字信息的長期存取問題。對于數(shù)字圖書館來說,保存文獻與保存文獻中的信息并不完全相同。早期,工作人員只是將數(shù)字信息長期存取的關鍵歸于數(shù)字媒體的保存上,呼吁改進數(shù)字媒體的耐久性。然而,隨著數(shù)字技術變革速度的不斷加快,技術淘汰比數(shù)字媒體的形體損壞,對數(shù)字信息的長期存取具有更大的威脅。如何維護保證數(shù)字信息的長期存取,是中國數(shù)字圖書館建設中的關鍵所在。與傳統(tǒng)文獻一樣,數(shù)字信息的長期保存與其依附的媒體材料是不可分的,存儲媒體的損壞會導致數(shù)字信息的丟失。雖然媒體現(xiàn)有的壽命已超過了讀寫它的軟硬件的技術期限,但仍需要改進媒體的穩(wěn)定性、存儲能力和延長使用壽命,以減少數(shù)字信息的丟失和降低存儲費用。
四、高校圖書館數(shù)字化建設的改進
雖然數(shù)字化建設對圖書館而言是一個全新的實踐,但是在中國經(jīng)濟較發(fā)達的上海、廣東等省市的高校圖書館已經(jīng)率先進行了一些探索和嘗試,我們應該在汲取和借鑒其經(jīng)驗的基礎上,根據(jù)自身的特點科學的制定出一整套發(fā)展策略。
1.組建異構(gòu)數(shù)據(jù)的集成架構(gòu)。所謂異構(gòu)數(shù)據(jù)的集成是指對已經(jīng)存在的多個異構(gòu)數(shù)據(jù)庫,在盡可能少地影響其本地自治性的基礎上,構(gòu)造具有用戶所需要的某種透明性的分布式數(shù)據(jù)庫,以支持對物理上分布的多個數(shù)據(jù)庫的全局訪問和數(shù)據(jù)庫之間的互操作性。異構(gòu)數(shù)據(jù)集成技術是將各類信息通過一定的技術手段進行整合,以更好地提供給人們利用的一種技術。為了更好地為讀者服務,許多圖書館都建立了不同規(guī)模的應用信息系統(tǒng),自建或引進了大量的數(shù)據(jù)庫、資料庫。數(shù)字圖書館也同樣面臨著嚴峻的信息集成問題。圖書館要整合的數(shù)據(jù)庫主要包括書目數(shù)據(jù)庫、題錄/文摘數(shù)據(jù)庫、全文數(shù)據(jù)庫、電子期刊和電子圖書、相關的Web網(wǎng)站等。這些數(shù)據(jù)庫分布在不同的服務器,由不同的信息服務公司和出版社提供或由圖書館自建,成為各具不同特性的異構(gòu)數(shù)據(jù)庫,其異構(gòu)特征表現(xiàn)為數(shù)據(jù)模型異構(gòu)、數(shù)據(jù)結(jié)構(gòu)異構(gòu)、系統(tǒng)控制方式異構(gòu)、計算機平臺異構(gòu)、通信協(xié)議異構(gòu)、通信結(jié)構(gòu)模式異構(gòu)、操作系統(tǒng)異構(gòu)及網(wǎng)絡的異構(gòu) [3]。為了更好的為讀者服務,許多圖書館都建立了各式各樣的應用系統(tǒng),也引進了大量的數(shù)據(jù)庫。由于這些應用系統(tǒng)所基于的技術環(huán)境和針對的需求不同,彼此之間分離獨立,互操作困難,造成了資源浪費,信息得不到有效利用。如果使用信息集成技術,將不同的數(shù)據(jù)庫中的信息進行整合,統(tǒng)一到應用需要的全局模式上,可以做到整合已有資源,發(fā)揮現(xiàn)有信息的更大作用。因此,設計數(shù)字圖書館的異構(gòu)數(shù)據(jù)集成架構(gòu)時,應立足于對書目數(shù)據(jù)的集成,在集成架構(gòu)中加入數(shù)據(jù)倉庫元素,利用數(shù)據(jù)倉庫對集成的數(shù)目數(shù)據(jù)進行統(tǒng)一視圖的組織和管理[3];用MARC作為集成的元數(shù)據(jù),利用MARC對書目數(shù)據(jù)進行描述,并在MARC基礎上建立各類視圖;通過圖書館分類體系和主題詞表將書目數(shù)據(jù)按照不同的主題進行組織。
2.開展信息檢索與跨庫檢索研究。作為一門學科的信息檢索,其檢索技術的不斷研究與應用,一直對信息檢索領域產(chǎn)生著重要影響。目前研制的中文信息檢索方法或網(wǎng)上搜索引擎,無論是關鍵字符的機械式匹配,還是結(jié)合布爾邏輯運算提供更為復雜的查詢表達方式,多數(shù)是以關鍵詞匹配為基礎的。這種方式存在兩個缺陷:一是檢索結(jié)果只是在字面上符合用戶的要求,實際內(nèi)容往往偏離用戶的實際需要;二是用戶輸入的查詢詞稍有偏差,檢索系統(tǒng)就無法確定用戶的真正需要,因而無法提交正確的結(jié)果。
跨庫檢索系統(tǒng)為用戶提供了從統(tǒng)一界面訪問數(shù)字圖書館各類資源的便利。其中主要由研究模塊、用戶認證管理和使用跟蹤模塊組成。研究模塊使用戶可從統(tǒng)一的界面檢索所選擇的各種信息資源,檢索結(jié)果可以排序和組織,檢索界面可由用戶定制,系統(tǒng)可以保存檢索策略、定期發(fā)送定題情報服務及E-mail發(fā)送檢索結(jié)果;用戶認證管理模塊使系統(tǒng)管理員能夠很方便地設置和修改用戶的訪問權限,并針對不同用戶調(diào)整不同的訪問權限,或設置訪問特權;使用跟蹤模塊用來獲取用戶訪問各種信息資源的使用信息,包括登錄或退出檢索系統(tǒng)的次數(shù)和時間、用戶的各種輸入和檢索信息。
五、總結(jié)
近年來從概念分析到現(xiàn)實技術的研究,各地方圖書情報理論學者對數(shù)字圖書館建設做了不少深入的探討。數(shù)字圖書館的出現(xiàn),不僅為我們帶來嶄新的思維理念,而且拓展了傳統(tǒng)圖書館的資源體系與服務模式,使得各種信息資源得到開發(fā)利用及社會共享,但我們也必須清醒意識到,數(shù)字圖書館建設畢竟是一項長期的系統(tǒng)的工程,它的發(fā)展有賴于現(xiàn)代信息技術的進步和圖書館員自身素質(zhì)的提高,同時還面臨著信息增長與成本效益的矛盾、知識產(chǎn)權糾紛的問題。而我們目前理論界在對數(shù)字圖書館現(xiàn)實研究上還存在不少薄弱環(huán)節(jié),這些都有待于我們今后的研究與探討。我相信,未來數(shù)字圖書館的研究將逐步走向成熟與深入。
參考文獻:
[1] 馮長根.數(shù)字時代圖書館的創(chuàng)新與共享[M].北京:中國科學技術出版社,2009:49-51.
[2] 崔慕岳.河南省數(shù)字化圖書情報系統(tǒng)研究[M].鄭州:鄭州大學出版社,2005:92-137.
[3] 王蘭成,敖毅.數(shù)字圖書館技術:信息集成與信息檢索[M].北京:國防工業(yè)出版社,2007:83-256.[責任編輯 王玉妹]