趙繼書
摘 要:文中針對數(shù)字圖書館的發(fā)展為目的探討了數(shù)字圖書館儲存和媒體多樣化,對不同的媒體采用不同的存儲與壓縮方式,根據(jù)不同的讀者擁有多種語言檢索,主動地為讀者提供所需的信息資源,提供導(dǎo)航式和個性化服務(wù),分析了數(shù)字圖書館模式的組成即:網(wǎng)絡(luò)和通訊;信息資源,數(shù)據(jù)庫管理和檢索系統(tǒng)以及附加的咨詢系統(tǒng)。實現(xiàn)數(shù)字圖書館的相關(guān)標準和規(guī)范,采用不同的元數(shù)據(jù)格式,利用網(wǎng)絡(luò)接口等功能全文檢索信息資源。
關(guān)鍵詞:數(shù)字圖書館;讀者;信息資源;數(shù)據(jù)庫
每個讀者都有在圖書館查閱資料,借閱書刊,在書的海洋中遨游的經(jīng)歷,但是數(shù)字圖書館卻是內(nèi)容無限、圖文并茂、無邊無界的數(shù)字化的空間。對數(shù)字圖書館有各種各樣的定義。數(shù)字圖書館不是簡單的將信息資源進行數(shù)字化處理,或者僅僅建立一個圖書館計算機管理系統(tǒng)。怎樣才是真正的數(shù)字圖書館的內(nèi)容和含義呢?所謂數(shù)字圖書館,就是擁有多種媒體,內(nèi)容豐富的數(shù)字化信息資源,是一種能為讀者方便、快捷地提供信息的服務(wù)機制,數(shù)字圖書館是一個完整的系統(tǒng),它由分布的大規(guī)模和組織的數(shù)據(jù)庫和知識庫進行一致性的訪問,并獲取自己所需的最終信息資料。
1 數(shù)字圖書館的特征
1.1 數(shù)字圖書館海量存蓄和媒體多樣化
圖書館的基礎(chǔ)是書刊文獻信息資源,而數(shù)字圖書館的基礎(chǔ)是數(shù)字信息資源。由于社會的進步促使信息產(chǎn)量飛速增長,網(wǎng)絡(luò)的普及和電子出版物等及科技新型手段使得信息的發(fā)布和使用更便利。這樣的形式對圖書館來說信息的收集量,處理量和儲存量也相應(yīng)的不斷增大。從圖書館存儲信息的度量單位由KB、MB、到CB、TB甚至PB就是一個數(shù)字圖書館需要擁有海量存儲的極好例子。
數(shù)字圖書館的存儲介質(zhì)由傳統(tǒng)的紙質(zhì)轉(zhuǎn)變?yōu)槎喾N媒體、數(shù)字信號可以處理多種媒體的信息,如文字、聲音、圖像、動畫、三維體、虛擬空間等。對于這些不同的媒體可以采用不同的文件存儲格式和壓縮方式,目前,常見的在電子圖書采用的文件格式TXT、DOC、PDF、HTML、SGML、XML、WAV、MP2、GIF、JPEG、MPEG等。這些媒體信息僅僅對其數(shù)字化是遠遠不夠的,需要圖書館的專業(yè)人員對信息內(nèi)容加以再加工,根據(jù)各種媒體的特性進行標引、數(shù)據(jù)加工、限制、縮放等。
1.2 具有良好的網(wǎng)絡(luò)應(yīng)用環(huán)境和管理方法
一個良好的、高速的網(wǎng)絡(luò)運行環(huán)境是運行數(shù)字化圖書館的基礎(chǔ)。在這樣的網(wǎng)絡(luò)環(huán)境中,人們對數(shù)字信息的存取已經(jīng)突破了數(shù)字信息存放的地點的限制,然而在網(wǎng)絡(luò)空間中,我們還是需要人為的加上一些限制,必須重視網(wǎng)絡(luò)空間的安全。在數(shù)字圖書館中也應(yīng)根據(jù)各種應(yīng)用本身的需要來劃分不同的層次,網(wǎng)上用戶的使用層次也根據(jù)各館的政策和規(guī)定檢索不同層次的信息。讀者在對傳統(tǒng)的圖書館的使用中,往往被圖書館的地理位置所束縛,圖書館和圖書館之間的相互使用性,無法更好的發(fā)揮。而數(shù)字圖書館已遠遠超越了地理位置的限制,通過網(wǎng)絡(luò)和計算機,將全國甚至全世界的數(shù)字圖書館有組織的連接起來,同時它還超越了時間和空間的約速,讀者可以在任何時候,任何地方去獲得任何自己所需要的信息資源。
1.3 信息查閱檢索方便
具有智能的數(shù)字信息資源的檢索軟件簡單的將傳統(tǒng)的圖書館中慣用的檢索手段如關(guān)鍵詞、提名、布爾邏輯等查詢方式應(yīng)用于數(shù)字圖書館,但遠遠無法解決數(shù)字圖書館中浩瀚的信息資源的查準和查全的問題,而數(shù)字圖書館中存儲的海量和多媒體信息需要有智能化的搜索引擎、交互式智能化而又簡單易用的多媒體檢索工具、讓讀者在數(shù)字化圖書館系統(tǒng)的各種數(shù)據(jù)庫和知識庫中獲取有組織的、連續(xù)性的、真正所需的信息資源,讓使用者不必預(yù)先了解或?qū)W習(xí)檢索各種類數(shù)據(jù)庫的技術(shù)和方法,這就是意味著數(shù)字圖書館必須有異物平臺的統(tǒng)一檢索界面的功能,并可根據(jù)讀者的需求提供個性化的主動服務(wù)。數(shù)字圖書館在檢索方法上的要求是以人工智能為基礎(chǔ),讀者可以通過自己熟悉的自然語言,不斷地與系統(tǒng)進行交互,逐步縮小搜索目標,并將檢索結(jié)果予以知識化關(guān)系,最終獲得確切的信息資源,檢索的結(jié)果可以有多種形式的顯示、表達或演示甚至構(gòu)造虛擬現(xiàn)實。
1.4 擁有多種媒體、多種語言、全文檢索
數(shù)字圖書館所收藏的資源信息不限于印刷體,而是具有聲音、圖像、形視等多種媒體,它的存儲載體也相應(yīng)地有光盤、錄音、錄像帶及各種類型的數(shù)字化、電子化裝置。因此數(shù)字圖書館應(yīng)提供生動、具體、逼真的形象資源。此外,由于讀者提供信息資源一致性的服務(wù),要求數(shù)字圖書館具有兼容多種語言的能力。不同文化背景、使用了不同語言的讀者,都可以在數(shù)字圖書館中訪問到多種數(shù)據(jù)庫和知識庫,取得自己的目標文獻資源。
2 數(shù)字圖書館的模式
數(shù)字圖書館的模式由三個部分附加層組成:用戶界面、網(wǎng)絡(luò)和通訊;信息資源、數(shù)據(jù)庫管理和檢索系統(tǒng)以及附加的咨詢系統(tǒng)。
2.1 通訊系統(tǒng)
網(wǎng)絡(luò)和通訊系統(tǒng)數(shù)字化圖書館的重要基礎(chǔ)。從宏觀的數(shù)字化圖書館的概念處罰,它是一個整體化建設(shè),包括一個單位內(nèi)的區(qū)域網(wǎng)絡(luò)以及地區(qū)、國家和國際網(wǎng)絡(luò)及通訊系統(tǒng)的建設(shè)。它是一大批共同遵循TCP/IP通訊協(xié)議的計算機網(wǎng)絡(luò)通過網(wǎng)絡(luò)設(shè)備互連而成的龐大網(wǎng)絡(luò)。目前Internet已經(jīng)聯(lián)系著多個國家和地區(qū),大量的信息資源均可通過它獲得。今后的網(wǎng)絡(luò)和通訊環(huán)境將是各國的NII和全球的GII。寬帶網(wǎng)是數(shù)字圖書館要求的運行環(huán)境。
2.2 信息資源
一個現(xiàn)實的數(shù)字化圖書館在今后一段時間內(nèi)將同時存在三種資源;即本單位收藏或開發(fā)的數(shù)字化信息資;傳統(tǒng)圖書館的印刷型資料,但應(yīng)有各種數(shù)字化的索引;外界數(shù)字化圖書館、信息中心和電子出版物數(shù)據(jù)庫的資料等,就長遠觀點而言,還應(yīng)有國家級的“知識銀行”、“文獻數(shù)據(jù)庫系統(tǒng)”,供各個數(shù)字化圖書館共享。全世界已有包括美國國會圖書館在內(nèi)的1000多所公共圖書館、大學(xué)圖書館及400多個學(xué)術(shù)機構(gòu),將其聯(lián)機館藏目錄通過Internet免費對外開放。它們已是虛擬圖書館重要的信息資源。
2.3 數(shù)字圖書館的咨詢系統(tǒng)
數(shù)字化圖書館的咨詢系統(tǒng)顯得特別重要,一般分為自我服務(wù)系統(tǒng)和請求幫助系統(tǒng)。這是數(shù)字化圖書館的重要組成部分,前者能在客戶端上顯示讀者指南,可用菜單方式,也可用超級卡或窗口軟件,它能自動指引讀者使用數(shù)字化圖書館。目前,大多數(shù)信息中心均有自我服務(wù)系統(tǒng)。后者為請求幫助系統(tǒng),應(yīng)隨時提供給用戶。數(shù)字化圖書館應(yīng)有各種信息專家,隨時接受讀者的聯(lián)機訪問并提供咨詢。已有數(shù)字化圖書館的示范單位,有的已使用專家系統(tǒng)部分解決一些讀者提出的較疑難問題。請求幫助系統(tǒng)應(yīng)能在讀者不中斷檢索的情況下,一步一步地幫助用戶解決問題;系統(tǒng)專家還能監(jiān)控這些活動,知道信息專家解決問題的情況。endprint