任玉珍
(煙臺(tái)大學(xué)圖書館,山東煙臺(tái) 264005)
數(shù)字圖書館檢索工具的若干研究
任玉珍
(煙臺(tái)大學(xué)圖書館,山東煙臺(tái) 264005)
隨著信息化時(shí)代的發(fā)展,數(shù)字圖書館的建立與發(fā)展是大勢(shì)所趨,信息的發(fā)展帶來的網(wǎng)絡(luò)信息的繁榮。隨著社會(huì)的發(fā)展,傳統(tǒng)的人工標(biāo)引方法已經(jīng)不適用了。因此,必須要改變傳統(tǒng)的引擎技術(shù),并采用相關(guān)的技術(shù)對(duì)信息資源進(jìn)行分類,從而能夠有效改善數(shù)字圖書館發(fā)展。
數(shù)字圖書館 檢索工具 搜索引擎
數(shù)字圖書館一詞主要是從Digital Library中翻譯過來的。二十一世紀(jì)進(jìn)入了高科技經(jīng)濟(jì)時(shí)代,隨著社會(huì)的發(fā)展,計(jì)算機(jī)、信息以及網(wǎng)絡(luò)技術(shù)也得到不斷的發(fā)展,信息高速公路和信息技術(shù)革命,進(jìn)一步促進(jìn)圖書館向自動(dòng)化和數(shù)字化方向發(fā)展。如何利用數(shù)字圖書館自身資源,向用戶提供更加安全、優(yōu)質(zhì)的服務(wù),是本文主要探討的問題。下文對(duì)數(shù)字圖書館的特征進(jìn)行分析。
一般來講,數(shù)字圖書館主要是數(shù)字信息庫(kù)的體現(xiàn),它主要具有以下幾個(gè)特征:
信息資源數(shù)字化是數(shù)字圖書館的基本特征。這與傳統(tǒng)的圖書館有著非常重要的區(qū)別。數(shù)字圖書館信息儲(chǔ)存的形式主要通過紙質(zhì)文獻(xiàn)轉(zhuǎn)換成數(shù)字化文獻(xiàn),從而能有效改變現(xiàn)實(shí)的儲(chǔ)存空間,更加有利于人們的閱讀。
網(wǎng)絡(luò)的不斷發(fā)展,為數(shù)字圖書館之間的聯(lián)系奠定了堅(jiān)實(shí)的基礎(chǔ),有利于打破紙質(zhì)文獻(xiàn)的局限性。通過數(shù)字圖書館,人們可以對(duì)圖書進(jìn)行跨庫(kù)搜索,在短時(shí)間內(nèi)有效實(shí)現(xiàn)了信息傳遞之間的距離。此外,它具有非常豐富的數(shù)字化資源,包括全文數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)信息資源庫(kù)、OPAC書刊目錄庫(kù)、多媒體數(shù)據(jù)庫(kù)等。這些數(shù)據(jù)庫(kù)都能夠有效提高檢索的效率和質(zhì)量。
由于數(shù)字和網(wǎng)絡(luò)化的不斷發(fā)展,能夠有效實(shí)現(xiàn)地域之間的聯(lián)系,文件之間的共享。任何人都可以通過對(duì)圖書館進(jìn)行資源的共享和利用。
數(shù)字圖書館能將圖書、期刊、數(shù)據(jù)庫(kù)、網(wǎng)頁(yè)等載體上的信息進(jìn)行鏈接,并以動(dòng)態(tài)的形式提供相應(yīng)的服務(wù)。與傳統(tǒng)的圖書館相比,數(shù)字圖書館不僅能對(duì)圖書進(jìn)行準(zhǔn)確的查詢,還能夠與相關(guān)的知識(shí)內(nèi)容進(jìn)行鏈接,方便讀者知識(shí)的搜索。隨著信息化知識(shí)的不斷發(fā)展,信息提供變得更加豐富。
根據(jù)上述的幾點(diǎn)描述,表明我國(guó)目前數(shù)字圖書館已經(jīng)得到了一定的發(fā)展,數(shù)字圖書館的資源內(nèi)容已經(jīng)非常豐富了。在目前社會(huì)當(dāng)中,很多公立圖書館,其媒體信息和資源庫(kù)方面的建立有著非常明顯的進(jìn)步。然而,在發(fā)展的過程中,數(shù)字圖書館也不可避免地出現(xiàn)著各種問題,下文進(jìn)行詳細(xì)的分析。
目前盡管數(shù)字圖書館不斷發(fā)展,但數(shù)字圖書館并沒有被賦予一個(gè)完整的定義。其形式也表現(xiàn)出多種情況,其中包括數(shù)字資源系統(tǒng)、網(wǎng)上書店等。隨著社會(huì)的發(fā)展,我國(guó)的數(shù)字化圖書館得到了不斷的發(fā)展,不斷豐富了網(wǎng)絡(luò)信息資源和學(xué)術(shù)資源,為用戶的檢索提供了方便。
然而,這樣豐富的資源,卻往往缺乏了對(duì)信息的管理和組織。
第一,信息過多。由于用戶尋求的信息過多,在大量的信息當(dāng)中,用戶經(jīng)常會(huì)在信息當(dāng)中迷失方向。
第二,信息的類型多種多樣。除了文本信息之外,數(shù)字圖書館信息還具有音頻、視頻等方面的信息,這些信息的管理需要管理人員具備一定的專業(yè)水平。
第三,信息更新速度較快。由于信息更新的速度較快,并具有較強(qiáng)的實(shí)時(shí)性,因此,必須拋棄原有的人工標(biāo)引工作。
圖書館檢索工具是在網(wǎng)絡(luò)信息資源以及數(shù)字圖書館信息資源利用和檢索的基礎(chǔ)上,通過構(gòu)建完整的檢索平臺(tái),將各種信息進(jìn)行檢索。建設(shè)數(shù)字圖書館,首先需要對(duì)網(wǎng)絡(luò)信息資源進(jìn)行全面搜集,并進(jìn)行有效利用。本文主要針對(duì)如何在數(shù)字圖書館建設(shè)的過程中利用相關(guān)工具,對(duì)網(wǎng)絡(luò)信息資源進(jìn)行分類和標(biāo)引。
搜索引擎是人們使用到最重要的應(yīng)用之一,在如此繁多的因特網(wǎng)信息中,人們能利用搜索引擎找到自己所需要的信息,因此該原理受到了人們的喜愛。然而,目前搜索引擎最大的缺點(diǎn)就在于引擎并沒有經(jīng)過人工干預(yù),因此搜索得出的信息質(zhì)量往往不高。為此,應(yīng)該將引擎與人工檢索相結(jié)合,從而更好地對(duì)信息資源進(jìn)行組織。
舉個(gè)例子,目前雅虎在信息檢索方面具有較為豐富的經(jīng)驗(yàn)。其主要的分類是采用人工標(biāo)引的方式進(jìn)行,從而能有效提高信息檢索的精確度,為用戶提供更多更好的服務(wù)。圖書館工作人員在長(zhǎng)期的工作過程中,積累了豐富的圖書資源分類經(jīng)驗(yàn),從而為信息資源的分類作出了重要的貢獻(xiàn)。但是目前僅靠這樣的人工標(biāo)引方式是不正確的,必須要結(jié)合信息檢索工具。
除了上述的搜索引擎之外,圖書館檢索工具還應(yīng)該包括圖書館獨(dú)立的檢索平臺(tái)。圖書館檢索工具是一種基于網(wǎng)絡(luò)資源和素質(zhì)的信息資源庫(kù),為用戶提供不同類型的檢索系統(tǒng)。下文進(jìn)行詳細(xì)的分析。
3.2.1 網(wǎng)絡(luò)收集功能
圖書館獨(dú)立的檢索工具,能夠有效利用外界的搜索引擎將信息進(jìn)行收集和過濾。這種過濾方式主要將人工編制的目錄進(jìn)行儲(chǔ)存,并收入網(wǎng)絡(luò)信息資源庫(kù)。其主要功能包括:
第一,跨圖書館進(jìn)行檢索。用戶可以在檢索的過程中選定多個(gè)資源庫(kù)。在擇資源數(shù)據(jù)庫(kù)的時(shí)候,將以往的檢索方式運(yùn)用到不同資源庫(kù)的信息檢索當(dāng)中。
第二,支持全文檢索。全文檢索是一種新興的檢索方法,進(jìn)行搜集時(shí),遇到任意一個(gè)網(wǎng)站的時(shí)候,檢索工具可以將網(wǎng)絡(luò)信息進(jìn)行標(biāo)引,并儲(chǔ)存到信息資源庫(kù)上。用戶可以通過搜索相應(yīng)的關(guān)鍵字,從而找出匹配的結(jié)果。
第三,提供多種途徑進(jìn)行檢索。用戶可以進(jìn)行自然語言、關(guān)鍵詞等方面的檢索,檢索工具還能夠?qū)⒕哂袡z索意義的詞語進(jìn)行保存,為用戶提供更加方便準(zhǔn)確的檢索結(jié)果。
第四,多媒體檢索。在提供檢索的相關(guān)資源上,對(duì)文本信息進(jìn)行服務(wù)檢索,檢索的對(duì)象可以有圖像、聲頻或視頻。
第五,目錄分類結(jié)構(gòu)。該結(jié)構(gòu)有利于非專業(yè)用戶進(jìn)行檢索。舉個(gè)例子,某高校圖書館的分類項(xiàng)目非常廣泛,除了具有網(wǎng)絡(luò)資源之外,還會(huì)在高校圖書館的收藏中進(jìn)行資源的數(shù)字化服務(wù)。
3.2.2 結(jié)果顯示功能
除了具有網(wǎng)絡(luò)收集功能之外,檢索工具還具有結(jié)果顯示功能,其主要體現(xiàn)在于,數(shù)字圖書館可以按照時(shí)間先后進(jìn)行排序,用戶也可以對(duì)相關(guān)排序進(jìn)行選擇。當(dāng)檢索的關(guān)鍵詞符合越多,其在文章中出現(xiàn)的次數(shù)也就越多,則表明了該內(nèi)容與客戶檢索的內(nèi)容相符程度越高。
3.2.3 結(jié)果顯示格式統(tǒng)一
數(shù)字圖書館系統(tǒng)必須使用統(tǒng)一的檢索局面,對(duì)檢索的結(jié)果進(jìn)行分類和分層次分析。當(dāng)用戶搜索之后,顯示的結(jié)果要對(duì)符合的題錄或關(guān)鍵詞、甚至將摘要信息進(jìn)行標(biāo)記。用戶在瀏覽題錄后,再進(jìn)一步選擇是否需要下載全文。
3.2.4 超文本鏈接
在顯示結(jié)果當(dāng)中,要對(duì)全文的一些主題詞提供相應(yīng)的超鏈接,讓用戶能通過這些超鏈接進(jìn)行更多知識(shí)的了解。其中包括以下兩個(gè)方面。
第一,搜索和鏈接。當(dāng)用戶輸入相關(guān)網(wǎng)址之后,若沒有限制的話,則會(huì)出現(xiàn)成千上萬個(gè)網(wǎng)址,這樣的搜索是非常麻煩的,非常浪費(fèi)時(shí)間。因此,檢索工具應(yīng)該要進(jìn)行過濾,對(duì)不必要的網(wǎng)址進(jìn)行過濾,從而將檢索的結(jié)果精簡(jiǎn)化。在工作的過程中,工作人員可以對(duì)原始網(wǎng)址的源文件進(jìn)行讀入,若發(fā)現(xiàn)具有符合要求的格式,則進(jìn)一步檢查網(wǎng)頁(yè)的元數(shù)據(jù)是否已經(jīng)存入數(shù)據(jù)庫(kù)當(dāng)中。并在有需要的數(shù)據(jù)庫(kù)當(dāng)中加入新的網(wǎng)址或元素。然后,工作人員要將其中一個(gè)網(wǎng)址去除,并對(duì)網(wǎng)頁(yè)中的元數(shù)據(jù)和鏈接進(jìn)行搜索。整個(gè)過程周而復(fù)始,直到能將地址隊(duì)列中的網(wǎng)址都搜索完畢,在搜索完畢之后,通過人工進(jìn)行選定,將有效的數(shù)據(jù)規(guī)定在一定的范圍之內(nèi),從而建立超鏈接。
第二,索引和檢查。因特網(wǎng)的任何網(wǎng)頁(yè)都符合檢索的內(nèi)容和范圍之內(nèi),應(yīng)用檢索技術(shù)對(duì)相關(guān)關(guān)鍵詞進(jìn)行分析和記錄,工作人員將檢索的記錄進(jìn)行檢查,并確定檢索的記錄是否符合標(biāo)準(zhǔn),并將其添加到資源庫(kù)當(dāng)中。此外,在檢索的過程中,還應(yīng)該對(duì)檢索工具進(jìn)行標(biāo)記,從而顯示出檢索的結(jié)果。
本文通過對(duì)網(wǎng)絡(luò)搜索引擎技術(shù),對(duì)建立數(shù)字圖書館檢索工具提出幾點(diǎn)設(shè)想和建議。除了檢索工具要進(jìn)一步發(fā)展之外,還應(yīng)該建立信息豐富的資源庫(kù),從而使圖書館的結(jié)構(gòu)模型不斷構(gòu)建和完善,以此作為支撐,在開發(fā)數(shù)字圖書館工具的過程中,工作人員必須要注重結(jié)構(gòu)的兼容性、公共性等。此外,圖書館檢索工具還應(yīng)該不斷更新發(fā)展,從而與外界的搜索引擎和其他程序開發(fā)商的程序相結(jié)合,在堅(jiān)持搜索原則的同時(shí),必須要加強(qiáng)檢索信息的描述和交流。
[1]沈素梅.數(shù)字圖書館檢索工具探析[J].內(nèi)蒙古圖書館工作,2009.06.02.
[2]全濤.數(shù)字圖書館檢索工具初探[J].科技創(chuàng)新導(dǎo)報(bào),2008.06.18.
[3]段其憲,時(shí)永梅.網(wǎng)絡(luò)檢索工具的比較研究[J].情報(bào)科學(xué),2008.03.06.
[4]王小蘭.淺析數(shù)字圖書館檢索工具及其功能[J].江西圖書館學(xué)刊,2007.32.01.
[5]劉迎紅.淺析數(shù)字圖書館的特點(diǎn)與功能[J].現(xiàn)代企業(yè)教育,2006.03.09.
任玉珍(1964.06.19),女,漢族,山東省煙臺(tái)人,本科,館員,主要研究方向(或工作方向):圖書館管理、圖書情報(bào)。