●陳全平
(1.南開大學(xué) 信息資源管理系,天津 300071;2.東莞松山湖圖書館,廣東 東莞 523808)
特色數(shù)據(jù)庫是依托館藏或可獲得信息資源,針對用戶的信息需求,對某一學(xué)科或某一專題有利用價值的信息進(jìn)行收集、分析、評價、處理、存儲,并按照一定標(biāo)準(zhǔn)和規(guī)范將本館或可獲得的特色資源數(shù)字化,以滿足用戶個性化需求的信息資源庫。[1]隨著專業(yè)細(xì)化、學(xué)科交叉、知識爆炸的信息社會的快速發(fā)展,特色數(shù)據(jù)庫有助于及時、準(zhǔn)確、高效地獲取專業(yè)信息。
我國特色數(shù)據(jù)庫建設(shè)始于20世紀(jì)90年代,特色數(shù)據(jù)庫的建設(shè)經(jīng)歷了萌芽起步階段(1995年前)、穩(wěn)步發(fā)展階段(1996—2000年)、快速發(fā)展階段(2000年后)三個階段。[2]特色數(shù)據(jù)庫的名稱源于自建數(shù)據(jù)庫這個概念。在萌芽起步階段,各級別的專業(yè)及綜合性情報(bào)機(jī)構(gòu)初期依托館藏,著眼于自建數(shù)據(jù)庫建設(shè),誕生了一批書目型和文摘型專業(yè)文獻(xiàn)數(shù)據(jù)庫;在穩(wěn)步發(fā)展階段,“中國高等教育文獻(xiàn)保障系統(tǒng)”和全國文化共享工程項(xiàng)目的啟動,又誕生一批各具特色的書目型、文摘型數(shù)據(jù)庫和少量全文型數(shù)據(jù)庫;快速發(fā)展階段,在以上基礎(chǔ)上增加圖文等多媒體型數(shù)據(jù)庫,一些軟件公司專門針對圖書館自建特色數(shù)據(jù)庫的工作,提供一些數(shù)據(jù)庫的發(fā)布工具,如清華同方TPI、易寶北信TRS、國圖數(shù)字DIPS、北大方正DESi等,這些軟件工具為圖書館自己建設(shè)數(shù)據(jù)庫帶來了很大的便利。截至目前,全國建設(shè)了一大批各具特色的數(shù)據(jù)庫,從規(guī)模上看,比較大的數(shù)據(jù)庫群有中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)“十五”全國高校專題特色數(shù)據(jù)庫,公共圖書館依托全國文化共享工程項(xiàng)目和通過自建等建設(shè)的特色數(shù)據(jù)庫,[3]區(qū)域合作建設(shè)如天津高等教育文獻(xiàn)信息中心建設(shè)的包括“動植物病害智能診斷專家系統(tǒng)”等14個特色數(shù)據(jù)庫[4]的數(shù)據(jù)庫群。從內(nèi)容上看,比較有代表性的是反映高校特色[5](學(xué)科、專業(yè)等)、民族特色[6]、地方特色[7]、企業(yè)特色[8]、需求特色[9]等的數(shù)據(jù)庫,涉及范圍廣,覆蓋的主題眾多。然而,在特色數(shù)據(jù)庫的建設(shè)中還存在一些問題,如建設(shè)意識、開發(fā)水平、地區(qū)分布不平衡等,因此,無論是從原則的制訂和把握上,還是從實(shí)際的采集、加工、發(fā)布和利用上,都有值得進(jìn)一步研究和探討的必要,特別是針對存在的問題找到相應(yīng)的對策是具有重要意義的。本文擬從國內(nèi)特色數(shù)據(jù)建設(shè)中存在的問題出發(fā),探討研究相應(yīng)的對策,以期與同行交流。
主要表現(xiàn)為:①從規(guī)模上看,一是特色數(shù)據(jù)庫建設(shè)主體單位的數(shù)量和比例偏小,二是各建設(shè)主體單位間的數(shù)量比例不均衡,高校圖書館表現(xiàn)積極,所占比例較大。[3,5]②從建設(shè)主體上看,特色數(shù)據(jù)庫建設(shè)由誰承擔(dān)和由誰組織缺乏統(tǒng)一的權(quán)威機(jī)構(gòu)來統(tǒng)籌規(guī)劃解決。③從認(rèn)識上看,特色數(shù)據(jù)庫建設(shè)主體單位或建設(shè)者們對特色這個概念在一開始就缺乏一個清晰或者基本統(tǒng)一的認(rèn)識和理解,存在許多誤區(qū),導(dǎo)致特色數(shù)據(jù)庫建設(shè)沿不同方向進(jìn)行,常常存在找不準(zhǔn)方向、找不到重點(diǎn)、找不到特色等現(xiàn)象,有時即使已經(jīng)開發(fā)建設(shè)了特色數(shù)據(jù)庫,但常常存在對特色資源的挖掘不深,滿足于表面內(nèi)容或華麗的外表。④由于特色數(shù)據(jù)庫的特殊性(使用范圍、使用對象和采用的技術(shù)等),對于特色數(shù)據(jù)庫的評價缺少或沒有比較一致認(rèn)可的指標(biāo)體系和方案,從而影響了特色數(shù)據(jù)庫建設(shè)的熱情和動力,常常出現(xiàn)建設(shè)期間熱情高漲,維護(hù)期間偃旗息鼓甚至慘遭廢棄或淘汰。
主要表現(xiàn)為:①從數(shù)據(jù)量上看,數(shù)據(jù)庫規(guī)模小,專業(yè)面窄,數(shù)據(jù)量不足,文獻(xiàn)收藏覆蓋面(時間范圍、內(nèi)容范圍)不全,以本單位收藏為主,以網(wǎng)上資源為輔,館藏聯(lián)合數(shù)據(jù)所占比例較小。②從文獻(xiàn)類型上看,文獻(xiàn)類型單一,書目、題錄類型信息多,全文、圖片、音頻、視頻等類型較少。③從數(shù)據(jù)標(biāo)引上看,原始信息不全,特殊文獻(xiàn)標(biāo)引的規(guī)范性和準(zhǔn)確性不夠(原因一是根據(jù)規(guī)范標(biāo)引時,本身難度大,二是有時無規(guī)范可用時,需要自定義),缺乏數(shù)據(jù)質(zhì)量控制(即使使用統(tǒng)一標(biāo)準(zhǔn)和規(guī)范,但在相關(guān)度和深度上因人或單位而異,數(shù)據(jù)內(nèi)容缺乏評價標(biāo)準(zhǔn)),標(biāo)引中也存在人為原因?qū)е碌腻e誤。④從資源組織上看,由于缺少現(xiàn)成的、標(biāo)準(zhǔn)的分類體系和主題詞表,要形成科學(xué)、合理、符合用戶習(xí)慣的分類組織體系及方便的主題瀏覽檢索體系比較困難,從而使嚴(yán)密的知識組織體系的形成或構(gòu)建變得更為艱難。⑤從信息服務(wù)功能上看,文獻(xiàn)揭示深度不足,資源加工整合力度欠缺,缺乏信息增值服務(wù),檢索功能(檢索途徑或檢索式構(gòu)造、檢索結(jié)果處理)不強(qiáng),一站式檢索功能不足。⑥從整體開發(fā)水平上看,有處于初級或雛形階段的,有處于發(fā)展和成熟階段的,層次不齊,并且技術(shù)選型上也存在一定差異,數(shù)據(jù)庫接口不規(guī)范、互操作性不強(qiáng)是常見的問題。
主要表現(xiàn)為:①從選題主題來看,公共圖書館的選題反映地方經(jīng)濟(jì)、政治、參考決策等內(nèi)容的數(shù)據(jù)庫偏少,高校圖書館的選題反映地區(qū)特色或地區(qū)某一領(lǐng)域特點(diǎn)的偏少,科學(xué)院(所)圖書館和專業(yè)及綜合情報(bào)服務(wù)機(jī)構(gòu)反映新型產(chǎn)業(yè)和行業(yè)發(fā)展的數(shù)據(jù)庫偏少。②從選題分布來看,存在重復(fù)建設(shè)、缺乏協(xié)作和區(qū)域發(fā)展不平衡等問題;③科學(xué)院(所)圖書館和專業(yè)及綜合情報(bào)服務(wù)機(jī)構(gòu)(包括商業(yè)數(shù)據(jù)公司)大多依托本單位的和可獲得的資源建設(shè)面向各行業(yè)的特色數(shù)據(jù)庫,但由于盈利和非盈利之差異,使得特色數(shù)據(jù)庫的質(zhì)量和服務(wù)存在較大差異,在一定程度上也影響使用范圍和使用效果。
主要表現(xiàn)為:①軟件平臺層次不齊,有自主開發(fā)的,有合作開發(fā)的,也有購買成熟商業(yè)軟件的,但有時缺少統(tǒng)一如標(biāo)引系統(tǒng)、檢索系統(tǒng)、操作系統(tǒng)、功能指標(biāo)等方面的標(biāo)準(zhǔn)和共同遵守的如標(biāo)引、分類、檢索點(diǎn)選擇等方面的規(guī)范,其中對重復(fù)數(shù)據(jù)(同一個數(shù)據(jù)庫的數(shù)據(jù)重復(fù)、不同數(shù)據(jù)數(shù)據(jù)庫的數(shù)據(jù)重復(fù))處理、文檔格式(包括文獻(xiàn)數(shù)字化后的文檔格式和文獻(xiàn)加工后的文檔格式)處理缺乏相應(yīng)的控制機(jī)制。②即使制訂了一些標(biāo)準(zhǔn)和規(guī)范,但在執(zhí)行中或多或少存在一些差異,而且這些標(biāo)準(zhǔn)和規(guī)范不能覆蓋所有特色文獻(xiàn),需要自行制訂相應(yīng)的操作規(guī)范,由此帶來更多差異。
主要表現(xiàn)為:特色數(shù)據(jù)庫的數(shù)據(jù)來源大部分涉及到知識產(chǎn)權(quán)問題,文獻(xiàn)數(shù)字化復(fù)制性質(zhì)導(dǎo)致的數(shù)字化文獻(xiàn)的著作權(quán)等問題,網(wǎng)絡(luò)資源的加工利用帶來的版權(quán)問題,現(xiàn)有法律條例無法適應(yīng)文獻(xiàn)信息資源網(wǎng)絡(luò)化發(fā)展的要求問題,由此而導(dǎo)致的文獻(xiàn)資源作者、建設(shè)者、利用者合法權(quán)益的合理合法解決問題等,都是特色數(shù)據(jù)庫建設(shè)、使用中不能回避的問題。②特色數(shù)據(jù)庫的自主權(quán)或知識產(chǎn)權(quán),如數(shù)據(jù)庫軟件、數(shù)據(jù)庫數(shù)據(jù)等保護(hù)是一個容易被忽視的問題,需要從法律、運(yùn)營、技術(shù)三方面考慮和解決,使特色數(shù)據(jù)庫成果得到合理合法地使用和保護(hù)。
主要表現(xiàn)為:特色數(shù)據(jù)庫建設(shè)初期宣傳力度大,有一定使用效果和社會效益,但建設(shè)中后期缺少宣傳和培訓(xùn),加上使用中或多或少的限制,其利用率不高,影響力小,造成“養(yǎng)在深閨人未識”的窘境,形成資源有特色而利用效果不好的局面。因此,適時引入有效機(jī)制甚至是市場營銷的各種策略和手段,對特色數(shù)據(jù)庫推而廣之,樹立品牌,使更多的用戶了解與利用,達(dá)到社會效益最大化。
主要表現(xiàn)為:①有合作協(xié)議,因協(xié)議的可操作性不強(qiáng),在實(shí)際運(yùn)轉(zhuǎn)過程中存在很多困難。② 有合作愿望,因合作單位間存在人員、技術(shù)和基礎(chǔ)條件的差異,對合作缺乏信心或缺乏合作積極性。③有利益雙贏意愿,因分工不明確和不公,利益存在沖突或難以協(xié)調(diào),合而不作或者享而不建是合作中常出現(xiàn)的問題。④合作的統(tǒng)一管理機(jī)構(gòu)缺失,或者即使有,常缺乏權(quán)威或有效的行政權(quán)利和手段來組織合作建設(shè)。
(1)財(cái)力、物力、人力的投入是軟硬基礎(chǔ)設(shè)施的保障。特色數(shù)據(jù)庫不論規(guī)模大小、技術(shù)難易程度、建設(shè)周期長短、開發(fā)主體和使用對象各異,均需要一定的量的投入,包括設(shè)備、場地、人員、管理及各類型文獻(xiàn)信息資源等方面,而且進(jìn)行特色數(shù)據(jù)庫的后續(xù)維護(hù)、數(shù)據(jù)更新等又需要持續(xù)不斷地投入。如CALIS管理中心設(shè)有專項(xiàng)資金資助,但各承建單位也提供了配套資金或人力物力進(jìn)行建設(shè),特別是后期投入是特色數(shù)據(jù)保持其生命力長久的重要因素。投入是特色數(shù)據(jù)庫建設(shè)任何階段必要的“動力”,因此,多途徑爭取投入是特色數(shù)據(jù)庫建設(shè)的首要任務(wù)。
(2)特色數(shù)據(jù)庫資源建設(shè)意識是特色數(shù)據(jù)庫建設(shè)獲得支持的保障。意識有多高,重視程度就有多強(qiáng),意識源于數(shù)據(jù)庫事業(yè)發(fā)展的需要和市場需求。各級公共圖書館主管部門領(lǐng)導(dǎo)和圖書館領(lǐng)導(dǎo)、高校圖書館主管領(lǐng)導(dǎo)和圖書館領(lǐng)導(dǎo)的高度重視及圖書館的廣大工作人員的熱情和努力促進(jìn)了特色數(shù)據(jù)庫的建設(shè)。如在全國文化共享工程和CALIS工程的項(xiàng)目推動下,出現(xiàn)了一批高質(zhì)量的特色數(shù)據(jù)庫;高校圖書館根據(jù)館藏情況和用戶需求建設(shè)了一批各具特色的數(shù)據(jù)庫。強(qiáng)烈的事業(yè)意識、責(zé)任意識、服務(wù)意識是特色數(shù)據(jù)庫建設(shè)獲得支持的強(qiáng)有力保障,因此,需要以項(xiàng)目為載體、以成效回報(bào)政府或用戶,逐步將這些意識滲透到文化部門各級領(lǐng)導(dǎo)、特色數(shù)據(jù)庫建設(shè)主體單位領(lǐng)導(dǎo)和建設(shè)人員。
(3)一群具有高素質(zhì)的建設(shè)人才是高質(zhì)量完成特色數(shù)據(jù)庫的保障。特色數(shù)據(jù)庫的建設(shè)表明,要完成高質(zhì)量的特色數(shù)據(jù)庫建設(shè),除需要與普通數(shù)據(jù)庫建設(shè)需求的專業(yè)型高素質(zhì)人才外,還需要具有對特色數(shù)據(jù)庫所涉及的文獻(xiàn)有一定研究和造詣的專業(yè)技術(shù)人員、專家和具備一定管理和協(xié)調(diào)能力的優(yōu)秀管理人員。因此,需要提供優(yōu)質(zhì)工作環(huán)境和出臺人才吸引政策,從而招到合適人才、培養(yǎng)有用人才和有效管理人才,以期滿足特色數(shù)據(jù)庫高質(zhì)量建設(shè)的要求。
(4)先進(jìn)的技術(shù)平臺是特色數(shù)據(jù)庫發(fā)揮有效作用的保障。特色數(shù)據(jù)庫的開發(fā)要采用先進(jìn)、實(shí)用、合乎數(shù)據(jù)庫特點(diǎn)的技術(shù)標(biāo)準(zhǔn)、技術(shù)規(guī)范、技術(shù)平臺,以確保開發(fā)出來的特色數(shù)據(jù)庫具有較強(qiáng)的可擴(kuò)展性、可移植性、易用性、易維護(hù)性等。因此,采用的先進(jìn)技術(shù)平臺提供的相應(yīng)功能要能夠滿足使用對象的需求,能充分挖掘特色數(shù)據(jù)庫的信息資源,特別是其中的關(guān)鍵技術(shù)的采用和應(yīng)用要合理科學(xué),如超大規(guī)模內(nèi)容數(shù)據(jù)的管理技術(shù)、多媒體技術(shù)、人工智能技術(shù)、XML技術(shù)等。
(1)選題是特色數(shù)據(jù)庫開發(fā)方向正確的關(guān)鍵。好的選題一方面要體現(xiàn)特色,另一方面要有明確的使用對象。好的選題是在充分調(diào)查、研究、分析、比較的基礎(chǔ)上確定的,好的選題是數(shù)據(jù)庫開發(fā)成功的一半。特色數(shù)據(jù)庫選題應(yīng)遵循需求第一、特色為重、優(yōu)勢互補(bǔ)、先易后難、不重復(fù)建設(shè)的總原則。
(2)獨(dú)特性是特色數(shù)據(jù)庫的靈魂所在。特色數(shù)據(jù)庫的特色一方面要體現(xiàn)內(nèi)容獨(dú)到、精辟和有風(fēng)格,別具一格;另一方面要體現(xiàn)內(nèi)容的價值和生命力,以形成具有權(quán)威性的高價值的特色數(shù)據(jù)庫。獨(dú)特性是特色數(shù)據(jù)庫區(qū)別于其他數(shù)據(jù)庫的標(biāo)志。
(3)服務(wù)是特色數(shù)據(jù)庫開發(fā)的根本。一方面要通過宣傳、培訓(xùn)推廣特色數(shù)據(jù)庫,讓更多的用戶知道、了解并且學(xué)會使用特色數(shù)據(jù)庫,為特色數(shù)據(jù)庫找到最佳用戶;另一方面要能為有需求的用戶提供最佳的產(chǎn)品和服務(wù),提供滿足需求的服務(wù)是特色數(shù)據(jù)庫建設(shè)目的所在,是其生存延續(xù)和可持續(xù)發(fā)展所在。注重特色數(shù)據(jù)庫的附加值,提供信息增值服務(wù)是特色數(shù)據(jù)庫發(fā)展創(chuàng)新的方向之一;對于涉及信息增值服務(wù)和鏈接獲取原文需要付費(fèi)的還要提供配套的、便利的費(fèi)用計(jì)算和收取服務(wù)。
(4)建設(shè)是特色數(shù)據(jù)庫服務(wù)的重要支撐。特色數(shù)據(jù)庫建設(shè)帶來了提供特色服務(wù)的機(jī)會,然而其建設(shè)是一個長期的、系統(tǒng)的復(fù)雜工程,后續(xù)維護(hù)和更新是特色數(shù)據(jù)庫保持旺盛生命力的關(guān)鍵。因此,特色數(shù)據(jù)庫建設(shè)要想可持續(xù)發(fā)展,就必須要走聯(lián)合、協(xié)作、共建共享之路。
(1)共建是特色數(shù)據(jù)庫大規(guī)模和高質(zhì)量的關(guān)鍵。特色數(shù)據(jù)庫建設(shè)有多種方式,共建帶來了合作,可以帶動更多的單位參與建庫工作,獲得共同發(fā)展的機(jī)會,共建可以使特色數(shù)據(jù)庫建設(shè)得更為完善、全面,為使特色數(shù)據(jù)庫做大做強(qiáng)和更具特色提供機(jī)會。因此,在資源和技術(shù)等全球化、用戶需求多元化背景之下,不論單個共建單位之間,還是區(qū)域內(nèi)的共建單位聯(lián)盟都要將共建理念、共建規(guī)劃、共建制度、共建框架、共建實(shí)施、共建控制、共建評價等方面落到實(shí)處,要有切實(shí)可行的操作方案。
(2)共享是特色數(shù)據(jù)庫建設(shè)充分發(fā)揮功能和價值的靈魂。共享是共建的目的之一,共建為共享提供了可能。共享是當(dāng)今網(wǎng)絡(luò)信息時代文獻(xiàn)信息資源發(fā)展和用戶市場需求發(fā)展的必然要求;共享節(jié)約了特色數(shù)據(jù)庫開發(fā)、維護(hù)、使用成本;共享能讓更多的用戶參與到數(shù)據(jù)庫的建設(shè)中來,如通過用戶反饋信息,改進(jìn)特色數(shù)據(jù)庫建設(shè),促進(jìn)提高特色數(shù)據(jù)庫質(zhì)量。因此,要合理、合法、有效地?cái)U(kuò)大特色數(shù)據(jù)庫使用范圍,巧妙規(guī)避相關(guān)政策和規(guī)定及與知識產(chǎn)權(quán)相關(guān)的條款限定,使更多的用戶享受特色數(shù)據(jù)庫建設(shè)成果。
(3)協(xié)作是特色數(shù)據(jù)庫有效建設(shè)和高質(zhì)量的根本。統(tǒng)一的規(guī)劃和宏觀管理,統(tǒng)一的組織結(jié)構(gòu)和規(guī)章制度是有效開展共建特色數(shù)據(jù)庫的前提,而協(xié)調(diào)管理也是至關(guān)重要的,良好的協(xié)作能產(chǎn)生協(xié)同效應(yīng)。因此要做到:建立合作組織結(jié)構(gòu)和規(guī)章制度,遵守合作協(xié)議和規(guī)定;建立權(quán)威性協(xié)作協(xié)調(diào)機(jī)構(gòu),安排專職協(xié)調(diào)人員管理;建立交流和溝通機(jī)制,保證合作中信息交流通暢。促使特色數(shù)據(jù)庫的建設(shè)高效、完善。
(4)發(fā)展是特色數(shù)據(jù)庫生命力和活力的重要支撐,其特點(diǎn)是體現(xiàn)一個“特”字,強(qiáng)調(diào)一個“專”字,重在一個“用”字,求在一個“新”字。不論特色數(shù)據(jù)庫是處于籌建期、建設(shè)中,還是處于使用中和維護(hù)期,特色數(shù)據(jù)庫的開發(fā)技術(shù)應(yīng)以實(shí)用為原則,選擇最新最適宜的技術(shù);數(shù)據(jù)庫類型應(yīng)從文本型、書目型、文摘型等常見的類型逐步過渡到圖文并茂、聲像俱全的多媒體類型;數(shù)據(jù)庫內(nèi)容應(yīng)保持一定的更新頻率,提供更方便的利用形式。任何數(shù)據(jù)庫都存在一個生命周期,即包括構(gòu)思、規(guī)劃、開發(fā)、應(yīng)用發(fā)展、消亡等階段,特色數(shù)據(jù)庫也不例外??傊厣珨?shù)據(jù)庫只有處于不斷發(fā)展中才具有較強(qiáng)的生命力和活力,才能更好地為用戶提供獨(dú)到的優(yōu)質(zhì)服務(wù),否則就可能遭到被淘汰從而消亡的命運(yùn)。
[1]范亞芳,郭太敏.特色數(shù)據(jù)庫建設(shè)若干問題研究[J].情報(bào)理論與實(shí)踐,2008(4):550-553.
[2]王小瓊.我國圖書情報(bào)系統(tǒng)自建特色數(shù)據(jù)庫研究概述 [J].現(xiàn)代情報(bào),2007(12):28-30.
[3]覃鳳蘭.公共圖書館特色數(shù)據(jù)庫建設(shè)調(diào)查分析及對策研究[J].圖書情報(bào)工作,2009(8):83-87.
[4]李凌杰.天津市高校圖書館特色數(shù)據(jù)庫建設(shè)現(xiàn)狀與分析 [J].圖書館工作與研究,2008(9):71-74.
[5]肖乃菲.西南地區(qū)高校圖書館特色數(shù)據(jù)庫建設(shè)的現(xiàn)狀與分析[J].圖書館工作與研究,2009(1):45-48.
[6]蘇萍.構(gòu)建維吾爾語言文學(xué)專業(yè)特色數(shù)據(jù)庫[J].圖書情報(bào)工作,2006(S2):97,100-101.
[7]馬莎,等.攀枝花蘇鐵特色數(shù)據(jù)庫建設(shè)[J].圖書館,2007(5):107,110.
[8]勾學(xué)海,等.吉林省企業(yè)競爭情報(bào)系統(tǒng)特色數(shù)據(jù)庫建設(shè)研究 [J].情報(bào)科學(xué),2005(5):730-737.
[9]高建林,等.基于Internet的“廉政文化研究”特色數(shù)據(jù)庫模型架構(gòu)的設(shè)計(jì)與開發(fā)[J].圖書館學(xué)研究,2009(11):20-24.