汪初蕓 蘇建華
〔摘 要〕相較紙質(zhì)資源電子資源具有數(shù)量大、更新快、載體形式多樣等特點,且大部分數(shù)據(jù)庫商能夠提供原始數(shù)據(jù)。這些特點決定了對電子資源編目需采取不同的策略:確定編目對象和級別、選擇編目方式、數(shù)據(jù)審查檢驗及批量導入。因此圖書館必須在統(tǒng)一標準的指引下采取科學的辦法,注重數(shù)據(jù)質(zhì)量控制、評估資源發(fā)現(xiàn)系統(tǒng)的影響、開展聯(lián)合編目才能保證電子資源編目數(shù)據(jù)的質(zhì)量。
〔關(guān)鍵詞〕圖書館;電子資源;編目;研究進展;書目數(shù)據(jù);質(zhì)量控制
DOI:10.3969/j.issn.1008-0821.2016.04.025
〔中圖分類號〕G254.36 〔文獻標識碼〕A 〔文章編號〕1008-0821(2016)04-0134-03
〔Abstract〕Compared with traditional paper resources,electronic resources have such characteristics as huge quantity,rapid update,a variety of manifestations,and most database suppliers can provide the original data.The electronic resource cataloging need to adopt different cataloging strategies:determining the object and the level of the catalogs,selecting a way of cataloging,checking the data and processing them batch by batch.The academic libraries should adopt scientific approach under a unified standard,pay attention to data quality control,evaluating the influence of resource discovery system,carrying out cooperative cataloging to ensure the quality of electronic resources cataloging data.
〔Key words〕library;electronic resources;cataloging;research process;bibliographic data;quality control
隨著現(xiàn)代網(wǎng)絡(luò)和通信技術(shù)的發(fā)展,電子媒體和資源已經(jīng)成為人們獲取資訊的重要渠道,成為圖書館購買資源的重要來源,大有取代紙質(zhì)資源的勢頭。以筆者所在西南政法大學圖書館為例,年訂購的中外文印刷型期刊僅為1 600余種,而電子期刊有2萬多種,電子資源尤其是期刊已占據(jù)了圖書館資源的大半壁江山,這種變化促使圖書館必須將電子資源的編目提上日程。怎樣快速對大量電子資源進行編目以及如何有效維護MARC記錄中電子資源856字段URL的有效性,一直是困擾圖書館界的現(xiàn)實問題。本文考察了國內(nèi)外進行電子資源編目圖書館的最新實踐,試圖歸納總結(jié)探討電子資源編目的有效方法。
1 國內(nèi)外文獻研究綜述
國內(nèi)對電子資源編目的研究較少,只有少數(shù)幾個實力較強的圖書館做了實踐和理論探索:這幾個圖書館中清華大學圖書館的實踐和研究起步較早:先后有多篇文章介紹電子資源編目實踐中的一些具體方法,賈延霞等分好幾篇文章詳細介紹了中文電子圖書和電子期刊批量編目的具體實踐;北京大學圖書館的王亞林介紹了該館電子資源編目策略:即對有物理實體和無物理實體的電子資源分別做完全級和非完全級編目[1],上海交通大學圖書館采用圖書館管理系統(tǒng)自帶的批量處理功能實現(xiàn)了對各類電子資源的編目。
從國外的研究文獻看,電子資源編目主要工具為MarcEdit、圖書館管理系統(tǒng)自帶的批量處理功能以及Excel等,這三者結(jié)合就能實現(xiàn)對電子資源的批量導入、更新和維護。如芝加哥伊利諾伊大學使用Voyager集成管理系統(tǒng),批處理時需要先導出記錄,在系統(tǒng)外應(yīng)用MarcEdit進行批量修改,然后再重新導入系統(tǒng)。休斯敦大學圖書館使用Millennium管理系統(tǒng)、MarcEdit和Excel等對MARC記錄進行批量修改,然后再導入OPAC系統(tǒng),并利用系統(tǒng)自帶功能對系統(tǒng)記錄進行批量刪除[2]。Auraria圖書館和Wichita州立大學圖書館利用MarcEdit將開放獲取的電子書元數(shù)據(jù)及特藏資源元數(shù)據(jù)批量轉(zhuǎn)換為MARC。有調(diào)查顯示英國各圖書館大都將提供商的MARC記錄批量上載到書目管理系統(tǒng)中,但具體操作中做法不一。此外還有文獻表明國外圖書館電子資源的編目已涉及數(shù)據(jù)質(zhì)量審核、提高質(zhì)量的措施、流程管理、政策、經(jīng)驗和教訓等內(nèi)容,比如肯特州立大學圖書館、賓夕法尼亞州立大學圖書館、伊利諾伊州立大學芝加哥分校圖書館[3]??傊瑖鴥?nèi)外關(guān)于電子資源編目的實踐主要集中在利用第三方軟件批量處理MARC數(shù)據(jù)層面,對導入系統(tǒng)后的數(shù)據(jù)更新維護較少關(guān)注。
2 國內(nèi)高校電子資源編目實踐現(xiàn)狀
從上面的文獻調(diào)研可看出,國內(nèi)從事電子資源編目的圖書館并不多,清華、北大和上海交大圖書館的實踐比較典型,大部分圖書館由于技術(shù)所限對電子資源根本不做任何編目。進行編目的圖書館都是一些資金和技術(shù)力量比較雄厚的圖書館,而且都是通過批量操作:如上海交通大學圖書館采用Excel及MarcEdit對導入系統(tǒng)的數(shù)據(jù)進行校驗;清華大學圖書館采用編目員抽檢、Excel和MarcEdit軟件三者相結(jié)合的方式來校驗外部數(shù)據(jù)源。武漢大學、西安交通大學圖書館采取編目人員修改和工具批量修改相結(jié)合的方式處理數(shù)據(jù)[3],處理后再批量導入圖書館OPAC系統(tǒng),這樣檢索OPAC時可同時檢索到同一本書的印刷型和電子版書目(限于電子圖書),但查看時需要點擊電子資源進入單獨的書目,然后通過超星電子圖書鏈接獲取電子版全文(清華大學圖書館OPAC)。由于電子資源的編目數(shù)據(jù)均來源于數(shù)據(jù)庫商,標準的缺乏導致數(shù)據(jù)來源多樣化,格式多樣、質(zhì)量高低不一,這就需要人工抽檢和工具校驗同時進行,但MarcEdit等工具是基于MARC21為西文編目數(shù)據(jù)開發(fā)的,在檢驗數(shù)據(jù)有效性、字段統(tǒng)計等方面比較方便,在識別中文數(shù)據(jù)方面存在著欠缺,因此可以說國內(nèi)高校圖書館電子資源編目一開始便存在著不少問題。
2.1 數(shù)據(jù)來源多樣,數(shù)據(jù)質(zhì)量參差不齊
信息技術(shù)的發(fā)展使得電子資源的類型越來越多,電子期刊、電子圖書、視頻、音頻以及復合資源不斷產(chǎn)生,不斷加大著收集和組織的難度。同時數(shù)字出版的規(guī)模呈幾何級增長,數(shù)據(jù)庫規(guī)模越來越大,收錄百萬種電子圖書和萬種電子期刊的數(shù)據(jù)庫屢見不鮮,如中文電子圖書和期刊的業(yè)界翹楚讀秀和CNKI。面對如此眾多的電子資源,數(shù)據(jù)庫商收錄出版時也不能完全按照標準統(tǒng)一處理,因此提供給圖書館的數(shù)據(jù)質(zhì)量也良莠不齊,數(shù)據(jù)不完整、鏈接錯誤、前后不一致都需要工作人員校對、核實甚至補充。根據(jù)清華大學多年的實踐發(fā)現(xiàn):訂購資源量與數(shù)據(jù)不匹配,數(shù)據(jù)著錄格式不規(guī)范、字段信息不準確或不全面,URL鏈接不正確等問題比比皆是[3],有些規(guī)模小的出版商甚至連MARC數(shù)據(jù)都不提供。另外電子資源更新較快,數(shù)據(jù)庫商會根據(jù)商機不斷調(diào)整數(shù)據(jù)庫內(nèi)容,如增刊、減刊、改變?nèi)母采w范圍及地址等,這些都需要圖書館管理系統(tǒng)及時發(fā)現(xiàn)和編目人員及時維護更新,如果不及時維護便會出現(xiàn)數(shù)據(jù)不一致和死鏈等情況。調(diào)研中有圖書館就表示圖書館管理系統(tǒng)功能欠缺和維護技術(shù)的不完備也是影響電子資源編目數(shù)據(jù)質(zhì)量的重要因素。
2.2 缺乏標準,編目方法靈活多樣
目前電子資源編目通常有兩種方法,一種是單獨編目,北京大學、清華大學以及香港大學均采用這種方法;另一種是將電子資源與紙質(zhì)結(jié)合,將電子資源的URL地址增加到同一紙質(zhì)資源MARC記錄的856字段中,中國人民大學就是采取這種辦法進行電子資源編目。對電子期刊則采取導航和編目兩種方式處理,前者比較簡單通用,大多數(shù)圖書館均采用前者揭示電子期刊,后者比較麻煩,主要是由于同一種電子期刊會隸屬于不同的數(shù)據(jù)庫,其URL會指向幾個數(shù)據(jù)庫,加大了編目人員維護更新856鏈接字段的難度,清華大學圖書館為了解決這一問題已經(jīng)探索出了新的辦法:首選將已有編目數(shù)據(jù)的電子期刊的856字段u子宇段中的URL全部轉(zhuǎn)換為指向電子期刊導航系統(tǒng)中該刊的地址,然后對未編目的電子期刊則用SFX知識庫的數(shù)據(jù)進行簡單編目并導入書目系統(tǒng),在不影響讀者使用的情況下再對這些數(shù)據(jù)完善補充[4]??傊壳案黟^的電子資源編目各自為政,缺乏統(tǒng)一的操作指南,這常常使得編目員處理不同電子資源數(shù)據(jù)庫時采取靈活變化的方式,客觀上導致了數(shù)據(jù)的多樣性。
3 改進國內(nèi)電子資源編目的建議
近年來,不少圖書館都引進了資源發(fā)現(xiàn)系統(tǒng),實現(xiàn)了對館藏資源的部分甚至全部覆蓋。這樣有些圖書館便不對電子資源進行編目,而是通過資源發(fā)現(xiàn)系統(tǒng)提供統(tǒng)一檢索服務(wù),比如北京師范大學、浙江大學等圖書館;但OPAC作為讀者查詢圖書館各類資源的重要途徑和常用方式,一直以來是不可或缺的,因此在OPAC中整合電子資源書目信息能極大地方便讀者使用和提高館藏資源利用率。因此怎樣將圖書館的電子資源盡可能地整合在OPAC系統(tǒng)的檢索功能里,以便更加簡便、直觀地利用是圖書館亟須解決的問題。
3.1 統(tǒng)一標準,選擇合適的編目策略
目前國內(nèi)圖書館紙質(zhì)資源編目有國圖和CALIS兩個標準,公共圖書館多用前者,高校圖書館則采用后者,但由于各館選取字段和編目員水平的差異造成各館的書目數(shù)據(jù)不完全一致。電子資源由于沒有成型的標準可遵循,各館都是按自己的需求和理解來執(zhí)行,又加之電子資源更新較快,使得電子資源書目數(shù)據(jù)更加雜亂無章,為此就需要業(yè)界共同努力實踐,制定出統(tǒng)一的編目指南,在統(tǒng)一指南的指引下開展電子資源編目。其次開展電子資源編目時必須采用合適的策略,當前國外電子資源編目主要依據(jù)《英美編目條例》的第9章、美國《國會圖書館條例解釋》及全美期刊合作編目計劃的規(guī)定,基于上述條例國外對資源編目主要采取兩種辦法:單一記錄和分散記錄編目法,前者將不同載體記錄集中著錄于一條記錄中,便于讀者理解和挑選,保證了數(shù)據(jù)的一致性,但需要大量的人工來維護記錄;后者利用數(shù)據(jù)源進行數(shù)據(jù)批量導入,編目效率較高,但會產(chǎn)生大量重復相似數(shù)據(jù),加大編目人員校驗的強度和讀者選擇的困擾。這兩種方式前者適合大型聯(lián)合編目中心使用,后者比較符合單館使用[1]。比如北京大學圖書館據(jù)此制定適合本館的電子資源編目策略:首先確定學術(shù)性電子圖書和期刊為編目對象,接著確定編目級別,對有館藏實體資源的電子資源做完全級編目(賦予分類號、索書號和主題詞),沒有的則根據(jù)需要靈活處理,然后則采用分散記錄編目法對引進電子資源進行批量導入,當數(shù)據(jù)庫內(nèi)856字段發(fā)生變化時可以批量刪改和更新。
3.2 注重數(shù)據(jù)后期維護,加強數(shù)據(jù)質(zhì)量控制
目前大部分數(shù)據(jù)庫商都能給圖書館提供MARC數(shù)據(jù),這極大減輕了編目員的工作量,但由于專業(yè)知識所限,數(shù)據(jù)商提供的數(shù)據(jù)并不能完全滿足圖書館的需要,實踐證明,國外數(shù)據(jù)商提供的數(shù)據(jù)比國內(nèi)的要規(guī)范的多,國內(nèi)數(shù)據(jù)庫提供的數(shù)據(jù)普遍存在著著錄資源不齊全、不規(guī)范、同一資源在多個數(shù)據(jù)庫出現(xiàn)等問題,尤其是鏈接數(shù)字資源地址856的z字段的形式和內(nèi)容多樣,造成讀者在OPAC中看到的信息也是多種多樣。為了保證電子資源在館藏OPAC中正確顯示,編目人員得到數(shù)據(jù)商提供的數(shù)據(jù)后必須認真分析,標記不規(guī)范或缺失的字段或子字段,制定科學合理的修改方案,尤其需要關(guān)注檢索點字段,如CNMARC的2字段、7字段、MARC21的5字段、856字段z的公共附注等[5]。同時編目人員也可同數(shù)據(jù)庫商溝通,提出圖書館所需MARC數(shù)據(jù)的格式標準,盡量從源頭上保證數(shù)據(jù)的質(zhì)量和減輕編目人員的工作量。
3.3 開發(fā)選擇適合工具,進行批量操作
電子資源種類繁多,數(shù)量巨大,對其進行逐條編目工程浩大,這就需要編目工作人員想辦法批量處理,目前數(shù)據(jù)庫商大多都給圖書館提供電子資源的Excel文件列表,這為批量編目提供了可能,但需要工具轉(zhuǎn)化軟件來執(zhí)行,北大圖書館自主開發(fā)了自動轉(zhuǎn)換程序,實現(xiàn)了Excel數(shù)據(jù)到MARC文件的轉(zhuǎn)化,批量處理時能按照MARC對各字段、子字段的要求將數(shù)據(jù)庫商提供的Excel文件的字段值標準化。清華圖書館引進了冠景公司開發(fā)的Marcpro具有數(shù)據(jù)庫文件轉(zhuǎn)換MARC文件、MARC文件轉(zhuǎn)換數(shù)據(jù)庫文件以及MARC記錄編輯修改的功能;武漢大學、東南大學、北京工業(yè)大學圖書館利用書目管理系統(tǒng)自身功能進行批量處理,這些工具的使用在減輕編目人員的工作量同時也提高了電子資源編目的速度和準確率。為保證電子資源批量編目的順利開展,筆者建議可以綜合使用多種工具檢驗:國外圖書館常用的檢驗西文書目數(shù)據(jù)的MarcEdit、MARCReport、Perl、OCLC宏命令,再加上國內(nèi)常用的Excel、商用軟件、自開發(fā)的軟件以及管理系統(tǒng)的自帶功能,上海交通大學圖書館綜合運用上述工具和Aleph系統(tǒng)實現(xiàn)了對購買的各種類型電子資源編目數(shù)據(jù)的批量導入和后期的數(shù)據(jù)更新維護。
3.4 正視資源發(fā)現(xiàn)系統(tǒng)的影響
近年來資源發(fā)現(xiàn)系統(tǒng)由于實現(xiàn)了對館藏資源的全覆蓋似乎有取代圖書館OPAC系統(tǒng)的勢頭,于是部分圖書館認為沒有必要再對電子資源進行編目,但筆者認為,作為圖書館查詢館藏的OPAC系統(tǒng)不應(yīng)退居幕后,雖然一些發(fā)現(xiàn)系統(tǒng)可以提供電子資源元數(shù)據(jù),但由于數(shù)據(jù)覆蓋面和數(shù)據(jù)質(zhì)量不高,在全面揭示本館館藏資源方面顯得有點差強人意,因此對電子資源批量編目仍是有價值和意義的。有調(diào)查發(fā)現(xiàn):部分圖書館認為資源發(fā)現(xiàn)系統(tǒng)能夠更快和大批量地實現(xiàn)電子資源規(guī)范化數(shù)據(jù)的上載,在導入數(shù)據(jù)時會優(yōu)先考慮資源發(fā)現(xiàn)系統(tǒng),編目導入OPAC系統(tǒng)則作為備選方案。筆者認為,雖然導入OPAC系統(tǒng)的數(shù)據(jù)需要編目人員花費一定的時間和精力審核和規(guī)范化處理,數(shù)據(jù)更新速度肯定不及資源發(fā)現(xiàn)系統(tǒng)迅速,但數(shù)據(jù)質(zhì)量是有保障的;資源發(fā)現(xiàn)系統(tǒng)雖然揭示資源較快,但隱含的數(shù)據(jù)質(zhì)量問題無法及時發(fā)現(xiàn),日積月累會影響圖書館編目數(shù)據(jù)的質(zhì)量。
3.5 開展聯(lián)合編目,實現(xiàn)資源共享
目前國內(nèi)的聯(lián)合編目僅限于實體資源,鮮見電子資源聯(lián)合編目的案例,而國外已有電子資源聯(lián)合編目的實踐,伊利諾伊大學芝加哥分校與伊利諾伊州學術(shù)和研究圖書館協(xié)會合作開展電子圖書編目,休斯敦大學圖書館與其他幾家圖書館共享其電子圖書,降低了各圖書館間的重復勞動[3]。國內(nèi)CALIS 在高校電子資源集團采購方面起到積極作用,但遲遲沒有開展電子資源的聯(lián)合編目。為此筆者認為,CALIS和國圖應(yīng)借鑒國外的實踐,組織同行開展電子資源編目理論和實踐討論,對具體案例尤其是國外的先進案例進行剖析,討論聯(lián)合編目的可行性,盡快制定出電子資源編目指南和聯(lián)合編目規(guī)程,并鼓勵成員館依據(jù)規(guī)則提交數(shù)據(jù),盡早實現(xiàn)電子資源書目的資源共享。
參考文獻
[1]王亞林.電子資源的編目策略[J].圖書館建設(shè),2012,(2):47-49,53.
[2]張軼華,曲建峰,李芳.Aleph系統(tǒng)批量編目功能的研究與實踐[J].圖書館雜志,2015,(1):66-72.
[3]賈延霞,楊慧.電子資源批量編目的實踐及研究[J].圖書情報工作,2014,(18):117-121.
[4]賈延霞,呂肖華,楊慧,等.電子期刊編目方法新嘗試——以清華大學圖書館的實踐為例[J].圖書館建設(shè),2011,(4):43-46,50.
[5].賈延霞,楊慧.利用數(shù)據(jù)庫商提供的電子資源MARC數(shù)據(jù)的策略[J].圖書館建設(shè),2012,(8):25-27.
(本文責任編輯:郭沫含)