劉 華 (中國科學(xué)技術(shù)信息研究所 北京 100038)
書目數(shù)據(jù)是計(jì)算機(jī)可識(shí)別和可處理的揭示館藏文獻(xiàn)資源的信息。聯(lián)合目錄數(shù)據(jù)庫匯集了多個(gè)圖書館和信息機(jī)構(gòu)的書目數(shù)據(jù),其完善程度及其書目數(shù)據(jù)的質(zhì)量都直接影響著圖書館信息資源的交流與共享,因此,聯(lián)合目錄數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量控制成為編目界關(guān)注的熱點(diǎn)。OCLC(Online Computer Library Center,聯(lián)機(jī)計(jì)算機(jī)圖書館中心)擁有著世界上最大的聯(lián)合編目數(shù)據(jù)庫——WorldCat??紤]到世界上9 031個(gè)圖書館都依賴于其書目數(shù)據(jù),OCLC非常重視WorldCat的質(zhì)量控制,并采取了一系列舉措。本文擬對(duì)OCLC的書目數(shù)據(jù)質(zhì)量控制舉措進(jìn)行剖析,并對(duì)我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)的質(zhì)量控制提出一些改進(jìn)建議。
1.1.1 廣泛應(yīng)用各種現(xiàn)有的標(biāo)準(zhǔn)或規(guī)范
WorldCat中的書目數(shù)據(jù)來自于世界各地眾多的成員館。為了使這些書目數(shù)據(jù)能夠在格式或著錄規(guī)則上一致,OCLC所采取的首要措施是廣泛實(shí)施各種標(biāo)準(zhǔn)和規(guī)范。這些標(biāo)準(zhǔn)和規(guī)范的采用呈現(xiàn)出一定的層次性:首先,采用相關(guān)國際標(biāo)準(zhǔn);其次,采用各國已有的規(guī)范;再次,針對(duì)上述規(guī)范中所未涉及到的內(nèi)容制訂相應(yīng)的規(guī)范。《書目格式與標(biāo)準(zhǔn)》[1]中詳細(xì)地指明了應(yīng)采用的標(biāo)準(zhǔn)和規(guī)范以及國際和各國標(biāo)準(zhǔn)與規(guī)范中未涉及的內(nèi)容,目前已出版第4版,并在不斷更新中,最近一次更新時(shí)間是2010年2月?,F(xiàn)有標(biāo)準(zhǔn)和規(guī)范的廣泛采用最大限度地保證了數(shù)據(jù)的兼容性(見下頁表1)。
1.1.2 實(shí)施OCLC質(zhì)量計(jì)劃
OCLC的質(zhì)量計(jì)劃主要是為了鼓勵(lì)其所有的成員館參與WorldCat書目數(shù)據(jù)的監(jiān)督和修正,對(duì)數(shù)據(jù)進(jìn)行補(bǔ)充、修正和去重而制定并實(shí)施的。這些質(zhì)量計(jì)劃能夠確保WorldCat數(shù)據(jù)的完整性和準(zhǔn)確性,包括:
(1)WorldCat修改申請(qǐng)(WorldCat Change Requests)這一計(jì)劃允許所有編目成員館提出修改申請(qǐng)表格、指出WorldCat書目數(shù)據(jù)或規(guī)范文檔中需要修改的錯(cuò)誤。也就是說,所有的編目成員館都擁有監(jiān)督WorldCat數(shù)據(jù)的權(quán)利,這使書目數(shù)據(jù)處于最廣泛的監(jiān)督中。
(2)最低級(jí)別升級(jí)(Minimal Level Upgrades) 這一計(jì)劃鼓勵(lì)所有編目成員館對(duì)WorldCat中未達(dá)到完全級(jí)的主記錄進(jìn)行內(nèi)容添加或修改,以使書目數(shù)據(jù)更為完整。為了保障所添加或修改的數(shù)據(jù)的準(zhǔn)確性,OCLC賦予所有編目成員館的添加或修改權(quán)利是有限的,其可添加或修改的字段僅限于系統(tǒng)中默認(rèn)的可編輯字段。
表1 WorldCat書目數(shù)據(jù)用到的標(biāo)準(zhǔn)或規(guī)范
(3)數(shù)據(jù)庫補(bǔ)充(Database Enrichment) 這一計(jì)劃是指所有編目成員館都可以對(duì)WorldCat中的主記錄進(jìn)行補(bǔ)充,以提升主記錄的質(zhì)量??梢匝a(bǔ)充的內(nèi)容包括:記錄中的索書號(hào)和主題標(biāo)目,006字段(附件特征)和007字段(載體形態(tài)),505字段(附注),在版編目數(shù)據(jù)中的300字段(載體形態(tài)項(xiàng))。
(4)升級(jí)在版編目數(shù)據(jù)(Cataloging-in-publication Upgrading)[2]這一計(jì)劃是指特定的成員館可以對(duì)在版編目數(shù)據(jù)進(jìn)行補(bǔ)充、編輯或修改。CIP(Cataloging in Publication,在版編目數(shù)據(jù))數(shù)據(jù)是由美國國會(huì)圖書館和其他國家或地區(qū)的國家編目機(jī)構(gòu)在出版物出版之前創(chuàng)建的書目數(shù)據(jù)。由于出版物在出版之前許多數(shù)據(jù)尚未確定,或者出版之后發(fā)生了改變,導(dǎo)致在版編目數(shù)據(jù)的完整性和準(zhǔn)確性有所欠缺,因此,所有CIP數(shù)據(jù)都需要進(jìn)行升級(jí),以確保其準(zhǔn)確性和完整性。1995年,OCLC提出CIP升級(jí)計(jì)劃,制訂了簡(jiǎn)要的項(xiàng)目規(guī)范,列出了CIP升級(jí)所需要修改的USMARC字段及其子字段以及有資格升級(jí)的成員館。該計(jì)劃允許任何具有完全級(jí)或更高授權(quán)的編目成員館添加300字段數(shù)據(jù);允許OCLC的高級(jí)參與者編輯整個(gè)CIP記錄;允許國家級(jí)高級(jí)授權(quán)的成員館將CIP升級(jí)為主記錄,并使之成為一個(gè)完全級(jí)的書目記錄。
(5)OCLC高級(jí)參與者計(jì)劃(OCLC Enhance Participants)[3]OCLC高級(jí)參與者實(shí)際上是一種認(rèn)證機(jī)制,經(jīng)過OCLC的許可,他們可以鎖定、編輯和替換WorldCat中的書目記錄。高級(jí)參與者分為兩類:①普通高級(jí)參與者,他們可以替換絕大多數(shù)由成員館輸入的記錄;②國家級(jí)高級(jí)參與者,他們主要是從美國國會(huì)圖書館選出的編目人員或合作編目項(xiàng)目的參加者,擁有更大的權(quán)限,可以替換大多數(shù)的國家級(jí)記錄。考慮到高級(jí)參與者所擁有的權(quán)限,OCLC制訂了嚴(yán)格的評(píng)估和培訓(xùn)機(jī)制,以確保這一計(jì)劃的順利進(jìn)行[4]。
(6)專家社區(qū)計(jì)劃(Expert Community)[5]專家社區(qū)計(jì)劃源自于“專家社區(qū)計(jì)劃實(shí)驗(yàn)”,該實(shí)驗(yàn)于2009年2-8月進(jìn)行,主要是賦予具有完全級(jí)編目授權(quán)的成員館更大的修改權(quán)限和范圍,以改進(jìn)和升級(jí)WorldCat主記錄。由于該實(shí)驗(yàn)進(jìn)行得很成功,因此OCLC保留了這一實(shí)驗(yàn)的所有功能,并將之作為專家社區(qū)計(jì)劃的一部分。被納入專家社區(qū)的成員館有權(quán)實(shí)時(shí)修改記錄,有權(quán)修改完全級(jí)書目記錄,有權(quán)修改更多主記錄的字段,有權(quán)將書目數(shù)據(jù)升級(jí)為主記錄。專家社區(qū)計(jì)劃實(shí)際上是將WorldCat的記錄維護(hù)工作更多地分配給成員館,使這部分工作能夠有更多的技術(shù)力量支撐。任何擁有完全級(jí)編目授權(quán)的成員館都可以申請(qǐng)加入該計(jì)劃。
1.1.3 參與非OCLC質(zhì)量計(jì)劃
非OCLC質(zhì)量計(jì)劃實(shí)際上是OCLC以合作的方式吸收其他合作機(jī)構(gòu)的高質(zhì)量數(shù)據(jù),并將其補(bǔ)充到WorldCat中,間接地提高其書目數(shù)據(jù)質(zhì)量的做法。目前,這一類非OCLC質(zhì)量計(jì)劃包括合作編目計(jì)劃以及合作聯(lián)機(jī)連續(xù)出版物和美國報(bào)紙計(jì)劃。
(1)合作編目計(jì)劃(Program for Cooperative Cataloging,簡(jiǎn)稱PCC)[6]PCC計(jì)劃主要是基于圖書館之間互相認(rèn)可的標(biāo)準(zhǔn),提供有用、及時(shí)和經(jīng)濟(jì)的編目數(shù)據(jù),以滿足讀者對(duì)圖書館館藏檢索日益增長(zhǎng)的需求。該計(jì)劃由美國國會(huì)圖書館和PCC計(jì)劃的參與者共同協(xié)調(diào),旨在增加高質(zhì)量的數(shù)據(jù)數(shù)量、增加負(fù)責(zé)國家級(jí)記錄的編目員和編目機(jī)構(gòu)的數(shù)量、制訂和維護(hù)互相認(rèn)可的數(shù)據(jù)標(biāo)準(zhǔn)。PCC的書目記錄可以直接提供給WorldCat,也可以通過OCLC規(guī)范文檔間接提供給WorldCat。
(2)合作聯(lián)機(jī)連續(xù)出版物(Cooperative Online Serials,簡(jiǎn)稱CONSER)[7]CONSER計(jì)劃是一個(gè)聯(lián)合在線連續(xù)出版物編目項(xiàng)目,是連續(xù)出版物的高質(zhì)量書目數(shù)據(jù)源。這一項(xiàng)目還出版關(guān)于連續(xù)出版物編目的文獻(xiàn)和培訓(xùn)材料,并發(fā)布有關(guān)連續(xù)出版物的標(biāo)準(zhǔn)。CONSER數(shù)據(jù)庫嵌在OCLC聯(lián)合目錄中,其成員館在OCLC上輸入、驗(yàn)證和修改連續(xù)出版物的編目數(shù)據(jù),或者通過FTP(File Transfer Protocol,文件傳輸協(xié)議)將原始記錄上傳至OCLC聯(lián)合目錄,并為連續(xù)出版物的目錄記錄提供日常維護(hù)。
(3)美國報(bào)紙計(jì)劃(U.S. Newspaper Program,簡(jiǎn)稱USNP)[8]USNP是美國聯(lián)邦政府和各州之間的合作項(xiàng)目,主要是對(duì)18世紀(jì)至今在美國出版的報(bào)紙進(jìn)行定位、編目并以縮微膠片的方式進(jìn)行保存。該項(xiàng)目由美國國家人文基金會(huì)提供贊助,由美國國會(huì)圖書館提供技術(shù)支持。USNP的數(shù)據(jù)庫收錄了自1690年以來在北美出版的300 000多種報(bào)紙,不僅提供書目數(shù)據(jù)和館藏位置信息,而且還致力于保存重要的、瀕臨消失的館藏。OCLC加入該計(jì)劃后,WorldCat中報(bào)紙記錄的數(shù)量和質(zhì)量均有大幅度的增加和提高。
1.2.1 多層次標(biāo)準(zhǔn)的實(shí)施確保其數(shù)據(jù)更具兼容性
著錄規(guī)則和標(biāo)準(zhǔn)是保證書目數(shù)據(jù)質(zhì)量的基礎(chǔ)。為了確保書目數(shù)據(jù)的準(zhǔn)確性,也為了提高其兼容性,OCLC實(shí)施了多層次標(biāo)準(zhǔn):①采用廣泛接受的國際標(biāo)準(zhǔn)或國際上通用的標(biāo)準(zhǔn),如DC(Dublin Core,都柏林元數(shù)據(jù)),AACR2;②在特定的編目實(shí)踐中,參考使用各個(gè)國家或地區(qū)的相關(guān)標(biāo)準(zhǔn),如美國音樂圖書館協(xié)會(huì)的《樂譜編目公告》;③與其他質(zhì)量計(jì)劃合作,開發(fā)相互認(rèn)可的標(biāo)準(zhǔn);④針對(duì)自身數(shù)據(jù)加工的特殊性,制訂相應(yīng)的細(xì)則。
1.2.2 開展最廣泛的合作
OCLC不僅注重與各成員館之間的縱向合作,也積極參加外界的各種質(zhì)量計(jì)劃,加強(qiáng)與OCLC以外的機(jī)構(gòu)的合作。例如,CONSER 計(jì)劃的成員館包括:美國國會(huì)圖書館和加拿大國家圖書館;選定的大學(xué)、政府、研究機(jī)構(gòu)、特殊機(jī)構(gòu)和公共圖書館;選定的圖書館協(xié)會(huì);訂閱代理機(jī)構(gòu)和制作摘要與索引的服務(wù)部門等。通過加入CONSER計(jì)劃,OCLC可以合作的機(jī)構(gòu)不再局限于圖書館領(lǐng)域,還涵蓋了眾多的其他類型機(jī)構(gòu)。這種廣泛的合作也為保障OCLC的書目數(shù)據(jù)質(zhì)量奠定了堅(jiān)實(shí)的基礎(chǔ),一方面,OCLC可以直接將這些機(jī)構(gòu)高質(zhì)量的書目數(shù)據(jù)納入WorldCat;另一方面,OCLC可以借助這些機(jī)構(gòu)中的編目人員加強(qiáng)對(duì)WorldCat的更新維護(hù)。
1.2.3 實(shí)行“全員監(jiān)督、分級(jí)更新維護(hù)”的原則
WorldCat是由OCLC眾多成員館共同建設(shè)的。因此,OCLC也鼓勵(lì)所有的編目成員館都參與到WorldCat的監(jiān)督與更新維護(hù)中,可歸納為“全員監(jiān)督、分級(jí)更新維護(hù)”的原則。所有的編目成員館在發(fā)現(xiàn)書目數(shù)據(jù)的錯(cuò)誤時(shí)都可以向OCLC提出修改記錄的申請(qǐng),可以在有限的字段內(nèi)對(duì)WorldCat中的記錄進(jìn)行補(bǔ)充,但更進(jìn)一步的更新維護(hù)則取決于編目成員館的級(jí)別。OCLC建立一定的評(píng)估機(jī)制,授權(quán)給不同水平的編目機(jī)構(gòu),讓他們對(duì)書目數(shù)據(jù)進(jìn)行不同程度的更新維護(hù)。“全員監(jiān)督”可以確保WorldCat處于更嚴(yán)密的監(jiān)督機(jī)制之下,也使各成員館更具“歸屬感”,有“當(dāng)家作主”的感覺;“分級(jí)更新維護(hù)”則能確保對(duì)WorldCat記錄修改的準(zhǔn)確性。
受OCLC的啟示,我國于20世紀(jì)90年代開始開展聯(lián)機(jī)聯(lián)合編目領(lǐng)域的探索。經(jīng)過十多年的發(fā)展,我國已經(jīng)形成不少聯(lián)機(jī)聯(lián)合編目系統(tǒng),如全國圖書館聯(lián)合編目中心(Online Library Cataloging Center,簡(jiǎn)稱OLCC)、CALIS聯(lián)機(jī)合作編目中心(CALIS Union Catalog Center,簡(jiǎn)稱CUCC)、中國科學(xué)院聯(lián)機(jī)聯(lián)合編目系統(tǒng)(Union Catalogue of Chinese Academic Library & Information System,簡(jiǎn)稱UNICAT)、上海市文獻(xiàn)聯(lián)合編目中心(Shanghai Information Union Catalog Center,簡(jiǎn)稱SIUCC)和地方版文獻(xiàn)聯(lián)合采編協(xié)作網(wǎng)(China Regional Library Network,簡(jiǎn)稱CRLNet)等。這些系統(tǒng)都有著各自的質(zhì)量控制舉措,以保障自身書目數(shù)據(jù)的質(zhì)量(見表2)。
表2 我國主要的聯(lián)機(jī)聯(lián)合編目系統(tǒng)的質(zhì)量控制舉措一覽表
與OCLC相比,我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)在質(zhì)量控制方面有以下特點(diǎn):
2.2.1 應(yīng)用的標(biāo)準(zhǔn)和規(guī)范各異
我國各大聯(lián)機(jī)聯(lián)合編目系統(tǒng)都基本遵循《中國文獻(xiàn)編目規(guī)則》、《中國機(jī)讀目錄格式》等基本標(biāo)準(zhǔn),但是這些國家標(biāo)準(zhǔn)并不足以解決編目過程中的所有細(xì)節(jié)問題,再加上出版物本身的復(fù)雜性,各大系統(tǒng)都制定了自己的標(biāo)準(zhǔn),以致應(yīng)用的標(biāo)準(zhǔn)和規(guī)范不一致。標(biāo)準(zhǔn)和規(guī)范的不一致一方面會(huì)給用戶帶來不便,因?yàn)橛脩粼趶牟煌到y(tǒng)下載數(shù)據(jù)時(shí)會(huì)面臨數(shù)據(jù)不兼容的問題;另一方面,會(huì)阻礙我國聯(lián)機(jī)聯(lián)合編目事業(yè)的進(jìn)一步發(fā)展,因?yàn)殡S著信息技術(shù)的飛速發(fā)展,我國各大聯(lián)機(jī)聯(lián)合編目系統(tǒng)勢(shì)必會(huì)匯聚在一起,數(shù)據(jù)之間不能兼容將會(huì)阻礙這一進(jìn)程。
2.2.2 側(cè)重于自身數(shù)據(jù)質(zhì)量的提高
我國幾大聯(lián)機(jī)聯(lián)合編目系統(tǒng)都側(cè)重于如何提高自身的數(shù)據(jù)質(zhì)量,并且在質(zhì)量控制方面,大都采取措施保證自身加工信息的完整性和準(zhǔn)確性,但不考慮共享其他系統(tǒng)高質(zhì)量的數(shù)據(jù)以間接地提升自身的數(shù)據(jù)質(zhì)量。這是我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)與OCLC最大的差異。
2.2.3 側(cè)重于數(shù)據(jù)加工的質(zhì)量控制
我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)的質(zhì)量控制主要包括兩個(gè)方面的內(nèi)容:制訂相關(guān)的標(biāo)準(zhǔn)和進(jìn)行編目員資格認(rèn)證。前者能夠確保數(shù)據(jù)加工人員加工數(shù)據(jù)時(shí)有據(jù)可依,后者則能夠確保數(shù)據(jù)加工人員的素質(zhì)。然而,我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)大多缺乏對(duì)上傳后數(shù)據(jù)的監(jiān)督機(jī)制與更新維護(hù)機(jī)制。雖然其中有些系統(tǒng)設(shè)立了嚴(yán)格的審查小組,但人少數(shù)據(jù)量大的現(xiàn)實(shí)使得這種審查不能及時(shí)發(fā)現(xiàn)問題并及時(shí)更新。
為了實(shí)現(xiàn)最大范圍的數(shù)據(jù)兼容,建議我國各大聯(lián)機(jī)聯(lián)合編目系統(tǒng):(1)采用國際標(biāo)準(zhǔn)或國家標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)加工。(2)合作開發(fā)統(tǒng)一的加工規(guī)范,在國際標(biāo)準(zhǔn)或國家標(biāo)準(zhǔn)不能適應(yīng)數(shù)據(jù)加工需求時(shí), 各系統(tǒng)之間應(yīng)進(jìn)行橫向合作,合作開發(fā)相對(duì)統(tǒng)一的規(guī)范,以規(guī)范編目中的細(xì)節(jié)問題、規(guī)范標(biāo)準(zhǔn)中的非標(biāo)準(zhǔn)因素,從而使各方數(shù)據(jù)能夠互相兼容,為成員館利用不同系統(tǒng)的數(shù)據(jù)提供便利。
各聯(lián)機(jī)聯(lián)合編目系統(tǒng)都匯集了多個(gè)成員單位的數(shù)據(jù),但我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)大多只設(shè)立專門的審查小組對(duì)數(shù)據(jù)進(jìn)行審核,這對(duì)于數(shù)量龐大的數(shù)據(jù)來說是遠(yuǎn)遠(yuǎn)不夠的。因此,建議采取一定的措施,鼓勵(lì)各成員館或具體用戶在發(fā)現(xiàn)問題數(shù)據(jù)時(shí)及時(shí)上報(bào);開辟多條途徑,為成員館上報(bào)錯(cuò)誤數(shù)據(jù)提供便利,如OLCC就為此設(shè)有專門的QQ群和編目論壇。
提高書目數(shù)據(jù)的質(zhì)量,除了加強(qiáng)對(duì)上傳數(shù)據(jù)的審查以外,還應(yīng)該強(qiáng)化書目數(shù)據(jù)更新與維護(hù)的機(jī)制。建議我國聯(lián)機(jī)聯(lián)合編目系統(tǒng)借鑒OCLC的分級(jí)更新維護(hù)機(jī)制,針對(duì)不同編目水平的編目員、圖書館進(jìn)行不同級(jí)別的授權(quán),賦予他們對(duì)書目記錄中的特定字段進(jìn)行更新和維護(hù)的權(quán)利。這樣一來,編目員對(duì)于書目數(shù)據(jù)中存在的某些問題可以在自己的權(quán)限內(nèi)及時(shí)處理,無須上報(bào)聯(lián)編中心,從而減少數(shù)據(jù)在審查過程中反復(fù)上傳的程序,間接加快數(shù)據(jù)上傳的速度,在保障書目質(zhì)量的同時(shí)提高數(shù)據(jù)加工與審查的速度。
[1] Bibliographic Formats and Standards[EB/OL]. [2010-05-13]. http://www.oclc.org/bibformats/default.htm.
[2]Upgrading of Cataloging-In-Publication (CIP) Records[EB/OL].[2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/cip/default.htm.
[3]OCLC Enhance Participants[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/enhance/#enhance.
[4]Enhance Evaluation Procedure[EB/OL]. [2010-05-13]. http://www.oclc.org/asiapacific/zhtw/support/documentation/worldcat/records/enhanceevaluation/default.htm.
[5]Expert Community[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/expert/.
[6]Program for Cooperative Cataloging[EB/OL]. [2010-05-13]. http://www.loc.gov/catdir/pcc/.
[7]Cooperative Online Serials[EB/OL]. [2010-05-13]. http://www.loc.gov/acq/conser/.
[8]U.S. Newspaper Program[EB/OL]. [2010-05-13]. http://www.neh.gov/projects/usnp.html.
[9]全國圖書館聯(lián)合編目中心[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/about-zxzc2.html.
[10]全國圖書館聯(lián)合編目中心2009 年工作會(huì)議資料[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/attendent/09年會(huì)/資料匯編2.pdf.
[11]CALIS聯(lián)機(jī)合作編目中心[EB/OL]. [2010-05-13]. http://www.calis.edu.cn/CALIS/lhml/index.asp.
[12]中國科學(xué)院聯(lián)合目錄集成服務(wù)系統(tǒng)[EB/OL]. [2010-05-13]. http://union.csdl.ac.cn/index.jsp.
[13]上海市文獻(xiàn)聯(lián)合編目中心[EB/OL]. [2010-05-13]. http://catalog.library.sh.cn/.
[14]地方版文獻(xiàn)聯(lián)合采編協(xié)作網(wǎng)[EB/OL]. [2010-05-13]. http://www.crlnet.org/.