吳麗坤 (哈爾濱工程大學(xué)圖書館 黑龍江 哈爾濱 150001)
CNMARC(China Machine-Readable Catalogue,中國機讀目錄)是資源共享的產(chǎn)物。其在中國產(chǎn)生并應(yīng)用的20多年來,被越來越廣泛地運用于書目機構(gòu)之間的信息交換。中國版本圖書館CIP(Cataloguing In Publication,圖書在版編目)數(shù)據(jù)核字號(簡稱CIP數(shù)據(jù)核字號)是國家新聞出版總署為編制好的CIP數(shù)據(jù)賦予的唯一一個核準(zhǔn)號碼。CNMARC與CIP數(shù)據(jù)核字號一直是各自獨立的,從沒有過任何關(guān)聯(lián)。筆者認(rèn)為CIP數(shù)據(jù)核字號應(yīng)該作為CNMARC中值得關(guān)注的一個信息點。另外,由于CIP數(shù)據(jù)核字號是中國新聞出版總署信息中心賦予每本圖書CIP數(shù)據(jù)的唯一核準(zhǔn)號碼[1],所以本文涉及的CNMARC所限定的文獻類型是中國出版的中文圖書。
MARC(Machine Readable Catalogue,機器可讀目錄)是以代碼形式和特定結(jié)構(gòu)記錄在計算機存儲載體上、用計算機識別與閱讀的目錄。MARC可一次輸入,多次使用。最早的MARC是美國國會圖書館的LCMARC(Library of Congress Machine Readable Cataloging,美國國會圖書館機讀目錄),后改名為USMARC(United States Machine Readable Cataloging,美國機讀目錄)。隨后各國開始編制自己的MARC,如英國的UKMARC(United Kingdom Machine Readable Cataloging,英國機讀目錄)。為便于各國MARC的互相交換,國際圖聯(lián)制定了UNIMARC(Universal Machine Readable Cataloging,國際書目數(shù)據(jù)通信格式),用以規(guī)范各國的MARC格式。我國于1979年開始引進美國的MARC,并對其加以研究。自1988年起,北京圖書館開始研制CNMARC。
CNMARC是我國通用的機讀目錄通訊格式,被應(yīng)用于中國國家書目機構(gòu)同其他國家書目機構(gòu)以及國內(nèi)圖書館與情報部門之間,以標(biāo)準(zhǔn)的計算機可讀形式交換書目信息。它是依據(jù)UNIMARC以及我國出版物的一些特殊情況和規(guī)則的新變化而編制的,并根據(jù)我國國情設(shè)計了一些地方字段,如091(統(tǒng)一書刊號)字段、092(訂購號)字段和905(館藏)字段等。
CIP是指根據(jù)一定的標(biāo)準(zhǔn),由某一集中編目機構(gòu)為在出版過程中的圖書編制書目數(shù)據(jù)[2]。在我國,這一集中編目機構(gòu)是新聞出版總署信息中心。隨著圖書出版量的急劇增長,為了快速、及時地對圖書進行編目加工和報道,圖書在版編目應(yīng)運而生。它的出現(xiàn)避免了單獨編目所造成的重復(fù)性勞動與人力浪費,有利于提高圖書編目的標(biāo)準(zhǔn)化和規(guī)范化程度,保證圖書編目的質(zhì)量,是實現(xiàn)編目工作標(biāo)準(zhǔn)化和文獻信息工作現(xiàn)代化的重要措施。同時,CIP對出版發(fā)行行業(yè)的深遠影響也體現(xiàn)在CIP數(shù)據(jù)的規(guī)范、集中、共享及可分析方面。CIP數(shù)據(jù)核字號在國家新聞出版總署網(wǎng)站可以查詢驗證(見圖1),驗證結(jié)果見圖2。
運用CNMARC格式編目的數(shù)據(jù)和CIP數(shù)據(jù)兩者都承擔(dān)和執(zhí)行著一個重要工作,即書目資源共享和編目現(xiàn)代化。編目的任務(wù)是對圖書進行整序、揭示文獻信息、提供檢索點、描述文獻內(nèi)容。上述兩者各自進行的是對圖書不同階段的描述,揭示圖書不同階段的信息。CIP是為在出版過程中的圖書編制書目數(shù)據(jù)。既然圖書尚在出版過程中,那么某些項目的變動則在所難免。而CIP數(shù)據(jù)核字號是與圖書一一對應(yīng)的,且被賦予之后不會變更。正是因為CIP數(shù)據(jù)核字號的唯一性,使它作為獨立檢索點成為可能。因此,CNMARC與CIP數(shù)據(jù)核字號應(yīng)該有所銜接。
從圖1和圖2中可以看出,利用CIP數(shù)據(jù)核字號查詢可以獲得圖書的題名、責(zé)任者、出版發(fā)行機構(gòu)等重要信息。最重要的是CIP數(shù)據(jù)核字號對圖書的ISBN(International Standard Book Number,國際標(biāo)準(zhǔn)書號)也有著準(zhǔn)確的反映。ISBN是機讀的編碼,從圖書的印刷、發(fā)行到銷售始終如一。它的引入簡化了圖書的訂購、庫存控制、賬目和輸出過程等任何出版業(yè)的分支程序。同時,ISBN對圖書館和文獻中心的圖書訂購、采選、編目和流通程序也都有促進作用。
圖書館側(cè)重于區(qū)別圖書的品種,主要通過核查ISBN來確定其是否重復(fù)。理論上,ISBN具有唯一性,只要其相同,就一定是同一種書。然而在實際工作中,由于出版物形式的多樣性,ISBN并不能完全起到區(qū)別圖書品種的作用。而且,由于國內(nèi)出版環(huán)境的復(fù)雜性,某些圖書的合法性有待商榷,其中有些也成為了圖書館的館藏。因此,在CNMARC中增加CIP數(shù)據(jù)核字號十分必要。
目前,由于圖書形式的多樣性,國家新聞出版總署可驗證的出版物中同一ISBN不止對應(yīng)一種圖書(非叢書)的情況絕非罕見(見圖3、表1)。
表1 ISBN相同、CIP數(shù)據(jù)核字號不同的圖書列表
書目數(shù)據(jù)是依據(jù)MARC標(biāo)準(zhǔn)編制的,無論其來源于何處,只要MARC標(biāo)準(zhǔn)沒變,CIP數(shù)據(jù)核字號的缺失便是共性問題。如圖3顯示,ISBN為7-5087-0015-5的記錄共8條,其各自的CIP數(shù)據(jù)核字號都不同,但CNMARC數(shù)據(jù)無法對CIP數(shù)據(jù)核字號的不同給予顯示。在ISBN相同的前提下,CIP數(shù)據(jù)核字號可以作為區(qū)別文獻的明顯信息,發(fā)揮區(qū)分相同ISBN圖書的作用。
合法性有待商榷的圖書通常分為3種:
(1)盜用ISBN的圖書 所謂盜用ISBN的圖書是指出版社出版的圖書使用的是某個已經(jīng)使用過或者即將被使用的ISBN,而且,盜用的ISBN通常被不止一次地使用。例如:以“ISBN” 為檢索入口,以 “7-80099-634-4” 為檢索條件,在CALIS中文聯(lián)合目錄數(shù)據(jù)庫中與國家圖書館中文及特藏數(shù)據(jù)庫中分別進行檢索,檢索結(jié)果見圖4和圖5。
在CALIS 中文聯(lián)合目錄數(shù)據(jù)庫中檢索到12種圖書。在國家圖書館中文及特藏數(shù)據(jù)庫中檢索到16條書目數(shù)據(jù)。這些圖書既不是叢書,作者也不相同,彼此沒有關(guān)系。擁有同一ISBN的數(shù)十種圖書的CNMARC數(shù)據(jù),沒有一個信息點、一個子字段反映CIP數(shù)據(jù)核字號的情況。CIP數(shù)據(jù)核字號存在與否、真實與否、正確與否不得而知。
(2)使用其他圖書的CIP數(shù)據(jù)核字號的圖書 有一類圖書顯示了CIP數(shù)據(jù)核字號,但是經(jīng)驗證發(fā)現(xiàn),該CIP數(shù)據(jù)核字號與其他圖書的吻合。例如,圖6中《世界美術(shù)全集》的CIP數(shù)據(jù)核字號為“2003013458”、ISBN為“7-80145-705-6”。將該CIP數(shù)據(jù)核字號通過中國新聞出版總署網(wǎng)站進行驗證,結(jié)果見圖7。顯然,圖7中的CIP數(shù)據(jù)核字號的圖書題名和ISBN等各項信息均與圖6不符。使用其他圖書的CIP數(shù)據(jù)核字號的圖書數(shù)據(jù)來源見圖8。
毫無疑問,圖4中顯示的同一ISBN的十幾種毫無關(guān)聯(lián)的圖書,圖6中使用其他圖書的CIP數(shù)據(jù)核字號的圖書及圖9中不明原因缺失CIP數(shù)據(jù)核字號的圖書,在出版過程中其數(shù)據(jù)沒有經(jīng)過新聞出版總署信息中心的備案審核。這種做法顯然違背了《出版管理條例》,這些圖書的合法性有待商榷。其CNMARC數(shù)據(jù)無法讓圖書館業(yè)內(nèi)人員及讀者分辨哪些是經(jīng)過國家新聞出版總署驗證核準(zhǔn)的合法出版物,哪些是盜用書號的圖書和出版過程中不曾被權(quán)威機構(gòu)驗證核準(zhǔn)的圖書。圖書館的采訪原則是采集正規(guī)途徑的出版物,同時收集對讀者有價值的文獻也是圖書館的職責(zé)[4]。從這個層面上說,無論是作為我國圖書館事業(yè)核心和總書庫的國家圖書館,還是作為高等教育文獻保障平臺的CALIS,即便不排斥這樣數(shù)據(jù)的出現(xiàn),也有義務(wù)在圖書的CNMARC格式數(shù)據(jù)中對CIP數(shù)據(jù)核字號的信息有所體現(xiàn),有責(zé)任把CIP數(shù)據(jù)核字號缺失或不正確的圖書和其他圖書區(qū)分開來。目前,CNMARC中沒有一個點可以顯示CIP數(shù)據(jù)核字號。筆者認(rèn)為,即使CNMARC無法驗證CIP數(shù)據(jù)核字號正確與否,仍舊可以將其作為一個信息標(biāo)注點,以便在需要驗證的時候有據(jù)可查。
讀者的信息素養(yǎng)和認(rèn)知方式千差萬別,一部分讀者曾試圖利用CIP數(shù)據(jù)核字號向圖書館薦購或要求獲取資源。面對這樣的情況,我們曾要求讀者重新提供檢索信息,也曾經(jīng)到新聞出版總署CIP核字號驗證中心查證。如果CNMARC數(shù)據(jù)庫中的CIP數(shù)據(jù)核字號信息完備,只要掌握CIP數(shù)據(jù)核字號這個信息(即便是錯誤的或被杜撰出來的),就可以從數(shù)據(jù)庫中檢索到其所屬的圖書信息。
CNMARC的根本依然是引進的UNIMARC,在此基礎(chǔ)上研究、翻譯,并依中國國情設(shè)計了一些地方字段。CNMARC的書目格式提供了對各種文獻類型進行著錄、檢索的詳細(xì)說明,也提供了對書目控制所需要的各種編碼數(shù)據(jù)元素的詳細(xì)說明。CNMARC的書目格式由記錄頭標(biāo)區(qū)、目次區(qū)和數(shù)據(jù)字段3個部分組成。增加信息檢索點需要在數(shù)據(jù)字段部分增加字段或子字段。
數(shù)據(jù)字段部分0--是標(biāo)識塊,圖書館和數(shù)據(jù)中心查重、檢索利用最為廣泛的ISBN就著錄在標(biāo)識塊的010標(biāo)準(zhǔn)編號及獲得方式項中。所以,要在CNMARC中增補CIP數(shù)據(jù)核字號,筆者建議在標(biāo)識塊增加一個體現(xiàn)中國國情的地方字段,如095字段,將其取名為“中國版本圖書館CIP數(shù)據(jù)核字號”。另外,為了把沒有CIP數(shù)據(jù)核字號的出版物區(qū)分開來,也為了便于統(tǒng)計這類圖書的數(shù)量,筆者建議用記錄頭標(biāo)區(qū)未定義(即空位)的第19字符位的不同取值來體現(xiàn)。例如,當(dāng)該字符位取值為1時,表示該CNMARC數(shù)據(jù)有CIP數(shù)據(jù)核字號信息(見圖10);當(dāng)該字符位取值為0時,表示CNMARC數(shù)據(jù)中無CIP數(shù)據(jù)核字號信息(見圖11)。
和任何新生事物一樣,CNMARC在中國誕生20多年來,經(jīng)歷了不斷完善和豐富的過程。當(dāng)前我國圖書形式的多樣性和出版發(fā)行環(huán)境的復(fù)雜性使在CNMARC中增補CIP數(shù)據(jù)核字號信息的需求愈加迫切。
[1]武二偉.國外圖書在版編目(CIP)現(xiàn)狀分析及對我國的啟示[J].現(xiàn)代情報,2009(3):18-22.
[2]曾照云.圖書在版編目(CIP)述評[J].現(xiàn)代情報,2006(11):94-96.
[3]中國新聞出版信息網(wǎng)[EB/OL].[2011-09-17].http://www.cppinfo.com/.
[4]趙志剛.對“盜號書”現(xiàn)象的剖析:基于新制度經(jīng)濟學(xué)視角的分析與思考[J].圖書館建設(shè),2008(6):52-55.