肖麗萍
〔摘 要〕Millennium系統(tǒng)是美國INNOVATIVE公司開發(fā)的一個(gè)功能齊全的圖書館集成管理系統(tǒng),其發(fā)展已超過25年歷史,在國內(nèi)外擁有眾多用戶。我館于2006年引進(jìn)該系統(tǒng),本文結(jié)合2年的編目模塊實(shí)踐,從數(shù)據(jù)套錄、統(tǒng)計(jì)、數(shù)據(jù)質(zhì)量控制等方面,全面論述該系統(tǒng)在我館編目工作中的應(yīng)用,同時(shí)分析其存在的問題并提出解決的辦法。
〔關(guān)鍵詞〕Millennium系統(tǒng);編目;數(shù)據(jù)質(zhì)量控制
〔中圖分類號〕G254.3 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)07-0174-03
Applications and Problems of Utilizing Millennium System in CatalogingXiao Liping
(Library,Jinan University,Guangzhou 510632,China)
〔Abstract〕Millennium system is a full-featured integrated library management system developed by INNOVATIVE Corp.of USA with 25 years history and thousands of users worldwide.Based on two years cataloging experience since 2006,the author analyze the advantages of application of Millennium system in cataloging and provide solutions for the existing defects.
〔Key words〕Millennium System;Cataloging;Data Quality Control
2006年,暨南大學(xué)圖書館引進(jìn)Millennium系統(tǒng),該系統(tǒng)是由美國INNOVATIVE公司開發(fā)的一個(gè)集采訪、編目、流通、期刊、OPAC、系統(tǒng)管理等于一體的功能齊全的圖書館集成管理系統(tǒng),在全世界40多個(gè)國家和地區(qū)擁有眾多用戶。在中國內(nèi)地有清華大學(xué)、西安交通大學(xué)、華中科技大學(xué)、國家會計(jì)學(xué)院、浙江省圖書館等10多家圖書館使用,其功能全面、結(jié)構(gòu)嚴(yán)謹(jǐn),使用方便,得到用戶的廣泛認(rèn)可。本文將結(jié)合2年的編目模塊實(shí)踐,具體討論Millennium系統(tǒng)編目模塊應(yīng)用中的優(yōu)勢和存在的問題,分析其中原因,并提出較為可行的解決辦法。
1 Millennium系統(tǒng)編目模塊應(yīng)用的優(yōu)勢
1.1 支持多數(shù)據(jù)源檢索
在聯(lián)機(jī)合作編目的形勢下,圖書館書目數(shù)據(jù)共建共享,數(shù)據(jù)套錄漸漸成為編目工作不可或缺的一部分。如何有效提高套錄效率就成為提高編目效率的一個(gè)重要方面。在Millennium系統(tǒng)的Z39.50客戶端,可以配置多個(gè)Z39.50服務(wù)器,其遠(yuǎn)程檢索支持不同語種和多種MARC格式,套錄數(shù)據(jù)可以同時(shí)選擇多個(gè)數(shù)據(jù)源庫進(jìn)行檢索。例如套錄西文圖書數(shù)據(jù)時(shí),可以同時(shí)選上CALIS聯(lián)合目錄、美國國會圖書館聯(lián)合目錄、美國Ohiolink聯(lián)合目錄等數(shù)據(jù)庫,進(jìn)行一次檢索,即可同時(shí)下載不同數(shù)據(jù)源庫的檢索結(jié)果。
1.2 具有強(qiáng)大而靈活的統(tǒng)計(jì)功能
圖書館統(tǒng)計(jì)工作是圖書館業(yè)務(wù)工作的重要組成部分,它對圖書館運(yùn)行中的各種數(shù)據(jù)進(jìn)行搜集、整理、分析研究,以便從中發(fā)現(xiàn)問題和解決問題。國內(nèi)系統(tǒng)在統(tǒng)計(jì)方面的功能比較欠缺,例如不能對數(shù)據(jù)進(jìn)行深層次的統(tǒng)計(jì)和分析,問題數(shù)據(jù)進(jìn)入大庫后很難將其查找出來等。Millennium系統(tǒng)具有非常強(qiáng)大的統(tǒng)計(jì)功能,編目模塊常用統(tǒng)計(jì)工具產(chǎn)生資料檔(Create lists)可以非常方便的統(tǒng)計(jì)出幾乎所有需要的統(tǒng)計(jì)結(jié)果。
利用資料檔,用戶可以根據(jù)自己所設(shè)定的條件,從書目、館藏等記錄數(shù)據(jù)庫中進(jìn)行檢索,找出符合自己要求的記錄集合。設(shè)定表達(dá)式時(shí),可以針對某一個(gè)索引組、某一字段或子字段,利用=、≥、含有等數(shù)學(xué)表達(dá)式,結(jié)合“與”、“或”、“非”等邏輯條件[1]。
在編目實(shí)踐中,主要用資料檔進(jìn)行個(gè)人工作量統(tǒng)計(jì)、抓取有問題記錄、批次業(yè)務(wù)統(tǒng)計(jì)、書目數(shù)據(jù)審校以及產(chǎn)生新書通報(bào)。
1.2.1 抓取有問題或需處理的書目記錄
只要根據(jù)需處理記錄的共同特征設(shè)定條件,就可以輕而易舉地找出相關(guān)記錄進(jìn)行處理[1]。例如要找出2008年12月已編目數(shù)據(jù)中漏加索書號字段的記錄,設(shè)定條件如下:
BIBLIOGRAPHIC Cat.Date between″2008-12-01″and″2008-12-31″AND BIBLIOGRAPHIC Call No.not exist。通過這個(gè)表達(dá)式即可抓取12月編目的所有書目記錄中無索書號字段的記錄。
1.2.2 批次業(yè)務(wù)統(tǒng)計(jì)
批次業(yè)務(wù)統(tǒng)計(jì)是編目典藏工作之前非常重要的內(nèi)容,統(tǒng)計(jì)結(jié)果的核查尤為重要。利用資料檔的字段排序功能,可以很容易找出取值范圍之外的錯(cuò)誤記錄。例如用書目記錄的索書號排序,沒有分編(即沒有索書號字段)的記錄就會排在最前面;同樣,用館藏記錄的條碼進(jìn)行排序,就可以將不符合本條碼段的記錄找出來。
1.2.3 書目數(shù)據(jù)審校
書目數(shù)據(jù)審校是書目數(shù)據(jù)質(zhì)量控制的重要環(huán)節(jié),也是保證書目數(shù)據(jù)標(biāo)準(zhǔn)化、規(guī)范化所采取的重要質(zhì)量控制措施。Millennium系統(tǒng)資料檔的數(shù)據(jù)排序及輸出等功能,可以非常方便的完成此工作。利用不同的字段排序,從資料檔里直接輸出該批數(shù)據(jù)需要檢查的字段內(nèi)容,比如題名、責(zé)任者、版本、索書號等,在本地直接用文本文檔查看。這就省去了逐條打開記錄的繁瑣,而且也更加直觀明了。
1.3 可有效控制數(shù)據(jù)質(zhì)量
圖書館的書目數(shù)據(jù)庫質(zhì)量的優(yōu)劣直接影響到文獻(xiàn)檢索效果,進(jìn)而影響到文獻(xiàn)的流通、文獻(xiàn)的開發(fā)利用和文獻(xiàn)資源共享[2]。然而,如何有效控制書目數(shù)據(jù)質(zhì)量卻是系統(tǒng)開發(fā)商面臨的重要難題。Millennium系統(tǒng)提供的多項(xiàng)功能如全域更新、標(biāo)目查重、標(biāo)目異動(dòng)報(bào)表等,為用戶控制書目數(shù)據(jù)質(zhì)量提供了充分的空間。只要編目人員充分利用這些功能,就可以極大的提高書目數(shù)據(jù)庫的質(zhì)量。
1.3.1 全域更新
Millennium系統(tǒng)的全域更新功能可以批次插入、修改、刪除、復(fù)制變長字段,修改特殊字段等。在抓取需要更新的記錄后,利用此功能可以批次快速更新記錄,在執(zhí)行更新之前還可以通過預(yù)覽查看更新之后的結(jié)果,以核對更新條件是否正確[3]。
例如我館正在回溯院系資料室回收圖書,需要在某一批數(shù)據(jù)的館藏記錄中增加一個(gè)字段表明該批數(shù)據(jù)回收來源。設(shè)置一定的條件抓取資料檔后,利用“插入定長字段”,將來源信息如“經(jīng)濟(jì)學(xué)院回收”加入條件中,執(zhí)行即可批次添加。
1.3.2 編目即時(shí)查重
Millennium系統(tǒng)在編目狀態(tài)下,提供了多種幫助功能來保障書目數(shù)據(jù)質(zhì)量。其幫助功能主要有:實(shí)時(shí)MARC格式提示、MARC格式檢查、標(biāo)目即時(shí)查重等。標(biāo)目即時(shí)查重功能可以在3個(gè)方面對書目數(shù)據(jù)的質(zhì)量予以保障。
(1)避免查重不嚴(yán)所致記錄重復(fù)。Millennium系統(tǒng)既可以對被編目記錄中某一索引字段即時(shí)查重,也可以同時(shí)對被編目記錄的全部索引字段即時(shí)查重。如遇到多個(gè)索引字段值均在書目數(shù)據(jù)庫中存在的情況,尤其是ISBN與題名同時(shí)出現(xiàn)重復(fù)的情況,就需要引起編目員的注意,通過仔細(xì)判斷來避免失誤[1]。
(2)索書號查重。通過索書號字段的即時(shí)查重,可以及時(shí)發(fā)現(xiàn)重號圖書,從而避免異書同號現(xiàn)象。
(3)排除輸入錯(cuò)誤。通過對題名、責(zé)任者等字段的即時(shí)查重,可以顯示相鄰記錄的索引值,有助于發(fā)現(xiàn)可能存在的輸入錯(cuò)誤[1]。
1.3.3 標(biāo)目異動(dòng)報(bào)表
書目數(shù)據(jù)庫中的記錄,只要有所變化,Millennium系統(tǒng)都會記錄下其標(biāo)目的變動(dòng),形成標(biāo)目異動(dòng)報(bào)表。通過報(bào)表,我們可以實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)質(zhì)量。在我館,標(biāo)目異動(dòng)報(bào)表主要用來記錄重復(fù)使用標(biāo)目的變化。
標(biāo)目異動(dòng)報(bào)表能夠產(chǎn)生重復(fù)控制號、索書號和館藏記錄條碼號的報(bào)表。從“索書號”重復(fù)提示,直接打開報(bào)表中的各個(gè)條目,可以進(jìn)行人工判重,排除因?yàn)閰^(qū)分號不同而被系統(tǒng)認(rèn)為重號的記錄;從“條碼號重復(fù)”提示,可以明確標(biāo)示出重復(fù)的條碼,從而保證館藏記錄主要標(biāo)識的惟一性。
另外,如果圖書館建立有本館的規(guī)范記錄庫,還可以使用標(biāo)目異動(dòng)報(bào)表進(jìn)行規(guī)范記錄控制。通過報(bào)表指出與規(guī)范記錄有關(guān)的規(guī)范記錄重復(fù)、使用非規(guī)范標(biāo)目和盲目參照等[1]。
2 Millennium系統(tǒng)存在的問題及解決辦法
Millennium系統(tǒng)是西方國家開發(fā)的系統(tǒng),由于國情的差異和思維方式的不同,系統(tǒng)功能開發(fā)的側(cè)重點(diǎn)也會有所不同。在編目模塊的設(shè)計(jì)上,國外系統(tǒng)更注重檢索[4],而對中國特殊國情需要的某些功能開發(fā)有所欠缺,目前,Millennium系統(tǒng)編目模塊存在的問題主要體現(xiàn)在如下3個(gè)方面:
2.1 有些中文字符轉(zhuǎn)換錯(cuò)誤
我館Millennium系統(tǒng)使用的是圖形界面,字符集為Unicode碼。Millennium系統(tǒng)對中日韓文采用EACC/CCCII作為內(nèi)碼存儲,在系統(tǒng)升級為Unicode之后,客戶端漢字輸入設(shè)為Unicode字符集。由于客戶端字符集與系統(tǒng)內(nèi)碼的不同,就需要進(jìn)行字符集編碼的轉(zhuǎn)換[5]。因?yàn)樽址D(zhuǎn)換表的問題,在字符轉(zhuǎn)換過程中,就出現(xiàn)了一系列的問題,包括字符缺漏,如“稅”字不能保存;有些字符轉(zhuǎn)換成了異體字或者亂碼,如漢字“真”在導(dǎo)入系統(tǒng)之后變成了“真”,等等。
為了解決字符問題,我館主要采用兩種方式:一是在編目過程中搜集錯(cuò)誤的字符,并將其發(fā)送給公司,由公司方重新匹配字符集,逐個(gè)修改;二是定期統(tǒng)計(jì)月度編目數(shù)據(jù),利用全域更新批次修改轉(zhuǎn)換錯(cuò)誤字符。
2.2 中文圖書原編時(shí)拼音羅馬化不符合CNMARC著錄要求因?yàn)槲覈褂孟笮挝淖?CNMARC著錄規(guī)則要求對有檢索意義的字段如題名、主題、責(zé)任者增設(shè)我國特有的拼音子字段,從而提供多一種檢索途徑。Millennium系統(tǒng)對漢字羅馬化(即產(chǎn)生拼音)的定義是將定長字段language為chi的記錄中所有的中文漢字都匹配一個(gè)拼音[6]。顯然,這種羅馬化的定義與CNMARC圖書著錄規(guī)則不相符。在Millennium系統(tǒng)中做中文圖書原編時(shí),無法使用其羅馬化功能自動(dòng)生成拼音,必須手動(dòng)逐個(gè)輸入。為了解決這一問題,我館中文圖書原編都在CALIS Z39.50客戶端完成,數(shù)據(jù)提交之后再從Millennium系統(tǒng)遠(yuǎn)程下載,覆蓋本地系統(tǒng)的簡編記錄。
2.3 Millennium系統(tǒng)還未與中國高等學(xué)校文獻(xiàn)保障系統(tǒng)(簡稱CALIS)達(dá)成協(xié)議,在系統(tǒng)中無法直接向CALIS上交館藏
作為CALIS的成員館,我們在下載其記錄的同時(shí)還必須向其提供本館的館藏信息,以利于各成員館之間的館際互借。由于協(xié)議尚未達(dá)成,我們不能直接通過Millennium系統(tǒng)向CALIS提交館藏,而只能到CALIS Z39.50客戶端重新執(zhí)行一次檢索并上交館藏信息。目前公司正在與CALIS協(xié)商,我們期待早一點(diǎn)有結(jié)果。
3 結(jié) 語
2年多的編目實(shí)踐,我們感受到Millennium系統(tǒng)編目模塊結(jié)構(gòu)嚴(yán)密,功能強(qiáng)大,使用方便,它提供了一整套編目業(yè)務(wù)管理的規(guī)范操作,有效提高了數(shù)據(jù)質(zhì)量,整體上提高了編目工作效率。然而由于各國國情不同,思維方式的差異等原因,造成了上述的問題。我們希望Millennium在今后的系統(tǒng)升級中,能更多考慮不同用戶的需求以滿足用戶需要。
參考文獻(xiàn)
[1]胡小菁.INNOPAC系統(tǒng)書目數(shù)據(jù)庫質(zhì)量控制[J].圖書館雜志,2001,(11):23-26.
[2]萬麗蓉.論書目數(shù)據(jù)的質(zhì)量控制[J].圖書館工作與研究,2007,(5):34-35.
[3]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 104002,2009-01-01.
[4]孫曉菲,曹玉霞.圖書館集成管理系統(tǒng)Horizon編目模塊評價(jià)[J].大學(xué)圖書館學(xué)報(bào),2002,(4):37-39.
[5]方紅.INNOPAC/MILLENNIUM系統(tǒng)漢字處理問題的研究[J].高等工程教育研究,2006,(S1):119-121.
[6]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 105472,2009-01-01.
[7]Millennium ILS:Innovative Interfaces[EB].http:∥www.iii.com/products/millennium_ils.shtml,2009-01-01.