摘 要:本文以綜合大學(xué)圖書(shū)館為例,詳細(xì)分析了多校區(qū)圖書(shū)館書(shū)目數(shù)據(jù)庫(kù)整合中可能存在的問(wèn)題,并就存在問(wèn)題提出了具體解決辦法,對(duì)我軍院校多校區(qū)書(shū)目數(shù)據(jù)庫(kù)的整合及管理將得到有益幫助。
關(guān)鍵詞:多校區(qū) 圖書(shū)館 整合 書(shū)目數(shù)據(jù)
中圖分類號(hào):G253 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2013)06(a)-0248-01
綜合大學(xué)多校區(qū)有多館逐步過(guò)渡到一個(gè)總館,圖書(shū)館的書(shū)目數(shù)據(jù)和館藏的整合是圖書(shū)館工作面臨的一個(gè)重要課題。本人就多年從事圖書(shū)館管理工作的工作實(shí)踐,根據(jù)總館與各分館書(shū)目數(shù)據(jù)的現(xiàn)狀整合經(jīng)驗(yàn)談?wù)勛约嚎捶?,以其?duì)類似綜合大學(xué)圖書(shū)館在書(shū)目數(shù)據(jù)庫(kù)整合上有所借鑒。
1 書(shū)目數(shù)據(jù)及館藏整合過(guò)程可能存在問(wèn)題
隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)、計(jì)算機(jī)技術(shù)的快速發(fā)展,為了提升圖書(shū)館自動(dòng)化業(yè)務(wù)管理水平,圖書(shū)館開(kāi)始相繼使用自動(dòng)化管理系統(tǒng),這對(duì)獨(dú)立館藏圖書(shū)管理是有效的,但如何對(duì)多館書(shū)目數(shù)據(jù)進(jìn)行整合,必須要解決以下幾個(gè)問(wèn)題。
1.1 分類標(biāo)準(zhǔn)不一致
對(duì)整合前各圖書(shū)館來(lái)說(shuō),有的館需要重點(diǎn)收藏的文獻(xiàn),而對(duì)其館則可能是非重點(diǎn)收藏的文獻(xiàn)。圖書(shū)館整合后對(duì)同一種類的文獻(xiàn)就有多種不同的分類標(biāo)準(zhǔn)。這樣在各館書(shū)目數(shù)據(jù)中,就有不同程度地存在同書(shū)異號(hào)和異書(shū)同號(hào)現(xiàn)象。
1.2 書(shū)目記錄重復(fù)現(xiàn)象
書(shū)目數(shù)據(jù)的重復(fù)主要表現(xiàn)為同一種書(shū)有兩個(gè)或多個(gè)索書(shū)號(hào),編目人員工作粗心大意,不認(rèn)真細(xì)致地查重,導(dǎo)致將復(fù)本書(shū)誤作新書(shū)著錄。有時(shí)因數(shù)據(jù)錄入錯(cuò)誤,也會(huì)造成書(shū)目數(shù)據(jù)的重復(fù)記錄,通過(guò)對(duì)各館書(shū)目數(shù)據(jù)庫(kù)檢查,發(fā)現(xiàn)各館或多或少都存在書(shū)目記錄重復(fù)現(xiàn)象。
1.3 數(shù)據(jù)項(xiàng)著錄詳簡(jiǎn)程度不一致
其一雖然校、院圖書(shū)館都采用總參軍訓(xùn)部統(tǒng)一配發(fā)的軍隊(duì)院校圖書(shū)館網(wǎng)絡(luò)管理系統(tǒng)(MILNETS系統(tǒng)),但各館在數(shù)據(jù)項(xiàng)的著錄上要求不同,而數(shù)據(jù)項(xiàng)著錄的詳簡(jiǎn)也不完全相同,著錄標(biāo)準(zhǔn)也不一致。其二編目人員對(duì)文獻(xiàn)著錄標(biāo)準(zhǔn)理解不一致。
1.4 條碼號(hào)(財(cái)產(chǎn)登錄號(hào))重復(fù)
條碼號(hào)的重復(fù)。多數(shù)圖書(shū)館業(yè)務(wù)工作進(jìn)行了計(jì)算機(jī)自動(dòng)化管理,基本實(shí)現(xiàn)了計(jì)算機(jī)編目、流通等功能模塊,各館原有的圖書(shū)條形碼一直保留在現(xiàn)系統(tǒng)中,如果把這些書(shū)目數(shù)據(jù)整合到一起,必然會(huì)引起不同種書(shū)圖書(shū)條碼會(huì)有重復(fù)現(xiàn)象,因此,圖書(shū)條碼號(hào)重復(fù)會(huì)給書(shū)目數(shù)據(jù)整合和流通借閱工作造成很大的麻煩。
1.5 書(shū)標(biāo)位置、規(guī)格、顏色不一致
由于各館根據(jù)自己館藏特點(diǎn),圖書(shū)上書(shū)標(biāo)的顏色、位置、規(guī)格各不相同,每個(gè)館至少有兩種以上的顏色,而且各館根據(jù)自己的館藏確定書(shū)標(biāo)的位置,這樣造成了書(shū)標(biāo)位置也不一樣(有高有低)。
2 解決問(wèn)題的途徑
2.1 刪除重復(fù)記錄
書(shū)目數(shù)據(jù)在整合前,各館要對(duì)各自書(shū)目數(shù)據(jù)庫(kù)的重復(fù)記錄要進(jìn)行刪除,制定判重規(guī)則,讓計(jì)算機(jī)能夠識(shí)別重復(fù)記錄,進(jìn)行自動(dòng)識(shí)別處理。判重條件可包括:題名、責(zé)任者、版次、ISBN、出版社、頁(yè)碼等項(xiàng)。盡可能保證各學(xué)院圖書(shū)館書(shū)目數(shù)據(jù)唯一性。重復(fù)書(shū)目數(shù)據(jù)刪除應(yīng)更改與其相對(duì)應(yīng)流通書(shū)庫(kù)里的條形碼、館藏位置、索書(shū)號(hào)等信息。由于編目人員書(shū)目數(shù)據(jù)著錄不盡相同,導(dǎo)致計(jì)算機(jī)系統(tǒng)難以識(shí)別所有相同的書(shū)目數(shù)據(jù),一些重復(fù)記錄還需要人工干預(yù)進(jìn)行判重處理。
2.2 按照標(biāo)準(zhǔn)選定基礎(chǔ)數(shù)據(jù)庫(kù)
第一步,選定基礎(chǔ)數(shù)據(jù)庫(kù)。重復(fù)數(shù)據(jù)合并時(shí),原則上應(yīng)該保留一條MARC質(zhì)量最好的數(shù)據(jù),將其余數(shù)據(jù)刪除。由于系統(tǒng)自動(dòng)判斷MARC質(zhì)量高低難度很大,所以在合并之前,應(yīng)組織專家對(duì)將要合并的各館書(shū)目數(shù)據(jù)庫(kù)進(jìn)行評(píng)估,在評(píng)估過(guò)程中,應(yīng)參考兩個(gè)重要指標(biāo):其一要根據(jù)CNMARC標(biāo)準(zhǔn)選一個(gè)數(shù)據(jù)相對(duì)最為標(biāo)準(zhǔn)的書(shū)目數(shù)據(jù)庫(kù)作為合并基礎(chǔ),書(shū)目數(shù)據(jù)標(biāo)準(zhǔn)直接影響數(shù)據(jù)庫(kù)的質(zhì)量;其二要考慮書(shū)目數(shù)據(jù)庫(kù)記錄數(shù)的數(shù)量,記錄數(shù)的多少將直接影響以后圖書(shū)整合的工作量,兩種因素應(yīng)綜合考慮,以選取適合本校的基礎(chǔ)數(shù)據(jù)庫(kù)。
2.3 構(gòu)建查重書(shū)目數(shù)據(jù)流程
首先選定基礎(chǔ)數(shù)據(jù)庫(kù),以基礎(chǔ)數(shù)據(jù)庫(kù)為標(biāo)準(zhǔn),其它三館的書(shū)目數(shù)據(jù)依次進(jìn)行查重比對(duì),對(duì)于重復(fù)的記錄和未重復(fù)的書(shū)目數(shù)據(jù)記錄進(jìn)行相關(guān)信息處理(重復(fù)如復(fù)本量累加、建立與基礎(chǔ)書(shū)目數(shù)據(jù)索書(shū)號(hào)的映射表等;未重復(fù)記錄進(jìn)行書(shū)目信息追加、索書(shū)號(hào)重新更改等,系統(tǒng)自動(dòng)判重方式的核心是編寫(xiě)判重算法規(guī)則的處理程序)。
其次制定判重規(guī)則,在制定規(guī)則時(shí)應(yīng)考慮重復(fù)記錄的要素和特征。系統(tǒng)自動(dòng)判重必須在書(shū)目記錄高度匹配的情況下方可自動(dòng)合并,而匹配數(shù)據(jù)運(yùn)算又是一個(gè)時(shí)間消耗過(guò)程。因此,為了提高數(shù)據(jù)查重和匹配效率,確定重復(fù)記錄的要素和特征時(shí),應(yīng)選擇合適的字段作為重復(fù)記錄的判重檢查點(diǎn)。常被選擇為系統(tǒng)判重檢查點(diǎn)的字段有:題名、責(zé)任者、ISBN號(hào)/統(tǒng)一書(shū)號(hào)、版次號(hào)、出版社、出版地、出版時(shí)間等字段。數(shù)據(jù)匹配點(diǎn)的檢查原則應(yīng)忽略全角、半角的輸入方式(包括漢字與阿拉伯?dāng)?shù)字);忽略外文字母的大、小寫(xiě);忽略空格及各種標(biāo)點(diǎn)符號(hào)等。
再次制定判重?cái)?shù)據(jù)處理方法,應(yīng)根據(jù)選定的判重字段進(jìn)行篩選,完全相同者視為重復(fù)記錄,如果判重點(diǎn)不完全匹配,在專用合并程序輔助下進(jìn)行人工判重。以表格形式兩條記錄同時(shí)顯示出來(lái),由人工來(lái)確認(rèn)是否重復(fù)數(shù)據(jù)。若是重復(fù)數(shù)據(jù),選擇一條質(zhì)量最好的數(shù)據(jù)作為合并基礎(chǔ)進(jìn)行合并,若不是重復(fù)數(shù)據(jù),繼續(xù)保留。人工判重比較靈活,判重的準(zhǔn)確率比較高,比規(guī)定某幾個(gè)字段的條件進(jìn)行比較判重更科學(xué)。在處理重復(fù)記錄過(guò)程中,應(yīng)采取系統(tǒng)與人工輔助相結(jié)合的方法。
2.4 圖書(shū)條碼的使用
圖書(shū)條碼為確保其唯一性,否則將造成不同圖書(shū),圖書(shū)條碼號(hào)可能相同,無(wú)法保證圖書(shū)條碼唯一性,條碼的更改應(yīng)在書(shū)目數(shù)據(jù)合并前進(jìn)行,這樣可更好地提高工作效率。
2.5 書(shū)標(biāo)的解決方法
針對(duì)各館書(shū)標(biāo)顏色(紅、綠、蘭)、位置高低及用途不同,合并后圖書(shū)館書(shū)標(biāo)顏色、位置必須統(tǒng)一,最捷徑的辦法應(yīng)該以基本書(shū)目數(shù)據(jù)庫(kù)為基準(zhǔn),在此基礎(chǔ)上根據(jù)館藏特點(diǎn)來(lái)決定是否增加書(shū)標(biāo)顏色,若其他館藏圖書(shū)的書(shū)標(biāo)位置與基礎(chǔ)書(shū)目數(shù)據(jù)庫(kù)中的圖書(shū)書(shū)標(biāo)位置不一致,在處理時(shí)應(yīng)以基礎(chǔ)數(shù)據(jù)庫(kù)中的書(shū)標(biāo)位置為標(biāo)準(zhǔn),在綜合考慮美觀、整齊、經(jīng)濟(jì)的基礎(chǔ)上制定適合本單位實(shí)施方案。
參考文獻(xiàn)
[1]黃艷芬.淺議合并院校圖書(shū)館館書(shū)目數(shù)據(jù)庫(kù)整的合[J].圖書(shū)館論壇,2003(4):20.