摘要:智慧圖書館時(shí)代,圖書館編目工作逐漸從傳統(tǒng)人力重復(fù)勞動(dòng)工作轉(zhuǎn)變?yōu)樽詣?dòng)化編目管理和利用。隨著智慧信息化的融合,圖書館編目工作面臨著機(jī)遇與挑戰(zhàn),傳統(tǒng)的編目方式越來(lái)越跟不上時(shí)代的發(fā)展,而自動(dòng)化編目技術(shù)的應(yīng)用逐漸成為圖書館編目工作的研究方向。文章從分析編目實(shí)踐角度看編目自動(dòng)化的優(yōu)缺點(diǎn),探索編目自動(dòng)化技術(shù)在圖書館編目工作中應(yīng)用的可行性策略。
關(guān)鍵詞:編目自動(dòng)化;圖書編目;編目工作
中圖分類號(hào):G254.3文獻(xiàn)標(biāo)志碼:A
0引言
圖書編目工作是一項(xiàng)非常煩瑣細(xì)致的工作,書目數(shù)據(jù)的創(chuàng)建是一項(xiàng)耗時(shí)、耗力、低產(chǎn)出的工作,因此,需要引入編目自動(dòng)化新技術(shù)。通過(guò)編目自動(dòng)化對(duì)圖書書目數(shù)據(jù)進(jìn)行編目,為圖書編目工作提供助力,真正把圖書編目工作帶入智慧化圖書館時(shí)代。
1圖書編目工作概述
圖書編目通常是指以特定的使用對(duì)象和目的,按照相應(yīng)的規(guī)則及方法為各種文獻(xiàn)資源進(jìn)行分類整理、編制目錄,從而建立館藏目錄體系的工作,簡(jiǎn)稱編目,其主要任務(wù)是對(duì)文獻(xiàn)資料的內(nèi)容和形式特征進(jìn)行描述和揭示[1]。圖書編目是文獻(xiàn)信息資源管理中的一項(xiàng)技術(shù)性基礎(chǔ)工作,它的主要作用是通過(guò)編制目錄對(duì)文獻(xiàn)信息進(jìn)行有序化處理,對(duì)文獻(xiàn)資料進(jìn)行書目控制,通過(guò)目錄控制文獻(xiàn)資料的存在狀況和特征,以達(dá)到利用文獻(xiàn)資源、交流書目信息以及資源共享的目的,從而為用戶提供信息服務(wù)[2]。
圖書編目工作發(fā)展到現(xiàn)在經(jīng)歷了3個(gè)階段,分別是手工編目、計(jì)算機(jī)編目和聯(lián)合編目。傳統(tǒng)的編目方式是統(tǒng)編鉛印卡片目錄,隨著計(jì)算機(jī)技術(shù)的發(fā)展,傳統(tǒng)手工方式向計(jì)算機(jī)編目轉(zhuǎn)變。計(jì)算機(jī)編目是指依據(jù)編目規(guī)則,運(yùn)用計(jì)算機(jī)編制機(jī)讀目錄格式,以特定結(jié)構(gòu)和代碼形式記錄在計(jì)算機(jī)載體上,能夠通過(guò)計(jì)算機(jī)識(shí)別并編輯制作書目信息。聯(lián)合編目是指運(yùn)用計(jì)算機(jī)與互聯(lián)網(wǎng)信息技術(shù),由眾多圖書館一起合作編目,利用具有統(tǒng)一標(biāo)準(zhǔn)的書刊聯(lián)合目錄數(shù)據(jù)庫(kù),在此基礎(chǔ)上進(jìn)行聯(lián)機(jī)共享編目,即任何一個(gè)授權(quán)成員圖書館對(duì)入館新文獻(xiàn)的編目下載以后,其他圖書館成員便能夠從網(wǎng)上查詢并下載,從而減少了文獻(xiàn)編目工作中的重復(fù)工作,提高文獻(xiàn)數(shù)據(jù)質(zhì)量和信息加工效率,實(shí)現(xiàn)文獻(xiàn)資源的互通與互享,加快文獻(xiàn)信息的傳遞[3]。
2編目自動(dòng)化的概述
在智慧化圖書館時(shí)代,圖書館編目工作面臨著機(jī)遇與挑戰(zhàn)。傳統(tǒng)的編目工作是一項(xiàng)非常煩瑣復(fù)雜的工作,在編目過(guò)程中,通過(guò)實(shí)物書對(duì)照來(lái)獲取信息的方式比較煩瑣,人工操作存在不確定性,因此,需要引入各種自動(dòng)化技術(shù)。通過(guò)編目自動(dòng)化技術(shù)工具輔助,對(duì)圖書信息進(jìn)行編目,由手工輸入過(guò)程變成機(jī)器輸入,或由純?nèi)斯ぬ顚懽兂芍恍枰斯ばr?yàn),從而減少工作量,提高工作效率,為圖書編目工作的融合創(chuàng)新發(fā)展提供助力,更好地實(shí)現(xiàn)圖書資源的共享和利用。
2.1編目自動(dòng)化的優(yōu)點(diǎn)
2.1.1提高編目工作效率和準(zhǔn)確性
傳統(tǒng)圖書編目工作需要手工操作,環(huán)節(jié)多、重復(fù)操作率高、耗時(shí)長(zhǎng)、效率低,人工操作容易出錯(cuò),比如錯(cuò)誤著錄題名、責(zé)任者、出版信息等需要客觀著錄的信息,影響圖書編目質(zhì)量。智慧圖書館時(shí)代,圖書編目工作可以通過(guò)使用智能化方法對(duì)圖書進(jìn)行編目工作,減輕編目工作量。例如,采用光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)可以自動(dòng)識(shí)別圖書信息,包括題名、責(zé)任者、出版信息等,并將這些信息轉(zhuǎn)化為可編輯的文本形式。OCR是一種將圖像中的字符轉(zhuǎn)換為可編輯文本的技術(shù),OCR識(shí)別技術(shù)的原理是通過(guò)對(duì)圖像進(jìn)行分析和處理,提取出其中的文字信息[4]。在編目實(shí)踐中,編目員通過(guò)采用OCR技術(shù)拍攝圖書,將圖片中的文字轉(zhuǎn)化為可編輯的文本,從而自動(dòng)錄入,減輕了編目員的工作負(fù)擔(dān),提高工作效率,通過(guò)OCR技術(shù)還可以自動(dòng)識(shí)別圖書的題名、出版社、責(zé)任者等,避免手動(dòng)錄入過(guò)程中出現(xiàn)的漏字、錯(cuò)別字等問(wèn)題,確保圖書信息的準(zhǔn)確性。
2.1.2降低培訓(xùn)難度,節(jié)約人力成本
隨著現(xiàn)代出版行業(yè)蓬勃發(fā)展,出版量日益增大,圖書館新書采購(gòu)、入藏量也隨之不斷增大,但是圖書館在館編目員數(shù)量是一定的,依靠館內(nèi)編目員進(jìn)行逐條編目很難在有限時(shí)間完成所有新書的編目工作,因此,大多數(shù)圖書館會(huì)選擇將編目業(yè)務(wù)進(jìn)行外包,以達(dá)到節(jié)約成本提高效率的目的。然而編目外包公司招錄的編目員大部分缺乏圖書館專業(yè)知識(shí),不是圖情專業(yè)科班出身,沒(méi)有系統(tǒng)學(xué)習(xí)過(guò)《中文圖書機(jī)讀目錄格式》和《中國(guó)圖書館分類法》等著錄規(guī)則、分類法知識(shí)。外包公司更是為了節(jié)約時(shí)間和成本,往往只是對(duì)員工進(jìn)行短時(shí)間培訓(xùn)就直接上崗實(shí)操,編目員大部分都是邊干邊學(xué),在實(shí)際工作中,經(jīng)常會(huì)出現(xiàn)錯(cuò)字、漏字、多字、遺落字段等硬傷問(wèn)題,對(duì)標(biāo)引和分類問(wèn)題更是缺乏深度思考,導(dǎo)致標(biāo)引分類錯(cuò)誤。圖書館在編編目員的初學(xué)者從零基礎(chǔ)到獨(dú)立自主編目至少需要半年時(shí)間,需要逐個(gè)字段地掌握具體編目規(guī)則、對(duì)圖書的主題詞和分類法有深度思考,編目這個(gè)工作還需要以老帶新的模式不斷積累經(jīng)驗(yàn)。而外包公司為了追求經(jīng)濟(jì)效益,不會(huì)對(duì)外包編目員進(jìn)行長(zhǎng)時(shí)間的崗前培訓(xùn),編目工作是計(jì)件工作,為了追求數(shù)量,外包公司編目員必然會(huì)在短時(shí)間內(nèi)完成更多的數(shù)據(jù)數(shù)量,在沒(méi)有新技術(shù)的前提下,數(shù)據(jù)數(shù)量和數(shù)據(jù)質(zhì)量本身就是矛盾體,勢(shì)必會(huì)導(dǎo)致編目數(shù)據(jù)出現(xiàn)硬傷錯(cuò)誤,從而影響圖書檢索的準(zhǔn)確性。編目自動(dòng)化系統(tǒng)可以自動(dòng)完成圖書編目流程,降低編目成本。對(duì)于使用者來(lái)說(shuō),需要了解編目自動(dòng)化系統(tǒng)的使用方法,簡(jiǎn)單了解編目基本規(guī)則和分類法。編目員可以借助編目系統(tǒng),做出契合本圖書館規(guī)則的書目數(shù)據(jù)。湖北三新文化傳媒有限公司在降低編目難度、降低培訓(xùn)難度和節(jié)約人力成本方面做出了創(chuàng)新性研究,開(kāi)發(fā)了一個(gè)獨(dú)立于業(yè)務(wù)系統(tǒng)的編目數(shù)據(jù)預(yù)生成、核驗(yàn)的在線編目協(xié)作平臺(tái)。系統(tǒng)中自帶280條固定編目規(guī)則,這些編目規(guī)則提煉全國(guó)1000多家圖書館的日常編目中共性的部分。通過(guò)對(duì)編目規(guī)則的解讀,解讀為標(biāo)準(zhǔn)格式,由開(kāi)發(fā)人員對(duì)這部分規(guī)則進(jìn)行配置,配置成系統(tǒng)中的圖書館自定義編目規(guī)則,導(dǎo)入實(shí)際的數(shù)據(jù),通過(guò)規(guī)則處理之后,將處理的結(jié)果逐個(gè)字段進(jìn)行驗(yàn)證。編目自動(dòng)化集合編目數(shù)據(jù)聚合套錄、編目數(shù)據(jù)生成、外部數(shù)據(jù)導(dǎo)入、數(shù)據(jù)智能校對(duì)等功能為一體,將編目數(shù)據(jù)制作的時(shí)間由原來(lái)的分鐘級(jí)降至毫秒級(jí),從而大大節(jié)約了人力成本。
2.2編目自動(dòng)化面臨的問(wèn)題和挑戰(zhàn)
2.2.1需要克服自動(dòng)分類和標(biāo)引的技術(shù)難題
圖書標(biāo)引和分類是圖書編目工作賴以生存的基礎(chǔ),是編目工作的一個(gè)重要環(huán)節(jié),也是編目工作的一個(gè)難點(diǎn),如何利用編目自動(dòng)化技術(shù)實(shí)現(xiàn)標(biāo)引和分類的自動(dòng)化是編目自動(dòng)化面臨的一個(gè)重大挑戰(zhàn)。標(biāo)引和分類自動(dòng)化旨在根據(jù)圖書內(nèi)容自動(dòng)分類,不過(guò)這項(xiàng)技術(shù)需要投入大量的研發(fā)成本和技術(shù)支持,目前來(lái)看,還暫時(shí)不能準(zhǔn)確實(shí)現(xiàn)自動(dòng)化分類和標(biāo)引?,F(xiàn)有自動(dòng)化編目數(shù)據(jù)的主題標(biāo)引和分類標(biāo)引存在著直接套錄CIP(在版編目)數(shù)據(jù),無(wú)法做到真實(shí)揭示圖書主題和對(duì)圖書進(jìn)行準(zhǔn)確分類。
例1:《飛行疲勞管理》徐莉,李嘉主編
606# $a飛行疲勞$x管理(CIP標(biāo)識(shí))
690##V321.95(CIP標(biāo)識(shí))
本書從書名看,似乎講的是飛機(jī)疲勞,實(shí)際上,本書通過(guò)對(duì)飛行人員的健康狀況及生活方式進(jìn)行分析,總結(jié)提煉了疲勞管理在飛行工作中的應(yīng)用。實(shí)質(zhì)上講的是飛行員疲勞影響飛機(jī)飛行安全,CIP原分類號(hào)為航空發(fā)動(dòng)機(jī)的疲勞,因此,該書應(yīng)給的690分類標(biāo)引為:
690##V328。
例2:《暢銷書》(美)奧利維亞·戈德史密斯(Olivia Goldsmith)著
606# $a暢銷書$x創(chuàng)作(CIP標(biāo)識(shí))
本書從書名看,是一本關(guān)于如何創(chuàng)作暢銷書的專著,實(shí)際上,本書將寫作的艱辛、競(jìng)爭(zhēng)的激烈、主人公之間的愛(ài)恨糾葛描述得淋漓盡致,情節(jié)跌宕起伏,是一部小說(shuō),因此,該書的正確主題標(biāo)引應(yīng)為:
606# $a長(zhǎng)篇小說(shuō)$y美國(guó)$z現(xiàn)代
2.2.2需要克服數(shù)據(jù)安全問(wèn)題
數(shù)據(jù)是圖書館的核心要素,數(shù)據(jù)安全是智慧化圖書館的重中之重。由于圖書館信息資源龐大,數(shù)據(jù)安全對(duì)于圖書館信息安全是非常重要的,對(duì)于圖書館來(lái)說(shuō),一旦發(fā)生數(shù)據(jù)安全事件,例如網(wǎng)絡(luò)攻擊、數(shù)據(jù)竊取、越權(quán)訪問(wèn)、信息泄露等,不僅會(huì)造成數(shù)字文化資源的損失,還會(huì)不可避免地對(duì)數(shù)字化圖書館信息安全產(chǎn)生潛在影響。編目自動(dòng)化平臺(tái)如果想要和圖書館編目系統(tǒng)完美融合,不可避免地需要和圖書館編目系統(tǒng)進(jìn)行對(duì)接,從而在編目自動(dòng)化系統(tǒng)處理工作時(shí),能直接從圖書館編目系統(tǒng)中獲取所需的數(shù)據(jù),在編目自動(dòng)化工作處理完成并經(jīng)編目員確認(rèn)之后,能直接從編目自動(dòng)化系統(tǒng)中將數(shù)據(jù)導(dǎo)入圖書館編目系統(tǒng)。
例:2001#$a 乞丐的愿望$b 專著$f (美)南?!た死姿怪?/p>
2252#$ 世界科幻大師叢書
462#0$1001002431595
投標(biāo)區(qū)LDR改為oam2
“世界科幻大師叢書”編目系統(tǒng)庫(kù)里是進(jìn)行了叢書總記錄的,因此,編目自動(dòng)化平臺(tái)要想和叢書總記錄進(jìn)行掛接,就需要和圖書館編目系統(tǒng)庫(kù)進(jìn)行對(duì)接,調(diào)取叢書總記錄號(hào),然后通過(guò)462字段進(jìn)行連接,讓本書《乞丐的愿望》能夠掛到叢書總記錄中去。而這個(gè)對(duì)接工作就不可避免地涉及數(shù)據(jù)安全問(wèn)題,編目自動(dòng)化系統(tǒng)是否會(huì)攻擊圖書館管理系統(tǒng)、竊取圖書館數(shù)據(jù)信息、對(duì)圖書館敏感數(shù)據(jù)進(jìn)行挖掘,這對(duì)圖書館管理來(lái)說(shuō)也是一個(gè)不小的挑戰(zhàn)。
3編目自動(dòng)化實(shí)現(xiàn)的思考
關(guān)于自動(dòng)著錄、自動(dòng)標(biāo)引問(wèn)題。人工智能技術(shù)已經(jīng)經(jīng)歷了數(shù)十年的發(fā)展,在自然語(yǔ)言理解、深度學(xué)習(xí)技術(shù)、機(jī)器學(xué)習(xí)和知識(shí)獲取等領(lǐng)域有了深入的進(jìn)展,技術(shù)上的突破為圖書編目自動(dòng)化實(shí)現(xiàn)增加了可能性。就編目而言,一本圖書的完整編目模塊分為圖書的物理特征描述、圖書主題內(nèi)容揭示和責(zé)任者規(guī)范控制3個(gè)模塊。要想編目自動(dòng)化像人一樣,自動(dòng)著錄一條完整、準(zhǔn)確的數(shù)據(jù)是有待研究的,但是如果讓這3個(gè)模塊分別單獨(dú)進(jìn)行深度學(xué)習(xí),等這3個(gè)模塊深度學(xué)習(xí)調(diào)整到最優(yōu)狀態(tài),再讓它們相互作用、相互影響、相互連接,實(shí)現(xiàn)真正的編目自動(dòng)化,還是值得期待的。
關(guān)于數(shù)據(jù)安全問(wèn)題,編目自動(dòng)化系統(tǒng)如果和圖書館編目系統(tǒng)進(jìn)行對(duì)接,圖書館系統(tǒng)就需要采用先進(jìn)的技術(shù)手段保護(hù)本館數(shù)據(jù)的安全,例如:建立數(shù)據(jù)備份系統(tǒng),對(duì)館內(nèi)數(shù)據(jù)進(jìn)行備份;對(duì)重要數(shù)據(jù)進(jìn)行屏蔽,未經(jīng)授權(quán)不得隨意查看;對(duì)數(shù)據(jù)進(jìn)行加密,保證數(shù)據(jù)在使用過(guò)程中不被非法獲??;對(duì)越權(quán)訪問(wèn)的軟件進(jìn)行限制訪問(wèn)等,編目自動(dòng)化平臺(tái)對(duì)接編目數(shù)據(jù)庫(kù)時(shí),只開(kāi)放部分權(quán)限,以防平臺(tái)篡改數(shù)據(jù),造成數(shù)據(jù)的泄露。
對(duì)于編目員而言,編目自動(dòng)化改變了傳統(tǒng)編目工作模式,提高了工作效率,是一種全新的編目工作模式,是利用人工智能技術(shù)進(jìn)行內(nèi)容創(chuàng)作和編輯。因此,編目員需要具備大局意識(shí),理解編目自動(dòng)化的重要性和必要性,并且需要主動(dòng)學(xué)習(xí)編目自動(dòng)化的使用方法和操作技巧,善于發(fā)現(xiàn)編目自動(dòng)化的優(yōu)點(diǎn)和缺點(diǎn),提出改進(jìn)建議,推動(dòng)編目自動(dòng)化的完善和發(fā)展。
4結(jié)語(yǔ)
隨著自然語(yǔ)言處理技術(shù)、機(jī)器深度學(xué)習(xí)技術(shù)等各種信息技術(shù)的發(fā)展,探索編目自動(dòng)化平臺(tái)在圖書編目領(lǐng)域應(yīng)用已經(jīng)成為大勢(shì)所趨。應(yīng)用智能化自動(dòng)化技術(shù)進(jìn)行圖書編目,可以最大限度發(fā)揮人機(jī)結(jié)合優(yōu)勢(shì),提高編目的工作效率,降低編目人工成本。未來(lái)的發(fā)展方向上,需要借助人工智能技術(shù),對(duì)編目自動(dòng)標(biāo)引進(jìn)行更深度的學(xué)習(xí),提高編目數(shù)據(jù)質(zhì)量的可靠性,加強(qiáng)編目員人才的培養(yǎng),為編目自動(dòng)化更進(jìn)一步發(fā)展提供智力支持。
參考文獻(xiàn)
[1]盧紅梅.高校圖書館編目工作存在的問(wèn)題及對(duì)策研究:以聊城大學(xué)圖書館為例[D].保定:河北大學(xué),2009.
[2]何樂(lè).數(shù)字環(huán)境下我國(guó)文獻(xiàn)編目工作的變革與創(chuàng)新研究[D].南昌:南昌大學(xué),2019.
[3]方威明.我國(guó)聯(lián)機(jī)編目現(xiàn)狀述要[J].圖書館建設(shè),2001(2):28-30.
[4]李利沛.數(shù)字化時(shí)代圖書館編目工作的自動(dòng)化與智能化發(fā)展研究[J].中文科技期刊數(shù)據(jù)庫(kù)(全文版)社會(huì)科學(xué),2023(6):49-52.
(編輯何琳編輯)
Feasibility study of cataloging automation from the perspective of cataloging practice
Zhu ?Yunqin
(National Library of China, Beijing 100081, China)
Abstract: ?In the era of smart libraries, library cataloging work has gradually shifted from traditional manual repetitive labor to automated cataloging management and utilization. With the integration of intelligent information technology, library cataloging work is facing both opportunities and challenges. Traditional cataloging methods are no longer keeping up with the development of the times, and the application of automated cataloging technology is gradually becoming a research direction for library cataloging work. The article analyzes the advantages and disadvantages of cataloging automation from the perspective of cataloging practice, and explores the feasibility strategies of applying cataloging automation technology in library cataloging work.
Key words: cataloging automation; book cataloging; cataloging
作者簡(jiǎn)介:朱云秦(1990— ),女,館員,碩士研究生;研究方向:中文圖書編目。