巫紅霞
(鎮(zhèn)江高等專科學(xué)校 裝備制造學(xué)院,江蘇 鎮(zhèn)江 212003)
數(shù)據(jù)挖掘在高校圖書館藏書管理中的應(yīng)用
巫紅霞
(鎮(zhèn)江高等??茖W(xué)校 裝備制造學(xué)院,江蘇 鎮(zhèn)江 212003)
利用數(shù)據(jù)挖掘技術(shù)分析圖書借閱數(shù)據(jù),可以科學(xué)地剔除舊圖書,同時(shí)為最新的圖書在書架中預(yù)留空間,減少館藏圖書倒架次數(shù),合理布局館藏書架,優(yōu)化館藏資源和空間。
圖書館;數(shù)據(jù)挖掘;書架;藏書管理
高校圖書館依托豐富的館藏資源為廣大師生服務(wù)[1]。圖書館資源以紙質(zhì)圖書為主。紙質(zhì)圖書主要存放在館藏書架中。圖書館藏書品種和數(shù)量逐漸增加,與有限的館藏書架之間的矛盾日益凸顯。這就要求圖書管理人員能夠合理利用有限的館藏書架存放更具價(jià)值的圖書,完成這項(xiàng)工作的關(guān)鍵是預(yù)測(cè)圖書的變化趨勢(shì),利用數(shù)據(jù)挖掘技術(shù)可以很好地解決這一問題。
數(shù)據(jù)挖掘(Data Mining,DM)[2]最早出現(xiàn)于1989年,就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)庫中提取隱性信息并且加工成可理解的信息和知識(shí)的過程。數(shù)據(jù)挖掘常用的方法有關(guān)聯(lián)規(guī)則、決策樹及統(tǒng)計(jì)分析等。數(shù)據(jù)挖掘的任務(wù)主要是能分類、回歸、時(shí)間序列分析、預(yù)測(cè)、聚類、匯總、關(guān)聯(lián)規(guī)則、序列發(fā)現(xiàn)等。
剔除舊圖書[3]一般指對(duì)破舊、過時(shí)的或者失去價(jià)值的圖書進(jìn)行清理。比如因年代久遠(yuǎn)變得陳舊或內(nèi)容滯后而失去參考價(jià)值的圖書、有新版或修訂版的圖書、殘缺破損不利于閱讀的圖書、復(fù)本過多[4]的圖書、在規(guī)定時(shí)間內(nèi)未流通的圖書、借閱率低的圖書,都可以作為剔舊圖書而入藏舊書庫。
在實(shí)際工作中,對(duì)于殘缺破損的或有新版、修訂版的圖書,剔除工作相對(duì)簡(jiǎn)單,復(fù)本過多的圖書和借閱率低的圖書的剔舊工作相對(duì)困難。利用數(shù)據(jù)挖掘技術(shù)可以科學(xué)地分析圖書的復(fù)本數(shù),統(tǒng)計(jì)圖書在一定周期內(nèi)的借閱次數(shù),從而得出借閱率。但單從借閱率低、復(fù)本數(shù)多等方面考慮剔除舊圖書是不科學(xué)的。有些優(yōu)秀的圖書往往會(huì)被反復(fù)續(xù)借,并長(zhǎng)期在某一特定用戶手中,其借閱次數(shù)不一定很多,但借閱時(shí)間很長(zhǎng)。這些圖書并不一定能在借閱次數(shù)上體現(xiàn)其優(yōu)勢(shì),因此,還需要統(tǒng)計(jì)圖書的平均借閱時(shí)間,并依此設(shè)定平均借閱閾值,去掉未達(dá)到閾值的圖書,找到館藏中借閱時(shí)間較長(zhǎng)的圖書。
以鎮(zhèn)江高等專科學(xué)校圖書館為例,統(tǒng)計(jì)中文圖書的借閱率,并進(jìn)行分析。設(shè)定借閱時(shí)間為2013年1月至2014年6月,借閱率小于0.3。通過數(shù)據(jù)挖掘得到如圖1所示的統(tǒng)計(jì)結(jié)果。
在圖1中,我們可以看到,《晨讀十分鐘》復(fù)本數(shù)為12,借閱次數(shù)為2,借閱率低,可以適當(dāng)降低復(fù)本數(shù)。同樣,《語文學(xué)科知識(shí)與教學(xué)能力》復(fù)本數(shù)為6,借閱次數(shù)為1,借閱率也比較低,可以降低復(fù)本數(shù)。
圖書排架[5]就是將已經(jīng)加工整理的圖書按照某種標(biāo)準(zhǔn)和次序陳放在書架上的過程。鎮(zhèn)江高等??茖W(xué)校圖書館是根據(jù)圖書分類號(hào)來排架的,其優(yōu)點(diǎn)是, 讀者能夠比較方便準(zhǔn)確地找到所需要的圖書,并在查找自己所要的圖書的同時(shí)關(guān)注相似的圖書。缺點(diǎn):1) 讀者需要準(zhǔn)確知道欲借圖書的索書號(hào)。2) 圖書館必須為各類新進(jìn)圖書預(yù)留合理的書架空間,否則會(huì)導(dǎo)致圖書的重新整架甚至倒架,增加圖書管理人員的工作量。3) 讀者進(jìn)入圖書館借書,很可能就在某類自己感興趣的圖書中查閱,很少同時(shí)關(guān)注其他類別的圖書。
圖1 圖書借閱率統(tǒng)計(jì)分析
因此,需要對(duì)圖書館系統(tǒng)中的數(shù)據(jù)進(jìn)行挖掘分析,了解各類圖書的利用率[6]和更新指數(shù),統(tǒng)計(jì)各類圖書借閱情況??梢愿鶕?jù)圖書的利用率合理排架,即將利用率高的圖書陳放在容易查找的書架上。可以根據(jù)圖書的更新指數(shù)預(yù)留書架空間。可以根據(jù)某一時(shí)期圖書借閱次數(shù)排行榜找出最受歡迎的圖書,開設(shè)《好書介紹》欄目,甚至可以針對(duì)特定群體進(jìn)行好書介紹和推薦。設(shè)立專門的書架為圖書展讀處,最好設(shè)立在讀者進(jìn)入圖書館的必經(jīng)之地,吸引讀者注意。圖書館也可以主辦各類讀書節(jié)活動(dòng)吸引讀者。
以鎮(zhèn)江高等專科學(xué)校圖書館為例,圖書利用率統(tǒng)計(jì)結(jié)果詳見圖2。從圖2可以看出,B類(哲學(xué)類)、H類(語言、文字類)、I類(文學(xué)類)、K類(歷史、地理類)、Q類(生物科學(xué)類)等圖書的利用率高,可以將放置這幾類圖書的書架放在容易查找、方便上架的地方。
圖2 圖書利用率分析
在圖3中,《哈佛家訓(xùn)大全集》《誰還在背單詞,大學(xué)英語四級(jí)詞匯》《你好,舊時(shí)光(全3冊(cè))》《Q版漫畫技法從入門到精通》等借閱次數(shù)較多,可以將它們作為熱門圖書推薦放在最受歡迎圖書的書架上。
在圖4中,B類(哲學(xué)類)、D類(政治法律類)、F類(經(jīng)濟(jì)類)、G類(文化、科學(xué)、教育、體育類)、H類(語言、文字類)、I類(文學(xué)類)、J類(藝術(shù)類)、K類(歷史、地理類)、T類(工業(yè)技術(shù)類)等圖書的更新指數(shù)較高,因此要增加這幾類圖書的書架預(yù)留空間。
高校圖書館館藏圖書多且更新快。合理布局館藏書架是圖書館工作的重要部分。合理布局館藏書架、優(yōu)化館藏圖書不僅可以減少圖書館工作人員的勞動(dòng)量, 方便讀者借閱,而且可以提高圖書館的服務(wù)質(zhì)量和圖書的利用率。
圖3 圖書借閱次數(shù)排行榜
圖4 圖書更新指數(shù)分析
本文只是簡(jiǎn)單地介紹了數(shù)據(jù)挖掘技術(shù)在高校圖書館藏書管理工作中的應(yīng)用。隨著數(shù)據(jù)挖掘技術(shù)的不斷深入研究,其在圖書館工作中的應(yīng)用也會(huì)越來越廣,比如進(jìn)行圖書采購、讀者個(gè)性化服務(wù)、領(lǐng)導(dǎo)的決策分析等。
[1] 方小蘇.圖書館館藏資源配置的效率分析[J].圖書情報(bào)工作,2005(7):91-93.
[2] 巫紅霞.基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的高校教學(xué)管理決策支持系統(tǒng)[D].南京:南京航空航天大學(xué),2009:5.
[3] 王忠,劉惠琴.談?wù)勷^藏中文圖書剔舊工作[J].圖書館論壇,1995(3):41-42.
[4] 梅國(guó)華.分類排架研究綜述[J].圖書情報(bào)工作,2004(3):102-104.
[5] 劉新文.圖書館圖書復(fù)本量的定量分析[J].西南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007(4):87-89.
[6] 胡振華,蔡新.基于解釋結(jié)構(gòu)模型的高校圖書館紙質(zhì)資源利用率影響因素分析[J].圖書情報(bào)工作,2010(4):46-50.
〔責(zé)任編輯: 盧 蕊〕
Applicationofdatamininginmanagementofuniversitylibrarycollections
WUHong-xia
(School of Equipment Manufacturing, Zhenjiang College, Zhenjiang 212300, China)
Using data mining techniques to analyze the data of library borrowing can help to remove the old literature in a scientific and rational way and reserve space for the latest literature on the bookshelf, reduce the number of book collections on the shelves and optimize the resources and space for collection with reasonable layout of library shelves.
library; data mining; bookshelf; library collection management
2014-09-28
巫紅霞(1977—),男,江蘇句容人,講師,碩士,主要從事計(jì)算機(jī)數(shù)據(jù)庫、數(shù)據(jù)挖掘研究。
G253.5
: C
:1008-8148(2015)02-0046-03