張宏偉,史惠媛
黑龍江中醫(yī)藥大學(xué),黑龍江 哈爾濱 150040
?
數(shù)據(jù)挖掘在高校圖書(shū)館文獻(xiàn)采購(gòu)決策中的應(yīng)用——以黑龍江中醫(yī)藥大學(xué)圖書(shū)館為例
張宏偉,史惠媛
黑龍江中醫(yī)藥大學(xué),黑龍江 哈爾濱 150040
摘要:在高校圖書(shū)館文獻(xiàn)采購(gòu)過(guò)程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)讀者利用圖書(shū)館歷史數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)出圖書(shū)采購(gòu)經(jīng)費(fèi)分配比例,按照讀者閱讀需求采購(gòu)熱點(diǎn)圖書(shū),補(bǔ)充缺漏圖書(shū)及復(fù)本量不足圖書(shū),進(jìn)而為文獻(xiàn)采購(gòu)工作提供科學(xué)、合理的決策依據(jù)。
關(guān)鍵詞:高校圖書(shū)館;文獻(xiàn)采購(gòu);數(shù)據(jù)挖掘
【引文格式】張宏偉,史惠媛.數(shù)據(jù)挖掘在高校圖書(shū)館文獻(xiàn)采購(gòu)決策中的應(yīng)用——以黑龍江中醫(yī)藥大學(xué)圖書(shū)館為例[J].中國(guó)中醫(yī)藥圖書(shū)情報(bào)雜志,2016,40(2):22-24.DOI:10.3969/j.issn.2095-5707.2016.02.006
程煥文先生認(rèn)為資源是圖書(shū)館絕對(duì)的至高無(wú)上的王[1]。文獻(xiàn)采購(gòu)是高校圖書(shū)館文獻(xiàn)資源建設(shè)的第一站,是決定文獻(xiàn)資源建設(shè)質(zhì)量的最重要的關(guān)鍵環(huán)節(jié)。隨著圖書(shū)價(jià)格持續(xù)上漲,高校圖書(shū)館文獻(xiàn)購(gòu)置費(fèi)相對(duì)有限,在圖書(shū)采購(gòu)過(guò)程中如何保證館藏結(jié)構(gòu)科學(xué)性的同時(shí),提高紙質(zhì)文獻(xiàn)資源利用率,是圖書(shū)館亟待解決的問(wèn)題。
數(shù)據(jù)挖掘(date mining)是從大量的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識(shí)的過(guò)程。圖書(shū)館自動(dòng)化管理系統(tǒng)每天會(huì)產(chǎn)生大量流通、檢索、查詢等數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行挖掘,可以獲知讀者個(gè)性化需求、文獻(xiàn)利用率等信息。利用這些信息對(duì)已有館藏進(jìn)行評(píng)估,可以為文獻(xiàn)采購(gòu)工作提供科學(xué)、合理的決策依據(jù)。
目前,高校圖書(shū)館紙質(zhì)文獻(xiàn)傳統(tǒng)采購(gòu)決策過(guò)程中,決策主觀性較強(qiáng),客觀依據(jù)不足[2]。文獻(xiàn)采購(gòu)多以現(xiàn)場(chǎng)采購(gòu)和書(shū)目采購(gòu)為主,采購(gòu)人員少,對(duì)各專業(yè)、學(xué)科所需文獻(xiàn)資源把握不到位、訂購(gòu)精確度不高。一方面受采購(gòu)人員的知識(shí)結(jié)構(gòu)、專業(yè)背景、業(yè)務(wù)素質(zhì)及工作經(jīng)驗(yàn)等因素的限制,圖書(shū)館文獻(xiàn)采購(gòu)決策長(zhǎng)期以來(lái)停留在憑經(jīng)驗(yàn)和靠感覺(jué)的水平上,文獻(xiàn)采購(gòu)時(shí)主觀判斷成分過(guò)多。另一方面讀者參與文獻(xiàn)采購(gòu)的熱情不高,使得文獻(xiàn)采購(gòu)的采全率和采準(zhǔn)率不高,導(dǎo)致學(xué)校投入的有限購(gòu)書(shū)經(jīng)費(fèi)所購(gòu)文獻(xiàn)資源利用率不高,讀者文獻(xiàn)需求得不到滿足和保障[3]。
為了使文獻(xiàn)采購(gòu)工作更客觀、科學(xué)、合理,有必要應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)讀者借閱流通、檢索查詢、預(yù)約借書(shū)、博碩學(xué)位論文引文等歷史數(shù)據(jù)進(jìn)行定性和定量分析,獲知讀者個(gè)性化閱讀需求,為圖書(shū)館文獻(xiàn)采購(gòu)決策提供數(shù)據(jù)參考,進(jìn)而提高文獻(xiàn)資源采選質(zhì)量和館藏資源利用率。
2.1 依據(jù)借閱流通數(shù)據(jù)指導(dǎo)采購(gòu)資金分配
利用金盤(pán)圖書(shū)管理系統(tǒng)集成統(tǒng)計(jì)模塊對(duì)每年各大類圖書(shū)借閱流通情況進(jìn)行統(tǒng)計(jì),得到讀者借閱量趨勢(shì)變化情況,進(jìn)而預(yù)測(cè)讀者需求量,指導(dǎo)下一年采購(gòu)經(jīng)費(fèi)在各大類文獻(xiàn)中的投入增減情況[4]。遵循文獻(xiàn)利用率最大效應(yīng)原則,對(duì)于零借閱的圖書(shū)應(yīng)減少或停止采購(gòu),保證各大類圖書(shū)的借閱流通數(shù)量和采購(gòu)經(jīng)費(fèi)所占比重相一致,有針對(duì)性地補(bǔ)充館藏文獻(xiàn)資源,從而達(dá)到資源優(yōu)化配置。
黑龍江中醫(yī)藥大學(xué)圖書(shū)館2013、2014、2015年圖書(shū)采購(gòu)經(jīng)費(fèi)分別為166.1萬(wàn)、155.9萬(wàn)、143.2萬(wàn)元人民幣,借閱量分別為71 112、87 278、80 538冊(cè)。表1中列出這3年各類借出圖書(shū)所占采購(gòu)經(jīng)費(fèi)及借閱量的百分比,據(jù)此可以指導(dǎo)2016年制定文獻(xiàn)資源采購(gòu)計(jì)劃,合理分配各類圖書(shū)采購(gòu)經(jīng)費(fèi),使采購(gòu)決策更加科學(xué)合理,最大限度地提升館藏資源利用率。
表1 2013-2015年黑龍江中醫(yī)藥大學(xué)圖書(shū)館圖書(shū)采購(gòu)經(jīng)費(fèi)分配與圖書(shū)借閱量統(tǒng)計(jì)(%)
2.2 依據(jù)檢索查詢數(shù)據(jù)獲知讀者亟需文獻(xiàn)
利用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則對(duì)讀者每個(gè)月圖書(shū)檢索查詢數(shù)據(jù)進(jìn)行自動(dòng)捕捉、采集和整理,過(guò)濾冗余信息。將讀者關(guān)注度較高的檢索詞按使用次數(shù)降序排列(見(jiàn)圖1)。對(duì)照2014年熱門圖書(shū)檢索詞排行榜,取檢索次數(shù)≥50次的圖書(shū)作為熱點(diǎn)圖書(shū),這些是讀者迫切亟需的文獻(xiàn)資源,圖書(shū)館應(yīng)對(duì)照館藏規(guī)劃,優(yōu)先采購(gòu)人氣熱點(diǎn)圖書(shū)。
2.3 依據(jù)圖書(shū)預(yù)約借書(shū)數(shù)據(jù)補(bǔ)充館藏復(fù)本量
預(yù)約借書(shū)是指讀者預(yù)約登記某種借出狀態(tài)的圖書(shū),該圖書(shū)歸還后,預(yù)約讀者優(yōu)先得到此書(shū)的借閱權(quán),館藏復(fù)本量不足是讀者預(yù)約借書(shū)的原因。圖書(shū)預(yù)約信息真實(shí)反映了讀者對(duì)某類圖書(shū)的實(shí)際需求。首先,采購(gòu)人員基于金盤(pán)管理系統(tǒng),對(duì)預(yù)約數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。其次,根據(jù)讀者預(yù)約次數(shù),形成預(yù)約熱點(diǎn)圖書(shū)的書(shū)目表。最后,通過(guò)與館藏書(shū)目數(shù)據(jù)比較,制定符合讀者需求的采購(gòu)計(jì)劃,確定復(fù)本采購(gòu)數(shù)量。及時(shí)補(bǔ)充館藏復(fù)本量不足的圖書(shū),提升圖書(shū)館的服務(wù)質(zhì)量和服務(wù)效果,使高校圖書(shū)館文獻(xiàn)資源保障能力得到加強(qiáng)。
圖1 黑龍江中醫(yī)藥大學(xué)圖書(shū)館熱門檢索詞排行榜
2.4 依據(jù)博碩士論文引文量補(bǔ)充缺漏圖書(shū)
博碩士學(xué)位論文的引文真實(shí)地反映出作者在撰寫(xiě)過(guò)程中對(duì)專業(yè)文獻(xiàn)的需求特點(diǎn)和規(guī)律,其引文具有數(shù)量大、范圍廣和學(xué)術(shù)質(zhì)量高的特點(diǎn)。博碩士學(xué)位論文是對(duì)以前成果的借鑒、利用和創(chuàng)新,參考文獻(xiàn)具有精選性,對(duì)文獻(xiàn)的學(xué)術(shù)價(jià)值具有評(píng)測(cè)功能。因此,對(duì)博碩士學(xué)位論文引文進(jìn)行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)博碩士所在學(xué)科信息需求的一般規(guī)律和特點(diǎn),有利于指導(dǎo)圖書(shū)館文獻(xiàn)信息資源的館藏建設(shè)?;诓┐T士學(xué)位論文在線提交系統(tǒng),對(duì)博碩論文引文量進(jìn)行統(tǒng)計(jì)分析,對(duì)照館藏將文獻(xiàn)引用頻次≥3的缺漏圖書(shū),列為預(yù)采購(gòu)圖書(shū)。并根據(jù)文獻(xiàn)購(gòu)置經(jīng)費(fèi)的許可程度,最終有重點(diǎn)、有層次對(duì)缺漏圖書(shū)進(jìn)行補(bǔ)充。
2.5 依據(jù)科技查新參考文獻(xiàn)獲知教學(xué)科研文獻(xiàn)需求
科技查新,是為避免科研課題重復(fù)立項(xiàng)和客觀正確地判別科研成果的創(chuàng)新性而設(shè)立的一項(xiàng)工作。通過(guò)科技查新工作,能為科研立項(xiàng),科技成果的鑒定、評(píng)估、驗(yàn)收、獎(jiǎng)勵(lì),專利申請(qǐng)等提供客觀依據(jù),為科研人員提供快捷、可靠、豐富的文獻(xiàn)支持。
黑龍江中醫(yī)藥大學(xué)圖書(shū)館檢索中心(中國(guó)中醫(yī)藥文獻(xiàn)檢索中心黑龍江分中心),是國(guó)家中醫(yī)管理局于1995年批準(zhǔn)成立的,為首批國(guó)家級(jí)定點(diǎn)查新分中心,也是我省中醫(yī)藥領(lǐng)域唯一的國(guó)家級(jí)查新單位。由于科研人員研究方向多,文獻(xiàn)需求廣,因此不易從個(gè)體角度來(lái)分析其文獻(xiàn)需求,但可以從群體角度來(lái)研究高校教研室、重點(diǎn)實(shí)驗(yàn)室所需文獻(xiàn)需求?;谖茵^科技查新系統(tǒng),對(duì)科研人員申報(bào)的科技查新參考文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘,可以對(duì)我校重點(diǎn)實(shí)驗(yàn)室所關(guān)注的研究領(lǐng)域、研究熱點(diǎn)和發(fā)展方向進(jìn)行分類和預(yù)測(cè)。通過(guò)專家咨詢、建立模型與數(shù)據(jù)可視化等動(dòng)態(tài)結(jié)合方式,生成重點(diǎn)實(shí)驗(yàn)室所需科研文獻(xiàn)采購(gòu)報(bào)告,為滿足該重點(diǎn)實(shí)驗(yàn)室文獻(xiàn)需求提供客觀準(zhǔn)確的采購(gòu)依據(jù)。
2015年,我館采購(gòu)原則是“保證中醫(yī)藥學(xué)科,兼顧醫(yī)學(xué)相關(guān)門類,關(guān)注學(xué)校新增專業(yè),滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展需求”。通過(guò)對(duì)上述5類數(shù)據(jù)綜合分析,形成科學(xué)、合理的客觀采購(gòu)依據(jù),輔助管理層作出及時(shí)有效的決策,進(jìn)而制定2016年的圖書(shū)采購(gòu)原則,即“中醫(yī)類求精、西醫(yī)類求新、關(guān)注新增專業(yè)、滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展要求”。
3 小結(jié)
應(yīng)用數(shù)據(jù)挖掘技術(shù)從海量的借閱流通數(shù)據(jù)中預(yù)測(cè)采購(gòu)經(jīng)費(fèi)比例,對(duì)照年度采購(gòu)原則和計(jì)劃,將讀者亟需的圖書(shū)進(jìn)行分類,按需求頻度進(jìn)行排序,頻度相同、資金有限或數(shù)量已達(dá)上限的情況下,以優(yōu)先滿足教學(xué)和科研圖書(shū)為采購(gòu)原則。需要指出的是,采購(gòu)決策應(yīng)以實(shí)際數(shù)據(jù)為參考,同時(shí)也要避免唯數(shù)據(jù)論,對(duì)時(shí)效性強(qiáng)、借閱量大的教材、輔導(dǎo)類等圖書(shū)要控制其采購(gòu)的種數(shù)和復(fù)本量,可通過(guò)購(gòu)買電子書(shū)形式予以解決。在經(jīng)費(fèi)有限的情況下使投入產(chǎn)出收益達(dá)到最大化,真正做到“每位讀者有其書(shū)”和“每本書(shū)有其讀者”。
參考文獻(xiàn)
[1]程煥文.圖書(shū)館的價(jià)值與使命[J].圖書(shū)館雜志,2013(3):4-8.
[2]王春生.我國(guó)圖書(shū)館實(shí)施讀者主導(dǎo)式采購(gòu)的策略[J].圖書(shū)情報(bào)工作,2013,57(5):71-75.
[3]杜友桃,伍曉光,宋宇.圖書(shū)館文獻(xiàn)采訪中讀者薦購(gòu)工作探討[J].中國(guó)中醫(yī)藥圖書(shū)情報(bào)雜志,2014,38(2):51-54.
[4]袁芳.大數(shù)據(jù)環(huán)境下圖書(shū)館文獻(xiàn)資源建設(shè)模式的變革[J].圖書(shū)情報(bào)工作,2015,59(18):91-94.
(修回日期:2016-01-23;編輯:魏民)
Applicatin of Data Mining in the Literature Purchasing Decisions of Libraries of the Colleges and Universities - Taking Library of Heilongjiang University of Chinese Medicine as an Example
ZHANG Hong-wei,SHI Hui-yuan
(Heilongjiang University of Chinese Medicine,Harbin Heilongjiang 150040,China)
Abstract:In the literature purchasing process of libraries of the colleges and universities,applying data mining technology in the analysis of library historical data can predict the allocation proportion of book purchasing budget,purchase hotspot books according to readers’ reading demands,and supplement missing books and books with insufficient duplications,with a purpose to provide scientific and reasonable decision basis for literature purchasing.
Key words:libraries of the colleges and universities; literature purchasing; data mining
收稿日期:(2016-01-11)
基金項(xiàng)目:2015年度黑龍江省藝術(shù)科學(xué)規(guī)劃課題省級(jí)共建項(xiàng)目(2015D002)
中圖分類號(hào):G253.1
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):2095-5707(2016)02-0022-03
第一作者:張宏偉,館員,研究方向?yàn)閿?shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)儲(chǔ)、數(shù)字圖書(shū)館建設(shè)。E-mail:dbt5@163.com