龔曉婷 肖錚 陳俊杰
摘 要:大數(shù)據(jù)時(shí)代到來(lái),人們以新的技術(shù)和視角看待數(shù)據(jù)。圖書(shū)館如何應(yīng)用現(xiàn)有數(shù)據(jù),挖掘和提煉數(shù)據(jù)價(jià)值,已成為行業(yè)關(guān)注熱點(diǎn)。文章以廈門大學(xué)圖書(shū)館針對(duì)用戶數(shù)據(jù)進(jìn)行統(tǒng)計(jì)挖掘,通過(guò)可視化的方法進(jìn)行展現(xiàn)為例,介紹了廈門大學(xué)圖書(shū)館“圕·成長(zhǎng)”項(xiàng)目的設(shè)計(jì)思路、實(shí)施過(guò)程和項(xiàng)目展望。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)可視化;創(chuàng)新服務(wù)
中圖分類號(hào):G25 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2016)02-0072-03
一、 引言
數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用在圖書(shū)館用戶需求分析[1]、個(gè)性化服務(wù)推薦[2]、讀者忠誠(chéng)度提升[3]、期刊管理[4]等方面。近年來(lái)隨著大數(shù)據(jù)概念的普及,人們對(duì)于數(shù)據(jù)的價(jià)值以及數(shù)據(jù)的應(yīng)用都有了新的認(rèn)識(shí)。大數(shù)據(jù)給圖書(shū)館帶來(lái)了新的影響和挑戰(zhàn),同時(shí)也給圖書(shū)館的服務(wù)創(chuàng)新和發(fā)展提供了新的機(jī)遇[5] 。如何喚醒沉睡在圖書(shū)館系統(tǒng)中的用戶數(shù)據(jù),提煉它們的價(jià)值,已成為行業(yè)關(guān)注的熱點(diǎn)。
互聯(lián)網(wǎng)公司對(duì)于用戶數(shù)據(jù)的挖掘分析與包裝營(yíng)銷給予圖書(shū)館新的啟發(fā)[6]。上海圖書(shū)館2013年春節(jié)推出了個(gè)人年度閱讀賬單,是一份基于讀者上一年借閱記錄的回顧總結(jié)。廈門大學(xué)圖書(shū)館2013年畢業(yè)季,為畢業(yè)生送上了一份獨(dú)特的畢業(yè)禮物:“圕·時(shí)光”網(wǎng)站收集整理畢業(yè)生的借閱歷史、入館記錄、論文題目等個(gè)人數(shù)據(jù),用清新文藝的圖文講述畢業(yè)生的圖書(shū)館故事[7]。
大學(xué)生的校園生活,與圖書(shū)館有著密切的關(guān)系,他們?cè)趫D書(shū)館學(xué)習(xí)、娛樂(lè)、志愿服務(wù),在書(shū)香陪伴下成長(zhǎng)。圖書(shū)館積累了大量的相關(guān)數(shù)據(jù),如學(xué)生的借閱記錄、到館記錄、座位使用記錄、自助文印記錄等等。廈門大學(xué)圖書(shū)館的“圕·成長(zhǎng)”項(xiàng)目,對(duì)圖書(shū)館各系統(tǒng)中的用戶數(shù)據(jù)進(jìn)行了清理、關(guān)聯(lián)、統(tǒng)計(jì)、挖掘,進(jìn)行精心設(shè)計(jì)和包裝,以信息圖表的形式呈現(xiàn)給用戶,使之成為一份讀者的數(shù)字檔案,記錄他們成長(zhǎng)的軌跡。
二、 “圕·成長(zhǎng)”設(shè)計(jì)思路
“圕·成長(zhǎng)”以在校學(xué)生為受眾對(duì)象,在學(xué)年初發(fā)布,目的在于通過(guò)數(shù)據(jù)進(jìn)行總結(jié)和梳理,讓學(xué)生看到過(guò)去一年自己的到館次數(shù)、借閱冊(cè)次、自習(xí)時(shí)間以及其它服務(wù)的使用情況。通過(guò)數(shù)據(jù)讓學(xué)生更加了解自己,了解全校用戶的整體情況,更好地引導(dǎo)學(xué)生認(rèn)識(shí)到圖書(shū)館對(duì)個(gè)人的影響和作用,并通過(guò)相關(guān)數(shù)據(jù)分析,推薦圖書(shū)館的特色服務(wù),讓學(xué)生在未來(lái)更好地使用圖書(shū)館,幫助他們更好地成長(zhǎng)。
1.用戶數(shù)據(jù)統(tǒng)計(jì)與展示
用戶個(gè)人數(shù)據(jù)來(lái)自圖書(shū)館自動(dòng)化系統(tǒng)、門禁系統(tǒng)、座位管理系統(tǒng)、自助文印系統(tǒng),主要數(shù)據(jù)包括用戶上一學(xué)年的借閱總量、入館總數(shù)、自習(xí)時(shí)間、超期滯納金、自助文印使用量等;以個(gè)人數(shù)據(jù)為基礎(chǔ),按照專業(yè)、年級(jí)、學(xué)院的借閱平均數(shù),入館平均數(shù)、自習(xí)平均數(shù)進(jìn)行排名。
在圖表展示中,筆者將用戶個(gè)人數(shù)據(jù)與同專業(yè)、同年級(jí)中排名第一的用戶數(shù)據(jù)以及平均數(shù)據(jù)進(jìn)行橫向?qū)Ρ?,這樣用戶可以清楚地了解自己與第一名的差距,以及自己在同專業(yè)、同年級(jí)同學(xué)中所處的位置。排名靠前,是對(duì)學(xué)生過(guò)去一年努力的肯定。排名靠后,則是善意的提醒,激勵(lì)他們以年級(jí)平均和年級(jí)第一作為目標(biāo),在新學(xué)年能夠多來(lái)圖書(shū)館,多閱讀,在下一年的成長(zhǎng)賬單中“刷”數(shù)據(jù)。
此外,筆者針對(duì)圖書(shū)館系統(tǒng)的歷史數(shù)據(jù)進(jìn)行了統(tǒng)計(jì),生成熱門圖書(shū)列表。其中既有基于上一年度流通記錄統(tǒng)計(jì)的年度熱門圖書(shū),也有基于全部歷史記錄統(tǒng)計(jì)出的按專業(yè)、按年級(jí)的熱門圖書(shū)。系統(tǒng)通過(guò)判別讀者專業(yè)年級(jí)信息,將其所借圖書(shū)與熱門圖書(shū)進(jìn)行比較,如果熱門圖書(shū)不在其借閱歷史記錄中,則將這些熱門圖書(shū)推薦給用戶;同時(shí)結(jié)合用戶數(shù)據(jù)分析,推薦圖書(shū)館的相關(guān)服務(wù)。比如對(duì)于超期滯納金較多的用戶,推薦圖書(shū)館的郵件、短信超期提醒服務(wù);對(duì)于預(yù)約圖書(shū)較多的用戶,推薦電子圖書(shū)的服務(wù);對(duì)于入館和自習(xí)較多的用戶,推薦圖書(shū)館的書(shū)包柜服務(wù)等等。
考慮到項(xiàng)目推出后,可能有大一、研一的新生帶著好奇心訪問(wèn),而此類用戶并無(wú)上一學(xué)年統(tǒng)計(jì)數(shù)據(jù),在登錄后,系統(tǒng)將為其推薦新生需要的各種攻略指南,比如如何使用廈門大學(xué)的學(xué)生郵箱、如何找書(shū)、座位系統(tǒng)的使用、二維碼在圖書(shū)館中的應(yīng)用等等。
2.排行榜單的設(shè)計(jì)
筆者在統(tǒng)計(jì)用戶個(gè)人數(shù)據(jù)時(shí),分別對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行了排序處理,由此得出各項(xiàng)數(shù)據(jù)的用戶排行,將最能反映用戶與圖書(shū)館親密程度的借閱量、入館次數(shù)、自習(xí)時(shí)間這三項(xiàng)數(shù)據(jù)生成榜單,前五名用戶分別賦予“書(shū)神”、“館主”、“學(xué)霸”稱號(hào),既是對(duì)獲此名號(hào)的用戶的褒獎(jiǎng),也能激發(fā)其它用戶設(shè)立更高的目標(biāo)。除了個(gè)人排名,還以學(xué)院為單位進(jìn)行了數(shù)據(jù)統(tǒng)計(jì),計(jì)算出各學(xué)院同學(xué)在借閱量、入館次數(shù)、自習(xí)時(shí)間三項(xiàng)指標(biāo)的平均值,由此生成學(xué)院PK榜——通過(guò)此榜單,可以看出全校哪個(gè)學(xué)院的學(xué)生最愛(ài)閱讀,哪個(gè)學(xué)院的學(xué)生最愛(ài)來(lái)圖書(shū)館,哪個(gè)學(xué)院的學(xué)生自習(xí)時(shí)間最長(zhǎng)。
三、 “圕·成長(zhǎng)”項(xiàng)目的實(shí)現(xiàn)
1.數(shù)據(jù)整理
從原始數(shù)據(jù)到項(xiàng)目可用的最終數(shù)據(jù),須經(jīng)過(guò)數(shù)據(jù)提取、數(shù)據(jù)清理、數(shù)據(jù)統(tǒng)計(jì)三階段。
(1)數(shù)據(jù)提取
原始數(shù)據(jù)散存于圖書(shū)館自動(dòng)化系統(tǒng)、門禁系統(tǒng)、座位管理系統(tǒng)、自助文印系統(tǒng)的Oracle和SQL Server數(shù)據(jù)庫(kù)中。因項(xiàng)目反映的是學(xué)生用戶上一學(xué)年的數(shù)據(jù),所以筆者以學(xué)號(hào)作為用戶唯一身份標(biāo)識(shí),以2013年9月1日到2014年8月30日作為時(shí)間區(qū)間,從各系統(tǒng)的相關(guān)表中抽取可用字段值,保存至臨時(shí)庫(kù)中。首先通過(guò)自動(dòng)化系統(tǒng)的用戶表,將所有有效的在校生的信息抽取出來(lái),再以此用戶數(shù)據(jù)為基礎(chǔ),抽取其它系統(tǒng)中的相關(guān)記錄。如從自動(dòng)化系統(tǒng)中抽取出相關(guān)借閱歷史記錄,從門禁系統(tǒng)中抽取入館日志記錄,從座位系統(tǒng)中抽取選座離座記錄,從自助文印系統(tǒng)中抽取歷史使用記錄等。
(2)數(shù)據(jù)清理
數(shù)據(jù)清理主要以處理無(wú)效數(shù)據(jù)和重復(fù)數(shù)據(jù)為主,例如門禁系統(tǒng)中的記錄是以用戶單次入館記錄的,為了統(tǒng)計(jì)需要,我們需要將用戶同一天多次入館記錄合并成一條記錄。座位系統(tǒng)中以用戶選座和離座的時(shí)間點(diǎn)作為日志記錄,為了計(jì)算用戶在座時(shí)間,須將日志記錄中獨(dú)立的選座記錄和離座記錄對(duì)應(yīng),用離座時(shí)間減去選座時(shí)間,得出用戶單次在座時(shí)長(zhǎng)。
(3)數(shù)據(jù)統(tǒng)計(jì)
數(shù)據(jù)統(tǒng)計(jì)的工作主要通過(guò)SQL的聚集函數(shù)和Excel的數(shù)據(jù)透視表功能,分別統(tǒng)計(jì)用戶的借閱總量、入館總數(shù)、自習(xí)時(shí)間、常用座位、常去的閱覽室、超期滯納金、自助文印使用量。按照學(xué)生類型、專業(yè)、年級(jí)、學(xué)院四個(gè)維度對(duì)用戶進(jìn)行分組,計(jì)算平均值,并得出每個(gè)分組中的借閱量、入館次數(shù)、自習(xí)時(shí)間的排行。
2.程序設(shè)計(jì)
程序設(shè)計(jì)由后端開(kāi)發(fā)與前端實(shí)現(xiàn)兩部分組成。
(1)后端開(kāi)發(fā)
因項(xiàng)目主要以數(shù)據(jù)展示為主,所以后端開(kāi)發(fā)的主要工作是數(shù)據(jù)庫(kù)建表,裝載各類前期統(tǒng)計(jì)數(shù)據(jù)、頁(yè)面數(shù)據(jù)讀取。系統(tǒng)交互的程序主要是用戶登錄和用戶留言,在用戶登錄時(shí)生成一個(gè)隨機(jī)字符串作為分享時(shí)使用的URL參數(shù),也方便了后續(xù)的使用統(tǒng)計(jì)。
(2)前端開(kāi)發(fā)
前端開(kāi)發(fā)的任務(wù)是數(shù)據(jù)的可視化展示及響應(yīng)式頁(yè)面的實(shí)現(xiàn)。結(jié)合項(xiàng)目特點(diǎn),美工設(shè)計(jì)采用了清新簡(jiǎn)約的風(fēng)格,使用四種色彩作為主要設(shè)計(jì)配色,代表了大學(xué)四年,亦代表項(xiàng)目中四項(xiàng)主題數(shù)據(jù):我愛(ài)閱讀、愛(ài)館如家、專屬領(lǐng)地、圕的推薦??紤]到用戶通過(guò)微博微信分享后的受眾主要使用移動(dòng)終端瀏覽,因此項(xiàng)目采用響應(yīng)式頁(yè)面設(shè)計(jì),保證移動(dòng)端的訪問(wèn)體驗(yàn)。筆者選擇成熟流行的前端開(kāi)發(fā)框架Bootstrap,配合頁(yè)面美工設(shè)計(jì),實(shí)現(xiàn)基本的頁(yè)面布局和展示效果。項(xiàng)目的數(shù)據(jù)展示部分采用開(kāi)源的前端數(shù)據(jù)可視化庫(kù)ECharts,根據(jù)展示內(nèi)容構(gòu)建相應(yīng)的圖形樣式,如借閱數(shù)據(jù)通過(guò)柱狀圖展示,自習(xí)時(shí)間曲線通過(guò)面積圖展示。圖樣如圖1至圖5。
1.宣傳推廣
項(xiàng)目完成后,通過(guò)多渠道跨平臺(tái)進(jìn)行宣傳推廣,充分利用圖書(shū)館的官方網(wǎng)站以及微博、微信平臺(tái)進(jìn)行營(yíng)銷。筆者在微博開(kāi)啟了“圕·成長(zhǎng)”、“院系PK”相關(guān)話題,用戶可將自己的數(shù)據(jù)展示頁(yè)面分享,也可對(duì)院系PK榜單進(jìn)行評(píng)論。在不到十天的時(shí)間里,筆者通過(guò)微信平臺(tái)推送了六條圖文消息,閱讀量總計(jì)達(dá)10912次,而用戶在微信朋友圈的分享,亦吸引了大量相關(guān)用戶登錄。此外,為鼓勵(lì)用戶登錄與分享,筆者設(shè)計(jì)了獎(jiǎng)勵(lì)幸運(yùn)用戶的活動(dòng),逢整百的登錄用戶將獲得一份珍貴的圖書(shū)館紀(jì)念禮品。通過(guò)以上營(yíng)銷手段,有效地增加了系統(tǒng)使用率,擴(kuò)大了項(xiàng)目影響力。
2.效果評(píng)估
截止到2015年4月13日,已有4999位同學(xué)登錄查看過(guò)個(gè)人的“圕·成長(zhǎng)”賬單,微博分享229次,相關(guān)話題閱讀量高達(dá)85.2萬(wàn);通過(guò)微博、微信分享鏈回的總訪問(wèn)量17666次;總瀏覽量33526次,單用戶平均訪問(wèn)次數(shù)為3.173次。新華網(wǎng)[8]和廈門晚報(bào)[9]就此項(xiàng)目專門采訪項(xiàng)目組成員及榜單達(dá)人,進(jìn)行了深度報(bào)道。
四、結(jié)束語(yǔ)
“圕·成長(zhǎng)”項(xiàng)目嘗試使用數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)挖掘和數(shù)據(jù)可視化的方法,將讀者數(shù)據(jù)以全新形式呈現(xiàn)給讀者,使這份數(shù)據(jù)賬單成為讀者成長(zhǎng)的印記,成為圖書(shū)館送給讀者的一份禮物。項(xiàng)目本身也拓展為一次圖書(shū)館服務(wù)的推廣營(yíng)銷活動(dòng)。未來(lái),筆者將應(yīng)用新的技術(shù)手段,針對(duì)用戶數(shù)據(jù)進(jìn)行更全面深入的挖掘,如分析用戶的閱讀興趣、專業(yè)特長(zhǎng)、學(xué)習(xí)周期等,并通過(guò)用戶每年數(shù)據(jù)的縱向?qū)Ρ龋玫胤从秤脩舻某砷L(zhǎng)歷程,同時(shí)為圖書(shū)館的館藏采選策略、讀者服務(wù)模式、空間規(guī)劃設(shè)計(jì)等提供決策參考。
參考文獻(xiàn):
[1]李瑋平.基于數(shù)據(jù)挖掘的圖書(shū)館讀者需求分析[J].圖書(shū)館論壇,2004(3):86-88.
[2]顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書(shū)館個(gè)性化服務(wù)的探討[J].圖書(shū)館雜志,2013(8):63-65.
[3]姚婉燕.高校圖書(shū)館讀者忠誠(chéng)度提升與數(shù)據(jù)挖掘的融合研究[J].情報(bào)科學(xué),2010(11):1646-1651.
[4]李繼宏.數(shù)據(jù)挖掘及其在高校圖書(shū)館期刊管理中的應(yīng)用[J].現(xiàn)代情報(bào),2004(7):84-86.
[5]韓翠峰.大數(shù)據(jù)時(shí)代圖書(shū)館的服務(wù)創(chuàng)新與發(fā)展[J].圖書(shū)館,2013(1):121-122.
[6]淘寶UED.設(shè)計(jì)提升品牌價(jià)值[EB/OL].[2015-05-21].http://ued.taobao.org/blog/wp-content/uploads/2012/12/1212淘寶時(shí)光機(jī)器(設(shè)計(jì)提升品牌價(jià)值)1.pdf.
[7]龔曉婷等.讀者數(shù)據(jù)的挖掘與創(chuàng)意呈現(xiàn):以“圕·時(shí)光”為例[J].大學(xué)圖書(shū)館學(xué)報(bào),2013(6):92-96.
[8]新華網(wǎng).廈大曬出年度閱讀榜單:看“學(xué)霸”是如何煉成的?[EB/OL].[2015-05-21].http://news.xinhuanet.com/local/2014-12/20/c_1113716434.htm.
[9]廈門晚報(bào).廈大圖書(shū)館發(fā)布年度排行榜,書(shū)神、館主、學(xué)霸紛出爐[EB/OL]. [2015-05-21].http://www.xmnn.cn/dzbk/xmwb/20141215/201412/t20141215 _4249713.htm.(編輯:魯利瑞)