国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶行為數(shù)據(jù)的圖書館電子資源使用分析

2017-07-24 17:20:25秦艷姣
關(guān)鍵詞:類型數(shù)據(jù)庫

秦艷姣

(湖北第二師范學(xué)院 圖書館,武漢 430205)

基于用戶行為數(shù)據(jù)的圖書館電子資源使用分析

秦艷姣

(湖北第二師范學(xué)院 圖書館,武漢 430205)

在大數(shù)據(jù)時代,高校圖書館作為全校的信息資源共享中心,積累了海量的用戶行為數(shù)據(jù), 通過對這些大量繁雜且分散的數(shù)據(jù)信息進(jìn)行分析、挖掘,可得到隱藏在數(shù)據(jù)中的有價值信息。本文以實(shí)例說明通過數(shù)據(jù)挖掘技術(shù)對用戶行為數(shù)據(jù)分析的方法,提出圖書館電子資源使用分析的意義。

大數(shù)據(jù);數(shù)據(jù)挖掘;用戶行為數(shù)據(jù);電子資源

近年來,隨著計(jì)算機(jī)的廣泛應(yīng)用以及云計(jì)算、物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,數(shù)據(jù)的種類和規(guī)模都在急劇增大,這些數(shù)據(jù)正在以異常驚人的速度為人們收集并存儲,全球步入“大數(shù)據(jù)”時代。如何在大數(shù)據(jù)時代下將這些海量數(shù)據(jù)轉(zhuǎn)換成對自身有價值的信息和知識是社會各部門普遍關(guān)注的問題。隨著網(wǎng)絡(luò)化時代的發(fā)展和數(shù)字化圖書館的提出,作為向廣大師生傳播文化知識的圖書館也面臨著大數(shù)據(jù)的沖擊。如何順應(yīng)大數(shù)據(jù)時代發(fā)展趨勢,對大量數(shù)據(jù)進(jìn)行分析處理,向廣大師生提供高質(zhì)量的、具有本校特色的服務(wù)信息是現(xiàn)代圖書館建設(shè)中的重要課題。

一、大數(shù)據(jù)時代下的高校網(wǎng)絡(luò)用戶行為數(shù)據(jù)

在網(wǎng)絡(luò)世界里,人與網(wǎng)絡(luò)之間的互動、人與人之間的互動構(gòu)成了網(wǎng)絡(luò)用戶行為。網(wǎng)絡(luò)用戶行為是指“用戶在上網(wǎng)過程中表現(xiàn)出來的有意識的活動或者使用網(wǎng)絡(luò)資源時所呈現(xiàn)出的規(guī)律”。從其范疇上講,分為狹義的和廣義的兩種理解。狹義的網(wǎng)絡(luò)用戶行為包含網(wǎng)絡(luò)用戶在上網(wǎng)過程中進(jìn)行的正?;顒?,如瀏覽網(wǎng)頁、下載文件、觀看視頻、電子交易等;從廣義的角度上講,還包括用戶異常的網(wǎng)絡(luò)活動,如掃描,攻擊等。

網(wǎng)絡(luò)用戶上網(wǎng)行為通過網(wǎng)絡(luò)日志(Web日志)記錄。網(wǎng)絡(luò)日志記錄了客戶端每一次請求的細(xì)節(jié),如:請求資源,請求時間,客戶IP,服務(wù)器IP,發(fā)送字節(jié)數(shù),接收字符數(shù)等等。當(dāng)用戶在網(wǎng)絡(luò)上瀏覽頁面時,都需要向服務(wù)器發(fā)出請求,把所請求頁面發(fā)送到用戶計(jì)算機(jī)。每當(dāng)站點(diǎn)上的一個頁面文件被訪問一次時,服務(wù)器的日志文件中就會增加一條相應(yīng)的記錄(包括不成功記錄),這些記錄數(shù)據(jù)反映了多個用戶(可能同時)對WEB 站點(diǎn)的存取行為。

隨著社會的發(fā)展,特別是通信和計(jì)算機(jī)技術(shù)的不斷進(jìn)步,電子資源的數(shù)量和需求不斷增加,目前,市場上可獲取的電子資源上萬種,國內(nèi)有幾百種,形式多樣。高校是各種電子資源需求最大的單位,高校圖書館作為高校的文獻(xiàn)信息保障部門,在資源采購是應(yīng)該如何有理有據(jù)地采購電子資源,采購什么樣的電子資源才符合讀者需求和教學(xué)科研需要的問題日益突出。特別是地方中小院校,由于資金緊缺,更需要研究和考慮該問題,使有限的經(jīng)費(fèi)投入發(fā)揮最大的使用效益。

在大數(shù)據(jù)時代,高校圖書館作為全校的信息資源共享中心,積累了海量的用戶行為數(shù)據(jù),如用戶查詢電子資源生成的訪問日志、用戶訪問電子資源時留下的評語以及用戶收藏電子資源情況等。通過這些大量繁雜且分散的數(shù)據(jù)信息進(jìn)行分析、挖掘,可得到隱藏在數(shù)據(jù)中的有價值信息,發(fā)現(xiàn)能滿足圖書館讀者真正需求且最適合本校實(shí)際的特色電子資源,開展高校圖書館電子資源服務(wù)建設(shè)。

二、通過數(shù)據(jù)挖掘技術(shù)對用戶行為數(shù)據(jù)分析的方法

本文以某高校圖書館為例,挖掘讀者使用電子資源的行為數(shù)據(jù),為圖書館提供客觀、真實(shí)且遵循同一標(biāo)準(zhǔn)的電子資源訪問日志,便于圖書館對電子資源的使用價值進(jìn)行客觀分析評估,從而為圖書館采購決策工作、挖掘讀者使用需求、圖書館服務(wù)方向等方面提供支持。

具體做法為從校園網(wǎng)絡(luò)出口采集機(jī)構(gòu)范圍內(nèi)訪問電子資源的底層非結(jié)構(gòu)化的Web日志,對數(shù)據(jù)進(jìn)行清洗、會話識別及分析。實(shí)現(xiàn)對數(shù)字資源使用數(shù)據(jù)的獲取,并進(jìn)行統(tǒng)一的統(tǒng)計(jì)和分析,將圖書館購買的數(shù)字資源的使用情況在同一平臺展現(xiàn)和對比,可以了解各電子資源的使用和效用情況。參與本次測試數(shù)據(jù)庫共4個,測試數(shù)據(jù)庫如下:CNKI、萬方、讀秀知識庫(屬于超星廠家)、超星數(shù)據(jù)庫。采集數(shù)據(jù)時間段為20天,采集的網(wǎng)絡(luò)設(shè)備為校園網(wǎng)1000人上網(wǎng)的出口交換機(jī)。本次參與測試沒有涵蓋校園網(wǎng)所有用戶,旨在通過這部分網(wǎng)絡(luò)用戶行為數(shù)據(jù)的分析,揭示出一種分析方法,進(jìn)而用這種方法去分析校園網(wǎng)所有的網(wǎng)絡(luò)日志。

從產(chǎn)品各個模塊功能對數(shù)據(jù)庫使用情況進(jìn)行展示,展示內(nèi)容主要有:測試數(shù)據(jù)庫單日下載量排名、測試數(shù)據(jù)庫各類資源單日下載量排名、測試數(shù)據(jù)庫檢索詞排名、測試數(shù)據(jù)庫單篇文獻(xiàn)下載排名、測試數(shù)據(jù)庫期刊下載排名、測試數(shù)據(jù)庫不同IP下載排名、測試數(shù)據(jù)庫單IP使用詳情展示。

1.數(shù)據(jù)庫使用分析

數(shù)據(jù)庫使用單日報表:

通過圖1,可以了解當(dāng)日下載次數(shù)排名數(shù)據(jù)庫依次為CNKI、萬方、讀秀知識庫、超星。此外,也可以對單日下載量進(jìn)行瀏覽次數(shù)的排序。

用同樣的方法,也可以得出數(shù)據(jù)庫使用月度報表、數(shù)據(jù)庫使用年度報表。

2.資源統(tǒng)計(jì)分析

通過該項(xiàng)分析,可查看和分析各種資源的使用數(shù)據(jù)及不同資源在不同時間段的使用量,可以對資源的使用進(jìn)行年度、月度、單日分析。

資源使用統(tǒng)計(jì)分析單日報表:

通過圖2,可以了解單日期刊資源下載次數(shù)排名數(shù)據(jù)庫依次有CNKI、萬方、讀秀知識庫等,此外還可以對數(shù)據(jù)庫資源的瀏覽次數(shù)排序。

圖書館官員還可選取若干資源,對其單日下載量生成柱狀圖。

3.檢索詞使用統(tǒng)計(jì)分析

查看不同數(shù)據(jù)庫在不同時間段的熱點(diǎn)檢索詞排名及頻次,同時還可以通過綁定院系IP,查看不同院系在不同時間段的熱點(diǎn)檢索排名及頻次。

對某高校圖書館檢索詞使用量進(jìn)行排名。其效果圖為:

通過圖3可以比較直觀的看出熱門檢索詞有“幼兒+問題”、“cognition+linguistics”、“cognitive+linguistics”、“商務(wù)英語口語”、“Westminster abbey”、“多義詞教學(xué)”、“metaphor”、“l(fā)anguage and society”、“華盛頓歐文”、“社會語言學(xué)視角下的 英語性別差異”。

4.下載瀏覽分析

可從篇名下載、篇名瀏覽、期刊下載、期刊瀏覽這四個方面對讀者使用情況進(jìn)行分析。

圖1 數(shù)據(jù)庫單日使用報表

圖2 資源單日使用報表

圖3 檢索詞統(tǒng)計(jì)分析報表

圖4 篇名下載分析報表

篇名下載分析:

期刊下載分析:

通過圖5可以了解在選定期間的期刊下載的排名,可以對應(yīng)到具體的期刊名稱,以及下載的人數(shù)。

5.讀者使用行為分析

讀者使用整體統(tǒng)計(jì):

根據(jù)IP 展示不同讀者的使用數(shù)據(jù)包括訪問次數(shù)、檢索次數(shù)、瀏覽次數(shù)、下載次數(shù)等使用數(shù)據(jù),通過圖可以了解下載次數(shù)最多的IP 是125.220.64.228.

讀者使用詳情日志查詢:

通過圖7可以了解用戶檢索的URL,題名/關(guān)鍵詞,數(shù)據(jù)庫,類型,使用時間等詳細(xì)信息。

圖5 期刊下載分析報表

圖6 讀者使用整體統(tǒng)計(jì)

圖7 讀者使用詳情日志查詢

三、圖書館電子資源使用分析的意義

1.指導(dǎo)電子資源的采購。利用數(shù)據(jù)挖掘技術(shù)對現(xiàn)有數(shù)據(jù)庫及電子資源的使用日志進(jìn)行分析、挖掘,獲得電子資源使用評估報告,同時可以對新增電子資源在試用期間的訪問日志進(jìn)行分析,獲得試用電子資源的使用分析報告。通過數(shù)據(jù)庫訪問次數(shù)、下載次數(shù)、單篇下載成本、訪問院系分布等一系列量化指標(biāo)評估電子資源的利用率以及學(xué)科覆蓋率,指導(dǎo)圖書館電子資源采購決策的制定,使用量較大、訪問次數(shù)頻繁的數(shù)據(jù)庫或電子資源優(yōu)先購買,使用量一般的可以根據(jù)資金情況統(tǒng)籌安排購買,使用量較少或基本不使用的數(shù)據(jù)庫可以不購買或按照用戶數(shù)采購而不是包庫采購,使用量上升較快的建議增訂。

2.引導(dǎo)電子資源的推廣培訓(xùn)。結(jié)合學(xué)校的學(xué)院分布以及學(xué)科設(shè)置,通過數(shù)據(jù)挖掘技術(shù)獲得電子資源使用的學(xué)院、學(xué)科分布情況,從而了解各學(xué)院對電子資源的利用率。對資源利用率明顯偏低的學(xué)院,可以從資源宣傳力度、學(xué)科館員深入院系開展服務(wù)等方式加大電子資源的推廣培訓(xùn),提升電子資源的整體利用率。

3.為圖書館開展嵌入式服務(wù)指引方向。將圖書館服務(wù)無縫地、動態(tài)地、融入用戶知識過程中,是圖書館未來發(fā)展的必然選擇。嵌入式服務(wù)以用戶為中心,通過融入用戶的工作學(xué)習(xí)生活空間,提供個性化服務(wù),使用戶處于圖書館服務(wù)無處不在、無時不有的環(huán)境當(dāng)中。通過數(shù)據(jù)挖掘技術(shù)對電子資源的使用日志進(jìn)行分析,了解具體用戶習(xí)慣使用的數(shù)據(jù)庫、期刊資源,以及更細(xì)化的篇名下載分析、檢索詞統(tǒng)計(jì),可以精準(zhǔn)的定位用戶的需求。圍繞具體用戶的資源需求,圖書館館員可以將服務(wù)主動推送給用戶。同時,通過關(guān)鍵詞統(tǒng)計(jì)等分析結(jié)果,圖書館可以得出某段時間用戶比較關(guān)注的共性需求,可以圍繞這些共性需求,圖書館可以針對性的開展資源檢索服務(wù)或使用培訓(xùn)。

4.為師生評價提供數(shù)據(jù)參考依據(jù)。通過讀者使用情況分析,可以清晰的了解用戶在某時間段使用圖書館電子資源的整體情況,可以分析哪些教師在某一時期或經(jīng)常性使用電子資源,對教師的工作考核以及科研完成情況提供某種程度的參考??梢苑治瞿男W(xué)生較多自主利用電子資源學(xué)習(xí),為學(xué)生的評優(yōu)提供某種程度的參考。

四、結(jié)語

大數(shù)據(jù)環(huán)境下高校圖書館電子資源使用分析采用數(shù)據(jù)挖掘技術(shù),通過對網(wǎng)絡(luò)上用戶使用電子資源訪問日志、下載信息、搜索關(guān)鍵詞等進(jìn)行深入挖掘,感知本校師生用戶對電子資源的使用統(tǒng)計(jì)以及信息需求,進(jìn)而量化高校電子資源使用情況,達(dá)到合理制定采購計(jì)劃、開展電子資源推廣培訓(xùn)、指引圖書館嵌入式服務(wù)以及幫助師生評價等作用。

[1]李碩.大數(shù)據(jù)時代圖書館電子資源特色化服務(wù)研究 [J].互聯(lián)網(wǎng),2015,(10):123-124.

[2]高建輝,鐘衛(wèi).地方高校圖書館電子資源優(yōu)化配置方案研究 [J]. 雄楚師范學(xué)院學(xué)報,2015,(3):81-86.

[3]謝守美,黃萍莉,龔主杰.圖書館嵌入式服務(wù)的理論基礎(chǔ)、模式和途徑 [J]. 圖書與情報,2012,(4):33-38.

[4]候力鐵.泛在環(huán)境下圖書館嵌入式服務(wù)創(chuàng)新路徑研究 [J]. 河南圖書館學(xué)刊,2013,(7):110-112.

[5]杜杰.基于校園網(wǎng)海量訪問日志的用戶行為分析 [DB/OL].中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫,2012,(6).

責(zé)任編輯:彭雷生

Analysis of Library Electronic Resources Based on User Behavior Data

QIN Yan-jiao

(Library, Hubei University of Education, Wuhan 430205, China)

In the era of big data, the university library, as the information resource sharing center of the whole school, could accumulate massive user behavior data. Through the analysis and mining of these big and complicated data, we can get valuable information hidden in the data. This particle illustrates the method of analyzing the behavior of users by means of data mining technology, and puts forward the significance of library electronic resource analysis.

big data; data mining; user behavior data; electronic resources

2017-03-15

秦艷姣(1982-),女,湖北紅安人,高級工程師,碩士,研究方向?yàn)榫W(wǎng)絡(luò)教學(xué)。

G250.73

:A

:1674-344X(2017)4-0128-05

猜你喜歡
類型數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
腎小球?yàn)V過率下降與腦卒中類型及預(yù)后關(guān)系探討
我國高職院校實(shí)訓(xùn)基地主要類型及其存在價值初論
職教論壇(2016年24期)2016-11-14 09:02:16
C語言教學(xué)探討
人名中不應(yīng)該使用生僻字
人間(2016年27期)2016-11-11 17:29:11
“逗”孩子行為的危害及破解對策
南北橋(2016年10期)2016-11-10 17:33:00
利用野花組合營造花海景觀的技術(shù)研究
數(shù)據(jù)庫
數(shù)據(jù)庫
五常市| 获嘉县| 营山县| 京山县| 余江县| 皋兰县| 阳信县| 教育| 辰溪县| 中西区| 南京市| 开阳县| 盐源县| 甘肃省| 措美县| 酒泉市| 青铜峡市| 龙井市| 新郑市| 民县| 塔河县| 麻阳| 华池县| 昌乐县| 巴马| 博兴县| 连山| 信丰县| 高雄县| 常山县| 乐山市| 南涧| 德兴市| 东乡族自治县| 佛山市| 澜沧| 阿拉善右旗| 崇左市| 中方县| 庆云县| 五原县|