国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字圖書館用戶信息獲取行為研究

2015-03-03 02:58陳越都平平王靜
中國教育網(wǎng)絡(luò) 2015年5期
關(guān)鍵詞:應(yīng)用層原型報(bào)文

文/陳越 都平平 王靜 等

數(shù)字圖書館用戶信息獲取行為研究

文/陳越都平平王靜等

隨著數(shù)字圖書館的發(fā)展,用戶對(duì)文獻(xiàn)資源的利用方式逐漸轉(zhuǎn)向在線形式。據(jù)教育部圖工委統(tǒng)計(jì), 國內(nèi)高校2012年館均電子文獻(xiàn)采購經(jīng)費(fèi)180萬元,是2007年的2.2倍。在電子文獻(xiàn)資源的使用大幅增加的情況下,如何獲取數(shù)字圖書館用戶信息行為的相關(guān)信息,以便為數(shù)字圖書館信息平臺(tái)建設(shè)、電子資源配置提供依據(jù),成為值得研究的問題。

對(duì)網(wǎng)絡(luò)用戶信息行為的定量研究方法有日志數(shù)據(jù)挖掘、系統(tǒng)軟件計(jì)數(shù)及網(wǎng)絡(luò)數(shù)據(jù)采集等途徑。這些方法在改善現(xiàn)有評(píng)估手段的同時(shí),也不同程度的存在一定局限性,主要有以下幾點(diǎn):

1.數(shù)據(jù)獲取對(duì)業(yè)務(wù)環(huán)境的依賴性強(qiáng)。日志挖掘方法中,用戶端和服務(wù)器端緩存(Cache)、代理(Proxy)及防火墻地址轉(zhuǎn)換(NAT)等技術(shù)都會(huì)影響對(duì)數(shù)據(jù)的獲取和處理,從而削弱挖掘效果。獲取系統(tǒng)軟件計(jì)數(shù)數(shù)據(jù)時(shí)一般依賴電子資源數(shù)據(jù)庫廠商提供,實(shí)時(shí)性較差且有時(shí)難以獲得完整數(shù)據(jù)。

2.行為信息提取內(nèi)容較少?;诜?wù)端系統(tǒng)軟件計(jì)數(shù)或日志挖掘的方法很難收集到用戶端個(gè)體信息,現(xiàn)行的基于網(wǎng)絡(luò)層統(tǒng)計(jì)的方法又側(cè)重于用戶行為模式的判斷,忽略行為內(nèi)容的分析。如基于snort的過量下載檢測(cè)方法,其處理的數(shù)據(jù)層次局限于網(wǎng)絡(luò)層,沒有對(duì)應(yīng)用層數(shù)據(jù)作進(jìn)一步處理,基于DPI的pdf文件下載檢測(cè)方法僅對(duì)特定類型進(jìn)行捕獲,同樣也沒有針對(duì)應(yīng)用層信息進(jìn)行分析和處理。

針對(duì)上述局限性,本文利用應(yīng)用層特征分析技術(shù)對(duì)數(shù)字圖書館用戶信息獲取報(bào)文進(jìn)行分解處理,討論了相應(yīng)處理過程并用算法予以實(shí)現(xiàn),最終設(shè)計(jì)了系統(tǒng)原型并進(jìn)行了開發(fā)與測(cè)試。

用戶信息獲取行為報(bào)文的應(yīng)用層特征分析與檢測(cè)

報(bào)文的特征分析

針對(duì)文獻(xiàn)獲取行為,利用Fiddler軟件,我們進(jìn)行了報(bào)文截取和分析。一個(gè)典型的下載請(qǐng)求如圖1所示。

圖1 用戶請(qǐng)求報(bào)文結(jié)構(gòu)

在該請(qǐng)求報(bào)文的首部字段中,即可獲取提供下載報(bào)文的主機(jī)域名或IP地址,如:Host: libvip.cumt.edu.cn

對(duì)起始行中的Get請(qǐng)求進(jìn)行分析,其中包含如下信息:

1.該下載請(qǐng)求的文件存放路徑:

file=R1388765X

报价| 河东区| 曲阜市| 错那县| 眉山市| 宝清县| 那坡县| 黎川县| 水城县| 瓦房店市| 什邡市| 灵璧县| 贡觉县| 德令哈市| 准格尔旗| 东方市| 海城市| 唐河县| 蓬安县| 太白县| 成都市| 东莞市| 阳新县| 濮阳县| 灌云县| 河东区| 稻城县| 龙泉市| 收藏| 桐梓县| 游戏| 永康市| 黔西| 墨脱县| 瑞安市| 黔西县| 洛浦县| 宿松县| 宁国市| 穆棱市| 克山县|