国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)情報(bào)分析平臺(tái)在圖書館管理與服務(wù)中的應(yīng)用

2020-04-20 11:36王慧
卷宗 2020年5期
關(guān)鍵詞:大數(shù)據(jù)時(shí)代圖書館

摘 要:伴隨著大數(shù)據(jù)時(shí)代的到來(lái)以及相關(guān)技術(shù)的不斷發(fā)展,圖書館也必然需要隨著大數(shù)據(jù)時(shí)代的發(fā)展而改變。圖書館的館藏?cái)?shù)量近些年呈現(xiàn)出了內(nèi)容龐大、結(jié)構(gòu)多樣的發(fā)展趨勢(shì),數(shù)據(jù)雖然增多但是在實(shí)際應(yīng)用方面的效果并不理想。對(duì)此,為了進(jìn)一步推動(dòng)圖書館發(fā)展,提升圖書館的社會(huì)服務(wù)價(jià)值,本文簡(jiǎn)要分析大數(shù)據(jù)情報(bào)分析平臺(tái)在圖書館管理與服務(wù)中的應(yīng)用,希望可以為相關(guān)工作者提供幫助。

關(guān)鍵詞:大數(shù)據(jù)時(shí)代;圖書館;情報(bào)分析平臺(tái);管理與服務(wù)

隨著互聯(lián)網(wǎng)時(shí)代的快速發(fā)展,大數(shù)據(jù)時(shí)代以及智能化時(shí)代已經(jīng)充斥著改革行業(yè),在這一背景之下,傳統(tǒng)的圖書館管理和服務(wù)模式也逐漸進(jìn)入到了智能化時(shí)代。對(duì)此,當(dāng)代圖書館的管理與服務(wù)模式也需要適當(dāng)?shù)母淖儯瑥亩m應(yīng)時(shí)代的發(fā)展步伐。今年前國(guó)外就開(kāi)展了關(guān)于眾包的圖書館管理模式,眾包屬于一種全新的經(jīng)濟(jì)模式,主要是指公司或機(jī)構(gòu)以員工執(zhí)行的任務(wù)以外包方式提供個(gè)大眾網(wǎng)絡(luò),從而提高工作的整體效益。對(duì)于圖書館而言,大數(shù)據(jù)的到來(lái)也間接提供了許多的發(fā)展空間,圖書館也需要學(xué)些各種全新模式,像眾包這種創(chuàng)新一樣更好的改進(jìn)智能檢索系統(tǒng),并提升圖書館的館藏使用價(jià)值。對(duì)此,探討大數(shù)據(jù)情報(bào)分析平臺(tái)在圖書館管理與服務(wù)中的應(yīng)用具備顯著現(xiàn)實(shí)意義。

1 大數(shù)據(jù)環(huán)境下圖書館的管理與服務(wù)模式發(fā)展需求

大數(shù)據(jù)時(shí)代環(huán)境之下,傳統(tǒng)的圖書館管理與服務(wù)模式已經(jīng)無(wú)法滿足用戶以及圖書館自身發(fā)展的實(shí)踐性需求,當(dāng)代圖書館的館藏資料大多數(shù)已經(jīng)轉(zhuǎn)變?yōu)閱巫游臋n,這一些文檔資料的結(jié)構(gòu)非常豐富,同時(shí)數(shù)量龐大,與傳統(tǒng)紙質(zhì)資料相比所記錄的內(nèi)容更多。在用戶想要找尋某一個(gè)資料時(shí),便需要從海量的文獻(xiàn)資料當(dāng)中進(jìn)行搜索,此時(shí)許多用戶都無(wú)法根據(jù)自己的需求以及所提供的數(shù)據(jù)資料選擇出最佳的文獻(xiàn),再加上一些低質(zhì)量文獻(xiàn)的存在,導(dǎo)致用戶在文獻(xiàn)資料檢索過(guò)程中所消耗的時(shí)間會(huì)非常多,從而呈現(xiàn)出低效率、低收益的服務(wù)特征[1]。對(duì)此,圖書館在大數(shù)據(jù)時(shí)代背景之下必須有意識(shí)的創(chuàng)新,并借助情報(bào)分析平臺(tái)的建設(shè)與應(yīng)用,促使圖書館達(dá)到高效率的文獻(xiàn)管理,并為用戶提供更高效率的檢索服務(wù)。在具體工作中,一方面需要根據(jù)圖書館的管理模式現(xiàn)狀進(jìn)行針對(duì)性改進(jìn),落實(shí)與創(chuàng)新智能化模式,并構(gòu)建一個(gè)自主性、高效率性的文獻(xiàn)管理方法,盡可能降低人為資源的投入,降低維護(hù)風(fēng)險(xiǎn)。另一方面需要為用戶提供一個(gè)針對(duì)性的服務(wù),并保證服務(wù)本身的快捷、智能化,促使用戶可以快速的尋找到自己所需要的文獻(xiàn),并按照用戶的實(shí)際喜好與需求,自動(dòng)的為用戶提供一些可能有價(jià)值意義的文獻(xiàn)推薦,從而提高圖書館信息服務(wù)綜合價(jià)值。

2 大數(shù)據(jù)情報(bào)分析平臺(tái)在圖書館管理與服務(wù)中的應(yīng)用

2.1 平臺(tái)的搭建

網(wǎng)絡(luò)爬蟲技術(shù)主要是依據(jù)相關(guān)的規(guī)則自動(dòng)的抓取萬(wàn)維網(wǎng)的程序,其主要可以劃分為聚焦網(wǎng)絡(luò)爬蟲、通用網(wǎng)絡(luò)、深層網(wǎng)絡(luò)以及增量式的網(wǎng)絡(luò)。本文的研究目的在于抓取圖書館當(dāng)中的館藏資料和借閱的相關(guān)數(shù)據(jù)資料,所以在具體應(yīng)用中可以應(yīng)用聚焦網(wǎng)絡(luò)爬蟲實(shí)現(xiàn)[2]。在具體工作流程方面,先提供一個(gè)初始的URL,在抓取到網(wǎng)頁(yè)全文并按照相關(guān)的需求描述之后獲得有效的數(shù)據(jù),之后從網(wǎng)頁(yè)當(dāng)中提出全新的URL鏈接,在篩選之后借助篩選URL鏈接并加入到列表當(dāng)中,之后以循環(huán)方式不斷的抓取新的內(nèi)容,直到滿足相關(guān)條件之后才停止。在整個(gè)運(yùn)行期間,核心環(huán)節(jié)在于網(wǎng)頁(yè)的模塊解析,模塊本身的問(wèn)題在于兩個(gè)方面,一方面是解決網(wǎng)頁(yè)當(dāng)中提取自連接的問(wèn)題,促使其可以順利的加入到URL隊(duì)列當(dāng)中;另一方面是需要解決網(wǎng)頁(yè)內(nèi)容的解析問(wèn)題,當(dāng)前主流的技術(shù)是以HTMLParser為主。

HTMLParser屬于當(dāng)前基于HTML的數(shù)據(jù)處理與解析器,HTMLParser可以實(shí)現(xiàn)直接提取網(wǎng)頁(yè)當(dāng)中的子URL、解析網(wǎng)絡(luò)的結(jié)構(gòu)并對(duì)網(wǎng)頁(yè)當(dāng)中的信息數(shù)據(jù)進(jìn)行提取、處理,并將網(wǎng)頁(yè)數(shù)據(jù)以XML的格式進(jìn)行輸出[3]。在HTMLParser獲取文獻(xiàn)節(jié)點(diǎn)的同時(shí),會(huì)對(duì)文本內(nèi)容進(jìn)行處理借助聚焦網(wǎng)絡(luò)爬蟲并以圖書館作為主題實(shí)行數(shù)據(jù)爬取,此時(shí)便可以獲得圖書館情報(bào)的數(shù)據(jù)資料,并通過(guò)萬(wàn)維網(wǎng)當(dāng)中的HTML網(wǎng)頁(yè),這一些網(wǎng)頁(yè)劃分為兩種,一種是和網(wǎng)頁(yè)主題相關(guān)的信息,另一種屬于部分和主題相關(guān)的信息,典型內(nèi)容為版權(quán)、導(dǎo)航等信息。對(duì)于關(guān)聯(lián)性不高的數(shù)據(jù)會(huì)及時(shí)進(jìn)行過(guò)濾。

在數(shù)據(jù)處理方面,獲得的情報(bào)信息并不能及時(shí)分析,需要以分詞方式進(jìn)行處理,這里的數(shù)據(jù)會(huì)涉及中文與英文甚至是其他的文字,對(duì)于英文的相關(guān)文獻(xiàn),可以應(yīng)用分子處理方式,這一種處理也比較簡(jiǎn)單,可以直接應(yīng)用空格作為分隔符,并不需要其他的特殊處理方式。當(dāng)前成熟的分詞系統(tǒng)一種是按照字符串的匹配方式進(jìn)行計(jì)算,另一種按照統(tǒng)計(jì)和機(jī)器學(xué)習(xí)結(jié)合的形式進(jìn)行計(jì)算。按照字符串的匹配算法,主要是對(duì)字符串進(jìn)行掃描,在發(fā)現(xiàn)與詞料庫(kù)相匹配的字符串后進(jìn)行記錄[4]。例如,正反向、雙向的匹醉打匹配算法,這一種算法的速度非??觳⑶視r(shí)間復(fù)雜度比較低,更容易實(shí)現(xiàn),分類的效果也比較突出,但是對(duì)于歧義與未登錄詞匯的處理效果并不理想。另一種是按照統(tǒng)計(jì)學(xué)和計(jì)算機(jī)學(xué)習(xí)的結(jié)合形式,分類效果更好,可以解決歧義的相關(guān)詞匯,當(dāng)時(shí)需啊喲人工標(biāo)注的詞性作為支持,構(gòu)建分詞系統(tǒng)模型,可以應(yīng)用標(biāo)注后的數(shù)據(jù)對(duì)模型實(shí)行訓(xùn)練,也就是調(diào)整模型的參數(shù)。在分詞階段借助訓(xùn)練好的模型計(jì)算出分詞的概率,并以最大概率的分詞進(jìn)行輸出。因?yàn)閮煞N類型的分詞系統(tǒng)都有各自的優(yōu)勢(shì),所以在應(yīng)用中也可以應(yīng)用結(jié)合的原則,例如按照雙向醉打匹配與HMM的分詞方式消除歧義的問(wèn)題,這一種模型可以應(yīng)用正向最大匹配與逆向的足底啊匹配兩種形式實(shí)現(xiàn)對(duì)文本信息的分析處理,并通過(guò)HMM模型實(shí)現(xiàn)對(duì)兩次匹配結(jié)果的對(duì)比分析,最終達(dá)到理想的分詞效果。

2.2 實(shí)踐應(yīng)用

目前來(lái)看,在大數(shù)據(jù)環(huán)境之下,情報(bào)分析平臺(tái)的應(yīng)用流程已經(jīng)相對(duì)比較清晰,在面對(duì)海量數(shù)據(jù)的儲(chǔ)存基礎(chǔ)上,可以將已經(jīng)擁有的數(shù)據(jù)實(shí)行分析、整理、選擇以及轉(zhuǎn)換等處理措施,數(shù)據(jù)的準(zhǔn)備工作屬于情報(bào)分析平臺(tái)的基礎(chǔ)前提,同時(shí)也是決定情報(bào)分析平臺(tái)應(yīng)用質(zhì)量與效率的關(guān)鍵。當(dāng)前來(lái)看,圖書館在服務(wù)與管理工作中情報(bào)分析平臺(tái)的應(yīng)用已經(jīng)具備較高的實(shí)踐價(jià)值。在圖書館發(fā)展方面,可以借助這一平臺(tái)實(shí)現(xiàn)市場(chǎng)發(fā)展方向的明確。與市場(chǎng)營(yíng)銷相似,屬于最早應(yīng)用情報(bào)分析平臺(tái)的領(lǐng)域,其主要是按照用戶的實(shí)際需求,將不同的圖書館閱讀、借閱等習(xí)慣以及消費(fèi)的特征等分類的方式進(jìn)行總結(jié)管理,同時(shí)保障館藏資源的供應(yīng)更適用于閱讀者的需求,盡可能提升圖書館館藏的使用價(jià)值。促使圖書館的服務(wù)范圍也可以從廣泛性轉(zhuǎn)變?yōu)獒槍?duì)性、個(gè)性化。

3 總結(jié)

綜上所述,大數(shù)據(jù)時(shí)代的到來(lái)雖然給圖書館的運(yùn)營(yíng)與管理工作提出了許多的挑戰(zhàn),但是也間接的供應(yīng)了更加理想和寬闊的發(fā)展前景。對(duì)此,圖書館在新時(shí)代環(huán)境之下,應(yīng)當(dāng)勇于創(chuàng)新,借助硬件、理念等方面的創(chuàng)新,提升大數(shù)據(jù)技術(shù)的實(shí)踐性應(yīng)用價(jià)值,提升圖書館綜合管理水平,為館藏需求者提供更加優(yōu)質(zhì)、人性化、全買性的服務(wù),為社會(huì)的進(jìn)一步、長(zhǎng)遠(yuǎn)性發(fā)展提供可靠支持。

參考文獻(xiàn)

[1]高峰,羅雪瓊,張建偉.醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)及其在醫(yī)療行為監(jiān)管中的應(yīng)用[J].中國(guó)醫(yī)學(xué)裝備,2019,31(3):168-171.

[2]郭力,邊根慶.基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個(gè)性化服務(wù)系統(tǒng)研究[J].電子測(cè)量技術(shù),2019,23(16):1-6.

[3]黨秀云,杜男杰.大數(shù)據(jù)在公共服務(wù)需求識(shí)別與精準(zhǔn)供給中的應(yīng)用研究[J].中共福建省委黨校學(xué)報(bào),2019,14(5):62-70.

[4]楊利軍,高軍.圖書館個(gè)性化服務(wù)中的大數(shù)據(jù)可視化分析與應(yīng)用研究[J].現(xiàn)代情報(bào),2015(7):70-74.

作者簡(jiǎn)介

王慧(1974-),女,漢族,湖南澧縣,本科,中級(jí)職稱,圖書管理,桃江縣科學(xué)技術(shù)和工業(yè)信息化局。

猜你喜歡
大數(shù)據(jù)時(shí)代圖書館
圖書館
從“數(shù)據(jù)新聞”看當(dāng)前互聯(lián)網(wǎng)新聞信息傳播生態(tài)