国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代圖書館信息資源個(gè)性化服務(wù)模式研究

2014-11-19 00:34蔡新紅
科技創(chuàng)新導(dǎo)報(bào) 2014年17期
關(guān)鍵詞:個(gè)性化服務(wù)信息資源服務(wù)模式

蔡新紅

摘 要:普遍認(rèn)為,大數(shù)據(jù)具有結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)等類型,以其容量大、類型多、高時(shí)效、低密度和難分辨等特征。該文通過對大數(shù)據(jù)含義分析,認(rèn)為大數(shù)據(jù)時(shí)代用戶對信息需求具有時(shí)效性、精確性、全面性和數(shù)據(jù)內(nèi)容針對性。根據(jù)大數(shù)據(jù)時(shí)代信息特點(diǎn)和用戶信息需求,提出通過建立個(gè)性化引擎、開展云搜索服務(wù)、進(jìn)行云推薦與推送服務(wù)和建立個(gè)性化用戶分析系統(tǒng)等方法,建立用戶個(gè)性化服務(wù)模式。

關(guān)鍵詞:大數(shù)據(jù)時(shí)代 信息資源 個(gè)性化服務(wù) 服務(wù)模式

中圖分類號:G252 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2014)06(b)-0195-02

近年來,云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的推動下,特別是2012年3月22日,奧巴馬政府宣布投資2億美元,主要用于研發(fā)采集、組織和分析大數(shù)據(jù)的工具及技術(shù),并拉動大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國家戰(zhàn)略,這意味著一種全新的致富手段擺在我們面前,它的價(jià)值堪比石油和黃金,有人將“大數(shù)據(jù)戰(zhàn)略”比之為克林頓政府1993年推出的“信息高速公路”計(jì)劃,從此,全球真正步入了“大數(shù)據(jù)”時(shí)代,大數(shù)據(jù)(Big Data)成為當(dāng)下熱點(diǎn)問題。在大數(shù)據(jù)時(shí)代中,數(shù)據(jù)作為一種資源如何加以高效利用并開發(fā)出其中的價(jià)值,這已成為政府公共管理部門和企業(yè)界、投資者普遍關(guān)注的問題。

1 大數(shù)據(jù)時(shí)代讀者需求

對圖書館而言,其創(chuàng)新變革經(jīng)歷了數(shù)字圖書館(DL)、信息共享空間(IC)、IFRD、機(jī)構(gòu)知識庫存(IR)、移動圖書館(ML)、云計(jì)算等,數(shù)字資源的積累經(jīng)歷了傳統(tǒng)的數(shù)字化到原生數(shù)字資源的發(fā)展過程??梢哉f,到目前為止,中文紙質(zhì)圖書、期刊、學(xué)位論文等文獻(xiàn)類型,已大部完成數(shù)字化轉(zhuǎn)換。英文及其它文種的紙質(zhì)資源正在進(jìn)行大規(guī)模數(shù)字化。事實(shí)上,傳統(tǒng)資源只占數(shù)字資源的很小部分,而原生資源(Born-digital resources)在每臺終端機(jī)、每個(gè)用戶都不斷地產(chǎn)生信息??梢哉f,未來圖書館大數(shù)據(jù)主要來自數(shù)字圖書館、RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)和移動互聯(lián)數(shù)據(jù)等。而對用戶,其大宗旨就是如何利用相關(guān)數(shù)據(jù)技術(shù)的從海量、多樣性的數(shù)據(jù)中,即省時(shí)又省錢,并精確、全面、快速獲得有價(jià)值的信息。

1.1 對數(shù)據(jù)時(shí)效性要求

互聯(lián)網(wǎng)上每天都產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)都是以無序化、多樣化等形式出現(xiàn)的,如果用戶沒有相當(dāng)?shù)臅r(shí)間去歸納、整理是很難組織適合自己的信息,這后知后覺意味著損失先機(jī)、價(jià)值和效益。因此,圖書館如何通過數(shù)據(jù)挖掘技術(shù),為用戶迅速從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,組織、提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息推送技術(shù)推送到用戶手中。

1.2 對數(shù)據(jù)精確性與全面性要求

云華時(shí)代智能科技有限公司董事長郭昕認(rèn)為,大數(shù)據(jù)不僅改變了我們的思維方式,而且改變了我們的生產(chǎn)方式和生活方式,我們的精神世界和物質(zhì)世界都將構(gòu)建在大數(shù)據(jù)之上,大數(shù)據(jù)不僅僅是一門技術(shù),更是一種全新的商業(yè)模式,它與云計(jì)算共同構(gòu)成了下一代經(jīng)濟(jì)的生態(tài)系統(tǒng)。而圖書館數(shù)據(jù)從形式上分包含購置的資源、嵌入到圖書館相關(guān)資源、社交網(wǎng)絡(luò)資源、移動互聯(lián)網(wǎng)資源和圖書館一些傳感器所產(chǎn)生的資源等;從數(shù)據(jù)結(jié)構(gòu)上包含結(jié)構(gòu)性數(shù)據(jù)、半結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)。因此,無論在數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)容量上來看,大數(shù)據(jù)如果缺少必要的技術(shù)手段,人工的搜索或者瀏覽都無法全面了解數(shù)據(jù)全貌。用戶由于對數(shù)據(jù)處理及數(shù)據(jù)挖掘技術(shù)掌握的不夠,影響數(shù)據(jù)的完整性、準(zhǔn)確性和全面性,必將影響對事物的正確判斷,使其嗅覺變得遲鈍。在這個(gè)意義上,圖書館工作人員無論從事實(shí)要求和社會要求,都要求轉(zhuǎn)變職能,以大數(shù)據(jù)的思維出發(fā)提高服務(wù)水平,從聯(lián)機(jī)編目、館內(nèi)借閱、館際互借,轉(zhuǎn)而對各種數(shù)據(jù)提供精細(xì)分析和信息進(jìn)行實(shí)時(shí)分析,提供精確性與全面性的數(shù)據(jù)。

1.3 對數(shù)據(jù)內(nèi)容要求

客觀地說,用戶利用信息資源的動機(jī)一般由需要、認(rèn)知、學(xué)習(xí)等內(nèi)因和文化、社會、家庭、小群體、參考群體等外因共同決定,一方面每個(gè)用戶,其因知識背景、學(xué)科專業(yè)、科學(xué)研究方向決定其利用信息資源的層次、范疇和內(nèi)容,對數(shù)據(jù)要求不同。另一方面由于不同的數(shù)據(jù)有不同的結(jié)構(gòu)形式,不同的網(wǎng)站界面風(fēng)格設(shè)計(jì);其數(shù)據(jù)利用和定制途徑也不一樣,如果要使數(shù)據(jù)用戶根據(jù)自己所需,就要在用戶與數(shù)據(jù)之間建立一種關(guān)系,這種關(guān)系是對應(yīng)關(guān)系,是通過開通網(wǎng)絡(luò)全覆蓋進(jìn)行內(nèi)容定向和行為定向服務(wù)。

2 大數(shù)據(jù)時(shí)代讀者個(gè)性化服務(wù)模式

大數(shù)據(jù)時(shí)代的圖書館用戶數(shù)據(jù)需求,不再局限于簡單層次的信息查詢與反饋,而是轉(zhuǎn)向廣闊的信息源,用戶對信息產(chǎn)品的需求,不是簡單查找相關(guān)文獻(xiàn)來源與出處,而是要求提供綜合度高、附加值大的信息產(chǎn)品。不僅是要信息咨詢?nèi)藛T提供圖書館現(xiàn)有數(shù)據(jù)庫、書目數(shù)據(jù)等結(jié)構(gòu)性數(shù)據(jù),同時(shí)還要查詢互聯(lián)網(wǎng)上非結(jié)構(gòu)性和半結(jié)構(gòu)性數(shù)據(jù)。為更好地利用這些數(shù)據(jù),圖書館員就要掌握一些數(shù)據(jù)挖掘工具與技術(shù),根據(jù)用戶利用信息資源的歷史記錄,掌握其學(xué)科專業(yè)背景、學(xué)術(shù)研究方向和閱讀興趣,對海量數(shù)據(jù)之間的關(guān)聯(lián)進(jìn)行分析,挖掘出隱藏其中的規(guī)律信息,形成滿足用戶需求的深層次信息產(chǎn)品;主動定制書目數(shù)據(jù)、文獻(xiàn)資料等專題信息,并定期進(jìn)行推送,真正實(shí)現(xiàn)個(gè)性化信息服務(wù)。

2.1 建立個(gè)性化引擎

眾所周知,在搜索領(lǐng)域Google、百度等已被用戶所熟悉,其強(qiáng)大的搜索功能贏得廣大用戶的青睞。針對圖書館而言,建立個(gè)性化的發(fā)現(xiàn)機(jī)制,能對各種數(shù)據(jù)進(jìn)行表述、分類及評價(jià)。這樣的個(gè)性化推薦系統(tǒng)必須能夠基于用戶信息需求提供相關(guān)的精確的推薦,而且這種信息需求收集是較全面的。推薦的結(jié)果必須能夠?qū)崟r(shí)計(jì)算、運(yùn)用,并能及時(shí)的對推送結(jié)果作出反饋。當(dāng)然建立用戶個(gè)性化推薦機(jī)制的形式各有不同,一般是基于圖書館網(wǎng)站內(nèi)容,利用讀者的信息行為和信息源,為讀者進(jìn)行個(gè)性化信息推薦,其推薦行為是根據(jù)用戶行為數(shù)據(jù)記錄和歷史信息需求進(jìn)行。

2.2 開展云搜索服務(wù)

一般認(rèn)為,云搜索是指可定制的、智能化站內(nèi)搜索。其核心價(jià)值訴求是保證所有資源利用者都能根據(jù)自己的數(shù)據(jù)需要找到相應(yīng)的信息,提高用戶的滿意度。站內(nèi)搜索支持所有論壇、CMS和手機(jī)終端應(yīng)用,其目的是節(jié)省服務(wù)器資源,不需限制搜索;搜索結(jié)果更精準(zhǔn);篩選方式更多樣;更迅速得出結(jié)果,提供搜索效益;通過云搜索可根據(jù)網(wǎng)站不同數(shù)據(jù)類型定義搜索條件,打造各種定制搜索需求,通過精準(zhǔn)內(nèi)容推薦,提升網(wǎng)站流量,增加用戶粘性,強(qiáng)化搜索范圍、索引管理、語詞(關(guān)鍵詞)管理等。endprint

在開展云搜索服務(wù)過程中,其主要內(nèi)容包括:擁有站內(nèi)搜索功能、劃詞搜索、帖子頁推薦、彈窗推薦、refer推薦和首頁熱詞分析等,其中站內(nèi)搜索是云搜索服務(wù)的基本搜索功能,可根據(jù)用戶信息需求,定制結(jié)構(gòu)化數(shù)據(jù),并進(jìn)行定時(shí)數(shù)據(jù)更新;首頁熱詞是云搜索服務(wù)的運(yùn)營助手,可根據(jù)信息流量動態(tài)伸縮信息資源;其他項(xiàng)目是云搜索服務(wù)的基本服務(wù)內(nèi)容推薦。

2.3 進(jìn)行云推薦與推送服務(wù)

各個(gè)商業(yè)網(wǎng)站或信息專業(yè)網(wǎng)站常用Refer進(jìn)行云推薦服務(wù)。Refer推薦服務(wù)需要與搜索引擎關(guān)鍵字匹配,并從所有的搜索引擎(百度、google、云搜索)到達(dá)的頁面(可能是帖子頁、可能是首頁、板塊頁等),當(dāng)其搜索關(guān)鍵詞被激活時(shí),頁面彈出具有更多相關(guān)內(nèi)容的彈出框;從而使外部搜索引擎到達(dá)站點(diǎn)的用戶看到站內(nèi)更多相關(guān)內(nèi)容,對站點(diǎn)產(chǎn)生信任感。云推送服務(wù)的優(yōu)點(diǎn)在于,云推送服務(wù)支持推送給一個(gè)人、一群人和所有人,單一終端多個(gè)應(yīng)用共享一個(gè)服務(wù)進(jìn)程和一條 TCP 長連接,從而有效降低手機(jī)的耗電量和數(shù)據(jù)流量,使用云推送服務(wù)用戶可使用“無賬戶登錄”。這樣,一是增強(qiáng)用戶粘性,通過云端之間的長連接,可以實(shí)時(shí)的推送消息到達(dá)用戶端。保持與用戶的溝通,大大提升用戶活躍度和留存率;二是節(jié)約成本,在省電省流量方面遠(yuǎn)超行業(yè)水平,基礎(chǔ)的消息推送服務(wù)永久免費(fèi),大大節(jié)省開發(fā)者推送的成本;三是穩(wěn)定安全的推送,強(qiáng)大的分布式集群長期為百度各大產(chǎn)品線提供推送服務(wù),保證消息推送服務(wù)的穩(wěn)定、可靠。

3 大數(shù)據(jù)圖書館個(gè)性化服務(wù)系統(tǒng)

以資源為核心的數(shù)字化圖書館建設(shè)到以讀者為核心的大數(shù)據(jù)圖書館,最重要的就是針對不同讀者全面解決用戶個(gè)性化信息需求。而大數(shù)據(jù)的應(yīng)用就在于加強(qiáng)用戶研究與交互數(shù)據(jù)的利用,并基于對用戶數(shù)據(jù)的分析,提升個(gè)性化服務(wù)的水平,開展定題跟蹤服務(wù)、精準(zhǔn)提供服務(wù)、定制知識關(guān)聯(lián)服務(wù)和信息推送服務(wù)。圖書館面對快速增長的大數(shù)據(jù),從中提取有價(jià)值信息,建立個(gè)性化用戶分析模型,針對不同用戶快速提供全面、準(zhǔn)確的信息資源,滿足其個(gè)性化服務(wù)需要,提高信息服務(wù)層次與服務(wù)質(zhì)量。為滿足大數(shù)據(jù)對圖書館的要求,需要在以下幾個(gè)方面進(jìn)行突破。

3.1 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)應(yīng)用的核心。數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,該過程也被稱為數(shù)據(jù)考古(Data Archaeology)、數(shù)據(jù)模式分析(Data Pattern Analysis)或功能相依分析(Functional Dependency Analysis)。個(gè)性化圖書館首先要求文獻(xiàn)資源的個(gè)性化,使有限的經(jīng)費(fèi)、寶貴的空間添置讀者真正需要的文獻(xiàn),提高文獻(xiàn)資源的利用效率,并根據(jù)學(xué)校的專業(yè)設(shè)置及教學(xué)科研情況分配文獻(xiàn)購置費(fèi),使各種文獻(xiàn)載體形式之間達(dá)到平衡。圖書館每天產(chǎn)生大量可以對采購工作產(chǎn)生指導(dǎo)作用的數(shù)據(jù),如自動化系統(tǒng)的流通數(shù)據(jù)、圖書館的歷史采購數(shù)據(jù)、查詢系統(tǒng)的各種查詢數(shù)據(jù)等。利用模糊聚類分析技術(shù),通過對圖書館業(yè)務(wù)系統(tǒng)的借閱、流通狀況、檢索請求及館藏書目庫進(jìn)行分析挖掘,以此分析出文獻(xiàn)的利用率,及時(shí)補(bǔ)充短缺的文獻(xiàn),剔除過時(shí)的文獻(xiàn)或減少部分文獻(xiàn)的采購復(fù)本量。運(yùn)用關(guān)聯(lián)分析技術(shù),對用戶每次借閱的文獻(xiàn)進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)各類文獻(xiàn)間的關(guān)聯(lián)規(guī)則或比例關(guān)系,可為各學(xué)科文獻(xiàn)的采購工作提供分析報(bào)告和預(yù)測報(bào)告,優(yōu)化館藏結(jié)構(gòu)。

3.2 用戶行為分析系統(tǒng)

用戶在借閱過程中,產(chǎn)生大量的借閱數(shù)據(jù),圖書館一方面通過對用戶的學(xué)科、專業(yè)背景以及其相關(guān)領(lǐng)域科研動向進(jìn)行宏觀分析,洞察用戶最新的科研走向,結(jié)合用戶相關(guān)歷史借閱數(shù)據(jù),推斷其借閱習(xí)慣與借閱趨勢,利用數(shù)據(jù)挖掘技術(shù),定制與其借閱相關(guān)聯(lián)的文獻(xiàn)資源,并通過推送技術(shù),把相關(guān)聯(lián)的文獻(xiàn)資源推薦給用戶,提升了圖書館在科研領(lǐng)域中的作用,為科研工作者提供了更多有價(jià)值的信息,提高服務(wù)的針對性、有效性和質(zhì)量。另一方面根據(jù)用戶借閱數(shù)據(jù)分析,判斷用戶圖書借閱的總體趨勢、各類借閱圖書分布、近期借閱熱門圖書,對圖書館館藏圖書進(jìn)行有效評估,預(yù)測出讀者關(guān)注的熱點(diǎn),并根據(jù)圖書資源評價(jià)意見,有效評估圖書館已有文獻(xiàn)的質(zhì)量以及讀者對未購買文獻(xiàn)的需求,合理采購文獻(xiàn)資源和電子資源,讓購買的資源更好地滿足讀者的需要,提高圖書館信息資源的利用率。

3.3 定題跟蹤服務(wù)系統(tǒng)

大學(xué)圖書館的一個(gè)重點(diǎn)工作是對重點(diǎn)學(xué)科開展定題跟蹤。定題跟蹤服務(wù)是指高校圖書情報(bào)部門針對某一特定課題的研究需要由圖書情報(bào)人員主動地、及時(shí)地、連續(xù)地為科研人員提供文獻(xiàn)資料,搜集情報(bào)信息和數(shù)據(jù),最大限度地滿足科研人員文獻(xiàn)信息需求的全程式服務(wù)。定題跟蹤服務(wù)采用Web挖掘技術(shù),對文檔進(jìn)行分類、自動摘要、頁面過濾、網(wǎng)頁聚類以及趨勢預(yù)測等。目前研究者從不同角度已經(jīng)提出了很多行之有效的文本分類方法,這些方法大多是基于機(jī)器學(xué)習(xí)方法的,根據(jù)其分類原理的不同分為線性分類器、統(tǒng)計(jì)學(xué)習(xí)分類器、基于實(shí)例的分類器、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)方法等。

3.4 信息推送服務(wù)系統(tǒng)

信息推送服務(wù)是基于推送技術(shù)發(fā)展而出現(xiàn)的一種新型服務(wù),它運(yùn)用推送技術(shù)來實(shí)現(xiàn)個(gè)性化的主動信息服務(wù),信息推送服務(wù)不僅能夠做到了針對用戶的需求快速查找信息,而且保證了所提供信息對用戶的有用性,做到了信息服務(wù)的個(gè)性化,是近年來圖書館信息服務(wù)重要發(fā)展方向。隨著無線通訊技術(shù)的發(fā)展,手機(jī)作為信息終端已經(jīng)成為現(xiàn)實(shí),在信息推送技術(shù)中,除了傳統(tǒng)的WWW、E-mail推送服務(wù),手機(jī)信息推送APP已經(jīng)成為目前研究的熱點(diǎn)。

參考文獻(xiàn)

[1] 張文彥.大數(shù)據(jù)時(shí)代的圖書館初探[J].圖書與情報(bào),2012(6).

[2] 百度百科:大數(shù)據(jù).http://baike.baidu.com/view/6954399.htm.

[3] 百科名片:大數(shù)據(jù)時(shí)代.http://baike.baidu.com/view/9424571.htm.

[4] “大數(shù)據(jù)時(shí)代”來臨[N].北京晚報(bào)網(wǎng),2012-06-15.

[5] 新華網(wǎng),大數(shù)據(jù)時(shí)代的中國機(jī)遇——訪IBM中國研究院院長沈曉衛(wèi). http://news.xinhuanet.com/fortune/2013-04/30/c_115597780.htm.

[7] 大數(shù)據(jù)時(shí)代的中國機(jī)遇.文摘36,2013-05-30].

[8] 舒宗瑛.圖書館信息管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].甘肅科技縱橫,2009,38(2).

[9] 龔軍慧.高校圖書館拓展與深化科研定題跟蹤服務(wù)的最佳實(shí)現(xiàn)途徑[J].情報(bào)探索,2012(11).

[10] 李沛.個(gè)性化信息推送服務(wù)及其在圖書館中的應(yīng)用[J].河南圖書館學(xué)刊,2010,30(5).endprint

猜你喜歡
個(gè)性化服務(wù)信息資源服務(wù)模式
互聯(lián)網(wǎng)思維下數(shù)字圖書館個(gè)性化服務(wù)建設(shè)研究
需求理論在高校圖書館就業(yè)服務(wù)中的應(yīng)用研究
關(guān)于構(gòu)建黨校圖書館中信息資源的共建與共享方案
文化館總分館制服務(wù)模式的實(shí)施探索
談云計(jì)算與信息資源共享管理
基于網(wǎng)絡(luò)的信息資源組織與評價(jià)現(xiàn)狀及發(fā)展趨勢研究