国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘技術的圖書信息化管理研究

2019-05-16 03:06:02闞秀紅
中文信息 2019年4期
關鍵詞:數(shù)據(jù)挖掘書籍圖書

闞秀紅

摘 要:龐雜性、關聯(lián)性和隱晦性是圖書信息化管理數(shù)據(jù)的三大特點,傳統(tǒng)的圖書管理系統(tǒng)難以從數(shù)據(jù)中有效信息實現(xiàn)優(yōu)化圖書配置。近年來,高速發(fā)展的信息產(chǎn)業(yè)帶來了新的圖書信息化管理系統(tǒng),圖書的借閱與查詢產(chǎn)生大量的圖書訪問數(shù)據(jù),基于數(shù)據(jù)挖掘技術的圖書信息化管理,目前是研究的一大熱點。

關鍵詞:數(shù)據(jù)挖掘技術 圖書信息化管理

中圖分類號:G25文獻標識碼:A文章編號:1003-9082(2019)04-000-01

圖書檢索等信息隨著信息技術的迅速發(fā)展變得急速膨脹,傳統(tǒng)的圖書管理系統(tǒng)對于圖書館訪客的需求不能做到深度挖掘,造成圖書資源管理和相關決策的不便,同時會影響圖書館的發(fā)展[1]。近年來,國內(nèi)外眾多學者從各個方面研究了數(shù)據(jù)挖掘技術下的圖書信息化管理系統(tǒng)的實現(xiàn)方案,探討了基于數(shù)據(jù)挖掘技術的圖書推薦、個性化服務等研究。數(shù)據(jù)挖掘技術在國外應用的狀況較為廣泛,其研究熱度和創(chuàng)新程度持續(xù)升高,但是真正應用在圖書管理系統(tǒng)中還沒有十分成熟。在國內(nèi),圖書館管理相繼引入數(shù)據(jù)挖掘技術,利用這一新型的高新技術分析和處理借閱信息產(chǎn)生的大量數(shù)據(jù),旨在尋找數(shù)據(jù)之間的相互聯(lián)系,為圖書信息化進一步管理提供技術支持。

本文將介紹數(shù)據(jù)挖掘技術以及在圖書管理系統(tǒng)中應用特點等方面,概述圖書管理中數(shù)據(jù)挖掘的層次結(jié)構和數(shù)據(jù)挖掘的需求。

一、數(shù)據(jù)挖掘技術的概述

隨著物聯(lián)網(wǎng)和計算機技術的迅速發(fā)展,絕大多數(shù)的企業(yè)已經(jīng)應用了大數(shù)據(jù),既顛覆了傳統(tǒng)意義上的數(shù)據(jù)認知,也引發(fā)了數(shù)據(jù)獲取、存儲、分析、挖掘以及可視化等的革新[2]。人類生產(chǎn)生活方式隨著大數(shù)據(jù)及其相關技術的發(fā)展發(fā)生巨大變化。大數(shù)據(jù)的表面特征就是“巨大數(shù)據(jù)量”,這一特征使得新型數(shù)據(jù)處理模式在短時間內(nèi)具備傳統(tǒng)工具無法實現(xiàn)的決策力、洞察力,這是大數(shù)據(jù)更核心的意義。但是,原始數(shù)據(jù)仍然會受到雜質(zhì)和干擾信息的影響,這些大數(shù)據(jù)通常是模糊且沒有明顯規(guī)律的。用一定技術手段過濾其中的雜質(zhì)和干擾信息,以便獲取有價值的數(shù)據(jù),因此,基于大數(shù)據(jù)技術得到的科學決策,數(shù)據(jù)挖掘就是這種手段,通常通過五個步驟來實現(xiàn):理解數(shù)據(jù)、準備數(shù)據(jù)、理解業(yè)務、建立模型、評估模型和模型部署。而數(shù)據(jù)挖掘技術的手段主要包括關聯(lián)規(guī)則分析、聚類分析、分類分析、預測、時序模式和偏差分析等。

從聚類分析的角度來看,將相似的事務以同一類個體的相似度歸類,不同類別的個體差異性較大。這種分組結(jié)果是一種多元化統(tǒng)計方法,在原有數(shù)據(jù)集合缺乏知識領域或者是領域知識完整,通過聚類分析技術,自動把無標識數(shù)據(jù)對象劃分成不同類別,因此獲得數(shù)據(jù)集合真實的原本的消息。合并法、分解法、樹狀圖、劃分聚類、譜聚類等都是常用的聚類分析方法。

早在1989年第11屆國際聯(lián)合人工智能學術會議上,挖掘數(shù)據(jù)資源的思想就被發(fā)掘,數(shù)據(jù)挖掘技術的重點也隨著社會的進步由發(fā)現(xiàn)方法轉(zhuǎn)移到了系統(tǒng)應用方面,并注重學科之間的相互滲透和技術改革的多種策略的并行使用?,F(xiàn)階段,圖書館的主要作用是給1讀者提供學習資源,但由于多種因素的制約,有些圖書館的管理模式過時,服務流程出錯,導致圖書管理出現(xiàn)一定的困難。

二、圖書信息化管理的數(shù)據(jù)特征

圖書管理員和讀者是圖書管理的兩答使用者,管理員為了更好的獲知讀者對圖書的需求,必須與讀者建立足夠的聯(lián)系和互動,只有明確了讀者的需求,才能進一步實現(xiàn)圖書管理內(nèi)書籍的種類和數(shù)量的優(yōu)化,避免資源浪費,提升圖書管理的服務功能。圖書館的建立會使館藏不斷增加,隨后圖書管理規(guī)模也會不斷的擴大,圖書管理數(shù)據(jù)增大的同時會帶來以下幾種特征:

1.龐雜的數(shù)據(jù)信息

圖書管理過程中,讀者檢索、閱讀和管理員的借閱和檢查都會生成大量的數(shù)據(jù)信息,讀者的范圍是不確定的因素,每年都會出現(xiàn)新用戶加入和舊用戶退出的情況,就會導致管理數(shù)據(jù)變不斷增加。

2.隱晦的信息關系

數(shù)據(jù)背后真正的規(guī)律性會因大量數(shù)據(jù)的堆積而遮蓋,采用有效的算法對數(shù)據(jù)信息進行合理分析和處理,其內(nèi)部隱藏的更加有價值的信息才能夠被挖掘。

3.相互關聯(lián)的信息

關聯(lián)性是指用戶本身的信息和圖書檢索信息之間的關聯(lián),這種關聯(lián)性較為淺顯,大量數(shù)據(jù)潛在性的背后隱藏著更有價值的信息,挖掘這一信息才能發(fā)現(xiàn)數(shù)據(jù)之間的關聯(lián)性,足夠充分的關聯(lián)性讓圖書信息化管理工作更好的完成。

圖書管理數(shù)據(jù)信息的這幾大特征對管理員和讀者都提出了不同的要求,這種要求是傳統(tǒng)圖書管理系統(tǒng)無法實現(xiàn)的,基于數(shù)據(jù)挖掘技術在圖書管理系統(tǒng)的應用可以建立更加強烈、高效、精確你的聯(lián)系,為圖書管理提供了更大的舞臺。

三、數(shù)據(jù)挖掘技術在圖書管理中的需求

數(shù)據(jù)預處理、關聯(lián)數(shù)據(jù)挖掘和模型可視化分析是基于數(shù)據(jù)挖掘技術在圖書信息化管理中的三個層次,在這一過程中,讀者借閱行為模式分析、管理員個性化服務工作和文獻牌價管理工作的主要關注的三個方面。

1.數(shù)據(jù)挖掘技術的三個層次結(jié)構

數(shù)據(jù)預處理階段是從圖書管理系統(tǒng)的數(shù)據(jù)庫中轉(zhuǎn)換和集成生成的數(shù)據(jù),然后把集成數(shù)據(jù)導為數(shù)據(jù)挖掘技術系統(tǒng)可以應用的格式,最后把轉(zhuǎn)換過格式的數(shù)據(jù)保存到圖書館數(shù)據(jù)庫中,這種階段也被稱作數(shù)據(jù)收集階段?;陉P聯(lián)規(guī)則和合適的算法挖掘上一階段已經(jīng)備好的管理數(shù)據(jù)則為關聯(lián)規(guī)則挖掘階段。在模式可視化分析階段,逐一確定數(shù)據(jù)挖掘目標作為圖書借閱行為、個性化服務和文獻排架選擇挖掘任務的參數(shù),進一步對數(shù)據(jù)進行挖掘,最終導出可視化模式規(guī)則。

2.數(shù)據(jù)挖掘的準備和過程

目前研究表明,數(shù)據(jù)挖掘技術和數(shù)據(jù)庫中的知識發(fā)現(xiàn)屬于同一個領域,二者等價,重合度相當大。在數(shù)據(jù)分析和數(shù)據(jù)庫以及統(tǒng)計學領域中,數(shù)據(jù)挖掘技術的應用最為廣泛,相比較來說,知識發(fā)現(xiàn)則是強調(diào)機器學習和人工智能。數(shù)據(jù)挖掘技術要從數(shù)據(jù)中枚舉模式或者模型結(jié)構,是知識發(fā)現(xiàn)中的關鍵一步,與算法保持密切相關,二者各過程也要記住算法在可接受的計算范圍內(nèi)進行[3]。

通過讀者的檢索記錄、借閱習慣和要求等,分析讀者群,了解書籍對于讀者的歡迎度,并結(jié)合讀者群的身份信息以及上述信息,對讀者的特征進行分析,利用聚類數(shù)據(jù)獲知讀者的檢索和借閱行為規(guī)則,這就是所謂的借閱行為模式。個性化服務工作需要我們分析讀者身份信息和檢索、借閱記錄間的關聯(lián)性,通過不同讀者的需要,創(chuàng)建個性化服務的數(shù)據(jù)支持,不同讀者對于不同類型書籍的借閱時間和順序是大不相同的,把讀者的閱讀習慣分析透徹,合理安排圖書的布局,這樣一來就為不同時間段內(nèi)給讀者帶來適當?shù)膱D書提供了合理的數(shù)據(jù)支持。在分析借閱行為模式和個性化服務工作之后,繼續(xù)深入的對不同圖書的受歡迎度和借閱記錄進行分析,通過數(shù)據(jù)挖掘技術提供圖書館文獻排架的合理布局的技術支持,并提高圖書利用率,這一行為被稱為圖書館文獻排架分析。

四、數(shù)據(jù)挖掘技術在圖書信息化管理的應用

數(shù)據(jù)挖掘技術在數(shù)字圖書館中的應用多數(shù)是Web信息提取、圖書館Web挖掘、多媒體數(shù)據(jù)挖掘、提供智能搜索引擎服務等。很多學者已經(jīng)在這一方面進行了廣泛而深入的研究探討。圖書管理員可以利用挖掘的信息的背后,為讀者提供合理且適當?shù)慕ㄗh和意見,為借閱者解答疑惑。

經(jīng)過大量的研究調(diào)查表明,在圖書借閱過程中,不同的書籍之間也會有強大的關聯(lián)性,而讀者對于書籍的需求也不相同,不同的讀者之間也會有較大的變化,圖書館中的書籍的數(shù)量都是有一定的限度,因此,優(yōu)化借閱頻繁書籍的挖掘?qū)^藏適量的需求是十分重要的。大量研究數(shù)據(jù)顯示,不同書籍的信任度一般會高于75%,讀者通過借閱某類型的書籍來完善自身的知識體系,充分挖掘與這些知識體系相關的試劑的借閱數(shù)據(jù)對于圖書館館藏書籍的種類和數(shù)目的完善是非常有幫助的。書籍間支持度較低的現(xiàn)象通常會由圖書館限制書籍的免費借閱時間所影響,因此,密切關注信任度這一指標在數(shù)據(jù)挖掘技術在圖書信息化管理中的應用也十分必要[4]??梢暬跀?shù)據(jù)挖掘過程中也是不可或缺的步驟,連接整個數(shù)據(jù)挖掘的階段,從開始對分析和處理數(shù)據(jù)的初步認識和了解,通過可視化來顯示數(shù)據(jù)結(jié)果,這樣一來便于為后續(xù)工作奠定基礎。

目前我們的圖情界數(shù)據(jù)挖掘技術相對較多,但通常達到如何利用問題的水平,對實際業(yè)務有指導價值的、具有可操作性的產(chǎn)品較少,并且圖書館的管理系統(tǒng)使用自行研發(fā)的個性化等服務系統(tǒng)的能力有限,開發(fā)數(shù)據(jù)挖掘技術的難度較大,因此,專業(yè)化研究數(shù)據(jù)挖掘技術的企業(yè)和研發(fā)機構會大大推動基于數(shù)據(jù)挖掘技術的圖書信息化管理的使用和普及。

總結(jié)

筆者通過分析數(shù)據(jù)挖掘技術以及圖書信息化管理中的應用方面并總結(jié)圖書管理系統(tǒng)中數(shù)據(jù)的特征,分別闡述了數(shù)據(jù)挖掘的層次結(jié)構和數(shù)據(jù)挖掘的需要和準備兩大內(nèi)容,通過研究數(shù)據(jù)展開數(shù)據(jù)挖掘技術在圖書管理應用的驗證,表明了數(shù)據(jù)挖掘的結(jié)果和實際生活中讀者的借閱書籍結(jié)果是一致的,進一步說明了目前的圖書信息化管理中數(shù)據(jù)挖掘技術的應用,能夠更準確、更高效的提供數(shù)據(jù)支持,實現(xiàn)對圖書館書籍的種類和數(shù)目的優(yōu)化,將其服務質(zhì)量進一步提升,達到讀者滿意的程度??萍嫉牟粩喟l(fā)展會帶來讀者需求的進一步增多,更高效的算法計日可待,在分析和處理圖書館中讀者的借閱、歸還產(chǎn)生的大量信息中,新型算法可以為不同類型的讀者提供更加個性的服務,加快圖書館事業(yè)的發(fā)展。

參考文獻

[1]吳菁.數(shù)據(jù)挖掘在圖書管理中的應用研究[J].農(nóng)業(yè)圖書情報學刊,2015.

[2]李會艷.數(shù)據(jù)挖掘技術在高職院校圖書管理中的應用[J].農(nóng)業(yè)圖書情報學刊,2015.

[3]張晴,李琦.大數(shù)據(jù)時代的移動圖書管理系統(tǒng)的研究與實現(xiàn)[J].價值工程,2018.

[4]郭家義.個性化檢索系統(tǒng)中的數(shù)據(jù)挖掘技術分析.現(xiàn)代圖書情報技術,2003.

猜你喜歡
數(shù)據(jù)挖掘書籍圖書
魯迅與“書籍代購”
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
圖書推薦
南風(2020年22期)2020-09-15 07:47:08
歡迎來到圖書借閱角
AOS在書籍編寫的應用
書籍
班里有個圖書角
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
書籍是如何改變我們的
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
普兰店市| 边坝县| 古蔺县| 巨鹿县| 赤峰市| 海盐县| 浑源县| 礼泉县| 中方县| 迁安市| 玉林市| 无极县| 铜川市| 湟源县| 平邑县| 顺义区| 商丘市| 禹城市| 临清市| 天门市| 烟台市| 深水埗区| 内丘县| 沈阳市| 贵港市| 柘城县| 正定县| 曲靖市| 宁南县| 丰县| 古交市| 黔西县| 九台市| 石首市| 车致| 政和县| 南木林县| 黑山县| 磐安县| 和顺县| 尉氏县|