国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在中學(xué)圖書管理系統(tǒng)中的應(yīng)用研究

2017-05-27 08:11:48汪濤
中文信息 2016年12期
關(guān)鍵詞:數(shù)據(jù)挖掘中學(xué)

汪濤

摘 要: 數(shù)據(jù)挖掘作為一種深層次的數(shù)據(jù)分析方法,此方法可以從大量數(shù)據(jù)中尋找出反應(yīng)用戶特征的信息和規(guī)則,將中學(xué)圖書管理與數(shù)據(jù)挖掘相結(jié)合,尋找提取隱藏在大量的管理數(shù)據(jù)之中的有效數(shù)據(jù),包括用戶數(shù)據(jù)的搜集、數(shù)據(jù)倉的建立,以及用戶特征的分析等主要內(nèi)容。

關(guān)鍵詞:數(shù)據(jù)挖掘 中學(xué) 圖書管理系統(tǒng)

中圖分類號:TP315 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-9082(2016)12-0151-01

現(xiàn)今時代,隨著數(shù)據(jù)庫技術(shù)的成熟和數(shù)據(jù)引用的普及,人類積累的數(shù)據(jù)量正以指數(shù)級迅速增長。進(jìn)入九十年代,隨著英特網(wǎng)的出現(xiàn)和高速發(fā)展,以及隨之到來的私有網(wǎng)以及內(nèi)部網(wǎng)和外部網(wǎng)的產(chǎn)生運(yùn)用,整個世界之間的距離被縮小,人們可以利用發(fā)達(dá)的網(wǎng)絡(luò)跨越時空的局限,在網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)的交換。因此,曾經(jīng)的局部數(shù)據(jù)庫不復(fù)存在,展現(xiàn)在人們面前的是龐大的的信息海洋,數(shù)據(jù)正如洪水一般向人們涌來。當(dāng)數(shù)據(jù)量龐大到一定范圍時,如果沒有有效的方法,找尋提取有限數(shù)據(jù)的工作難度加大,人們面對著如海洋一般龐大的數(shù)據(jù)像大海撈針一樣徒勞無功。據(jù)有效估計(jì),一個大型企業(yè)數(shù)據(jù)庫中只有約7.23%的數(shù)據(jù)得到應(yīng)用。

隨著我國經(jīng)濟(jì)的快速發(fā)展,在教育之中投入了更多的基礎(chǔ)建設(shè)資金,不少中學(xué)都擁有自己的圖書館,學(xué)生的學(xué)習(xí)方式更加多樣化,不僅僅是只用教科書,圖書館的建立擴(kuò)大了學(xué)生的知識來源,大量的數(shù)據(jù)需要更加合適的管理才能將圖書館的功能發(fā)揮最大化。

數(shù)字圖書館概念的提出無疑是傳統(tǒng)圖書館管理的一次新進(jìn)步、新改革,數(shù)字圖書館是在傳統(tǒng)圖書館的基礎(chǔ)上建立起來的,是現(xiàn)代圖書館進(jìn)化階段的一大步。未來中學(xué)圖書館的發(fā)展重點(diǎn)將是在數(shù)字化管理信息的基礎(chǔ)上發(fā)展,穩(wěn)定高效的信息管理系統(tǒng)是圖書館發(fā)展的大前提大后方。

數(shù)據(jù)挖掘技術(shù)的應(yīng)用將更好地幫助圖書館管理系統(tǒng)的運(yùn)行。

一、數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)、人工智能以及數(shù)據(jù)庫三者有機(jī)結(jié)合所得的產(chǎn)物。21世紀(jì)是數(shù)字化的時代,信息大爆炸所帶來的科學(xué)數(shù)據(jù)的大量積累,因此數(shù)據(jù)庫被廣泛使用,人們在利用數(shù)據(jù)的過程中認(rèn)識到海量的數(shù)據(jù)利用起來十分不方便、效率低下,并且從大量的數(shù)據(jù)之中找出有效數(shù)據(jù)的難度巨大。在這樣的困難的敦促之下,數(shù)據(jù)庫挖掘技術(shù)適時而生。

數(shù)據(jù)挖掘技術(shù)是從大量的、隨機(jī)的、有干擾的數(shù)據(jù)之中,尋找提取出隱藏在海量數(shù)據(jù)中對人們有用的或人們不自知但又存在潛在的利用價(jià)值的數(shù)據(jù)、知識、規(guī)則或者模型。數(shù)據(jù)挖掘是一門包含很多復(fù)雜知識的交叉學(xué)科,它不僅包括數(shù)理統(tǒng)計(jì),模式識別、模糊數(shù)學(xué)這些有關(guān)數(shù)學(xué)的專業(yè)知識,還包括神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫等相關(guān)的技術(shù)知識。

數(shù)據(jù)挖掘技術(shù)的內(nèi)容主要有三個方面:數(shù)據(jù)、算法和技術(shù)以及建模能力。數(shù)據(jù)挖掘技術(shù)按照功能可分為兩大類:預(yù)測新模式以及描述性模式[1]。

數(shù)據(jù)挖掘的步驟內(nèi)容龐大,簡單概括得到以下內(nèi)容:

1.從海量的數(shù)據(jù)庫中獲得數(shù)據(jù);

2.選擇適當(dāng)?shù)奶卣鲗傩裕?/p>

3.挑選出合適的樣本策略;

4.排除數(shù)據(jù)中不正常的數(shù)據(jù),同時補(bǔ)充不夠的部分;

5.用恰當(dāng)?shù)慕稻S、變換的手段使數(shù)據(jù)挖掘的過程與數(shù)據(jù)模型相適配;

6.辨識出所得到的數(shù)據(jù)是否可視化或者是信息化;

這些步驟是從數(shù)據(jù)到知識的必經(jīng)之路。每一步驟都可能是成功的關(guān)鍵或失敗的開始。在一般的定義中數(shù)據(jù)挖掘是知識獲取的一部分。

二、數(shù)據(jù)挖掘技術(shù)在圖書管理系統(tǒng)上的應(yīng)用意義

關(guān)于數(shù)據(jù)挖掘技術(shù)在圖書管理系統(tǒng)上的應(yīng)用,有以下幾個理論與方法: Kyle Banerjee 先生在1998年提出數(shù)據(jù)挖掘技術(shù)更適用于全文本動態(tài)變化的數(shù)據(jù)庫;Nicholson和Stanton在2002年的圖書館中數(shù)據(jù)挖掘的研究中提出了“書目挖掘(Bibliomining)”這一專業(yè)名詞,書目挖掘是指在圖書館的數(shù)據(jù)管理中,將數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)原理、書目計(jì)量方式和報(bào)告工具這些技術(shù)有機(jī)的結(jié)合在一起,在行為信息與數(shù)據(jù)的基礎(chǔ)上獲取隱藏的模式。[2]

在中學(xué)的圖書館中大致有兩個方面的問題,第一,圖書館的管理中會有大量的不斷需要更新數(shù)據(jù)和之前需要保存的歷史數(shù)據(jù),這些數(shù)據(jù)如何被高效的利用起來。另一個方面,許多中學(xué)為了一些關(guān)于圖書館的評測,只重視圖書館的藏書量,但忽略了這些圖書的分類結(jié)構(gòu)與質(zhì)量高低,這大大降低了圖書館數(shù)據(jù)的利用率,導(dǎo)致圖書館的藏書不能物盡其用,大量的書籍閑置。

因?yàn)橐陨纤龅脑?,筆者認(rèn)為數(shù)據(jù)挖掘技術(shù)將能夠在中學(xué)圖書館管理系統(tǒng)之中有很大的研究價(jià)值及發(fā)展空間。

三、在中學(xué)圖書館管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的重點(diǎn)

1.圖書館中大量的數(shù)據(jù)

大量的數(shù)據(jù)是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ),圖書館中的信息面對著不斷的更新,例如用戶的借還信息,圖書館每日人流量,借閱圖書名錄等,這些信息都可以作為數(shù)據(jù)挖掘的數(shù)據(jù)來源,每一日的新數(shù)據(jù)在第二天都將變成歷史數(shù)據(jù),在不斷增加的歷史數(shù)據(jù)面前,傳統(tǒng)的數(shù)據(jù)庫只能起到數(shù)據(jù)管理的作用,而不能透過這些數(shù)據(jù)得到規(guī)律。

2.讀者的需求分析

一般的分析是以調(diào)查研究為基礎(chǔ),但數(shù)據(jù)挖掘的分析與此不同,運(yùn)用數(shù)據(jù)分析可以從海量的、不同類型的數(shù)據(jù)中挖掘出讀者身份,讀者閱讀習(xí)慣等具有特色的數(shù)據(jù)。

3.服務(wù)個性化

隨著各種書籍的種類、內(nèi)容、出版社等日益增多,知識的載體也逐漸豐富,讀者的需求越來越難以把握,想要做到讀者滿意與資金的利用兩方平衡十分不易。應(yīng)用數(shù)據(jù)挖掘技術(shù)可以更好地幫助這個問題的解決,利用大數(shù)據(jù)的挖掘分析出事物之間的聯(lián)系與規(guī)律,在大量的用戶數(shù)據(jù)中分析出他們讀書類型的傾向,以方便圖書館購書便利以及優(yōu)化圖書館藏書結(jié)構(gòu)。用大數(shù)據(jù)挖掘?qū)崿F(xiàn)個性化的服務(wù)。

四、在圖書館管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)還存在的問題

1.在大數(shù)據(jù)中數(shù)據(jù)挖掘的精度問題

在現(xiàn)今的數(shù)據(jù)挖掘中都是利用數(shù)據(jù)驅(qū)動來進(jìn)行數(shù)據(jù)挖掘,這只能在數(shù)據(jù)內(nèi)容上得出規(guī)律,這樣的數(shù)據(jù)準(zhǔn)確性及精度遠(yuǎn)遠(yuǎn)不夠[3]。而且,數(shù)據(jù)挖掘并不是萬能的,它只是一個幫助更容易分析數(shù)據(jù)的一個工具,它能夠輔助圖書館工作人員更加深入的分析數(shù)據(jù),但他不能辨識出數(shù)據(jù)的實(shí)際價(jià)值。

2.用戶的數(shù)據(jù)安全

現(xiàn)在是信息化的時代,個人的信息安全問題得到人們的重視。在構(gòu)建數(shù)據(jù)庫、運(yùn)用各種數(shù)據(jù)挖掘、分析工具的同時,要注意用戶隱私數(shù)據(jù)的處理。

3.數(shù)據(jù)挖掘技術(shù)與圖書館其他應(yīng)用的融合問題

目前數(shù)據(jù)挖掘技術(shù)還不是十分完備,它正處于一個不斷發(fā)展的過程中,要是數(shù)據(jù)挖掘技術(shù)可以和更多的管理應(yīng)用系統(tǒng)相融合,成為一種嵌入式技術(shù),使各個技術(shù)都能發(fā)揮優(yōu)勢的一面,而不輕易出現(xiàn)互相沖突。

參考文獻(xiàn)

[1]周倩,《數(shù)據(jù)挖掘在圖書館用戶資源管理中的應(yīng)用研究》[J],《圖書情報(bào)知識》2006(6)

[2]周倩,《構(gòu)建圖書館現(xiàn)代化CRM系統(tǒng)》[J],《圖書情報(bào)工作》,2004(6)

[3]楊睿娜,《數(shù)據(jù)挖掘在高職院校圖書館管理中的應(yīng)用》[J],《科技創(chuàng)新與應(yīng)用》2012(3)

猜你喜歡
數(shù)據(jù)挖掘中學(xué)
從好演講中學(xué)什么
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
在多解中學(xué)創(chuàng)新
Big Hero 6: Always be with You
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
寧波市四眼碶中學(xué)
孩子從玩中學(xué)會了什么
人生十六七(2015年5期)2015-02-28 13:08:25
諸暨市學(xué)勉中學(xué)
庆元县| 仁布县| 铅山县| 永登县| 上栗县| 乌苏市| 磐石市| 西峡县| 夹江县| 英山县| 镇巴县| 林甸县| 盐池县| 手机| 依安县| 涡阳县| 贺州市| 当雄县| 乐至县| 镇安县| 眉山市| 衢州市| 扬中市| 凤城市| 德令哈市| 丰台区| 乐都县| 儋州市| 台湾省| 卢湾区| 东兰县| 华坪县| 富蕴县| 普陀区| 龙海市| 台江县| 舒城县| 正镶白旗| 沛县| 桐乡市| 时尚|