文/姚穎莉
數(shù)據(jù)挖掘在圖書館個性化服務中的應用
文/姚穎莉
伴隨信息技術高速發(fā)展,數(shù)據(jù)挖掘技術逐漸受到人們的廣泛關注,即信息利用與提取過程中,該項技術一直占據(jù)重要地位。對此,文章首先進行數(shù)據(jù)挖掘技術分析,然后闡述該項技術在圖書館個性化服務中的應用,以發(fā)揮數(shù)據(jù)挖掘技術重要作用,從而實現(xiàn)圖書館整體服務質(zhì)量、技術水平的提高,為圖書館的發(fā)展提供有力保障,以發(fā)揮數(shù)據(jù)挖掘最大價值。
數(shù)據(jù)挖掘 圖書館 個性化服務 應用
在我國信息技術的發(fā)展背景下,圖書館的建設水平得到顯著提高,同時相繼創(chuàng)建自動化的管理體系,此類管理體系包含大量數(shù)據(jù)與表單,并在圖書館相關業(yè)務中發(fā)揮指導性作用。然而,結合當前情況發(fā)現(xiàn),數(shù)據(jù)處理方式仍然是以傳統(tǒng)理念為主,使其數(shù)據(jù)備份和查詢比較落后,對此,若要解決此類問題,則應加大數(shù)據(jù)挖掘技術的應用力度,進而向讀者提供良好服務。
數(shù)據(jù)挖掘的特點表現(xiàn)為:可以進行數(shù)據(jù)庫中數(shù)據(jù)的抽取和轉換等處理,并從中獲取決策重要數(shù)據(jù)。而對數(shù)據(jù)挖掘技術進行劃分時,如果按照數(shù)據(jù)結構方式進行,通??梢詫⑵浞譃槿?,即文本數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘、數(shù)值數(shù)據(jù)。
主要是對文本信息進行數(shù)據(jù)挖掘,如果數(shù)據(jù)挖掘對象均由文本組合而成,根據(jù)數(shù)據(jù)挖掘算法、信息檢索算法的運用,以實現(xiàn)文本信息的自動化處理和分析,將此過程稱之為文本數(shù)據(jù)挖掘。其主要工作內(nèi)容包括:特征提取與文本分類、數(shù)據(jù)探索分析、概念操作等,在對文本數(shù)據(jù)挖掘進行應用時,主要是以詞串表示法、貝葉斯分類算法、詞集合算法等技術手段為輔助,以便于完成信息數(shù)據(jù)相關工作。
具體是指:針對頁面結構與用戶信息、Web頁面等Web數(shù)據(jù),采取數(shù)據(jù)挖掘技術對人們有用信息進行提取,通過對站點設計的優(yōu)化和改進,有利于進行電子商務。對Web數(shù)據(jù)挖掘進行應用時,需要從眾多信息Web頁面內(nèi)獲取有用知識,主要包括用戶的訪問內(nèi)容和行為等,按照此類內(nèi)容、知識,對站點設計進行改進,以實現(xiàn)Web頁面優(yōu)化的目的。具體包括:內(nèi)容安排和結構優(yōu)化、特色服務、活動開展等,進而向用戶提供更多便利,使其在最短時間內(nèi)尋找信息。在對Web數(shù)據(jù)挖掘進行深入研究發(fā)現(xiàn),根據(jù)挖掘對象的差異,可以將其具體分為Web日志、結構、內(nèi)容挖掘。
對于數(shù)值數(shù)據(jù)挖掘來講,其任務主要分為兩類,即描述、預測。換而言之,其挖掘功能為概念描述,重點進行分類和預測等相關分析。比較常見方法有模糊數(shù)學方法;歸納學習方法;遺傳算法;仿生物技術等。每種方法擁有與其相對應的特點和應用領域,需要對其予以重視。
就圖書館而言,傳統(tǒng)資源配置和服務模式早已無法適應時代需求,其原因為:如果采取人工方式進行信息采集,經(jīng)常會受到采集人員知識能力和個人喜好等影響,使其具有較強的主觀性。而將數(shù)據(jù)挖掘技術應用其中,則能更好解決以上問題,利用數(shù)據(jù)挖掘技術獨特優(yōu)勢,以實現(xiàn)檢索請求和流通記錄等數(shù)據(jù)分析,以便于掌握各文獻的實際流通借閱狀況,為了解讀者借閱行為提供便利。結合此類信息,對文獻資源進行針對性補充,將老舊文獻資源進行剔除,或者按照挖掘信息對圖書館資源分配進行優(yōu)化,以實現(xiàn)資源有效劃分的目的。當進行圖書館數(shù)據(jù)結構的挖掘時,其主要是為了解圖書館結構模式、頁面結構,基于此,為更好進行頁面分類、聚類提供保證。另外,在進行網(wǎng)頁分析后,對頁面質(zhì)量予以評價,利用檢索方式和網(wǎng)站檢索的優(yōu)化,為讀者更好使用數(shù)字圖書館提供便利,使其資源得到高效運用。
當進行流通記錄與檢索請求的信息挖掘后,讀者可以對圖書館情況予以相應了解。然而,在圖書館信息建設和個性化服務方面仍然存在問題。在進行信息建設的加強時,應由多方面進行信息資源的收集,確保個性化服務得到進一步拓展,應該對讀者進行全面了解,即在數(shù)據(jù)挖掘前提下,對圖書館內(nèi)容進行不斷挖掘。在此過程中,應先掌握圖書館的信息建設模式,通過分析總結其重要意義。按照某領域信息實際需求,對其信息進行自動捕捉和采集,通過冗余信息的篩選,以信息推送方式對其給予應用,從而向讀者提供相應服務,以滿足其個性化需求。在進行圖書館信息訪問時,對其訪問模式和興趣進行挖掘,利用聚類方法、關聯(lián)性法則,對用戶群體進行針對了解,然后根據(jù)相應信息制定個性化服務方案。另外,還可以結合挖掘信息,對頁面進行動態(tài)調(diào)整,以復核讀者實際需求。而拓展個性化服務時,可以通過用戶訪問情況,對其信息進行挖掘,使其服務內(nèi)容得到具體明確,進而向用戶提供個性化服務,使其自動化水平得到顯著提升,為圖書館更好發(fā)展提供保障的同時,還能發(fā)揮數(shù)據(jù)發(fā)掘在圖書館個性化服務中的應用價值。
數(shù)據(jù)挖掘屬于一項新型技術,同時也是增值服務的一種。伴隨數(shù)據(jù)挖掘技術的發(fā)展,將其應用于圖書館的管理系統(tǒng),可以更好進行數(shù)據(jù)處理和分析等工作,以發(fā)揮其最大潛力和價值,促使其在未來發(fā)展的基礎上,實現(xiàn)數(shù)據(jù)庫擴容與技術植入、理念深入的目的。由此可見,圖書館的個性化服務中,將數(shù)據(jù)挖掘技術應用其中,能夠實現(xiàn)原有圖書館的轉變,為其發(fā)展起到有效促進作用。
[1]張佳琴.數(shù)據(jù)挖掘在高校圖書館個性化服務中的應用[J].漯河職業(yè)技術學院學報,2013,12(06):188-189.
[2]項爾津.高校圖書館個性化服務中數(shù)據(jù)挖掘技術的應用研究[J].蘭臺世界,2014(29):135-136.
[3]謝旭明.數(shù)據(jù)挖掘技術在圖書館個性化服務管理中的應用[J].企業(yè)導報,2013(15):320-320.
[4]張黃.芻議數(shù)據(jù)挖掘功能在圖書館個性化服務系統(tǒng)中的應用[J].湖北函授大學學報,2014(07):82-83.
作者單位南陽醫(yī)學高等??茖W校 河南省南陽市473000