周清清 郭鑫
摘要:該文介紹了Web挖掘技術及其在校園教學資源共享系統(tǒng)中的典型應用??梢酝ㄟ^Web數據挖掘高度自動化地對校園教學資源共享系統(tǒng)中的海量信息進行推理與挖掘,從而得到有價值的模式,并且預測用戶未來行為,有針對性地向他們推薦特定的教學資源。
關鍵詞:Web挖掘;教學資源;內容挖掘
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)19-4364-02
如今這個信息化的時代,網絡已經深入到我們的日常生活中了,通過網絡我們可以實現(xiàn)資源的共享,校園網教學資源共享系統(tǒng)就是一個資源共享平臺,所有的校園網用戶可以通過這個系統(tǒng)訪問各種教學資源,并且可以簡單地獲取這些資源。但是,該系統(tǒng)的數據是海量的,所以如何從這么多的數據中找到對用戶有用的信息,是一個亟待解決的問題,而Web挖掘技術正好為我們解決了這個問題。
1 Web數據挖掘
1.1 Web數據挖掘概述
Web數據挖掘從數據挖掘發(fā)展而來,都是在分析大量數據的基礎上,做出歸納性的推理,預測用戶的行為等。Web挖掘與傳統(tǒng)的數據挖掘相比有它自身的特點,首先Web挖掘的數據是數據量巨大,動態(tài)性極強的,其次,Web上的數據是處于異構數據庫中的,最后,Web挖掘的信息多樣性,根據web對象不一樣,可以分為三大類:web結構挖掘、內容挖掘與訪問信息挖掘。
1) 內容挖掘
指從Web內容/數據/文檔中發(fā)現(xiàn)有用信息,Web上的信息五花八門,傳統(tǒng)的Internet由各種類型的服務和數據源組成,包括WWW、FTP、Telnet等,現(xiàn)在有更多的數據和端口可以使用,比如政府信息服務、數字圖書館、電子商務數據,以及其他各種通過 Web可以訪問的數據庫。Web內容挖掘的對象包括文本、圖象、音頻、視頻、多媒體和其他各種類型的數據。其中針對無結構化文本進行的Web挖掘被歸類到基于文本的知識發(fā)現(xiàn)(KDT)領域,也稱文本數據挖掘或文本挖掘,是Web挖掘中比較重要的技術領域,也引起了許多研究者的關注。最近在Web多媒體數據挖掘方面的研究成為另一個熱點。
2) Web結構挖掘
Web結構挖掘是對Web頁面之間的鏈接結構進行挖掘。在整個Web空間里,有用的知識不僅包含在Web頁面的內容之中,而且也包含在頁面的鏈接結構之中。對于給定的Web頁面集合,通過結構挖掘可以發(fā)現(xiàn)頁面之間的關聯(lián)信息,頁面之間的包含、引用或者從屬關系等。
3) Web訪問信息挖掘
Web訪問信息挖掘是對用戶訪問Web時在服務器方留下的訪問記錄進行挖掘。通過分析日志記錄中的規(guī)律,可以識別用戶的忠實度、喜好、滿意度,可以發(fā)現(xiàn)潛在用戶,增強站點的服務競爭力。
1.2 校園網教學資源共享系統(tǒng)中Web數據挖掘的步驟
1) 首先要確定挖掘的對象,在校園網教學資源共享系統(tǒng)中主要的對象是校園網用戶。
2) 收集原始數據并將其作為數據源。
3) 進行預處理,主要包括事務識別、數據清理、會話識別與格式化等過程,刪除掉無用的信息以提高挖掘效率。
4) 建立數據挖掘模型,利用數據模型進行測試與模擬,得到相關的挖掘結果。
5) 進行數據模式分析與挖掘,可以利用相關技術與驗證方法來解釋挖掘結果,做出決策或豐富知識。
1.3 校園網教學資源共享系統(tǒng)中Web數據挖掘的數據源
① 服務器數據:校園網用戶訪問生成的web日志內容,可以以文本形式存儲在web服務器上。
② 將圖片、圖像與文本數據,特別是html內容保存到服務器中。
③ 保存超鏈接數據。
④ 保存必要的用戶信息數據。
2 Web挖掘在校園網資源共享系統(tǒng)中應用
2.1數據抽取方法在校園網資源共享系統(tǒng)中的應用
利用數據抽取方法對零散的網絡數據進行整理,得到有規(guī)則的知識與數據,并且可以對數據進行濃縮,把基本的與原始的數據從低層次轉化成高層次,為學生管理者提供決策依據。
2.2智能化搜索中進行數據挖掘
如何滿足不同用戶的需求是我們亟待解決的一個很重要的問題,所以我們在搜索引擎中使用數據技術,構建智能搜索引擎,從而提高搜索性能。
挖掘的方法主要包括文檔分類、自動生成、聚類與分類等,利用這些技術可以實現(xiàn)個性化的搜索引擎。使用戶能快速準確地檢索到有價值的信息。通過對數據的聚類,可以將用戶的檢索結果合并在一起,縮小頁面的數量,提高搜索引擎的查準率與查全率。
3 用戶關系管理中的數據挖掘技術應用
1) 用戶關系管理概念
用戶關系管理是通過用戶與行為數據的收集,發(fā)現(xiàn)有用的潛在的用戶,并不斷完善用戶服務和分析來滿足用戶的要求。
2) Web數據挖掘在用戶關系管理中的應用
Web數據挖掘能夠幫助校園網教學資源共享系統(tǒng)確定用戶的特點,使系統(tǒng)管理員能夠為用戶提供有針對性的服務。
利用Web數據挖掘,可以理解訪問者的動態(tài)行為,據此優(yōu)化校園網教學資源共享系統(tǒng)的運行。通過分類技術,對不同的用戶進行個性化的服務,以此來提高用戶的滿意度,挖掘出潛在的用戶信息,并提取出用戶的共用特征,幫助校園網教學資源共享系統(tǒng)更好地了解用戶的興趣,預測他們的需求,有針對性地向他們推薦特定的教學資源。
4 結論
本文對Web挖掘技術進行了綜述,介紹了其在校園教學資源共享系統(tǒng)中的典型應用。Web數據挖掘高度自動化地對校園教學資源共享系統(tǒng)進行有效的分析與挖掘,從中找出有用的信息,為管理者進行服務,有針對性地向他們推薦特定的教學資源。該技術已經成為了數據挖掘領域中的熱點研究方向之一,利用該技術構建校園教學資源共享系統(tǒng),可以得到很多有用信息,具有實際應用價值,可以為高校的教學提供很大的幫助,對學生的自身發(fā)展也起了很大的作用,將Web挖掘應用于一個基于Web服務技術的校園網教學資源系統(tǒng),整合這些教學資源,讓校園網內用戶能夠透明的訪問,并為以后擴展到互聯(lián)網訪問做好技術準備,服務于數字校園的建設服務于教學。
參考文獻:
[1] 劉立軍,周軍,梅紅巖.Web使用挖掘的數據預處理[J].計算機科學, 2009,34(5):200-201.
[2] 王海英,田志學.Web使用挖掘在客戶關系管理中的應用[J].計算機工程應用,2008,23:200-223.
[3] 張偉.數據挖掘發(fā)展研究[J].計算機科學,2008,28(7):79-81.
[4] 劉浪,王麗亞,黃海量.基于Web的數據倉庫解決方案[J].計算機工程,2009,31(1):92-94.
[5] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計算機系統(tǒng), 2012(7):1282-1288.
[6] 涂承勝,陸玉昌.Web使用挖掘技術研究[J].小型微型計算機系統(tǒng), 2011,25(7): 1177-1184.endprint