曹先明,王 承,姜明鑫
1.中國聯(lián)合網(wǎng)絡通信有限公司濟寧市分公司校園服務中心,山東濟寧 272100
2.濟寧市高級職業(yè)學校,山東濟寧 272000
3.中國聯(lián)合網(wǎng)絡通信有限公司濟寧市分公司,山東濟寧 272000
數(shù)據(jù)挖掘的要領是從大量的、不完全的、有噪聲的、不清晰的、隨機化的現(xiàn)實使用數(shù)據(jù)中,提取隱藏在其中的、人們事前不能預知的、但已經(jīng)潛在的和可以使用的模式過程?;ヂ?lián)網(wǎng)技術在現(xiàn)代信息社會的大環(huán)境下,得到了長足的應用和發(fā)展。利用互聯(lián)網(wǎng)技術使得現(xiàn)代網(wǎng)絡教育可以充分利用長期以來傳統(tǒng)面授教育積累下來的大量優(yōu)秀教育資源。網(wǎng)絡中包含了豐富的動態(tài)超鏈接信息,以及頁面的訪問和使用信息。隨著WWW的發(fā)展,Web數(shù)據(jù)挖掘在數(shù)據(jù)挖掘領域中的作用越來越重要。通過挖掘Web使用記錄發(fā)現(xiàn)潛在的、有價值的信息,如用戶訪問了哪些頁面,點擊了哪些鏈接、哪些頁面的點擊頻率最高等等,通過對Web日志進行挖掘,可以跟蹤發(fā)現(xiàn)用戶的訪問習慣,以此來改進網(wǎng)頁的設計結構,以實現(xiàn)智能化、個性化的用戶界面。目前,數(shù)據(jù)挖掘的研究重點逐漸從發(fā)現(xiàn)方法的研究轉(zhuǎn)向?qū)嶋H的系統(tǒng)應用,國際上有影響的典型數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,IBM公司的Intelligent Miner,SGI公司的Set Miner等。
數(shù)據(jù)挖掘利用了如下一些領域的思想內(nèi)容:1)建模識別、機器語言學習、人工智能的探索算法、理論學習和建模技術;2)利用統(tǒng)計學中的估算、假設檢查和抽樣。數(shù)據(jù)挖掘容納了一些思想信息在其他領域中,這類領域中包含最先進的可視化信息檢索、進化計算論、電子信號處理、信息技術理論。
隨著數(shù)據(jù)倉庫技術的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,人們在積累了大量的數(shù)據(jù)信息后,急切地感覺到需要一種新的技術工具從大量數(shù)據(jù)信息中智能的、自動的抽取出有價值的符合用戶需要的知識或信息,數(shù)據(jù)庫知識的發(fā)現(xiàn)應運而生。數(shù)據(jù)挖掘就是對于在一些實際或察看信息的集合中查找模式的政策支持過程,人工智能、機器語言的學習、數(shù)據(jù)庫理論、統(tǒng)計分析學神經(jīng)系統(tǒng)網(wǎng)絡、知識庫技術系統(tǒng)、高性能計算應用、數(shù)據(jù)可視化教學信息查找、模式發(fā)現(xiàn)等學科的研究是數(shù)據(jù)挖掘涉及到的方面,數(shù)據(jù)挖掘是一個多學科多方面的交叉內(nèi)容。
我們把數(shù)據(jù)在網(wǎng)絡上的挖掘應用叫做Web挖掘,在網(wǎng)絡數(shù)據(jù)使用過程中,利用數(shù)據(jù)挖掘技術以及與萬維網(wǎng)有關的數(shù)據(jù)信息庫中的資源、網(wǎng)絡用戶的操作行為,在用戶操作過程中獲取有關部門感舉的信息,搜尋可利用的挖掘模式和潛在的數(shù)據(jù)信息,相關內(nèi)容涉及多個領域,例如:計算機網(wǎng)絡技術、數(shù)據(jù)挖掘技術、計算機科學技術、機器語言學等,是一項現(xiàn)代信息科學的綜合產(chǎn)物。對網(wǎng)頁中的頁面信息,以及頁面后臺數(shù)據(jù)庫中的操作數(shù)據(jù)進行統(tǒng)計收集,從網(wǎng)頁文件內(nèi)容里以及內(nèi)容中所描述的信息數(shù)據(jù)里抽取有價值的、潛在的、有用的信息的過程,叫做Web內(nèi)容挖掘。
電子商務是在全球各地廣泛的商業(yè)貿(mào)易交易中,在互聯(lián)網(wǎng)開放的網(wǎng)絡環(huán)境里,基于服務器、瀏覽器使用方式,買賣雙方不見面地情況下進行各種貿(mào)易活動,讓消費者完成網(wǎng)上購物、商鋪之間的網(wǎng)絡交易和在線支付以及各種商務貿(mào)易及相關的綜合性服務的一種商業(yè)運營模式,是當代社會最新型的運營模式。
電子商務是使用計算機技術、網(wǎng)絡技術和遠程通信技術,實現(xiàn)整個貿(mào)易過程的電子信息化和數(shù)據(jù)化;是使用互聯(lián)網(wǎng)作為手段,使買賣雙方不見面地情況下可進行各種商務貿(mào)易活動。
隨著信息系統(tǒng)的廣泛使用,如何充分利用數(shù)據(jù),發(fā)掘有用的知識,是廣大擁有大量數(shù)據(jù)的組織非常關心的問題,在此前景下,需要從數(shù)據(jù)中找出有用的知識。介于以上情況,人們需要使用一個新的技術工具將數(shù)據(jù)轉(zhuǎn)換為自己所需要發(fā)知識內(nèi)容,這便產(chǎn)生了數(shù)據(jù)挖掘技術。
數(shù)據(jù)挖掘技術在電子商務中的應用前景廣闊,隨著數(shù)據(jù)挖掘技術與數(shù)據(jù)庫技術的不斷發(fā)展,對Web挖掘中存在的各種復雜的非結構化數(shù)據(jù)會有更完善的解決方法。隨著社會的不斷發(fā)展,電子商務必將加快中國經(jīng)濟發(fā)展的步伐,電信行業(yè)的迅速發(fā)展,網(wǎng)絡迅猛普及更為中國的網(wǎng)絡電子商務打下了堅實的基礎。數(shù)據(jù)挖掘技術在電子商務中的應用前景廣闊,隨著數(shù)據(jù)挖掘技術與數(shù)據(jù)庫技術的不斷發(fā)展,對Web挖掘中存在的各種復雜的非結構化數(shù)據(jù)會有更完善的解決方法。
隨著社會的不斷發(fā)展,電子商務必將加快中國經(jīng)濟發(fā)展的步伐,電信行業(yè)的迅速發(fā)展,網(wǎng)絡迅猛普及更為中國的網(wǎng)絡電子商務打下了堅實的基礎。很多城市都在興建自己的數(shù)碼港我國上網(wǎng)人數(shù)也在快速上升,許多小區(qū)都有了互聯(lián)網(wǎng),寬帶的進入,相信會有更多的人采取這種方式來發(fā)展自己的營銷計劃。因而可以說,電子商務網(wǎng)站在中國將會有巨大的發(fā)展前景。
[1]朱明.數(shù)據(jù)挖掘[M].中國科學技術大學出版社,2002:75.
[2]余強,張海盛.個性化Web信息服務技術研究[J].四川:計算機應用研究,2006,2:198-200.
[3]毛國君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2005:20-39.