李戈
摘要:隨著電子商務(wù)在人們生活中的普及,電子商務(wù)技術(shù)水平越來越高。數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中也得到了廣泛的應(yīng)用。不同的電子商務(wù)環(huán)境,數(shù)據(jù)挖掘技術(shù)應(yīng)用是不同的。數(shù)據(jù)挖掘是通過存儲大量數(shù)據(jù),進(jìn)而發(fā)現(xiàn)新關(guān)聯(lián)模式的過程。數(shù)據(jù)挖掘技術(shù)既適應(yīng)商業(yè)的發(fā)展需求,有能夠幫助商業(yè)提取關(guān)鍵性信息。利用數(shù)據(jù)挖掘技術(shù),可以使企業(yè)商業(yè)貿(mào)易數(shù)據(jù)作為依據(jù)進(jìn)行商業(yè)決策,提升企業(yè)競爭實(shí)力。
關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;技術(shù);探討
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)13-0243-02
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用越來越廣泛,從而達(dá)到提升企業(yè)綜合實(shí)力的目的。本文針對電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)探討研究,將從數(shù)據(jù)挖掘技術(shù)的產(chǎn)生人手,根據(jù)數(shù)據(jù)挖掘技術(shù)方法和工具,提出電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的發(fā)展現(xiàn)狀。最后,對電子商務(wù)中數(shù)據(jù)挖掘技術(shù)進(jìn)行分析和探討。希望本文的研究,能為提升我國電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)水平提供參考性建議。
1數(shù)據(jù)挖掘技術(shù)的產(chǎn)生
數(shù)據(jù)挖掘技術(shù)的產(chǎn)生源于市場競爭。很多商場為了明確客戶的購買需求,增加銷售額,挖掘了消費(fèi)者各個方面的消費(fèi)數(shù)據(jù),如保險公司數(shù)據(jù)分析、貸款客戶特征等,這些數(shù)據(jù)可以統(tǒng)計(jì)成報(bào)表,為商場提供決策依據(jù)。隨著系統(tǒng)數(shù)據(jù)要求的提升,傳統(tǒng)的分析工具已經(jīng)不能滿足企業(yè)的需求,無法對深層次的數(shù)據(jù)進(jìn)行提取。信息管理系統(tǒng)的廣泛應(yīng)用解決了這個問題,數(shù)據(jù)挖掘技術(shù)就是這樣一種能夠?yàn)槠髽I(yè)提供高層次分析數(shù)據(jù)的一門技術(shù),也被稱為數(shù)據(jù)庫知識發(fā)現(xiàn),能夠?qū)?shù)據(jù)進(jìn)行高級處理,實(shí)現(xiàn)分類、聚類、關(guān)聯(lián)、預(yù)測等功能。
2數(shù)據(jù)挖掘技術(shù)方法和工具
數(shù)據(jù)挖掘技術(shù)的主要工具是計(jì)算機(jī),其操作分為幾個步驟。首先對海量數(shù)據(jù)進(jìn)行挖掘,挖掘的信息具有復(fù)雜的結(jié)構(gòu),接著,利用統(tǒng)計(jì)學(xué)等專業(yè)技術(shù),對復(fù)雜數(shù)據(jù)進(jìn)行計(jì)算和建模,得到最直觀最有效的數(shù)據(jù)。數(shù)據(jù)挖掘在建模方面方法有很多,包括傳統(tǒng)統(tǒng)計(jì)方法,如抽樣技術(shù)在理論指導(dǎo)下抽樣,實(shí)現(xiàn)時間序列分析。還有可視化技術(shù),這是用圖標(biāo)方式直觀表達(dá)信息。另外決策樹是利用樹狀圖進(jìn)行數(shù)據(jù)分類和預(yù)測。神經(jīng)網(wǎng)絡(luò)使模擬了神經(jīng)元,經(jīng)過輸入層、隱蔽層等,對數(shù)據(jù)調(diào)整結(jié)算,最終對結(jié)果分類。數(shù)據(jù)挖掘技術(shù)中包括遺傳算法、關(guān)聯(lián)規(guī)則挖掘算法等。
3電子商務(wù)中數(shù)據(jù)挖掘技術(shù)發(fā)展現(xiàn)狀
目前,國內(nèi)的數(shù)據(jù)挖掘技術(shù)主要應(yīng)用在電子商務(wù)中。主要研究人員為大學(xué)教授,部分研究者為公司在業(yè)人員。我國對于數(shù)據(jù)挖掘技術(shù)的研究領(lǐng)域不斷在擴(kuò)大,包括算法研究、數(shù)據(jù)挖掘?qū)嶋H應(yīng)用、數(shù)據(jù)挖掘理論分析等。我國現(xiàn)在正在進(jìn)行的有關(guān)研究項(xiàng)目是電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)的研究,該項(xiàng)目受到國家自然科學(xué)基金的支持,但是國相關(guān)產(chǎn)品研發(fā)也在逐漸報(bào)道。我國的KDD、人工智能等在進(jìn)一步研究中,這表明了數(shù)據(jù)挖掘技術(shù)在我國學(xué)術(shù)研究中得到了更高的重視。
4電子商務(wù)中數(shù)據(jù)挖掘技術(shù)探討
4.1預(yù)測方法分析
在電子商務(wù)活動中,分類與預(yù)測方法是必不可少的也是應(yīng)用最多的一項(xiàng)技術(shù)。分類的實(shí)質(zhì)是在電子商務(wù)中構(gòu)造分類函數(shù)和模型,形成分類器。其構(gòu)造方法包括統(tǒng)計(jì)法、神經(jīng)網(wǎng)絡(luò)法等。利用這些技術(shù)方法,能夠有效地將數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行映射,提取到另外一個特定類別中,以用于電子商務(wù)活動中的預(yù)測工作中。無論是歷史數(shù)據(jù)還是系統(tǒng)更新的數(shù)據(jù),都能夠自動提取給定數(shù)據(jù),進(jìn)而推導(dǎo)出有用數(shù)據(jù)的描述,以推廣描述的數(shù)據(jù)進(jìn)行未來數(shù)據(jù)的預(yù)測。
4.2聚類分析方法分析
聚類分析方法就是將數(shù)據(jù)按照一定原則進(jìn)行歸類的過程,在電子商務(wù)活動中,聚類分析可以對市場理論進(jìn)行細(xì)化。市場中的決策十分重要,市場細(xì)化能夠通過消費(fèi)者的需求情況,將同一類別個體進(jìn)行歸類,增大不同類別個體距離,提取聚類消費(fèi)者特征提取,為企業(yè)客戶提供特色服務(wù)。聚類分析方法包括統(tǒng)計(jì)法、機(jī)械法、神經(jīng)網(wǎng)絡(luò)法等。在神經(jīng)網(wǎng)絡(luò)法中,需要通過待分析即興數(shù)據(jù)建模,利用非線性數(shù)據(jù)和特征映射,對數(shù)據(jù)進(jìn)行挖掘,這是電子商務(wù)活動中最有發(fā)展前景的一項(xiàng)技術(shù)。
4.3數(shù)據(jù)抽取方法分析
電子商務(wù)具有虛擬性,數(shù)據(jù)中更多包含著消費(fèi)者的消費(fèi)傾向、動機(jī)、能力等。這些都是需要挖掘出來的,并進(jìn)行有無規(guī)則劃分的數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)抽取方法,可以將虛擬數(shù)據(jù)進(jìn)行壓縮,通過求均值、統(tǒng)計(jì)值方式,用圖形或統(tǒng)計(jì)圖表示出來,并進(jìn)行數(shù)據(jù)總結(jié)??梢圆捎脭?shù)據(jù)泛化方式,將基本的信息提升到更高的層次。同時也可以采用多為數(shù)據(jù)分析的方式,歸納數(shù)據(jù)屬性。在數(shù)據(jù)抽取過程中,涉及的操作,如匯集操作等,計(jì)算要及時將計(jì)算結(jié)果保存,以便為策系統(tǒng)提供數(shù)據(jù)依據(jù)。
4.4關(guān)聯(lián)規(guī)則應(yīng)用分析
面對事務(wù)型的數(shù)據(jù)庫,電子商務(wù)中主要運(yùn)用的是關(guān)聯(lián)規(guī)則法,關(guān)聯(lián)規(guī)則方法也是數(shù)據(jù)挖掘技術(shù)中的重要部分。其應(yīng)用主要是利用事物發(fā)生時間、消費(fèi)者購買的具體物品、消費(fèi)者購物標(biāo)識號等進(jìn)行數(shù)據(jù)的預(yù)測的分析。關(guān)聯(lián)規(guī)則是售貨數(shù)據(jù)的收集,隨著條形碼技術(shù)不斷成熟和發(fā)展,企業(yè)有關(guān)部門能夠利用該技術(shù)獲取大量的售貨記錄和消費(fèi)記錄。從這些歷史數(shù)據(jù)中統(tǒng)計(jì)出關(guān)聯(lián)規(guī)則,為企業(yè)的擴(kuò)大業(yè)務(wù)渠道和范圍提供有價值的信息,同時也可以幫助管理者對市場進(jìn)行規(guī)劃,有助于確定商品的種類、價格等。關(guān)聯(lián)規(guī)則包括有意義關(guān)聯(lián)規(guī)則,以及泛化關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則使研究對象更加明確。
4.5概念描述法分析
概念描述法,就是對語言進(jìn)行簡化,以描述的形式展現(xiàn)數(shù)據(jù)的特性表征。該方法主要包括數(shù)據(jù)特征化和數(shù)據(jù)區(qū)分兩個過程,前者是有針對性的對目標(biāo)數(shù)據(jù)進(jìn)行匯總,對數(shù)據(jù)庫進(jìn)行查詢和手機(jī)。該過程基本是通過屬性的不同進(jìn)行歸納,其表現(xiàn)形式一般為條形圖、曲線圖、多為數(shù)據(jù)圖、立方體圖等。數(shù)據(jù)區(qū)是將目標(biāo)類對象和一般特性進(jìn)行比較,比較后找出類比對象間的差異,用數(shù)據(jù)進(jìn)行特征化。在數(shù)據(jù)挖掘技術(shù)中,概念描述法要采用面向數(shù)據(jù)庫的范式,還要掌握一定的機(jī)械學(xué)習(xí)方法和技術(shù)。
4.6分類規(guī)則法分析
分類規(guī)則法,可以解決事件與對象歸類的問題,根據(jù)數(shù)據(jù)庫中的示例,做出正確的描述,從而建立分析模型,挖掘其中的規(guī)則。數(shù)據(jù)庫會對其中的記錄進(jìn)行分類,電力商務(wù)中,分類分第13卷第13期(2017年5月)析可以幫助客戶預(yù)測響應(yīng)行為,包括盈虧的狀況、地理數(shù)據(jù)等,每個商家企業(yè)都具體自己的屬性,只要與數(shù)據(jù)庫分析相一致,就能夠進(jìn)一步優(yōu)化商業(yè)模式。另外,序列模式發(fā)現(xiàn)法也是數(shù)據(jù)挖掘技術(shù)中必不可少的,其目的能夠分析數(shù)據(jù)前后的因果關(guān)系,從而形成數(shù)據(jù)交易集合,幫助電子商務(wù)的運(yùn)營者提供個性化服務(wù)。
5結(jié)論
數(shù)據(jù)挖掘技術(shù)的種類有很多,面對特定情況進(jìn)行數(shù)據(jù)挖掘技術(shù)選擇才是關(guān)鍵。為了使數(shù)據(jù)挖掘技術(shù)的實(shí)施更加高效,本文針對電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)探討研究,是從數(shù)據(jù)挖掘技術(shù)的產(chǎn)生人手,根據(jù)數(shù)據(jù)挖掘技術(shù)方法和工具,提出了電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的發(fā)展現(xiàn)狀。最后,對電子商務(wù)中數(shù)據(jù)挖掘技術(shù)進(jìn)行了分析和探討。包括分類與預(yù)測方法分析、聚類分析方法分析、數(shù)據(jù)抽取方法分析、關(guān)聯(lián)規(guī)則應(yīng)用分析、概念描述法分析、分類規(guī)則法分析等。希望本文的研究,能為提升我國電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)水平提供一份借鑒。