張 莉
(合肥工業(yè)大學(xué),安徽 合肥 230009;淮北職業(yè)技術(shù)學(xué)院,安徽 淮北 235000)
近年來(lái),網(wǎng)絡(luò)技術(shù)的不斷進(jìn)步,使得電子商務(wù)也隨之快速發(fā)展,在這一環(huán)境下許多商業(yè)開(kāi)始選擇電子商務(wù)作為其企業(yè)的發(fā)展道路,同時(shí)電子商務(wù)網(wǎng)站的競(jìng)爭(zhēng)也在不斷加劇.在電子商務(wù)的經(jīng)營(yíng)模式中,要從大量的數(shù)據(jù)信息中提取出對(duì)企業(yè)有用的信息,來(lái)使客戶對(duì)企業(yè)的滿意度有所提高,那么需要進(jìn)行解決的主要問(wèn)題就是要對(duì)此類網(wǎng)站的設(shè)計(jì)進(jìn)行改進(jìn)、對(duì)客戶關(guān)系進(jìn)行改善[1].而數(shù)據(jù)挖掘是在計(jì)算機(jī)技術(shù)的不斷發(fā)展中研究而來(lái)的一種信息的數(shù)據(jù)處理與分析的方法,具體來(lái)講,數(shù)據(jù)挖掘是可以從海量數(shù)據(jù)中進(jìn)行目標(biāo)信息提取的工具.站在企業(yè)的角度來(lái)說(shuō),數(shù)據(jù)挖掘這項(xiàng)技術(shù)在很大程度上能夠更加容易發(fā)現(xiàn)業(yè)務(wù)發(fā)展趨勢(shì).對(duì)企業(yè)的決策提供有力的依據(jù),從而提高企業(yè)在發(fā)展過(guò)程中的競(jìng)爭(zhēng)力.所以說(shuō)完整的電子商務(wù)網(wǎng)絡(luò)系統(tǒng)不應(yīng)僅僅是支持在線交易,同時(shí)也需要可以利用商業(yè)智能分析及其相關(guān)技術(shù)來(lái)為企業(yè)與用戶之間的關(guān)系管理、企業(yè)營(yíng)銷等提供一個(gè)全面的輔助,特別是在現(xiàn)在這個(gè)信息化的時(shí)代,相當(dāng)一部分的企業(yè)已經(jīng)擁有了大量信息數(shù)據(jù),而它需要的就是可以從中得到有用的方法或者規(guī)律用來(lái)指導(dǎo)企業(yè)經(jīng)營(yíng)實(shí)踐、改善與客戶之間的關(guān)系.正是這樣一種需求更加推動(dòng)了電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)的更深層次的研究.
(1)所謂的電子商務(wù)指的是單位或者個(gè)人利用因特網(wǎng)等工具,以數(shù)字電子方式來(lái)完成商務(wù)中的數(shù)據(jù)交換或者開(kāi)展相關(guān)的業(yè)務(wù)活動(dòng).當(dāng)前在國(guó)內(nèi)已經(jīng)進(jìn)行使用的有網(wǎng)上廣告業(yè)務(wù)、網(wǎng)上訂購(gòu)與支付業(yè)務(wù)、電子銀行業(yè)務(wù)等各種各樣的電子商務(wù)模式.就當(dāng)前的形式而言,電子商務(wù)由于它成本低、使用方便、不會(huì)受到時(shí)間或者空間的限制等特點(diǎn)開(kāi)始在全球的范圍內(nèi)快速發(fā)展.如果對(duì)其服務(wù)的范圍進(jìn)行歸類,那么可以分為三種類別,第一種是商業(yè)與商業(yè)(B2B)模式,第二種是商業(yè)與消費(fèi)者(B2C)模式,第三種是商業(yè)與政府(B2G)的模式.
(2)數(shù)據(jù)挖掘是一種新型的數(shù)據(jù)信息處理技術(shù),其主要是利用數(shù)據(jù)倉(cāng)庫(kù)中的大量數(shù)據(jù)信息,采用一定的方法,從中獲得有意義的信息或者發(fā)現(xiàn)新的關(guān)聯(lián)模式或者發(fā)展趨勢(shì)的過(guò)程.如果從電子商務(wù)中的企業(yè)角度來(lái)講,數(shù)據(jù)挖掘技術(shù)簡(jiǎn)稱為DM技術(shù)屬于一種新興的數(shù)據(jù)處理方式,簡(jiǎn)單的說(shuō)就是對(duì)長(zhǎng)期積累起來(lái)的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換并最終進(jìn)行分析等處理,經(jīng)過(guò)處理之后提取出能夠輔助商業(yè)決策的關(guān)鍵性信息.數(shù)據(jù)挖掘的主要優(yōu)點(diǎn)在于它可以創(chuàng)建一個(gè)預(yù)測(cè)模型,改變了以往只能夠創(chuàng)建一種回顧性的模型狀況.同時(shí)利用強(qiáng)大的數(shù)據(jù)挖掘技術(shù),能夠使相關(guān)的商戶將數(shù)據(jù)信息轉(zhuǎn)化成為有意思的具有參考價(jià)值的信息來(lái)幫助進(jìn)行經(jīng)營(yíng)決策,從而提高自己的市場(chǎng)競(jìng)爭(zhēng)力[2].
在電子商務(wù)進(jìn)行應(yīng)用的數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)過(guò)程大致要?jiǎng)澐譃槿齻€(gè)不同的階段:第一部分對(duì)需要挖掘的數(shù)據(jù)信息的準(zhǔn)備階段,第二部分對(duì)數(shù)據(jù)信息的挖掘階段,第三部分的主要任務(wù)是對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋與評(píng)價(jià).
準(zhǔn)備部分又可以分成數(shù)據(jù)的選取、數(shù)據(jù)信息的預(yù)處理.對(duì)數(shù)據(jù)進(jìn)行選取的主要目的就是對(duì)操作對(duì)象進(jìn)行確定,即是對(duì)目標(biāo)數(shù)據(jù)進(jìn)行確定,所謂的目標(biāo)數(shù)據(jù)是在經(jīng)過(guò)對(duì)用戶的需要進(jìn)行細(xì)致分析之后,對(duì)最有可能得到有利用價(jià)值的信息的那些從數(shù)據(jù)庫(kù)中抽取出來(lái)的數(shù)據(jù).獲取到這些數(shù)據(jù)以后需要進(jìn)行預(yù)處理,主要包含數(shù)據(jù)的去噪、計(jì)算缺值數(shù)據(jù)的推導(dǎo)、數(shù)據(jù)類型的轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換舉個(gè)例子來(lái)說(shuō)比如把連續(xù)型數(shù)據(jù)轉(zhuǎn)化成離散數(shù)據(jù),以方便進(jìn)行符號(hào)的歸納.
數(shù)據(jù)信息的挖掘階段是在上一步的基礎(chǔ)之上,即在目標(biāo)數(shù)據(jù)已經(jīng)確定,并且已經(jīng)完成了初始化的基礎(chǔ)之上,需要確定數(shù)據(jù)挖掘的目的與挖掘的類型.在對(duì)挖掘任務(wù)的目標(biāo)確定之后,要根據(jù)數(shù)據(jù)挖掘的知識(shí)類型選取合適的數(shù)據(jù)挖掘方法,最終完成數(shù)據(jù)挖掘具體操作即采用特定的數(shù)據(jù)挖掘方法從數(shù)據(jù)倉(cāng)庫(kù)中抽取所需的挖掘目標(biāo).
數(shù)據(jù)挖掘的結(jié)果的解釋和評(píng)價(jià)是在完成數(shù)據(jù)挖掘階段之后對(duì)發(fā)現(xiàn)的知識(shí),進(jìn)行評(píng)估,對(duì)于冗余或者無(wú)關(guān)的知識(shí)要進(jìn)行刪除;對(duì)于獲得的知識(shí)不符合用戶的要求的要進(jìn)行重新的挖掘.與此同時(shí),因?yàn)閿?shù)據(jù)挖掘需要面臨用戶,所以,在得到目標(biāo)知識(shí)以后還需要對(duì)所挖掘的知識(shí)附加相關(guān)解釋,來(lái)用一種便于用戶理解的方式供用戶使用[3].
綜上所述,整個(gè)數(shù)據(jù)信息的挖掘在實(shí)際情況下是一個(gè)不斷地循環(huán)與反復(fù)的過(guò)程,所以要對(duì)所挖掘出來(lái)的知識(shí)不斷求精和深化,最終要獲得用戶所需要的結(jié)果.
由于電子商務(wù)自身的某些獨(dú)特的特點(diǎn),同其他的應(yīng)用于普通商業(yè)領(lǐng)域中的數(shù)據(jù)挖掘相比,應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘具有如下幾個(gè)特點(diǎn):
(1)應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關(guān)系管理方面,電子商務(wù)利用因特網(wǎng)的技術(shù)能夠使企業(yè)和客戶之間的關(guān)系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等[4];
(2)電子商務(wù)本身就是一個(gè)信息化程度比較高的系統(tǒng),其自身累積的數(shù)據(jù)信息會(huì)存放在電子商務(wù)數(shù)據(jù)庫(kù)內(nèi),用戶可以比較便捷地得到這些信息,所以對(duì)于電子商務(wù)的數(shù)據(jù)挖掘的數(shù)據(jù)信息的準(zhǔn)備階段的相關(guān)工作就變得相對(duì)容易;
(3)電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘的主要目標(biāo)一般是使電子商務(wù)系統(tǒng)得到有效的改進(jìn).例如為客戶提供個(gè)性化頁(yè)面、把用戶比較感興趣的信息展現(xiàn)在網(wǎng)站首頁(yè)或得到哪一些商品比較受到客戶的歡迎等.
首先要講的是關(guān)聯(lián)規(guī)則在電子商務(wù)中的運(yùn)用,利用比較通俗的語(yǔ)言來(lái)講,從一個(gè)事件的發(fā)生與否方面進(jìn)行解釋,所謂的關(guān)聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對(duì)這些事件中的任意兩個(gè)或者多個(gè)事件提取出來(lái),通過(guò)一定的統(tǒng)計(jì)分析算法,最終確定兩個(gè)或者多個(gè)事件的發(fā)生與否是否存在著某種關(guān)系,而這種可能存在的管理,我們稱之為關(guān)聯(lián)規(guī)則[5].
列舉一個(gè)有趣的故事,就是在一個(gè)超市里面,店家把小孩的尿布同啤酒放到了一起,來(lái)供購(gòu)買(mǎi)者進(jìn)行購(gòu)買(mǎi),結(jié)果是二者的銷量都提升了一倍,其實(shí)這就是因?yàn)槎咧g有著某種潛在聯(lián)系,店家通過(guò)數(shù)據(jù)挖掘的方法發(fā)現(xiàn)的這個(gè)規(guī)則,并對(duì)這一關(guān)聯(lián)規(guī)則進(jìn)行了實(shí)際的運(yùn)用,從中得到了益處.同樣在電子商務(wù)中通過(guò)數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則,有著類似的意義.
其次在電子商務(wù)中數(shù)據(jù)挖掘聚類分析方法的應(yīng)用.在大量數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)與數(shù)據(jù)之間,往往會(huì)有某些性質(zhì)的類型相似,同樣也會(huì)有某些性質(zhì)或者特點(diǎn)相異,我們把這些性質(zhì)或者特點(diǎn)稱為觀察指標(biāo),聚類分析就是對(duì)于某一個(gè)特點(diǎn)指標(biāo)而言,把指標(biāo)相差不多的數(shù)據(jù)劃分為同一個(gè)類型,若相差較大則要?jiǎng)澐譃椴煌念愋?、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據(jù)分成一個(gè)類.在電子商務(wù)活動(dòng)中,這一方法的應(yīng)用主要集中在市場(chǎng)細(xì)分的工作之中.
分類分析系統(tǒng)的建立以生物的遺傳算法為基礎(chǔ),屬于其中的自學(xué)習(xí)的一種,它一般會(huì)包含三個(gè)子系統(tǒng),第一個(gè)是以串規(guī)則為基礎(chǔ)的并行生成子系統(tǒng)、第二個(gè)是規(guī)則評(píng)價(jià)子系統(tǒng).第三個(gè)是遺傳算法子系統(tǒng).
分類分析可以說(shuō)是電子商務(wù)中運(yùn)用到數(shù)據(jù)挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預(yù)測(cè)模型能夠?qū)σ恍I(yíng)銷方式或者其他的一些商業(yè)措施做出正確的預(yù)測(cè).
更高效的利用企業(yè)現(xiàn)有資源以及開(kāi)發(fā)新資源是當(dāng)代企業(yè)發(fā)展的關(guān)鍵.電子商務(wù)通過(guò)采用數(shù)據(jù)挖掘的技術(shù),能夠更加及時(shí)和正確的獲得企業(yè)當(dāng)前所有資源的具體使用情況,而且通過(guò)數(shù)據(jù)挖掘的技術(shù)可以分析以往的各種企業(yè)數(shù)據(jù),比如說(shuō)企業(yè)財(cái)務(wù)數(shù)據(jù)、企業(yè)庫(kù)存數(shù)據(jù)或者企業(yè)交易數(shù)據(jù),能夠較為及時(shí)的發(fā)現(xiàn)企業(yè)資源過(guò)度消耗的主要問(wèn)題所在,或者能夠得到各種商務(wù)活動(dòng)的投入與產(chǎn)出的比例,來(lái)為企業(yè)領(lǐng)導(dǎo)進(jìn)行經(jīng)營(yíng)決策提供有力的根據(jù)[6].
另外在企業(yè)的經(jīng)營(yíng)過(guò)程中,人們不斷推崇“以客戶為中心”的經(jīng)營(yíng)理念,在這一趨勢(shì)下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場(chǎng)競(jìng)爭(zhēng)力的一大課題.通過(guò)把數(shù)據(jù)挖掘應(yīng)用到電子商務(wù)之中,能夠使企業(yè)最準(zhǔn)確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過(guò)對(duì)已有客戶行為進(jìn)行相關(guān)性分析,可以形成潛在客戶資源的預(yù)測(cè)模型.
除此之外在企業(yè)經(jīng)營(yíng)過(guò)程中,利用數(shù)據(jù)挖掘可以解決另外一個(gè)嚴(yán)重影響了商業(yè)正常秩序的重要問(wèn)題.即當(dāng)前時(shí)區(qū)商務(wù)活動(dòng)中的地下的信用狀況問(wèn)題,這一問(wèn)題的嚴(yán)重程度已經(jīng)引起了人們的廣泛關(guān)注.在電子商務(wù)經(jīng)營(yíng)過(guò)程中,因?yàn)榫W(wǎng)上詐騙公司或者企業(yè)財(cái)務(wù)的現(xiàn)象屢見(jiàn)不鮮,信用危機(jī)已經(jīng)成為影響其快速正常發(fā)展的一個(gè)重要因素.而通過(guò)在電子商務(wù)中采用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對(duì)企業(yè)經(jīng)營(yíng)活動(dòng)的跟蹤,在此基礎(chǔ)上實(shí)現(xiàn)企業(yè)的資產(chǎn)評(píng)估、利潤(rùn)收益分析以及發(fā)展?jié)摿︻A(yù)測(cè)分析等,為電子商務(wù)在經(jīng)營(yíng)過(guò)程中提供了完善的安全保障體系,同時(shí)利用數(shù)據(jù)挖掘?qū)崿F(xiàn)企業(yè)網(wǎng)上全程監(jiān)控.另外通過(guò)實(shí)現(xiàn)基于數(shù)據(jù)挖掘的信用評(píng)估模型,可以在很大程度上進(jìn)行防范或者化解信用風(fēng)險(xiǎn),從而提高企業(yè)的信用度以及應(yīng)對(duì)風(fēng)險(xiǎn)能力.
電子商務(wù)是而今信息化時(shí)代進(jìn)步的產(chǎn)物,在未來(lái)的幾年內(nèi)電子商務(wù)必將會(huì)成為商業(yè)中存在的主要運(yùn)營(yíng)模式.隨著時(shí)間的積累,各種電子商務(wù)都會(huì)得到巨大的數(shù)據(jù)信息資源,這也是數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用的基本條件.從另外一方面而言,隨著數(shù)據(jù)挖掘在電子商務(wù)方面中的不斷深入研究與發(fā)展,已經(jīng)能夠向電子商務(wù)系統(tǒng)提供必不可少的技術(shù)支持,促進(jìn)了電子商務(wù)的發(fā)展與普及.
〔1〕謝丹夏.Web上的數(shù)據(jù)挖掘技術(shù)和工具設(shè)計(jì)[J].計(jì)算機(jī)工程與應(yīng)用,2001(6):85-87.
〔2〕王繼成,潘金貴,張福炎.Web挖掘技術(shù)研究[J].計(jì)算機(jī)研究與發(fā)展,2000,37(5):513-520.
〔3〕凌傳繁.Web挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報(bào)雜志,2006(01):22-25.
〔4〕吳九雄.Web挖掘在電子商務(wù)中的應(yīng)用研究[J].信息系統(tǒng)工程,2010(01):15-18.
〔5〕陳文偉.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2006.
〔6〕張吉善,胡曉棠,尤惠.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[D].東北大學(xué)工商管理學(xué)院,2007.