安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽蚌埠,233030
【摘要】本文在基于數(shù)據(jù)挖掘的電商用戶行為分析研究中,以某地區(qū)內(nèi)淘寶店鋪在運(yùn)營過程中所產(chǎn)生的數(shù)據(jù)作為研究基礎(chǔ),通過購物車及熵值法對(duì)店鋪產(chǎn)品進(jìn)行分析研究,分析電商用戶是否會(huì)再次購買淘寶店鋪內(nèi)的產(chǎn)生,按照預(yù)測(cè)結(jié)果,淘寶店鋪產(chǎn)品銷售數(shù)量能夠得到顯著提升。
【關(guān)鍵詞】網(wǎng)絡(luò)購物;數(shù)據(jù)挖掘;購物車分析;電子商務(wù)
伴隨著電子商務(wù)平臺(tái)的快速發(fā)展,有關(guān)物流產(chǎn)業(yè)不斷完善,網(wǎng)絡(luò)購物已經(jīng)成為人們最常見的購物形成,在社會(huì)經(jīng)濟(jì)建設(shè)內(nèi)所具有的作用顯著提升。人們通過點(diǎn)擊鼠標(biāo)就能夠完成產(chǎn)品瀏覽及購買的流程,購物并不需要受到時(shí)間及空間的限制,網(wǎng)絡(luò)購物已經(jīng)成為社會(huì)大眾常見消費(fèi)形成,消費(fèi)者消費(fèi)理念與消費(fèi)行為已經(jīng)發(fā)生了顯著改變,進(jìn)而對(duì)商業(yè)運(yùn)營模式與生態(tài)系統(tǒng)造成嚴(yán)重影響。
1、數(shù)據(jù)統(tǒng)計(jì)與分析
按照有關(guān)部門對(duì)網(wǎng)絡(luò)購物用戶行為統(tǒng)計(jì)之后發(fā)現(xiàn),其中有三分之一的用戶在2015年購物次數(shù)超過40次,主要購物次數(shù)集中仔30次左右,網(wǎng)絡(luò)購物已經(jīng)成為用戶常見消費(fèi)模式。科研人員根據(jù)網(wǎng)絡(luò)購物數(shù)據(jù)進(jìn)行分析研究內(nèi)發(fā)現(xiàn),大部分消費(fèi)者網(wǎng)絡(luò)購物都具有較高滿意度,其中年輕媽媽及準(zhǔn)媽媽該類人群成為網(wǎng)絡(luò)購物的主要消費(fèi)群體。
本文在分析研究內(nèi)所選取的地區(qū)店鋪覆蓋范圍十分廣泛,分析內(nèi)數(shù)據(jù)是按照某淘寶店鋪在2015年第四季度所產(chǎn)生的銷售數(shù)據(jù)作為基礎(chǔ),主要數(shù)據(jù)包含電商用戶基礎(chǔ)信息、購物時(shí)間、購買產(chǎn)品有關(guān)信息等。
1.1性別分析
在淘寶店鋪內(nèi)電商用戶性別分析內(nèi)發(fā)現(xiàn),該淘寶店鋪內(nèi)主要為女性消費(fèi)者,所占據(jù)的比例超過五分之四,遠(yuǎn)遠(yuǎn)多于男性消費(fèi)者。造成淘寶店鋪性別比例差異如此明顯的主要原因是由于女性要遠(yuǎn)遠(yuǎn)比男性更加關(guān)注服飾及裝飾的搭配。
1.2年齡分析
在該淘寶店鋪內(nèi),電商用戶年齡主要集中在18歲到36歲之間,該類用戶所占據(jù)的比例超過三分之二,主要以青年群體作為主要人群,其中網(wǎng)絡(luò)購物次數(shù)最為的群體年齡為25歲到29歲之間。造成淘寶店鋪內(nèi)消費(fèi)群體年齡比例的原因是由于網(wǎng)絡(luò)購物與年輕人的銷售模式更加溫和。
1.3城鄉(xiāng)屬性分析
在改淘寶店鋪內(nèi),超過90%電商用戶都是城鎮(zhèn)用戶,城鎮(zhèn)用戶為淘寶店鋪主要消費(fèi)群體,這種消費(fèi)模式與我國城市化建設(shè)相吻合。目前,農(nóng)村地區(qū)電商用戶數(shù)量與城市電商用戶數(shù)量之間存在較大差異,主要原因是由于農(nóng)村地區(qū)內(nèi)青年群體大部分都在城市內(nèi)生活。
2、數(shù)據(jù)挖掘分析
數(shù)據(jù)挖掘主要是從大量數(shù)據(jù)信息內(nèi),利用數(shù)學(xué)算法完成數(shù)據(jù)挖掘及知識(shí)獲得階段,其中主要是對(duì)數(shù)據(jù)類別及相關(guān)性進(jìn)行分析研究。本文在分析研究內(nèi),主要從購物車分析及潛在用戶挖掘角度分析研究。
2.1購物車分析
購物車主要表示超市內(nèi)為消費(fèi)者購物所提供的車輛,主要作為放置商品,消費(fèi)者準(zhǔn)備付款過程中,只需要將購物冊(cè)內(nèi)產(chǎn)品進(jìn)行結(jié)算即可。購物車分析主要是按照購物車內(nèi)所具有的產(chǎn)品信息,對(duì)消費(fèi)者的消費(fèi)行為進(jìn)行分析研究,主要體現(xiàn)在:消費(fèi)者在購買某件產(chǎn)品之后,產(chǎn)品能夠被消費(fèi)者選中可能性,要是A類產(chǎn)品購買可能性較高,這樣就能夠發(fā)現(xiàn)消費(fèi)者在消費(fèi)過程中所具有的目標(biāo),了解消費(fèi)者購買該類產(chǎn)品的原因,找到不同產(chǎn)品之間所具有的關(guān)聯(lián)性。商家就能夠根據(jù)消費(fèi)者消費(fèi)行為獲得更高的經(jīng)濟(jì)效益,提升自身在市場建設(shè)內(nèi)所具有的優(yōu)勢(shì)。淘寶店鋪在對(duì)購物車分析之后,能夠按照電網(wǎng)用戶實(shí)際需求對(duì)上架產(chǎn)品順序進(jìn)行調(diào)整。淘寶店鋪購物車數(shù)據(jù)主要包含產(chǎn)品數(shù)據(jù)、購買數(shù)據(jù)與用戶數(shù)據(jù)。
在對(duì)購物車分析過程中,最為關(guān)鍵制表為支撐度與置信度。在對(duì)淘寶店鋪內(nèi)消費(fèi)者分析研究內(nèi),探索m個(gè)消費(fèi)者對(duì)n個(gè)產(chǎn)品購買積極性,就可以通過對(duì)m個(gè)消費(fèi)者購物車內(nèi)數(shù)據(jù)及購買記錄進(jìn)行分析。支撐度主要是判斷產(chǎn)品在消費(fèi)者內(nèi)的歡迎情況,置信度主要是判斷兩個(gè)產(chǎn)品之間所具有的關(guān)聯(lián)性,也就是消費(fèi)者在產(chǎn)品某一件產(chǎn)品之后,在選擇購買其他產(chǎn)品的可能性。
2.2潛在客戶挖掘
為了能夠?qū)μ詫毜赇亙?nèi)潛在客戶進(jìn)行了解,能夠通過分析已購買消費(fèi)者消費(fèi)習(xí)慣及信息記錄等信息,了解到影響消費(fèi)者再次購買的主要因素,進(jìn)而通過這些因素構(gòu)建回歸邏輯模型,按照淘寶店鋪內(nèi)10月份的數(shù)據(jù)信息,分析出淘寶店鋪在11月份及12月份內(nèi)客戶數(shù)量。
按照有關(guān)電子商務(wù)平臺(tái)所潛在客戶挖掘內(nèi)所取得的成功經(jīng)驗(yàn),本文在分析研究內(nèi),選取了三種指標(biāo),分別是用戶可能在次購買有關(guān)性指標(biāo)、用戶基數(shù)指標(biāo)與行為指標(biāo)。其中用戶基礎(chǔ)指標(biāo)主要表示消費(fèi)者基礎(chǔ)信息、產(chǎn)品購買數(shù)量、歷史消費(fèi)次數(shù)等;行為指標(biāo)主要表示消費(fèi)者在購買完畢之后是否會(huì)給予好評(píng)、是否通過手機(jī)終端進(jìn)行購買。在對(duì)不同數(shù)據(jù)指標(biāo)進(jìn)行全面性了解之后,能夠?qū)⒉煌笜?biāo)之間所具有的關(guān)聯(lián)性進(jìn)行了解,訓(xùn)練集對(duì)象選取更加科學(xué)合理。通過熵值法在對(duì)數(shù)據(jù)樣本分析研究中,可以分為以下幾個(gè)步驟:
首先,對(duì)訓(xùn)練集進(jìn)行劃分。在該淘寶店鋪10月份眾多網(wǎng)購用戶內(nèi),選擇4000條銷售數(shù)據(jù)作為訓(xùn)練集內(nèi)對(duì)象,剩下銷售數(shù)據(jù)則作為驗(yàn)證用戶數(shù)據(jù)信息的驗(yàn)證集。
其次,數(shù)據(jù)標(biāo)準(zhǔn)化。指數(shù)取值過程中,因該選取超過5個(gè)的指標(biāo)對(duì)進(jìn)行劃分,進(jìn)而保證每一個(gè)指標(biāo)都具有6個(gè)層級(jí)數(shù)字進(jìn)行表示。
最后,對(duì)用戶再次購買信息增加效益進(jìn)行指標(biāo)計(jì)算。熵值法在實(shí)際應(yīng)用過程中所需要剔除的信息數(shù)據(jù)數(shù)量較少,同時(shí)能夠所提取的信息數(shù)據(jù)數(shù)量較多,進(jìn)而熵值法能夠應(yīng)用到關(guān)鍵指標(biāo)選取上,所遵循的原理如下:
假設(shè)z為訓(xùn)練集,訓(xùn)練集內(nèi)所涉及到的樣本標(biāo)識(shí)都是確定完畢的,在眾多樣本內(nèi)都包含一個(gè)原始集合,所具有的屬性能夠?qū)τ?xùn)練集樣本所具有的類別進(jìn)行客觀劃分,例如消費(fèi)者是否通過手機(jī)終端進(jìn)行購買,就能夠作為某一個(gè)樣本標(biāo)志,要是一共具有n類產(chǎn)品,其中所包含的樣本一共為a個(gè),這樣消費(fèi)者選中任何一種產(chǎn)品進(jìn)行購買的可能性也就為a/n。由表一內(nèi)數(shù)據(jù)可知,熵值法在實(shí)際應(yīng)用過程中,能夠有效對(duì)用戶是否再次購買產(chǎn)品所具有的經(jīng)濟(jì)效益進(jìn)行分析研究,按照淘寶店原有消費(fèi)數(shù)據(jù)作為研究對(duì)象,對(duì)再次購買用戶分布情況進(jìn)行了解。
按照熵值法在計(jì)算過程中所應(yīng)用到的數(shù)學(xué)公式,能夠?qū)⑻詫毜陜?nèi)歷史消費(fèi)數(shù)額與用戶再次購買所具有的信息增值為0.01.45,剩下有關(guān)數(shù)據(jù)也都是按照該方法進(jìn)行計(jì)算。
結(jié)論:按照淘寶店鋪在運(yùn)營過程中所產(chǎn)生的數(shù)據(jù)信息,對(duì)淘寶店鋪電商用戶的個(gè)人特征及購物模式進(jìn)行分析研究。在研究之后得出以下結(jié)論:女性是淘寶主要用戶群體,年齡主要集中在25歲到29歲之間,電商用戶在消費(fèi)過程中所具有的忠誠度有限,大多數(shù)消費(fèi)者產(chǎn)品購買頻率都為1次?;跀?shù)據(jù)挖掘的電商用戶行為分析研究之中,淘寶店鋪管理人員能夠選擇合理的營銷模式開展后期運(yùn)營,提高自身經(jīng)濟(jì)效益。
參考文獻(xiàn):
[1]牛紅惠,金顯華.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].淮陽職業(yè)技術(shù)學(xué)院學(xué)報(bào),2015(8)
[2]張婭妮.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].福建電腦,2013(5)
[3]藺莉,潘浩.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2014(4)
作者簡介:作者姓名:林杰,男,1996年8月,漢族,山東省臨沂市人,本科在讀,主要研究方向:信息與計(jì)算科學(xué)、金融信息分析。