張茜
【摘 要】本文從消費(fèi)者的角度,探索網(wǎng)購物流服務(wù)因素與客戶類別的關(guān)聯(lián)性,構(gòu)建一個(gè)研究框架。通過爬蟲工具對(duì)天貓超市的在線客戶評(píng)論數(shù)據(jù)挖掘,將語言轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),運(yùn)用Rapidminer軟件和FP-Growth算法挖掘出強(qiáng)關(guān)聯(lián)規(guī)則。結(jié)果表明,該框架能夠合理解釋樣本數(shù)據(jù),并且發(fā)現(xiàn)不同類別的網(wǎng)購客戶群體,對(duì)物流服務(wù)感知的側(cè)重點(diǎn)具有顯著差異。該結(jié)論為電商企業(yè)提供了物流服務(wù)盈利空間的切入點(diǎn),具有重要的現(xiàn)實(shí)意義。
【關(guān)鍵詞】在線評(píng)論;物流服務(wù);FP-Growth算法;關(guān)聯(lián)規(guī)則
一、引言
數(shù)據(jù)挖掘技術(shù)可以從大量的數(shù)據(jù)中提取出隱含的、以前不為人所知的、可信而有效的知識(shí),能夠?qū)?shù)據(jù)進(jìn)行再分析,以期獲得更加深入的了解,并且具有預(yù)測(cè)功能[1-2]。其中關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘知識(shí)模式中最活躍的一個(gè)分支,由Agrawal等于1993年首先提出,隨即廣泛應(yīng)用在各個(gè)行業(yè)中[3]。尤其對(duì)于大型零售組織,在處理大規(guī)模數(shù)據(jù),確定市場(chǎng)策略,提高決策支持能力方面。關(guān)聯(lián)規(guī)則挖掘具有較大的價(jià)值,是從大規(guī)模數(shù)據(jù)中提取隱含信息的有效方法。
綜上所述,為避免自建知識(shí)庫的局限,本研究引入關(guān)聯(lián)規(guī)則挖掘技術(shù),對(duì)客觀實(shí)時(shí)數(shù)據(jù)進(jìn)行分析。在天貓超市購物網(wǎng)站上搜集大量在線客戶評(píng)論,從中挖掘物流服務(wù)因素和網(wǎng)購顧客間影響關(guān)系,具有一定的理論創(chuàng)新性和技術(shù)可行性。
二、研究框架及關(guān)聯(lián)規(guī)則
研究首先從B2C電子商務(wù)網(wǎng)站(如天貓超市,當(dāng)當(dāng)網(wǎng)等)的購買頁面搜集大量在線客戶評(píng)論,每條評(píng)論都包含著客戶信息(用戶名,會(huì)員級(jí)別,所在區(qū)域等)以及自由格式的文本式評(píng)論內(nèi)容。接著從上萬條在線客戶評(píng)論中挖掘出有關(guān)于物流服務(wù)的內(nèi)容,本文主要從以下三個(gè)步驟展開研究。
(1)數(shù)據(jù)收集和預(yù)處理:在線客戶評(píng)論中按照客戶類別和物流服務(wù)因素提取數(shù)據(jù)信息。
在B2C市場(chǎng)中天貓超市自2016年市場(chǎng)占比為6.7%,到2018年占比13.6%,一直處于增長(zhǎng)狀態(tài)。天貓超市無論是在倉儲(chǔ)還是物流配送方面都遠(yuǎn)遠(yuǎn)領(lǐng)先于行業(yè)。物流也逐漸成為消費(fèi)者選擇在天貓超市購物的重要因素之一。因此,天貓超市網(wǎng)站上的在線評(píng)論數(shù)據(jù)具有一定的規(guī)模性和可研究性。接著是選定一種商品,使得評(píng)論內(nèi)容可統(tǒng)一處理。iPhone8作為一款風(fēng)靡全球的熱銷商品,其性能信息較其他產(chǎn)品更被廣大消費(fèi)者熟知,而且蘋果的品牌體驗(yàn)店已遍布各大城市各個(gè)商圈。大多數(shù)消費(fèi)者是在充分了解該產(chǎn)品信息后,才通過網(wǎng)絡(luò)在線購買的。所以,iPhone8產(chǎn)品的評(píng)論內(nèi)容更側(cè)重于對(duì)B2C企業(yè)的服務(wù)體驗(yàn),更利于本研究獲取有關(guān)物流服務(wù)的信息?;谝陨戏治?,本文在天貓超市的iPhone8購買頁面收集在線客戶評(píng)論。數(shù)據(jù)持續(xù)時(shí)長(zhǎng)為一年,呈自然語言格式,評(píng)論總量為62529條。本文選取多可網(wǎng)絡(luò)爬蟲工具通過設(shè)定入口網(wǎng)址、關(guān)鍵詞和評(píng)估詞表來抓取大量在線客戶評(píng)論中有關(guān)物流的評(píng)論。本研究選擇人工識(shí)別和篩選的方法對(duì)上述有關(guān)物流的在線客戶評(píng)論進(jìn)行預(yù)處理,以期得到一個(gè)準(zhǔn)確的有關(guān)客戶類別和物流服務(wù)因素的評(píng)論矩陣。
(2)關(guān)聯(lián)規(guī)則挖掘:在提取出的客戶類別和物流服務(wù)因素中挖掘關(guān)聯(lián)規(guī)則。在本研究中,關(guān)聯(lián)規(guī)則挖掘用來識(shí)別和提取在線客戶評(píng)論中隱含的有關(guān)物流服務(wù)因素和客戶類別相關(guān)關(guān)系?;诿珖?guó)君對(duì)關(guān)聯(lián)規(guī)則的定義和總結(jié),可將關(guān)聯(lián)規(guī)則問題描述為:假設(shè)I表示集合U和集合A的總項(xiàng)目集,即I={u1,u2,…,up,a1,a2,…,an}。那么關(guān)聯(lián)規(guī)則可表示為:X→Y,其中X∈I,Y∈I并且X∩Y=?覫。進(jìn)一步,令P(X)表示X在評(píng)論中出現(xiàn)的概率,換言之,如果x是包含X的評(píng)論的數(shù)量,n是所研究評(píng)論的總數(shù)量,那么,P(X)=x/n。
通常,描述關(guān)聯(lián)規(guī)則的兩個(gè)重要概念是支持度(Support)和置信度(Confidence)。那些超過最小支持度Suppmin和最小置信度confmin閾值的規(guī)則,就稱為強(qiáng)關(guān)聯(lián)規(guī)則。本研究中supp(X→Y)=P(X∪Y)表示評(píng)論的內(nèi)容中同時(shí)涉及X和Y的的概率;conf(X→Y)=P(X∪Y)/P(X)表示X出現(xiàn)的情況下出現(xiàn)Y的概率;lift(X→Y)表示X和Y出現(xiàn)的相關(guān)關(guān)系。由此,本文設(shè)定以下三個(gè)標(biāo)準(zhǔn),來挖掘X和Y之間的強(qiáng)關(guān)聯(lián)規(guī)則.支持度的標(biāo)準(zhǔn)是用來確保項(xiàng)集X和Y在評(píng)論中有最低出現(xiàn)率,置信度的標(biāo)準(zhǔn)用來捕獲評(píng)論中出現(xiàn)X的情況下,出現(xiàn)Y的條件概率,提升度(lift)的標(biāo)準(zhǔn)用來約束X和Y之間的影響關(guān)系,如果lift(X→Y)=1,由lift(X→Y)=P(X∪Y)/P(X)P(Y),可知P(X∪Y)=P(X)P P(X)P(Y),X和Y獨(dú)立;如果lift(X→Y)>1,即表示X和Y呈正相關(guān),X在評(píng)論中的出現(xiàn)影響Y的出現(xiàn)。
(3)相關(guān)性分析:結(jié)合實(shí)際情況,對(duì)規(guī)則進(jìn)行分析,并針對(duì)性的提出改善物流服務(wù)質(zhì)量,提高客戶體驗(yàn)的建議。由于本研究搜集了大量的評(píng)論數(shù)據(jù),可能會(huì)產(chǎn)生較多數(shù)量的關(guān)聯(lián)規(guī)則,為了便于分析客戶類別(U)與物流服務(wù)因素(A)的關(guān)聯(lián)性,我們將X項(xiàng)目集分類,并用下標(biāo)標(biāo)識(shí)。XU和XA分別表示X項(xiàng)目集中客戶類別和物流服務(wù)因素的子項(xiàng)目集,其中X∈A,X∈U,同樣Y項(xiàng)目集也可以分類為YU和YA。
三、結(jié)論
本研究對(duì)B2C電子商務(wù)企業(yè)的物流服務(wù)因素影響進(jìn)行了探討,從消費(fèi)者的角度出發(fā),基于在線客戶評(píng)論的數(shù)據(jù)挖掘方法,挖掘客戶類別與物流服務(wù)因素的關(guān)聯(lián)規(guī)則,發(fā)現(xiàn)不同類型的客戶對(duì)物流服務(wù)因素的感知側(cè)重點(diǎn)有所不同。由天貓超市的評(píng)論數(shù)據(jù)挖掘結(jié)果可知,活躍客戶即大多數(shù)客戶,更注重于物流配送速度、承諾配送時(shí)間的兌現(xiàn)水平以及退換貨服務(wù)等的物流服務(wù)因素;新客戶更在意物流的包裝;而VIP客戶更需要被重視感,對(duì)物流信息查詢的服務(wù)有更高的要求??梢?,B2C電子商務(wù)企業(yè)在提升物流服務(wù)質(zhì)量方面,需要抓準(zhǔn)關(guān)鍵點(diǎn),精細(xì)化消費(fèi)者的物流服務(wù)需求。
在當(dāng)前大數(shù)據(jù)方興未艾的背景下,數(shù)據(jù)挖掘技術(shù)可以深入挖掘在線客戶評(píng)論中所反映出的消費(fèi)者感知。然而要想滿足每個(gè)消費(fèi)者的服務(wù)需求,提供個(gè)性化的物流服務(wù),勢(shì)必會(huì)增加物流成本。因此,借助本文對(duì)天貓商城在線客戶評(píng)論的實(shí)證研究結(jié)果,B2C企業(yè)可以考慮通過劃分消費(fèi)者類別、對(duì)應(yīng)物流服務(wù)因素的顧客感知,提供精細(xì)化、規(guī)模化的物流服務(wù)。從而,在適當(dāng)控制物流成本的前提下,有針對(duì)性的優(yōu)化物流服務(wù),以達(dá)到高效提升客戶體驗(yàn)的管理目標(biāo)。
【參考文獻(xiàn)】
[1] CNNIC.第32次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201307/t20130717_40664.htm.
[2] iResearch.艾瑞咨詢:2013Q3中國(guó)網(wǎng)絡(luò)購物交易規(guī)模4547.6億元,B2C向平臺(tái)化發(fā)展[EB/OL]. http://ec.iresearch.cn/shopping/ 20131104/217734.shtml.
[3] 周劍雄,高潔.基于數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理[J].計(jì)算機(jī)系統(tǒng)應(yīng)用, 2003(2):9-11.