(昭通學院 數(shù)學與統(tǒng)計學院,云南 昭通 657000)
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)的產(chǎn)生、清洗、預測并給出相應的決策意見,一直是統(tǒng)計工作者研究的重要內(nèi)容。目前,隨著經(jīng)濟、科學技術、計算機技術與網(wǎng)絡技術的普遍應用,使得互聯(lián)網(wǎng)企業(yè)逐漸意識到網(wǎng)絡客戶體驗的重要性。根據(jù)相關研究數(shù)據(jù)表明,為網(wǎng)絡客戶提供優(yōu)質(zhì)的網(wǎng)絡體驗,可以有效提高客戶的滿意度、忠誠度以及消費行為。本文通過對網(wǎng)絡客戶體驗的客戶分類及對應方法進行研究,為網(wǎng)絡客戶體驗的客戶分類提供有效參考[1]。
本文實證研究的數(shù)據(jù)來源于某網(wǎng)絡公司為做客戶分類所收集的17 431個數(shù)據(jù),我們主要研究未失效的3 791個客戶數(shù)據(jù),起始變量包括賬戶ID,賬務名稱,公司名稱,一級行業(yè),關聯(lián)客戶ID,對應二級賬號,部門,客服姓名,綁定狀態(tài),最近續(xù)費方式,百度統(tǒng)計狀態(tài),信譽等級,信譽成長值,首次續(xù)費金額,最近續(xù)費金額,搜索+網(wǎng)盟日均消費,累計失效次數(shù),累計失效天數(shù),總投資,總續(xù)費金額,總續(xù)費次數(shù),消費提升潛力,賬號在網(wǎng)時間/月,月均投資額,月均續(xù)費次數(shù),月均續(xù)費額,客戶貢獻率總共27個變量。
通過觀察數(shù)據(jù),可以看出數(shù)據(jù)中存在大量缺失,變量之間存在多重共線,不利于我們使用分類方法。于是要進行數(shù)據(jù)的預處理,即變量選擇和缺失數(shù)據(jù)插補[2]。
根據(jù)本實例分類的目的,我們選擇以下變量:信譽等級、信譽成長值、搜索+網(wǎng)盟日均消費、累計失效次數(shù)、累計失效天數(shù)、平均失效率(=累計失效天數(shù)/累計失效次數(shù),單位為:天/次)、消費提升潛力、賬號在網(wǎng)時間/月、月均投資額(一個月按30.416 67計算=365/12)、月均續(xù)費次數(shù)、月均續(xù)費額、續(xù)費增長率(最近續(xù)費金額-首次續(xù)費金額)/首次續(xù)費金額)、客戶貢獻率(=該客戶總投資額/所有客戶總投資額)。
對于選取變量的缺失數(shù)據(jù)利用均值插補方法進行缺失插補。得到完整的客戶樣本量共計3 791個。
信譽等級:在本文中用阿拉伯數(shù)字1或2表示,數(shù)字越大,表示信譽等級越高。
信譽成長值:是指從開戶到現(xiàn)在累計起來的信譽度,信譽成長值越大,聲譽越好。
搜索+網(wǎng)盟日均消費:搜索+網(wǎng)盟日均消費越高越好。
累計失效次數(shù):累計失效次數(shù)越多,證明客戶的積極性不太高,但也不是絕對性的。
累計失效天數(shù):累計失效天數(shù)越多,證明客戶積極性不高,但也不是絕對性的。
平均失效率(=累計失效天數(shù)/累計失效次數(shù),單位為:天/次):平均失效率越大,說明累計失效天數(shù)越多,反映客戶的狀況不是很好。
消費提升潛力:消費提升潛力越大越好。
賬號在網(wǎng)時間/月:賬號在網(wǎng)時間/月越長越好
月均投資額(一個月按30.416 67計算=365/12):月均投資額越大越好
月均續(xù)費次數(shù):月均續(xù)費次數(shù)越多越好。
月均續(xù)費額:月均續(xù)費額越高越好。
續(xù)費增長率((最近續(xù)費金額-首次續(xù)費金額)/首次續(xù)費金額):續(xù)費增長率越大越好。
客戶貢獻率(=該客戶總投資額/所有客戶總投資額):客戶貢獻率越大越好。
任何一個成功的企業(yè)都有一個共同的目標:最大限度爭取最大量的客戶,提供給客戶最好服務。但是在企業(yè)發(fā)展中很難或者不可能做到對每一個客戶都平等對待,研究發(fā)現(xiàn),公司發(fā)展過程中,20%的客戶為公司創(chuàng)造了80%的利潤,而80%的客戶僅為公司帶來20%的利潤——這就是著名的“二八法則”[3],為此,一個公司要想得到持續(xù)健康的發(fā)展,必須合理優(yōu)化資源配置。本文首先根據(jù)已有數(shù)據(jù),分析了公司的客戶結構,然后通過從不同的角度思考對客戶進行不同的分類,最后根據(jù)分類結果提出針對性資源配置方法或者服務改進策略。
先通過計算客戶的累積貢獻率觀察公司客戶的分布狀況
客戶貢獻率:
首先,根據(jù)公式(1)計算出所有客戶的累積貢獻率,我們把結果展示在圖1中:
根據(jù)圖1我們可以得到:該公司17 431個客戶中投資額排名前1 127名客戶為公司做了80%的貢獻,即6.5%的客戶為公司做了80%的貢獻;而前2 932名客戶的總投資為公司做了90%的貢獻,即16.82%的客戶為公司做了90%的貢獻。
圖1 所有狀態(tài)下客戶投資累積貢獻率
其次,計算賬戶正常生效狀態(tài)下客戶的貢獻率和累積貢獻率,我們把結果展示在圖2中:
圖2 正常生效賬戶客戶總投資累積貢獻率
根據(jù)圖2我們可以得到:在3 791個正常生效賬戶中,總投資排名前273個賬戶為公司作出80%的貢獻(在所有正常生效賬戶中),即:7.2%的客戶為公司作出了80%的貢獻;總投資排名前802個賬戶為總司作出了90%的貢獻,即21.16%的客戶為公司作出了90%的貢獻。
綜上所述,說明:從本部分的分析,我們可以看出公司客戶的總體投資分布情況,為進一步認清每個客戶的價值提供一方面的依據(jù)。但要注意并不是排名靠后的賬戶價值就不高,那些排名靠后的賬戶或客戶,只要發(fā)展較好,依然有可能成為公司的大客戶,未來為公司作出巨大的貢獻[3]。
可以看出公司的貢獻分布符合二八法則,其后我們嘗試依靠K-均值聚類方法構建了3個不同的模型。
3.2.1 模型一
(下面的分類模型是基于正常生效的賬戶進行分類得到)
這個模型只考慮各賬戶月均投資進行的客戶分類。各賬戶的月均投資額的考慮,更能反映出客戶的價值,避免了由于開戶時間短,總投資額相對較小,但是潛力巨大的客戶的錯誤分類估計,同時對相應客戶采取的一系列營銷手段,是大有好處的[4]。
經(jīng)過計算分析,我們把均值比較接近的,放在同一類中,此模型分類統(tǒng)計結果如下表:
表1 模型一分類統(tǒng)計結果
根據(jù)分類模型有以下結論:
第1類客戶:月均投資額最高,平均每個客戶每個月能在公司的投資額為213 617.4元,第1類客戶有38個,占總客戶的1%;
第2類客戶:僅有一個,每個月在公司的投資額為1 315 677元,所占比例非常小;
第3類客戶:平均每個客戶的投資額為79 687.65元,這類客戶有97個,占總客戶的0.026%;
第4類客戶:每個客戶的月均投資額為4 111.481元,這類客戶有3 640個,占公司客戶的96.02%;第5類客戶:剛開戶的客戶,有15個,占總客戶的0.4%。
由該模型分類結果及分類統(tǒng)計結果可以看出客戶對公司的價值排序(由高到低)為:第1類、第2類、第3類、第4類、第5類。但是第5類為新開客戶,它的分類是合理地,但其價值排名,需要到以后具備相應數(shù)據(jù)進行劃分。
3.2.2 模型二
選取各賬戶月均投資額、月均續(xù)費次數(shù)、月均續(xù)費額、消費提升潛力四個指標為分類依據(jù),先對數(shù)據(jù)進行標準化,然后建立基于K-均值聚類法的分類模型進行分類。我們先來看一下K-均值聚類的定義:
K-均值聚類:K-均值聚類是最簡單的一種聚類算法。算法的目的是使各個樣本與所在類均值的誤差平方和達到最小(這也是評價K-均值聚類算法最后聚類效果的評價標準)
K-均值聚類算法的一般步驟:
(1)初始化。輸入基因表達矩陣作為對象集X,輸入指定聚類類數(shù)N,并在X中隨機選取N個對象作為初始聚類中心。設定迭代中止條件,比如最大循環(huán)次數(shù)或者聚類中心收斂誤差容限。
(2)進行迭代。根據(jù)相似度準則將數(shù)據(jù)對象分配到最接近的聚類中心,從而形成一類。初始化隸屬度矩陣。
(3)更新聚類中心。然后以每一類的平均向量作為新的聚類中心,重新分配數(shù)據(jù)對象。反復執(zhí)行第二步和第三步直至滿足中止條件。
評價標準:
假設有M個數(shù)據(jù)源,C個聚類中心。μc為聚類中心。該公式的意思也就是將每個類中的數(shù)據(jù)與每個聚類中心做離差平方和,j最小,意味著分割的效果最好,類似于最小二乘估計的思想。
根據(jù)公式(2),計算分析后,得到此分類模型統(tǒng)計結果如下表:
表2 模型二分類統(tǒng)計結果
由模型二的統(tǒng)計結果可得到以下結論:
第1類客戶:消費提升潛力均值為84、月均投資額為1 315 677、月均續(xù)費額和月均續(xù)費次數(shù)為0,這類客戶僅有一個,占總客戶的0.026%;
第2類客戶:消費提升潛力均值為81.35 092、月均投資額為21 663.43、月均續(xù)費額均值為20 915.35、月均續(xù)費均值次數(shù)為2.381 274,這類客戶有436個,占總客戶的11.50%;
第3類客戶:消費提升潛力均值為91.902 44、月均投資額為184 447、月均續(xù)費額均值為197 586.4、月均續(xù)費均值次數(shù)為4.693 503,這類客戶有41個。由此可見,這類客戶對公司的價值是最高的,占總客戶的1.08%;
第4類客戶:消費提升潛力均值為49.769、月均投資額為1 816.585、月均續(xù)費額均值為1 497.44、月均續(xù)費均值次數(shù)為0.436 697,這類客戶有2 316個,占總客戶的61.09%;
第5類客戶:消費提升空間為空的客戶,有997個,占總客戶的26.30%。
由該模型分類結果及分類統(tǒng)計結果可以看出客戶對公司的價值排序(由高到低)為:第3類、第2類、第1類、第4類、第5類。注意:在第5類客戶中也有很多高價值的客戶,這里只是由于這些客戶的消費提升潛力為空所以歸為了這一類中,切不可以為,上面的結論完全正確。對于第5類這樣的客戶可以尋找其他的方法分類。
3.2.3 模型三
選取各賬戶消費提升潛力、賬號在網(wǎng)時間(=數(shù)據(jù)下載時間-開戶時間)、月均投資額、月均續(xù)費次數(shù)、月均續(xù)費額、續(xù)費增長率六個指標為分類依據(jù),先對數(shù)據(jù)進行標準化,然后建立基于K-均值聚類法的分類模型進行分類。
3其中:
通過計算分析,該分類模型的統(tǒng)計結果如下表:
表3 型三分類統(tǒng)計結果
由分類模型三的統(tǒng)計結果可得到以下結論:
第1類客戶:消費提升潛力均值為82.867 07、在網(wǎng)時間均值為25.332 05個月、月均投資額為26 378.23、月均續(xù)費次數(shù)均值為2.690 308、月均續(xù)費額為25 525.64,續(xù)費增長率為239.16%,這類客戶有331個,占總客戶的8.73%;
第2類客戶:消費提升潛力均值為93、在網(wǎng)時間均值為112.3726個月、月均投資額為201 504.1、月均續(xù)費次數(shù)均值為3.550 688、月均續(xù)費額為201 490.3,續(xù)費增長率為29 900%,這類客戶有1個,占總客戶的0.026%;
第3類客戶:消費提升潛力均值為91.875、在網(wǎng)時間均值為31.723 56個月、月均投資額為184 020.6、月均續(xù)費次數(shù)均值為4.722 073、月均續(xù)費額為197 488.8,續(xù)費增長率為682.99%,這類客戶有40個,占總客戶的1.06%;
第4類客戶:消費提升潛力均值為51.727 88、在網(wǎng)時間均值為28.846 88個月、月均投資額為2 250.445、月均續(xù)費次數(shù)均值為0.548 572、月均續(xù)費額為1 958.437、續(xù)費增長率為28.45%、這類客戶有2 113個、占總客戶的55.74%;
第5類客戶:有缺失值的客戶、消費提升潛力均值為45.592 23、在網(wǎng)時間均值為6.469 664個月、續(xù)費增長率為21.59%,有1 306個,占總客戶的34.45%。
由該模型分類結果及分類統(tǒng)計結果可以看出客戶對公司的價值排序(由高到低)為:第2類、第3類、第1類、第4類、第5類。注意:在第5類客戶中也有很多高價值的客戶,這里只是由于這些客戶的消費提升潛力為空所以歸為了這一類中,切不可以為,上面的結論完全正確。對于第5類這樣的客戶可以尋找其他的方法分類。
根據(jù)上面的分析結果,我們可以得到:
(1)新興潛在型客戶:主要以消費提升潛力為衡量標準,滿足條件為月均投資額>總賬戶月均投資額平均值、消費提升潛力>前321名客戶消費潛力平均值、續(xù)費增長率>0;
(2)穩(wěn)定型客戶(或忠誠客戶):主要以月均續(xù)費次數(shù)為衡量標準,滿足的條件為月均續(xù)費次數(shù)>總用戶月均續(xù)費次數(shù)均值、累積失效次數(shù)<總用戶累積失效次數(shù)均值、續(xù)費增長率>=0;
(3)問題型:這類客戶主要考慮三個指標,分別是消費提升潛力、月均續(xù)費次數(shù)、月均續(xù)費額。具體為消費提升潛力>前321名客戶消費潛力平均值、月均續(xù)費次數(shù)<總賬戶月均續(xù)費次數(shù)均值、月均續(xù)費額<總賬戶月均續(xù)費額;
(4)流失型:這類客戶考慮的指標分別為累積失效次數(shù)、續(xù)費增長率。具體為累積失效次數(shù)>總賬戶累積失效次數(shù)均值、續(xù)費增長率<0;
(1)誰是你的大客戶——找準你的大客戶;
(2)攻——尋找大客戶的突破點;
(3)守——如何牢牢守住你的大客戶;
(4)防——怎樣打好你最后的攻堅戰(zhàn);
(5)修身——完美做人做事,吸引客戶。
(1)指派專門的營銷人員(或客戶代表)經(jīng)常聯(lián)絡,定期走訪,為他們提供服務的同時要給予更多的關注,營銷主管也應該定期的去拜訪他們。
(2)密切注意該類客戶的產(chǎn)品銷售、資金支付能力、人事變動、重組等異常動向。
小客戶在一個公司的所有客戶中占有很大的比重,此類客戶對企業(yè)完成經(jīng)濟指標貢獻甚微,消費額占企業(yè)總消費額的百分之二十左右[5]。由于他們數(shù)量眾多,具有“點滴匯成大?!钡脑鲩L潛力,企業(yè)應控制這方面的服務投入,按照“方便、及時”的原則,為他們提供大眾化的基礎性服務,或者將精力重點放在發(fā)掘有潛力的“明日之星”上,使其早日升為中等客戶甚至大客戶。企業(yè)營銷人員應保持與這些客戶的聯(lián)系,并讓他們知道當他們需要幫助的時候,企業(yè)總會伸出援助之手。